前言

这是2013年发表在ICASSP上的Singing voice timbre classification of Chinese popular music,有点老了,今早没事翻阅文档时发现了,题目吸引了我:中国流行音色的歌声音色分类。因为我做的也是歌声音色方面的内容,所以花了一个小时看了全文,又花了一个小时有了此文。

搜了一下本文关键词:singing voice timbre可见从02年到17年只有寥寥数篇文章,可见作者当时的研究是比较前沿的。

概述

本文目的是对歌声音色进行分类,作者自建了歌声数据集,专家标注六种音色标签,一段歌声可能同时具有多个标签,是一个多标签分类问题,使用SVM分类器进行分类。和通常的机器学习流程一样,本文先对歌声进行预处理,具体包括“歌声检测”和“歌声分离”,然后在提取不同的特征输入到SVM分类器,通过分类精度评估使用的预处理方法和特征的好坏。

背景

专家标注的六种音色标签

实验

歌声片段检测和歌声分离

歌声中会有停顿或者纯伴奏声音,歌声检测就检测出歌声中纯人声的片段,歌声分离就是将人声和伴奏剥离开来。作者先利用卡拉OK音乐训练一个人声/非人声二分类器,然后将其用到自己的数据集上。

卡拉OK音乐是双轨道音乐,一个轨道是歌声+伴奏(s+m’),另一个轨道是纯伴奏(m),因为m’和m比较相似,作者采用最小二乘法从s+m’中提取出s,这样就是纯人声了。有了s和m就可以训练一个SVM二分类器了。

作者研究音色用的数据集不是卡拉OK音乐,是我们普通人所接触的音乐,只有一个轨道,所以先用上述的歌声检测模型检测出歌声片段,然后在使用歌声分离(RPCA)的方法获得纯净的人声部分。

作者给出了不同预处理方法下的分类精度,可见先歌声检测在歌声分离效果最好。

特征提取

作者分别提取了通用的音频特征(平均能量,响度,过零率),歌声特征(音高,音质)和音乐特征(旋律,声调)

分类

比较不同的特征组合下的分类精度。CFS代表不同特征按权重组合,具体什么权重,文中未提。

小结

本文提出的歌声音色分类,数据集可以在这里获得。歌声音色分类和歌手分类是有区别的,因为歌手在演唱歌曲时不同的演唱方式能够产生差别很大的音色。所以本文在标注数据的时候不是按歌手,而是按照专家的音乐片段的评估,即不同的歌手演唱的不同的音乐可能有相同的音色标签。歌手分类就很好理解,是一个普通的分类问题,一段歌曲是哪个歌手唱的就属于哪类。本文提出的音色标签也很有价值,因为数据集是公开的,可以利用深度学习设计音色分类,情感识别和音乐推荐等实验。

[论文阅读] Singing Voice Timbre Classification of Chinese Popular Music相关推荐

  1. 论文阅读(1)--Fine-grained Image Classification by Exploring Bipartite-Graph Labels

    这是阅读<Fine-grained Image Classification by Exploring Bipartite-Graph Labels>这篇论文所做的笔记. 这篇论文是来自N ...

  2. 论文阅读(2)Classification of pit and fissure for caries risk based on 3D surface morphology analysis

    论文题目: Classification of pit and fissure for caries risk based on 3D surface morphology analysis of t ...

  3. 论文阅读笔记:Glyce: Glyph-vectors for Chinese Character Representations

    香侬科技提出了一种基于中文字形的向量表示形式:Glyce,基于Glyce的模型在13个中文NLP任务上达到了SOTA. 摘要: 直觉上,字形信息对于中文这样的表意文字上进行的nlp任务会有很多帮助,但 ...

  4. 语音合成(TTS)论文优选:ByteSing: A Chinese Singing Voice Synthesis System Using Duration Allocated Encoder-De

    声明:语音合成(TTS)论文优选系列主要分享论文,分享论文不做直接翻译,所写的内容主要是我对论文内容的概括和个人看法.如有转载,请标注来源. 欢迎关注微信公众号:低调奋进 ByteSing: A Ch ...

  5. Sentiment Classification towards Question-Answering with Hierarchical Matching Network 论文阅读笔记

    Sentiment Classification towards Question-Answering with Hierarchical Matching Network 论文阅读笔记 这篇论文介绍 ...

  6. 论文阅读——TR-GAN: Topology Ranking GAN with Triplet Loss for Retinal Artery/Vein Classification

    论文阅读--TR-GAN: Topology Ranking GAN with Triplet Loss for Retinal Artery/Vein Classification 基于对抗神经网络 ...

  7. 《论文阅读》Multi-Task Learning of Generation and Classification for Emotion-Aware Dialogue Response Gener

    <论文阅读>Multi-Task Learning of Generation and Classification for Emotion-Aware Dialogue Response ...

  8. 论文阅读——FPGA based Accelerators of Deep Learning Networks for Learning and Classification:A Review

    论文阅读之FPGA硬件加速Review FPGA-based Accelerators of Deep Learning Networks for Learning and Classificatio ...

  9. 论文阅读笔记:Multi-view adaptive graph convolutions for graph classification

    论文阅读笔记:Multi-view adaptive graph convolutions for graph classification 文章目录 论文阅读笔记:Multi-view adapti ...

最新文章

  1. 第十六届全国大学生智能车竞赛线上赛点赛道审核 - 华南赛区
  2. c编程:输入一个数字n,则n代表n行,每行输入2个数字a,b计算每行的a+b问题。
  3. 启明云端分享 | Sigmastar SSD201\SSD202D核心板在智能料理机方案的应用(4.3寸彩屏应用)
  4. python 函数中的面试题
  5. python内置哪些装饰器_Python内置的wraps装饰器有什么用
  6. 【树状数组】【P3608】平衡的照片
  7. 使用easy_install安装BeautifulSoup——Python
  8. Linux下常用网络配置命令
  9. PC电脑控制手机iphone(iOS 11、iOS 12、iOS 13),需越狱
  10. Glide遇到重定向url产生的bug分析以及解决
  11. 还不到4折:赶紧来抢券啊!!!
  12. 【本科生科研入门】英文科技论文写作-绘图篇
  13. Elasticsearch7.9集群部署,head插件,canal同步mysql数据到es,亲自测试,无坑
  14. windows开启远程桌面,防火墙拦截:只允许特定IP远程
  15. 玉米社:SEM百度竞价推广转化成本过高要如何处理?
  16. 主机服务器安全策略(一):账户口令安全
  17. [日程管理][Android]91todo日程任务管理
  18. 经过半年的摸爬滚打,入门机器学习如此简单
  19. 新手Web前八道题训练
  20. Java从网上读取docx文件到内存

热门文章

  1. android Notifications通知
  2. EKP前端/EKP-V16开发功能强化/快速切换用户 - SSO单点登录方式(public)
  3. 网银显示服务器无效是咋回事,快速解决win7系统招商网银无法登录提示无效请求请重新登录的处理方案...
  4. Obsidian | 保存图片到指定文件夹 | 图片保存位置
  5. pygame之image模块
  6. 布伦特原油 和 美原油双原油对冲套利程序化策略解析
  7. 腾讯云容器挂载configmap报错:read only fie system
  8. whoami显示当前登录的用户名
  9. 基于spingboot+springcloud微服务技术的在线教育平台系统
  10. 巴巴腾机器人怎么开机_常见问题-巴巴腾儿童机器人官网——致力于人工智能+智慧教育产品的极致创新...