Introduction

“ 鸡尾酒会问题”(cocktail party problem)是在计算机语音识别领域的一个问题,当前语音识别技术已经可以以较高精度识别一个人所讲的话,但是当说话的人数为两人或者多人时,语音识别率就会极大的降低,这一难题被称为鸡尾酒会问题。

解决方案

斯坦福大学的Andrew NG教授的机器学习公开课(http://v.163.com/special/opencourse/machinelearning.html)(ml-class.org)

在第一章unsupervised learning那段视频里解决鸡尾酒会问题(cocktail party problem)就写了一行代码:

[W,s,v] = svd ((repmat(sum(x.*x,1),size(x,1),1).*x)*x');

用fastICA算法可以比较好地解决http://research.ics.tkk.fi/ica/fastica/。

http://www.endolith.com/wordpress/2009/11/22/a-simple-fastica-example/ 是一个分离音乐的例子,效果比较明显。用的就是fastICA的python实现。不过好像用来解决cocktail party problem的话效果不太好。

Blind Source Separation of recorded speech and music signals:http://cnl.salk.edu/~tewon/Blind/blind_audio.html

from:

“ 鸡尾酒会问题”(cocktail party problem)相关推荐

  1. 说说鸡尾酒会问题(Cocktail Party Problem)和程序实现

    "鸡尾酒会问题"(cocktailparty problem)是在计算机语音识别领域的一个问题,当前语音识别技术已经可以以较高精度识别一个人所讲的话,但是当说话的人数为两人或者多人 ...

  2. Coursera公开课笔记: 斯坦福大学机器学习第一课“引言(Introduction)”

    Coursera公开课笔记: 斯坦福大学机器学习第一课"引言(Introduction)" 注:这是我在"我爱公开课"上做的学习笔记,会在52opencours ...

  3. 语音识别研究的四大前沿方向

    以下转自:http://blog.csdn.net/whaoxysh/article/details/19402337 " 鸡尾酒会问题"(cocktail party probl ...

  4. 学习笔记 | 独立成分分析(ICA, FastICA)及应用

    学习笔记 | 独立成分分析[ICA, FastICA]及应用 1 背景说明 2 算法原理 2.1 ICA简介 2.2 形式化表达 3 算法步骤与代码 4 算法改进:FastICA 5 ICA实例与应用 ...

  5. Introduction to Machine Learning

    Introduction to Machine Learning 引言 本系列文章是本人对Andrew NG的机器学习课程的一些笔记,如有错误,请读者以课程为准. 在现实生活中,我们每天都可能在不知不 ...

  6. 斯坦福大学机器学习第一课“引言(Introduction)”

    斯坦福大学机器学习第一课"引言(Introduction)" 一.机器学习概览 1)机器学习定义:机器学习是人工智能的一个分支,目标是赋予机器一种新的能力.机器学习的应用很广泛,例 ...

  7. 【机器学习】ICA 原理以及相关概率论,信息论知识简介

    看完了sparse coding,开始看ICA模型,本来ng的教程上面就只有一个简短的介绍,怎奈自己有强迫症,爱钻牛角尖,于是乎就搜索了一些ICA的介绍文章(都是从百度文库中搜来的),看完之后感觉这个 ...

  8. Deepmind讲座:深度学习中的记忆和注意力 注意力机制发展史与详解

    DeepMind x UCL | Deep Learning Lectures | 8/12 | Attention and Memory in Deep Learning(机翻讲稿) 图片外链失效, ...

  9. 【吴恩达机器学习笔记】1引言、单变量线性回归、线性代数回顾

    1引言(Introduction) 1.1欢迎(Welcome) 1.2机器学习是什么(What is machine learning?) Arthur Samuel(1959):机器学习是在没有进 ...

  10. 达摩院技术创新全景|懂你的语音AI

    过去十年,语音AI从实验室走向应用,语音搜索.交互早已融入日常.本文将带你一览达摩院语音AI技术创新全景,一起感受能听.会说.懂你的语音AI. 当你在家中与智能音箱进行交互对话,当你使用天猫超市或菜鸟 ...

最新文章

  1. Ubuntu上Vim安装NERDTree插件操作步骤
  2. webStroage案例
  3. python第三方库排行-scikit-learn: Python强大的第三方库
  4. 用CFree写的Windows SDK 画线程序
  5. 20应用统计考研复试要点(part7)--统计学
  6. uni app input添加获取验证码按钮_uni-app跨平台框架对微信小程序的无障碍支持探索...
  7. 惹毛了老婆后,老王居然本能地想按Ctrl+Z...
  8. [20150805]提升scn4.txt
  9. [Javascript]基于ExplorerCanvas绘制表盘时钟
  10. JavaScript数组-多维数组的困惑
  11. 《编程之美》笔记(一)
  12. WebGL 3D on iOS8 正式版
  13. 2018年数学建模美赛B题做题思路和详细分析(五)
  14. 《算法精解:C语言描述》勘误
  15. arcgis 经纬度转大地坐标_arcgis下平面坐标与大地坐标的转换
  16. MoFlow:生成分子图的可逆流模型
  17. position:relative;top属性移动div后的空白怎么去掉?
  18. 用winrar压缩工具切分文件和合并文件
  19. 程序员节的一点小感触
  20. Quartz执行逻辑(三)QRTZ_FIRED_TRIGGERS表的作用

热门文章

  1. oracle连接和执行流程总结
  2. DIV+CSS专题:第一天 XHTML CSS基础知识
  3. 第一次用Axure~
  4. Git 和 Github的关系
  5. javascript中的cookie
  6. luoguP3507 [POI2010]GRA 性质 + 动态规划
  7. Python初学手记----在window系统中安装环境
  8. [BZOJ] 1619: [Usaco2008 Nov]Guarding the Farm 保卫牧场
  9. Struts2.1.6 + Spring2.5+Hibernate3.2整合
  10. 2016.8.27一套简单的题解题报告