任务介绍:

数据预处理:从原始波形中提取MFCC特征(TAs已经做了!)
分类:使用预先提取的MFCC特征进行帧级音素分类

任务:多级分类
从语音中进行基于框架的音素预测

数据:

由于每一帧只包含25毫秒的语音,因此单个帧不可能代表一个完整的音素
通常,一个音素会跨越几个帧
将相邻的音素连接起来进行训练

每一段是39长度的向量。 将相邻的音素连接起来进行训练,然后会给出前后五段的数据,也就是我们有11*39 = 429 维度的一个特征,根据这个特征去做分类 。

libriphone/

  • train_split.txt (train metadata)

  • train_labels.txt (train labels)

  • test_split.txt (test metadata)

  • feat/ (pt文件,张量)

    • train/

    • test/

1.修改参数

2.修改网络,增加归一化和dropout

李宏毅2022hw2相关推荐

  1. 2018-3-21李宏毅机器学习视频笔记(十二)--Backpropagation

    视频来源: 李宏毅机器学习(2017)_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili https://www.bilibili.com/video/av10590361/?p=14 复合函数求偏 ...

  2. 2018-3-20李宏毅机器学习笔记十----------Logistic Regression

    上节讲到:既然是一个直线型,只需要求解w和b.为何还要那么费劲的使用概率??? 视频:李宏毅机器学习(2017)_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili https://www.bilib ...

  3. 2018-3-21李宏毅机器学习笔记十一-----Brief Introduction of Deep Learning?

    我觉的有用的: BP神经网络_百度百科 https://baike.baidu.com/item/BP%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C/4581827?fr=a ...

  4. 2018-3-19李宏毅机器学习视频学习笔记九----Classification: Probabilistic Generative Model

    视频来源: 李宏毅机器学习(2017)_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili https://www.bilibili.com/video/av10590361/?p=10 步骤: (1 ...

  5. 201-3-19李宏毅机器学习视频笔记七(游戏解释Gradient Descent)

    视频部分: 视频7:使用帝国时代游戏解释Gradient Descent 李宏毅机器学习(2017)_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili https://www.bilibili.co ...

  6. 李宏毅机器学习笔记六——Gradient Descent

    视频来源: 李宏毅机器学习(2017)_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili https://www.bilibili.com/video/av10590361/?p=6 使用GD的注意 ...

  7. 李宏毅机器学习笔记(五)-----Where does the error come from

    视频来源: 李宏毅机器学习(2017)_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili https://www.bilibili.com/video/av10590361/?p=5 functio ...

  8. 李宏毅笔记机器学习(四)——Regression——Demo

    视频来源: 李宏毅机器学习(2017)_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili https://www.bilibili.com/video/av10590361/?p=4 重点: (1) ...

  9. 李宏毅机器学习笔记(三)——Regression: output a scalar amp;amp; Gradient Descent

    视频来源: 李宏毅机器学习(2017)_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili https://www.bilibili.com/video/av10590361/?p=3 机器学习的目的 ...

最新文章

  1. python常用单词汇总_在.txt文件中找到最常用单词的Python程序必须打印word及其连接...
  2. 张洁的新书「流浪的老狗」
  3. 【Pytorch神经网络实战案例】16 条件WGAN模型生成可控Fashon-MNST模拟数据
  4. 浅谈点击信号对搜索的影响
  5. 架构师一般做到多少岁_《迷茫中的我们该如何突破瓶颈——成长为一名架构师》...
  6. 【https】keystore was tampered with or password was incorrect
  7. 【转】零拷贝的实现原理
  8. Windows 不能在 本地计算机 启动 SQL Server(MSSQLSERVER) 10048
  9. spark算子大全glom_Spark 算子- Value Transformation
  10. 微博登录及删除粉丝/转发/评论的脚本[更新中]
  11. css div背景图大小,divcss如何改变背景图片大小
  12. 接力和隔空投送无效、handoff airdrop无效
  13. layui.layim
  14. Java编程:Integer的取值范围(-2^31~2^31-1)分析
  15. ros移动机器人,激光雷达里程计rf2o_laser_odometry的使用与分析
  16. html5自适应网站模板
  17. C语言入门——递归(思想简要讲解+简单递归练习)
  18. 郑智的最后一场亚洲杯哭成泪人 老队长不易
  19. wave6000可以c语言编程吗,WAVE6000使用方法
  20. 小程序压缩视频 使用微信的compressVideo进行压缩,计算分辨率和码率关系进行压缩效果挺好

热门文章

  1. Accumulation
  2. 阿里云官网网址URL链接后面的spm是什么参数?有什么作用?
  3. Google AAB测试
  4. 2C4T与4C4T在计算密集型任务下的效率对比
  5. 你有没有过那种明知是对的但却没能去做的事?
  6. 南开大学张昊计算机,张昊(东北大学工商管理学院副教授)_百度百科
  7. PS室内植物素材合成教程分享骞
  8. 计算机促销策划方案,电脑促销活动方案 2017暑假电脑促销活动方案
  9. TCP序列号和确认号
  10. Nature:鲍哲南团队研发新型可穿戴显示器,电子皮肤时代加速到来