声事件识别之时域短时过零率
一、 概念介绍
短时过零率可以看做信号频率的简单度量,是谱特性的一种粗略估计。
(1) 过零就是指信号通过零值。过零率就是指每秒内信号值通过零值的次数
(2) 对于离散时间序列,过零则是指信号取样值改变符号,过零率则是每个样本改变符号的次数。对于声音信号,则是指一帧声音中语声音信号波形穿过横轴的次数,可以用相邻两个取样值改变符号的次数来计算。
二、 计算公式
其中,N是一帧的采样点数,sgn[ ]为符号函数,即
三、 MATLAB程序
sgn.m
%% sgm.m
function z = sgn(x)
if x>=0z=1;
elsez=-1;
end
短时过零率提取程序
clear all
clf
close all
[x fs]=audioread('D:\experiment\soundclassify\training\glass\2.wav'); %读取音频信号 x为信号样本,fs信号采样频率
%%%%%%%%%%%%%判断并合并单双声道%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%if size(x,2)>1x=x(:,1);
endframe=enframe(x,1024,512);%分帧 帧长1024 帧移512
zcr_sum=0;%变量保存过零点数
for i=1:size(frame,1) y=frame(i,:);%每帧数据 s=y'.*hamming(1024);%加汉明窗窗
%%%%%%%%%%%%%%%%%%%%%计算过零率%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% for j=1:size(s,1)-1 zcr_sum=zcr_sum+abs(sgn(s(j+1))-sgn(s(j))); end zcr_sum=zcr_sum/2; m(:,i) = zcr_sum;%将每帧的过零率保存到变量m中
end
figure(1)
plot(m)
xlabel('帧数/帧');
ylabel('过零数');
title('短时平均过零率')
(有错误,请批评指正)
声事件识别之时域短时过零率相关推荐
- 语音短时过零率计算——Python实现
概念 上一篇文章介绍了语音短时能量,这篇介绍一下语音的短时过零率.短时过零率也是一个比较基础的语音时域特征,下面就来介绍一下. 短时过零率就是单位时间穿过坐标系横轴的次数,计算公式如下: Zn=∑m= ...
- 音频信号特征提取(1):短时特征之短时能量、短时功率、短时过零率
特征提取(Feature Exaction)的重要性,就不用多说了. 对于音频信号,按时间分辨率.按局部or全局的观念.持续时间长短,或者爱怎么讲怎么讲,特征可分为长期(long-term).中期(m ...
- python求语音信号短时能量、短时过零率、语谱图
python语音信号处理(二) 一.短时能量 短时能量主要用于区分浊音段和清音段,因为浊音时E(i)值比清音时大得多:区分声母与韵母的分界和无话段与有话段分界. 计算第i帧语音信号yi(n)的短时能量 ...
- matlab短时过零率计算+源代码
[xx,Fs]=audioread('mei.wav'); % 读入数据文件 x=xx-mean(xx); % 消除直流分量 wlen=200; inc=80; % 设置帧长.帧移 win=hanni ...
- 声纹识别技术发展现状及未来五大发展趋势
走出实验室的声纹识别技术因其广阔的应用场景和价值,从特定领域到民用领域,在国内外正迎来第一波商用化浪潮. 而与此同时,关于声纹识别技术研究的成熟度以及安全可靠性,一直是应用领域讨论的重点,本文基于时下 ...
- 声纹识别技术五大发展趋势总结
走出实验室的声纹识别技术因其广阔的应用场景和价值,从特定领域到民用领域,在国内外正迎来第一波商用化浪潮. 而与此同时,关于声纹识别技术研究的成熟度以及安全可靠性,一直是应用领域讨论的重点,本文基于时下 ...
- 语音识别-过零率和短时能量-端点检测
端点检测 个人理解 能量与过零数的端点检测算法步骤 语音信号x(n)进行分帧处理 计算每一帧的短时能量,得到语音的短时帧能量 计算每一帧语音的过零数,得到短时帧过零数 考擦语音的平均能量设置一个较高的 ...
- matlab 端点检测 能零比法_基于短时能量与过零率的端点检测的matlab分析
基于语音端点检测的方法有很多,从历史的发展来看. 首先是基于短时能量和短视过零率的端点检测=〉各变换域=〉人工神经网络=〉基于倒谱距离的检测算法=〉基于谱熵的方法=〉几何门限的方法=〉sigma函数= ...
- 说话人识别/声纹识别学习路径的资料整理,从零学声纹识别
这是2年前我的总结,有点与最新方法和方向脱轨, 这两年内声纹识别/说话人识别已经又有很多新的方法出现, 等我看看论文和一些实验, 后面更新一波声纹识别的东西 ===================== ...
- [深度学习概念]·声纹识别技术简介
声纹识别技术简介 声纹识别,也称作说话人识别,是一种通过声音判别说话人身份的技术.从直觉上来说,声纹虽然不像人脸.指纹的个体差异那样直观可见,但由于每个人的声道.口腔和鼻腔也具有个体的差异性,因此反映 ...
最新文章
- python3.6安装版本选择
- spring boot 添加mybatis,以及相关配置
- nuxt2中使用less
- 恩智浦智能车大赛2020_内蒙古科技大学第九届智能车大赛校内公开赛总决赛
- es 删除重复数据_怎么标识并删除SPSS数据库里的“重复个案”?
- FastJson的使用方法总结
- HTML5新的javascript选择器
- 5 多数据save_[Python] 通过采集两万条数据,对无名之辈影评分析
- 网络安全公司的源代码遭泄露,售价25万美元
- Spark streaming消费Kafka的正确姿势
- 脚本——监控打印服务
- VS2003安装步骤及其错误
- 国外计算机核心期刊易读,国内英语写作研究现状的文献综述——对十大外语类核心期刊近五年(2012-2016)的统计分析...
- JS中各种width和height的区别
- Maven入门教程(十七)-Maven多Moudle项目创建
- 用python turtle画画草地天空星星花朵小草
- 工程制图 ( 制图的基本知识和基本技能)
- 爱普生 RS330 打印机墨水连供装置墨盒吸墨复位方法
- 无锡设计培训——室设行业现状与发展前景
- vga转html电脑打不开,HDMI转VGA常见故障及排除方法?
热门文章
- 可以丢掉SGD和Adam了,新的深度学习优化器Ranger:RAdam + LookAhead强强结合
- carry-lookahead adder 超前进位加法器
- Unable to instantiate service com.baidu.android.pushservice.PushService: java.lang.ClassNotFoundExc
- android gsm功能,Android手机-GSM网络与WCDMA网络选择的设置
- 人生的意义到底是什么?
- OneNote | OneNote 备份(线上+本地)
- c语言程序转换成单片机语言,STC12C2052AD单片机AD转换C语言程序(成功)
- BUCT2021年ACM竞赛班训练(四)全题解(0x3f3f3f3f)
- Linux学习第一节课学习心得
- 搜狗站长工具【post请求模拟登录】代码分享总结【批量提交搜狗收录网址】