一、数字音频三要素

1.采样率

采样率即采样频率,指的一秒内的采样次数,它反映了采样点之间的间隔大小。常说的 44.1KHz 采样率,也即 1 秒采集了 44100 个样本。间隔越小,丢失的信息越少,数字声音就越逼真细腻,要求的存储量也就越大。由于计算机的工作速度和存储容量有限,而且人耳的听觉上限为20kHz,所以采样频率不可能也不需要太高。根据奈奎斯特采样定律,只要采样频率高于信号中最高频率的两倍,就可以从采样中恢复原始的波形。因此,40kHz以上的采样频率足以使人满意。

在实际应用中,我们为了平衡带宽和音质,不同场景往往会有不同的选择。常见的选择如下:

2.采样位深

位深又叫做量化位数、采样位数、分辨率,它是指声音的连续强度被数字表示后可以分为多少级。N-bit的意思声音的强度被均分为2^N级。16-bit的话,就是65535级。这是一个很大的数了,人可能也分辨不出六万五千五百三十五分之一的音强差别。也可以说是声卡的分辨率,它的数值越大,分辨率也就越高,所发出声音的能力越强。原则上,这个值也是大一些比较好,但是记录的数据量也会成倍增长。

和采样率的选择类似,虽然理论上来说位深越大越好,但是综合带宽、存储、实际听感的考虑,我们应该为不同场景选用不同的位深:

3.声道数

声音记录只产生一个波形,称为单声道。声音记录只产生两个波形,称为立体声双道(最基本的立体声是两声道:左声道、右声道)。立体声比单声道声音丰满、空间感强,但需要两倍的存储空间。

二、音频码率

数字音频的三要素不仅影响音频质量,也会影响音频存储、传输所需的空间、带宽。而实际应用场景下,音质决定用户体验、带宽决定成本,都是我们必须考虑到。音质可能更多是主观上的感受,但带宽、空间是比较容易量化的,我们需要了解音频码率的概念。

音频码率,又称为比特率,指的是单位时间内(一般为1s)所包含的音频数据量,可以通过公式计算。比如采样率 44.1KHz,位深16bit的双声道音频PCM数据,它的原始码率为:

原始码率 = 采样率/s x 位深/bit x 声道数 x 时长(1s)=44.1x1000x16x2x1 = 1411200 bps = 1411.2 kbps = 1.411 Mbps (需要注意单位之间的差异和转换,b=bit)

如果一个PCM文件时长为1分钟,则传输/存储这个文件需要的数据量为:1.411 Mbps * 60s = 86.46Mb。

需要注意的是,上述计算结果是未经压缩的、原始音频PCM数据的码率。RTC场景下,往往还需要再使用 AAC、OPUS 等编码算法做编码压缩,进一步减小带宽、存储的压力。码率的选择也是一个综合质量和成本的博弈,以后我们会详细讲解音频编码的知识,此处大家先了解即可。

三、wav、mp3、pcm文件的组成部分

1.wav文件格式

wav是一种无损的音频文件格式,wav文件格式是用于多媒体文件存储的微软RIFF规范的一个子集。一个RIFF文件从一个文件头开始,后面是一系列的数据块。一个wav文件通常只是一个带有单一"WAVE"块的RIFF文件。"WAVE"块是由两个子块组成的,一个是指定数据格式的“fmt”块和另一个是包含实际样本数据的数据块。这种形式被称为是“规范形式”("Canonical form")。具体格式如图所示:

上图中的data区域就是就是真正的数据部分,data上面的44字节是文件头,其文件头格式可以用下面的结构体表示:

typedef struct WAV_HEADER_S
{  char            riffType[4];    //4byte,资源交换文件标志:RIFF     unsigned int    riffSize;       //4byte,从下个地址到文件结尾的总字节数   char            waveType[4];    //4byte,wav文件标志:WAVE      char            formatType[4];  //4byte,波形文件标志:FMT(最后一位空格符)   unsigned int    formatSize;     //4byte,音频属性(compressionCode,numChannels,sampleRate,bytesPerSecond,blockAlign,bitsPerSample)所占字节数  unsigned short  compressionCode;//2byte,格式种类(1-线性pcm-WAVE_FORMAT_PCM,WAVEFORMAT_ADPCM)  unsigned short  numChannels;    //2byte,通道数  unsigned int    sampleRate;     //4byte,采样率  unsigned int    bytesPerSecond; //4byte,传输速率  unsigned short  blockAlign;     //2byte,数据块的对齐,即DATA数据块长度  unsigned short  bitsPerSample;  //2byte,采样精度-PCM位宽  char            dataType[4];    //4byte,数据标志:data  unsigned int    dataSize;       //4byte,从下个地址到文件结尾的总字节数,即除了wav header以外的pcm data length
}WAV_HEADER;  

2.pcm文件格式

PCM(Pulse Code Modulation----脉码调制录音)。所谓PCM录音就是将声音等模拟信号变成符号化的脉冲列,再予以记录。PCM信号是由[1]、[0]等符号构成的数字信号,而未经过任何编码和压缩处理。与模拟信号比,它不易受传送系统的杂波及失真的影响。动态范围宽,可得到音质相当好的影响效果。在音视频中,PCM是一种用数字表示采样模拟信号的方法。

3.mp3文件格式

MP3是一个数据压缩格式,

4.wav与pcm文件的相互转换

WAV可以使用多种音频编码来压缩其音频流,不过我们常见的都是音频流被PCM编码处理的WAV,但这不表示WAV只能使用PCM编码,MP3编码同样也可以运用在WAV中,和AVI一样,只要安装好了相应的Decode,就可以欣赏这些WAV了。在Windows平台下,基于PCM编码的WAV是被支持得最好的音频格式,所有音频软件都能完美支持,由于本身可以达到较高的音质的要求,因此,WAV也是音乐编辑创作的首选格式,适合保存音乐素材。因此,基于PCM编码的WAV被作为了一种中介的格式,常常使用在其他编码的相互转换之中,例如MP3转换成WMA。

简单来说:pcm是无损wav文件中音频数据的一种编码方式,但wav还可以用其它方式编码。

(1)wav转pcm,原理就是将文件头去掉,数据转成int型即可。

(2)pcm转wav,原理就是利用wave库,添加通道信息、采样位数、采样率等信息作为文件头,pcm数据直接写入即可。

音频文件PCM、WAV、MP3的区别以及文件合并相关推荐

  1. 程序人生 - 音频格式 PCM、WAV、MP3 区别

    PCM PCM(Pulse Code Modulation----脉码调制录音).所谓PCM录音就是将声音等模拟信号变成符号化的脉冲列,再予以记录.PCM信号是由[1].[0]等符号构成的数字信号,而 ...

  2. Java pcm/wav文件转mp3(流的方式)

    项目场景: pcm与wav文件是无损音质,几分钟的文件就高达20几M,要求将pcm/wav文件转mp3文件,既完成文件的压缩,又不影响使用. 解决方案 网上找了很多例子,大都是Lame与FFmpeg, ...

  3. 【数字音频】WAV和PCM的关系和区别

    作者:张明云 链接:https://www.jianshu.com/p/1d1f893e53e9 來源:简书 什么是WAV和PCM? WAV:wav是一种无损的音频文件格式,WAV符合 PIFF(Re ...

  4. Android如何将采集到的音频PCM文件转为WAV并保存

    1.Android音频采集 添加权限 <uses-permission android:name="android.permission.RECORD_AUDIO" /> ...

  5. linux文件系统添加pcm,linux下用sox批量将pcm文件加wav头、批量修改采样率、切音频...

    linux下用sox可以给pcm文件加头 例如:test.pcm是不带wav头的pcm文件 $ sox -t raw -c 1 -e signed-integer -b 16 -r 16000 tes ...

  6. ffmpeg 解码音频(aac、mp3)输出pcm文件

    ffmpeg 解码音频(aac.mp3)输出pcm文件 播放pcm可以参考: ffplay -ar 48000 -ac 2 -f f32le out.pcm main.c #include <s ...

  7. PCM音频数据封装为WAV文件

    ------------------------------------全系列文章目录------------------------------------ PCM(Pulse Code Modul ...

  8. 多种音频文件(.wav, .mp3, .ogg)转化为wav文件,支持分、秒级别切分

    多种音频文件(.wav, .mp3, .ogg)转化为wav文件,支持分.秒级别切分 需求:调用python脚本,输入源文件路径.目标路径.切割的时长.切割时长的时间单位,能够将对应路径的源音频文件按 ...

  9. 使用lame对音频文件PCM进行转码为MP3格式

    1.LAME简介 LAME是目前非常优秀的一种MP3编码引擎,可以把音频文件转为MP3格式.当达到320Kbit/s以上时,LAME编码出来的音频质量几乎可以和CD的音质相媲美,并且能保证整个音频文件 ...

最新文章

  1. 两成开发者月薪超 1.7 万、算法工程师最紧缺! | 中国开发者年度报告
  2. 2021-03-12 控制三大顶会
  3. 开发板屏幕截图-适用于本公司海思和智源平台
  4. binaryviewer java_用java实现java的2进制文件字节序转换到C/C++的2进制文件字节序
  5. mybatis笔记之一次插入多条数据sql语句写法
  6. RapidIOIP核的验证方法研究_王玉欢
  7. 转载︱案例 基于贪心算法的特征选择
  8. 7. Nginx 预定义变量
  9. linux内核虚拟内存之物理内存
  10. 服务器双硬盘系统安装系统安装,固态机械混合安装教程!双硬盘安装系统的方法...
  11. 随心玩玩(一)易语言 大漠插件 制作脚本从入门到摔门而出(更完)
  12. Jmeter 中的BeanShell使用
  13. pentium500微型计算机,pentium g6950_pentium500微型计算机_pentium ivcpu时钟频率(2)
  14. Navicat 解决问题:提示No All Pattern Found File Already Patched?
  15. der解码规则_[转] DER编码和ASN.1
  16. vant 底部导航栏 中间凸起
  17. jQuery 08-13
  18. CMake设置Visual Studio工程的调试环境变量和工作目录cwd的方法
  19. Python学习——绘制世界人口地图
  20. 华为云配置https访问

热门文章

  1. centos8系统influxdb2修改默认端口8086
  2. Box2D-Lite源码阅读笔记(7)
  3. php需要的开发工具,PHP需要用到的一些开发工具
  4. 达人评测r7 7700x和i7 12700K选哪个好
  5. 李开复:关于如何打造领导力,我的九点思考
  6. php网页视频播放插件下载_php 网页播放器用来播放在线视频的代码(自动判断并选择视频文件类型)...
  7. Excel2010多窗口显示(修改注册表方法+脚本执行方法)
  8. [ITSS]信息技术服务标准详解
  9. 亚马逊美国站对CPC认证有什么要求
  10. 智能语音生活助手实现(QT)