系列文章目录

  • Delay Line 简介及其 C/C++ 实现
  • LFO 低频振荡器简介及其 C/C++ 实现
  • 【音效处理】Delay/Echo 算法简介
  • 【音效处理】Vibrato 算法简介
  • 【音效处理】Reverb 混响算法简介
  • 【音效处理】Compressor 压缩器算法简介
  • 【音频处理】Fast Convolution 快速卷积算法简介
  • 【音效处理】Channel Vocoder 算法简介

0. 前言

关于响度的概念,以及响度标准化 EBU R.128 的讨论,网上已经有很多优秀的博客了,我就不再赘述了。这里我列举我看到过的还不错的文章,供各位参考:

  • 音频 响度标准化 EBU R.128
  • 关于响度的拾遗
  • The Audio Producer’s Guide To Loudness
  • LUFS VS. dB: What’s the Difference?

看完这些介绍,你对响度或多或少已经有了些概念,它是对声音强度的一种描述,它是一种「主观」的心理量,影响因素包括很多,例如信号持续时长、频率特征、声场特性等等。

为了测量出音频的响度,有很多组织提出了不同的标准,今天我们要介绍的是由 EBU(European Broadcasting Union,欧洲广播联盟)提出的 EBU-R128 标准。通过该标准提出的算法,我们可以检测出关于响度的各种信息。具体的包括:

  • Momentary loudness:瞬时响度,即最近 400ms 的响度
  • Short-term loudness:短时响度,即最近 3s 的响度
  • Integrated loudness:从开始到现在的平均响度
  • Loudness range:响度范围,即响度变化的量化值
  • True Peak:真实峰值电平

这些值都有一套算法来计算,你可以参考 ITU-R BS.1770 或者 MATLAB-loudnessMeter 来了解具体算法流程。ebur128 提供响度检测的 C/C++ 实现,如果你想知道算法的实现细节,这份代码不要错过。响度检测算法不是这篇文章的重点,此处不再赘述。

Loudness Normalization 响度均衡

在有统一的响度标准以前,音量归一化通常是通过观察信号的峰值信号来进行的(Peak Normalization),即添加一个增益,使得 PCM 采样中的峰值达到一个给定的水平 – 通常是 0dBFS,即数字系统中允许的最响的水平。由于 Peak Normalization 它只关心信号峰值,所以单单 Peak Normalization 的结果并不能准确反映音频内容的响度。因此 Peak Normalization 通常用来改变音量,以确保数字录音的母带制作阶段有最佳的可用动态范围。然而,在 Limiter/Compressor 处理后再使用 Peak Normalization
,可用让音频更响。这种使用方式在一段时间内称为某种趋势,大家都希望自己的音频内容更响,从而吸引人们的耳朵。但其引发的结果就是「响度战争」。

另一种是基于响度的归一化,同样地往音频中添加一个增益,使得音频整体平均响度达到一定的水平。这个平均响度是可以近似的,如平均功率的简单计算(RMS),也可是准确的,例如 EBU R128 定义的响度。

响度均衡可以解决一连串多首歌曲响度不同的问题。在响度均衡前,播放列表中的一首歌可能必其他歌曲更加安静,所以听众必须将调整音量。

Offline Loudness Normalization 离线响度均衡

Offline 模式的响度均衡,也叫 Double Pass 模式,意思是你要处理音频两次

  • 第一次处理,获取音频 Integrated loudness,True peak 等信息
  • 第二次处理,输入 Target loudness(目标响度),以及上一步得到的 Integrated loudness, 算法将根据两个响度之间的差异,进行合适的增益。

如果你能拿到全部音频数据的情况下,这种处理方式是最佳的,但由于要处理音频两遍,耗时会增加。

伪代码如下:

auto audio_file = getAudioFile();// first pass
auto loudnessDetection()
{for(;;){auto block = getNextAudioBlock(audio_file);ebur128Process(block);if(reachAudioEnd(audio_file)){break;}}auto integrated_loudness = ebur128GetIntegratedLoudness();auto loudness_range = ebur128GetLoudnessRange();auto true_peak = ebur128GetTruePeak();return {integrated_loudness, loudness_range, true_peak};
}// second pass
auto lourdNormProcess(float integrated_loudness, float loudness_range,float true_peak,float target_loudness)
{auto gain = calcGain(integrated_loudness, loudness_range, true_peak, target_loudness);audio_file.applyGain(gain);
}

第一次的音频处理,目的在于检测当前音频的响度信息,你使用 ebur128 - github 即可,并不复杂。而第二次处理,却有不少细节需要考虑。

第二次要如何处理呢?我找到的最简单的方案来自于 Loudness Normalization in Accordance with EBU R 128 Standard,即将目标响度与输入响度差异,作为增益,在 pyloudnorm 中也使用了这种方案:

target = -23;
gaindB = target - loudness;
gain = 10^(gaindB/20);
xn = x.*gain;

但很明显,这种方案可能会导致爆音(clip),当音频中某些采样点经过增益后,其值超过了 1.0 那么爆音就发生了。

那么如何进行优化?在 Recommendation for Loudness of Audio Streaming and Network File Playback 中给出了两种可行的方案。

方案一。确定目标响度与输入响度的差异,如果必须降低电平以符合目标响度,那么没有问题,直接按上面的方法计算增益即可。如果必须提升电平以符合目标响度,那么增益的计算需要考虑 True Peak,使得它满足目标响度或者让 True Peak 达到 0db TP。这种处理方式可以尽可能保留声音质量,不会引入峰值限制。但在一些具有搞 Loudnss Range 的音频中,这样处理后的音频响度会低于目标响度。计算增益部分伪代码:

float calcGain(float integrated_loudness,float true_peak,float target_loudness)
{auto peak_diff = 1.0f - true_peak;auto peak_gain_db = scaleToDb(peak_diff);auto loud_gain_db = target_loudness - integrated_loudness;auto gain_db = min(peak_gain_db, loud_gain_db);return dbToScale(gain_db);
}

方案二。在方案一中,我们不想让信号的峰值出现 clip,因此在计算增益时要考虑 true peak。对于峰值的限制,我们完全可以交给 Limiter 来做。因此在方案二中,增益使用目标响度与输入响度的差异计算,接着让 Limiter 来进行增益的提升,避免 clip。这样做的好处是响度更加一致,但会引入更多峰值限制,从而影响声音质量。当我们的目标响度较低时,方案一仍然是最佳方法。方案二伪代码如下:

void loudnormWithLimiter(float integrated_loudness,float target_loudness)
{auto gain_db = target_loudness - integrated_loudness;auto limiter = Limiter();limiter.input_gain_db = gain_db;limiter.process(audio_file);
}

Live Loudness Normalization 实时响度均衡

在直播这样的场景下,音频可以认为是无限长的,你无法拿到全部音频数据,因此 Offline 模式在这种场景下无法工作。对于实时的音频流,EBU R128 定义瞬时响度和短时响度,我们可以根据它们来调整信号的增益。伪代码如下:

void loudnormProcess(float target_loudness)
{for(;;){auto block = getAudioBlockFromStream();ebur128Process(block);auto momentary = ebur128GetMomentary();auto short_term = ebur128GetShortterm();auto gain = calcGain(momentary, short_term, target_loudness);block.applyGain(gain);if(noAudioStream())break;}
}

实时响度均衡中,如何做增益控制有着不同的方案,例如在 Loudness Normalization in Accordance with EBU R 128 Standard 中使用了 AGC 来自动控制增益;在FFMPEG - af_loudnorm.c 中,检测短时响度与目标响度的差异,计算得到增益,并结合 Limiter 进行增益控制;在 esayeffects - autogain 中,则可以选择用短时响度还是瞬时响度,或者它们结合,来计算增益。总之,这一块目前似乎没有一个统一的方案,查找对应的论文也寥寥无几。

在个人的实现中,我选择短时响度 + Limiter 的实现方案,因为这样最简单,没有复杂的逻辑。但我没有做大范围的测试,该方案可能存在 bad case。


总结

本文重点介绍了响度均衡算法的处理方式,分为离线模式和实时模式。离线响度均衡需要处理两遍音频,第一遍获取音频响度信息,第二遍进行音频的增益控制;实时响度均衡通常结合瞬时响度或者短时响度来计算增益,如何进行增益控制,这部分业界有着不同的做法。


参考

  • 音频 响度标准化 EBU R.128
  • 关于响度的拾遗
  • The Audio Producer’s Guide To Loudness
  • LUFS VS. dB: What’s the Difference?
  • LOUDNESS METERING: ‘EBU MODE’ METERING TO SUPPLEMENT EBU R 128 LOUDNESS NORMALIZATION
  • ITU-R BS.1770
  • Audio normalization - Wikipedia
  • ebur128 - github
  • Loudness Normalization in Accordance with EBU R 128 Standard
  • Recommendation for Loudness of Audio Streaming and Network File Playback
  • FFMPEG - af_loudnorm.c
  • Audio Loudness Normalization With FFmpeg
  • loudnorm
  • esayeffects - autogain

【音频处理】Loudness Normalization 响度均衡算法简介相关推荐

  1. 分布式系统常见负载均衡算法

    一.概要 随着系统日益庞大.逻辑业务越来越复杂,系统架构由原来的单一系统到垂直系统,发展到现在的分布式系统.分布式系统中,可以做到公共业务模块的高可用,高容错性,高扩展性,然而,当系统越来越复杂时,需 ...

  2. [解决] 电脑没有Realtek 音频管理器 响度均衡

    前言:在一次对电脑进行大更新之后,包括Realtek 音频管理器变为了 Realtek Audio Control 之后,响度均衡就彻底没有了. 因为没有响度均衡,我的电脑的发声在很多情况下声音过小, ...

  3. 【音频处理】Channel Vocoder 算法简介

    系列文章目录 Delay Line 简介及其 C/C++ 实现 LFO 低频振荡器简介及其 C/C++ 实现 [音效处理]Delay/Echo 算法简介 [音效处理]Vibrato 算法简介 [音效处 ...

  4. java轮训算法_负载均衡算法WeightedRoundRobin(加权轮询)简介及算法实现

    Nginx的负载均衡默认算法是加权轮询算法,本文简单介绍算法的逻辑,并给出算法的Java实现版本. 算法简介 有三个节点{a, b, c},他们的权重分别是{a=5, b=1, c=1}.发送7次请求 ...

  5. EOF-DataScience:数据预处理/特征工程之线性变换—四种特征缩放Scaling算法简介、标准化standardization、归一化Normalization的概述与区别

    DataScience:数据预处理/特征工程之线性变换-四种特征缩放Scaling算法简介.标准化standardization.归一化Normalization的概述与区别 目录 数据处理中常见的四 ...

  6. 【音效处理】Compressor 压缩器算法简介

    系列文章目录 Delay Line 简介及其 C/C++ 实现 LFO 低频振荡器简介及其 C/C++ 实现 [音效处理]Delay/Echo 算法简介 [音效处理]Vibrato 算法简介 [音效处 ...

  7. LoRaWAN ADR (自适应速率) 算法简介及最新研究方向

    LoRaWAN ADR 自适应速率 算法简介及最新研究方向 1. 背景: 1.1 ADR简介 1.2 LoRaWan NS 1.3 ADR目标 1.4 ADR应用场景 2. ADR实现方式.原理: 3 ...

  8. 自古帝王多短命,假如皇帝也懂负载均衡算法...

    " 大家都知道古代皇帝各个都是后宫佳丽三千,而皇帝身上都天然的带着雨露均沾的精神,不想单独的宠爱一人! 来自:51cto技术栈 弱水三千,又怎舍得只取一瓢饮?据传皇帝们晚上睡觉个个都怕冷,因 ...

  9. hash算法_一致性hash算法简介

    一致性hash算法有什么用?我们为什么需要一致性hash算法?这两个问题的答案可以看这篇文章 分布式系统路由算法简介. 了解了一致性hash算法出现的背景,我们来看看什么是一致性hash算法.一致性h ...

最新文章

  1. Kubernetes中的nodePort,targetPort,port的区别和意义
  2. memcpy和strcpy的区别及memcmp和strcmp的区别
  3. BitBlt和StretchBlt的区别
  4. 关于css的text-indent首行缩进两个字符和图片缩进的问题
  5. 关于计算机的网络作文,关于网络世界的作文
  6. 备份linux系统报错_Linux 系统如何快速入门?分享民工哥总结的经验
  7. 关于链表逆置的递归和迭代方法
  8. 翻译:iOS Swift单元测试 从入门到精通 Unit Test和UI测试 UITest
  9. lopatkin俄大神精简中文系统Windows 10 Enterprise 2016 LTSB 14393.479 x86-x64 ZH-CN PIP
  10. 屏幕共享软件都有什么功能呢?
  11. Ubuntu升级Ruby
  12. C++模拟鼠标键盘操作(转)
  13. 手机计算机数据消失了怎么恢复,手机数据丢失的恢复方法
  14. 经典策略之Dual Trust策略
  15. java csrf 跨域_Django跨域请求CSRF的实例方法
  16. 读书笔记:《活出生命的意义》
  17. 手动制作满足SARscape要求的_dem数据
  18. win7局域网自建ftp服务器,win7系统搭建FTp服务器局域网内传输文件的解决教程
  19. 测试人跳槽~怎么说离职原因新的公司比较能接受?
  20. w10系统excel服务器,win10系统下excel如何制作表格

热门文章

  1. java 线程(二)线程常用方法
  2. 扩展坞+平板=笔记本?
  3. 互联网晚报 | 乐华娱乐回应被列入经营异常;美团否认广州骑手满员停止招聘;苹果iPhone 15 Pro设计图曝光...
  4. docker升级至指定版本
  5. 手机充电一夜不拔会影响手机寿命吗?
  6. webpack 打包图片文件
  7. java mongodb条件查询_java 操作mongodb查询条件的常用设置
  8. android 仿微信头像裁剪,Android仿微信QQ设置图形头像裁剪功能
  9. 计算机毕业设计Java演唱会门票订售及管理系统(源码+系统+mysql数据库+Lw文档)
  10. 南亚风情第壹城非遗文化节,一站式休闲首选之地