##关键词


AVAsset MP3 PCM 格式 音频 采样 AVAssetReader AVAssetWriter 输出 转换

本文所有示例代码或Demo可以在此获取:https://github.com/WillieWangWei/SampleCode_MP3ToPCM

如果本文对你有所帮助,请给个Star?

##概述


**本文仅讲解所用技术的基本概念以及将MP3转成PCM格式的实际应用,**其他格式的相互转换可以修改示例代码实现。关于AVAsset的其他使用场景可以参考这里,音频相关的内容可以参考这里。

首先了解一些概念:
#####AVAsset
它包含于AVFoundation,是一个不可变的抽象类,用来代表一个音视频媒体。一个AVAsset实例可能包含着一个或多个用来播放或处理的轨道,包含但不限于音频、视频、文本以及相关说明。但它并不是媒体资源本身,可以将它理解为时基媒体的容器。

#####AVAssetReader
我们可以使用一个AVAssetReader实例从一个AVAsset的实例中获取媒体数据。

#####AVAssetReaderAudioMixOutput
它是AVAssetReaderOutput的一个子类,我们可以将一个AVAssetReaderAudioMixOutput的实例绑定到一个AVAssetReader实例上,从而得到这个AVAssetReader实例的asset的音频采样数据。

#####AVAssetWriter
我们可以使用一个AVAssetWriter实例将媒体数据写入一个新的文件,并为其指定类型。

#####AVAssetWriterInput
我们可以将一个AVAssetWriterInput的实例绑定到一个AVAssetWriter实例上,从而将媒体采样包装成CMSampleBuffer对象或者元数据集合,然后添加到输出文件的单一通道上。

#####PCM
模拟音频信号经模数转换(A/D变换)直接形成的二进制序列,PCM就是录制声音时保存的最原始的声音数据格式。
WAV格式的音频其实就是给PCM数据流加上一段header数据。而WAV格式有时候之所以被称为无损格式,就是因为它保存的是原始PCM数据(也跟采样率比特率有关)。常见音频格式比如MP3AAC等等,为了节约占用空间都进行有损压缩。

##代码


这里列举两种应用场景:

  1. PCM数据写入磁盘保存成文件。
  2. PCM数据转成NSDate保存在内存中。

这两种场景都需要先读取MP3的数据,然后创建AVAssetReaderAVAssetReaderAudioMixOutput实例,所以前半部分的处理逻辑的一样的。

#####通用逻辑
0.导入头文件

import AVFoundation

1.创建AVAsset实例

func readMp3File() -> AVAsset? {guard let filePath = Bundle.main.path(forResource: "trust you", ofType: "mp3") else { return nil }let fileURL = URL(fileURLWithPath: filePath)let asset = AVAsset(url: fileURL)return asset
}

2.创建AVAssetReader实例

func initAssetReader(asset: AVAsset) -> AVAssetReader? {let assetReader: AVAssetReaderdo {assetReader = try AVAssetReader(asset: asset)} catch {print(error)return nil}return assetReader
}

3.配置转码参数

var channelLayout = AudioChannelLayout()
memset(&channelLayout, 0, MemoryLayout<AudioChannelLayout>.size)
channelLayout.mChannelLayoutTag = kAudioChannelLayoutTag_Stereolet outputSettings = [AVFormatIDKey : kAudioFormatLinearPCM,    // 音频格式AVSampleRateKey : 44100.0,    // 采样率AVNumberOfChannelsKey : 2,    // 通道数 1 || 2AVChannelLayoutKey : Data.init(bytes: &channelLayout, count: MemoryLayout<AudioChannelLayout>.size),  // 声音效果(立体声)AVLinearPCMBitDepthKey : 16,  // 音频的每个样点的位数AVLinearPCMIsNonInterleaved : false,  // 音频采样是否非交错AVLinearPCMIsFloatKey : false,    // 采样信号是否浮点数AVLinearPCMIsBigEndianKey : false // 音频采用高位优先的记录格式] as [String : Any]

4.创建AVAssetReaderAudioMixOutput实例并绑定到assetReader上

let readerAudioMixOutput = AVAssetReaderAudioMixOutput(audioTracks: asset.tracks, audioSettings: nil)if !assetReader.canAdd(readerAudioMixOutput) {print("can't add readerAudioMixOutput")return
}assetReader.add(readerAudioMixOutput)

接来下两种场景的处理逻辑就不一样了,请注意区分。

#####保存成文件
5.创建一个AVAssetWriter实例

func initAssetWriter() -> AVAssetWriter? {let assetWriter: AVAssetWriterguard let outPutPath = NSSearchPathForDirectoriesInDomains(.documentDirectory, .userDomainMask, true).first else { return nil }// 这里的扩展名'.wav'只是标记了文件的打开方式,实际的编码封装格式由assetWriter的fileType决定let fullPath = outPutPath + "outPut.wav"let outPutURL = URL(fileURLWithPath: fullPath)do {assetWriter = try AVAssetWriter(outputURL: outPutURL, fileType: AVFileTypeWAVE)} catch {print(error)return nil}return assetWriter
}

6.创建AVAssetWriterInput实例并绑定到assetWriter上

if !assetWriter.canApply(outputSettings: outputSettings, forMediaType: AVMediaTypeAudio) {print("can't apply outputSettings")return
}let writerInput = AVAssetWriterInput(mediaType: AVMediaTypeAudio, outputSettings: outputSettings)// 是否让媒体数据保持实时。在此不需要开启
writerInput.expectsMediaDataInRealTime = falseif !assetWriter.canAdd(writerInput) {print("can't add writerInput")return
}assetWriter.add(writerInput)

7.启动转码

assetReader.startReading()
assetWriter.startWriting()// 开启session
guard let track = asset.tracks.first else { return }
let startTime = CMTime(seconds: 0, preferredTimescale: track.naturalTimeScale)
assetWriter.startSession(atSourceTime: startTime)let mediaInputQueue = DispatchQueue(label: "mediaInputQueue")
writerInput.requestMediaDataWhenReady(on: mediaInputQueue, using: {while writerInput.isReadyForMoreMediaData {if let nextBuffer = readerAudioMixOutput.copyNextSampleBuffer() {writerInput.append(nextBuffer)} else {writerInput.markAsFinished()assetReader.cancelReading()assetWriter.finishWriting(completionHandler: {print("write complete")})break}}
})

#####转成NSDate
5.启动转码

assetReader.startReading()
var PCMData = Data()while let nextBuffer = readerAudioMixOutput.copyNextSampleBuffer() {var audioBufferList = AudioBufferList()var blockBuffer: CMBlockBuffer?// CMSampleBuffer 转 DataCMSampleBufferGetAudioBufferListWithRetainedBlockBuffer(nextBuffer,nil,&audioBufferList,MemoryLayout<AudioBufferList>.size,nil,nil,0,&blockBuffer)let audioBuffer = audioBufferList.mBuffersguard let frame = audioBuffer.mData else { continue }PCMData.append(frame.assumingMemoryBound(to: UInt8.self), count: Int(audioBuffer.mDataByteSize))blockBuffer = nil
}print("write complete")

##注意问题


性能问题

转码是个很占用CPU资源的计算过程。
具体完成一个转码过程的时间取决于文件时长、转码配置、设备性能等多个条件。这是一个典型的耗时操作,务必要做好线程优化。另外,可以根据业务逻辑间歇调用readerAudioMixOutput.copyNextSampleBuffer()及后续操作,降低CPU开销峰值。

内存管理

以本文将MP3转成PCM的代码为例,一个时长4分半左右的MP3对应的PCM数据在55MB左右,这些数据占用了大量的内存或磁盘空间,注意释放。你可以通过改变转码配置参数outputSettings来调整输出数据的大小。
在转码过程中,CMSampleBufferRefCMBlockBufferRef的对象在使用后需要调用CFRelease销毁,以防内存泄漏。

其他格式的转换

逻辑是一样的,你可以修改读取和输出的参数实现。注意处理的格式必须是AVFoundation所包含的,可以参考AudioFormatID这个类以及AVMediaFormat.hFile format UTIs。更多音频处理请参考Apple Developer Library :AVFoundation或第三方框架。

在macOS上转换格式

macOS上可以使用一个强大的音视频库FFmpeg,它可以帮助你快速转码出需要的音频格式作为调试素材。
macOS上编译FFmpeg请看这里。
MP3转换成PCM的命令:

ffmpeg mp3 => pcm    ffmpeg -i xxx.mp3 -f s16le -ar 44100 -ac 2  xxx.pcm

##总结


本文提供了将MP3转成PCM的一种实现,中间涉及了一些音频AVFoundationCoreMedia的知识,这里就不展开了,有问题的同学可以在文章下留言讨论。

本文所有示例代码或Demo可以在此获取:https://github.com/WillieWangWei/SampleCode_MP3ToPCM

如果本文对你有所帮助,请给个Star?

参考资料:
Apple Developer Library :AVFoundation
http://msching.github.io/blog/2014/07/07/audio-in-ios/

使用AVAsset转换音频格式相关推荐

  1. 如何转换音频格式?建议收藏这几个方法

    小伙伴们平时喜欢听音乐吗?像我有时会为了方便随时随地听音乐,会将音乐音频保存在各种播放设备内.但是有时候一些播放设备就会提示说,不支持该音频格式的播放,不知道有没有小伙伴和我遇到一样的问题?像这种时候 ...

  2. 怎样用MP3转换器转换音频格式

    昨晚睡觉的时候突然脑海里闪现出一首歌曲,就是张杰的一首<秋天的童话>,于是便立刻拿起手机来听,一搜发现这首歌曲居然有很多人翻唱过,所以就一首一首的听了下去,发现有些歌曲的格式都不一样,脑子 ...

  3. 如何转换音频格式简单图文教程

    以下是一款音频转换器简单快捷的转换音频格式图文教程,有兴趣的朋友们可以参考参考. 1.下载安装:下载安装迅捷音频转换器,并将其安装至电脑中 2.运行软件:双击生成在桌面上的快捷方式,运行软件 3.添加 ...

  4. php如何转换音频格式,音频格式如何在线转换,音频转换软件

    现在歌曲.音频的格式是五花八门,我们如果需要将各类歌曲.音频的格式统一,只能采取格式转换的方法,那么音频格式如何转换呢?音频转换软件哪个比较好呢?其实转换音频格式很简单,小编这边就有一个方法可以转换音 ...

  5. 音乐格式转换软件测试工程师,音频格式转换器如何转换音频格式(新手教程)

    如何转换mp3格式,我想大部分用户对mp3格式相当熟悉:音频格式包括aac.ac3.aiff.amr.m4a.mp2.mp3.ogg.ra.au.wav.wma.mka.flac(无损).wav(无损 ...

  6. mp3转换器如何转换音频格式

    昨天晚上突然失眠了,于是便在耳边放起来陶喆的一首<爱很简单>,这首歌大家应该都听过,没有听过的,小编也推荐给你们听哦!第二天早上由于休息在家无聊就搜索查看了这一首歌曲,越是好听的歌曲翻唱的 ...

  7. 不知道音频格式转换app有哪些?手机怎么转换音频格式?

    我们有时候想要播放本地音乐,却发现有些格式并不通用,在这个音乐软件可以播放,但是去到另一个软件打开就显示格式错误,这个时候我们可以转换音频格式,转换成通用格式,想在哪个软件打开就在哪个软件打开.那么问 ...

  8. mp3格式转换器怎么用?给你快速转换音频格式的方法

    mp3格式转换器怎么用?mp3格式是众多音频格式中的其中一种,相比于其他m4a.ogg和aac等格式是更为常见的一种.也正因此mp3有更加高的兼容性,所以很多小伙伴获得别的音频文件时会选择第一时间用m ...

  9. 如何转换音频格式mp3,可以免费音频格式转换的软件

    不知小伙伴们有没有遇到过这种情况呢,从网上或别人那里下载来一首歌,想要播放却被提示该音频格式不支持播放.其实这是因为有些音频格式比较少见,播放器无法兼容识别,这时就需要把音频格式转换为我们最常用的mp ...

最新文章

  1. 在spoc上安装linux系统,郁闷,HACMP的C-SPOC没办法用
  2. 常见的web漏洞及其防范(转)
  3. 独家 | 10分钟带你上手TensorFlow实践(附代码)
  4. 【mysql】--MHA+Atlas
  5. MQTT 与 Kafka
  6. Fat Jar Eclipse Plug-In Tutorial
  7. 数论-朴素卢卡斯(Lucas)模板
  8. 同比暴增3700%!百度取代谷歌成世界第二
  9. 前端面试题汇总(css基础篇)
  10. Python实践周 A卷 试题(不印刷)
  11. mod_expires和mod_deflate的配置
  12. 无监督学习之稀疏编码,自编码
  13. CFS任务放置代码详解
  14. ionic安装和创建项目
  15. 人工智能与商业智能,区别、定位与联系
  16. 【WZOI】默写数字
  17. itchat4j -- 用Java扩展个人微信号的能力
  18. hadoop和spark HA部署
  19. Kernel panic - not syncing VFS Unable to mount root fs on
  20. python识图找图_【python 图像识别】图像识别从菜鸟

热门文章

  1. 写代码python用什么笔记本好_写代码对电脑有要求吗?什么电脑适合写代码?
  2. SRPG游戏开发(三)第二章 创建项目
  3. linux挂载文件夹哪个最好,细说linux挂载——mount,及其他……
  4. Kindle Touch 看pdf格式书籍
  5. 饥荒服务器修改mod没反应,为什么饥荒中服务器mod不能用 | 手游网游页游攻略大全...
  6. arc lint java,JavaFX 类 Arc用法及代码示例
  7. Tomcat网页乱码、控制台乱码
  8. MindMaster思维导图 - 让专业知识平面化、系统化的一个工具
  9. 台湾学计算机软件方面报什么专业,想请问各位,台湾哪间大学读软件工程比较好??...
  10. php 插入ed2k,eD2k链接