1# 音频编码 2 3开发者可以调用本模块的Native API接口,完成音频编码,即将音频PCM编码压缩成不同的格式。 4 5接口不限制PCM数据的来源,开发者可以调用麦克风录制获取、也可以导入编辑后的PCM数据,通过音频编码,输出对应格式的码流,最后封装为目标格式文件。 6 7当前支持的编码能力请参考[AVCodec支持的格式](avcodec-support-formats.md#音频编码)。 8 9**适用场景** 10 11- 音频录制 12 13 通过录制传入PCM,然后编码出对应格式的码流,最后[封装](audio-video-muxer.md#媒体数据封装)成想要的格式。 14- 音频编辑 15 16 编辑PCM后导出音频文件的场景,需要编码成对应音频格式后再[封装](audio-video-muxer.md#媒体数据封装)成文件。 17> **说明:** 18> 19> AAC编码器默认采用的VBR可变码率模式,与配置的预期参数可能存在偏差。 20 21## 开发指导 22 23详细的API说明请参考[API文档](../../reference/apis-avcodec-kit/_audio_codec.md)。 24 25参考以下示例代码,完成音频编码的全流程,包括:创建编码器、设置编码参数(采样率/码率/声道数等)、开始、刷新、重置、销毁资源。 26 27在应用开发过程中,开发者应按一定顺序调用方法,执行对应操作,否则系统可能会抛出异常或生成其他未定义的行为。具体顺序可参考下列开发步骤及对应说明。 28 29如下为音频编码调用关系图: 30 31- 虚线表示可选。 32 33- 实线表示必选。 34 35 36 37### 在 CMake 脚本中链接动态库 38 39```cmake 40target_link_libraries(sample PUBLIC libnative_media_codecbase.so) 41target_link_libraries(sample PUBLIC libnative_media_core.so) 42target_link_libraries(sample PUBLIC libnative_media_acodec.so) 43``` 44 45### 开发步骤 46 471. 添加头文件。 48 49 ```cpp 50 #include <multimedia/player_framework/native_avcodec_audiocodec.h> 51 #include <multimedia/native_audio_channel_layout.h> 52 #include <multimedia/player_framework/native_avcapability.h> 53 #include <multimedia/player_framework/native_avcodec_base.h> 54 #include <multimedia/player_framework/native_avformat.h> 55 #include <multimedia/player_framework/native_avbuffer.h> 56 ``` 57 582. 创建编码器实例对象,OH_AVCodec *为编码器实例指针。 59 60 应用可以通过名称或媒体类型创建编码器。 61 62 ```cpp 63 // c++标准库命名空间。 64 using namespace std; 65 // 通过 codecname 创建编码器。 66 OH_AVCapability *capability = OH_AVCodec_GetCapability(OH_AVCODEC_MIMETYPE_AUDIO_AAC, true); 67 const char *name = OH_AVCapability_GetName(capability); 68 OH_AVCodec *audioEnc_ = OH_AudioCodec_CreateByName(name); 69 ``` 70 71 ```cpp 72 // 设置判定是否为编码;设置true表示当前是编码。 73 bool isEncoder = true; 74 // 通过媒体类型创建编码器。 75 OH_AVCodec *audioEnc_ = OH_AudioCodec_CreateByMime(OH_AVCODEC_MIMETYPE_AUDIO_AAC, isEncoder); 76 ``` 77 78 ```cpp 79 // 初始化队列。 80 class AEncBufferSignal { 81 public: 82 std::mutex inMutex_; 83 std::mutex outMutex_; 84 std::mutex startMutex_; 85 std::condition_variable inCond_; 86 std::condition_variable outCond_; 87 std::condition_variable startCond_; 88 std::queue<uint32_t> inQueue_; 89 std::queue<uint32_t> outQueue_; 90 std::queue<OH_AVBuffer *> inBufferQueue_; 91 std::queue<OH_AVBuffer *> outBufferQueue_; 92 }; 93 AEncBufferSignal *signal_; 94 ``` 95 963. 调用OH_AudioCodec_RegisterCallback()注册回调函数。 97 98 注册回调函数指针集合OH_AVCodecCallback,包括: 99 100 - OH_AVCodecOnError:编码器运行错误。 101 - OH_AVCodecOnStreamChanged:音频编码器暂未支持此回调。 102 - OH_AVCodecOnNeedInputBuffer:运行过程中需要新的输入数据,即编码器已准备好,可以输入PCM数据。 103 - OH_AVCodecOnNewOutputBuffer:运行过程中产生了新的输出数据,即编码完成。 104 105 开发者可以通过处理该回调报告的信息,确保编码器正常运转。 106 107 > **注意:** 108 > 回调中不建议进行耗时操作。 109 110 ```cpp 111 // OH_AVCodecOnError回调函数的实现。 112 static void OnError(OH_AVCodec *codec, int32_t errorCode, void *userData) 113 { 114 (void)codec; 115 (void)errorCode; 116 (void)userData; 117 } 118 // OH_AVCodecOnStreamChanged回调函数的实现。 119 static void OnOutputFormatChanged(OH_AVCodec *codec, OH_AVFormat *format, void *userData) 120 { 121 (void)codec; 122 (void)format; 123 (void)userData; 124 } 125 // OH_AVCodecOnNeedInputBuffer回调函数的实现。 126 static void OnInputBufferAvailable(OH_AVCodec *codec, uint32_t index, OH_AVBuffer *data, void *userData) 127 { 128 (void)codec; 129 // 编码输入码流送入InputBuffer队列。 130 AEncBufferSignal *signal = static_cast<AEncBufferSignal *>(userData); 131 unique_lock<mutex> lock(signal->inMutex_); 132 signal->inQueue_.push(index); 133 signal->inBufferQueue_.push(data); 134 signal->inCond_.notify_all(); 135 } 136 // OH_AVCodecOnNewOutputBuffer回调函数的实现。 137 static void OnOutputBufferAvailable(OH_AVCodec *codec, uint32_t index, OH_AVBuffer *data, void *userData) 138 { 139 (void)codec; 140 // 将对应输出buffer的index送入OutputQueue_队列。 141 // 将对应编码完成的数据data送入outBuffer队列。 142 AEncBufferSignal *signal = static_cast<AEncBufferSignal *>(userData); 143 unique_lock<mutex> lock(signal->outMutex_); 144 signal->outQueue_.push(index); 145 signal->outBufferQueue_.push(data); 146 } 147 signal_ = new AEncBufferSignal(); 148 OH_AVCodecCallback cb_ = {&OnError, &OnOutputFormatChanged, &OnInputBufferAvailable, &OnOutputBufferAvailable}; 149 // 配置异步回调。 150 int32_t ret = OH_AudioCodec_RegisterCallback(audioEnc_, cb_, signal_); 151 if (ret != AV_ERR_OK) { 152 // 异常处理。 153 } 154 ``` 155 1564. 调用OH_AudioCodec_Configure设置编码器。 157 158 设置必选项:采样率,码率,以及声道数,声道类型、位深。 159 160 可选项:最大输入长度。 161 162 flac编码: 需要额外标识兼容性级别(Compliance Level)和采样精度。 163 164 各音频编码类型参数范围说明: 165 | 音频编码类型 | 采样率(Hz) | 声道数 | 166 | ----------- | ------------------------------------------------------------------------------- | :----------------: | 167 | <!--DelRow-->AAC | 8000、11025、12000、16000、22050、24000、32000、44100、48000、64000、88200、96000 | 1、2、3、4、5、6、8 | 168 | Flac | 8000、11025、12000、16000、22050、24000、32000、44100、48000、64000、88200、96000 | 1~8 | 169 | MP3 | 8000、11025、12000、16000、22050、24000、32000、44100、48000 | 1~2 | 170 | G711mu | 8000 | 1 | 171 <!--RP3--><!--RP3End--> 172 173 例如对一个44100Hz采样率、2声道立体声、SAMPLE_S16LE采样格式的PCM音频,以32000bps的码率进行AAC编码的调用流程如下: 174 <!--RP4--> 175 ```cpp 176 int32_t ret; 177 // 配置音频采样率(必须)。 178 constexpr uint32_t DEFAULT_SAMPLERATE = 44100; 179 // 配置音频码率(必须)。 180 constexpr uint64_t DEFAULT_BITRATE = 32000; 181 // 配置音频声道数(必须)。 182 constexpr uint32_t DEFAULT_CHANNEL_COUNT = 2; 183 // 配置音频声道类型(必须)。 184 constexpr OH_AudioChannelLayout CHANNEL_LAYOUT = OH_AudioChannelLayout::CH_LAYOUT_STEREO; 185 // 配置音频位深(必须)。 186 constexpr OH_BitsPerSample SAMPLE_FORMAT = OH_BitsPerSample::SAMPLE_S16LE; 187 // 每20ms一帧音频数据。 188 constexpr float TIME_PER_FRAME = 0.02; 189 // 配置最大输入长度, 每帧音频数据的大小(可选)。 190 constexpr uint32_t DEFAULT_MAX_INPUT_SIZE = DEFAULT_SAMPLERATE * TIME_PER_FRAME * DEFAULT_CHANNEL_COUNT * sizeof(short); // aac 191 OH_AVFormat *format = OH_AVFormat_Create(); 192 // 写入format。 193 OH_AVFormat_SetIntValue(format,OH_MD_KEY_AUD_CHANNEL_COUNT, DEFAULT_CHANNEL_COUNT); 194 OH_AVFormat_SetIntValue(format,OH_MD_KEY_AUD_SAMPLE_RATE, DEFAULT_SAMPLERATE); 195 OH_AVFormat_SetLongValue(format,OH_MD_KEY_BITRATE, DEFAULT_BITRATE); 196 OH_AVFormat_SetIntValue(format, OH_MD_KEY_AUDIO_SAMPLE_FORMAT, SAMPLE_FORMAT); 197 OH_AVFormat_SetLongValue(format,OH_MD_KEY_CHANNEL_LAYOUT, CHANNEL_LAYOUT); 198 OH_AVFormat_SetIntValue(format,OH_MD_KEY_MAX_INPUT_SIZE, DEFAULT_MAX_INPUT_SIZE); 199 // 配置编码器。 200 ret = OH_AudioCodec_Configure(audioEnc_, format); 201 if (ret != AV_ERR_OK) { 202 // 异常处理。 203 } 204 ``` 205 <!--RP4End--> 206 例FLAC调用流程: 207 208 ```cpp 209 int32_t ret; 210 // 配置音频采样率(必须)。 211 constexpr uint32_t DEFAULT_SAMPLERATE = 44100; 212 // 配置音频码率(必须)。 213 constexpr uint64_t DEFAULT_BITRATE = 261000; 214 // 配置音频声道数(必须)。 215 constexpr uint32_t DEFAULT_CHANNEL_COUNT = 2; 216 // 配置音频声道类型(必须)。 217 constexpr OH_AudioChannelLayout CHANNEL_LAYOUT = OH_AudioChannelLayout::CH_LAYOUT_STEREO; 218 // 配置音频位深(必须) flac只有SAMPLE_S16LE和SAMPLE_S32LE。 219 constexpr OH_BitsPerSample SAMPLE_FORMAT = OH_BitsPerSample::SAMPLE_S32LE; 220 // 配置音频compliance level (默认值0,取值范围-2~2)。 221 constexpr int32_t COMPLIANCE_LEVEL = 0; 222 // 配置音频精度(必须) SAMPLE_S16LE和SAMPLE_S24LE和SAMPLE_S32LE。 223 constexpr OH_BitsPerSample BITS_PER_CODED_SAMPLE = OH_BitsPerSample::SAMPLE_S24LE; 224 OH_AVFormat *format = OH_AVFormat_Create(); 225 // 写入format。 226 OH_AVFormat_SetIntValue(format, OH_MD_KEY_AUD_CHANNEL_COUNT, DEFAULT_CHANNEL_COUNT); 227 OH_AVFormat_SetIntValue(format, OH_MD_KEY_AUD_SAMPLE_RATE, DEFAULT_SAMPLERATE); 228 OH_AVFormat_SetLongValue(format, OH_MD_KEY_BITRATE, DEFAULT_BITRATE); 229 OH_AVFormat_SetIntValue(format, OH_MD_KEY_BITS_PER_CODED_SAMPLE, BITS_PER_CODED_SAMPLE); 230 OH_AVFormat_SetIntValue(format, OH_MD_KEY_AUDIO_SAMPLE_FORMAT, SAMPLE_FORMAT); 231 OH_AVFormat_SetLongValue(format, OH_MD_KEY_CHANNEL_LAYOUT, CHANNEL_LAYOUT); 232 OH_AVFormat_SetLongValue(format, OH_MD_KEY_COMPLIANCE_LEVEL, COMPLIANCE_LEVEL); 233 // 配置编码器。 234 ret = OH_AudioCodec_Configure(audioEnc_, format); 235 if (ret != AV_ERR_OK) { 236 // 异常处理。 237 } 238 ``` 239 240 <!--RP2--><!--RP2End--> 241 2425. 调用OH_AudioCodec_Prepare(),编码器就绪。 243 244 ```cpp 245 ret = OH_AudioCodec_Prepare(audioEnc_); 246 if (ret != AV_ERR_OK) { 247 // 异常处理。 248 } 249 ``` 250 2516. 调用OH_AudioCodec_Start()启动编码器,进入运行态。 252 253 ```c++ 254 unique_ptr<ifstream> inputFile_ = make_unique<ifstream>(); 255 unique_ptr<ofstream> outFile_ = make_unique<ofstream>(); 256 // 打开待编码二进制文件路径(此处以输入为PCM文件为例)。 257 inputFile_->open(inputFilePath.data(), ios::in | ios::binary); 258 // 配置编码文件输出路径(此处以输出为编码码流文件为例)。 259 outFile_->open(outputFilePath.data(), ios::out | ios::binary); 260 // 开始编码。 261 ret = OH_AudioCodec_Start(audioEnc_); 262 if (ret != AV_ERR_OK) { 263 // 异常处理。 264 } 265 ``` 266 2677. 调用OH_AudioCodec_PushInputBuffer(),写入待编码器的数据。需开发者填充完整的输入数据后调用。 268 269 每帧样点数(SAMPLES_PER_FRAME)取值: 270 271 aac建议使用20ms的PCM样点数,即采样率*0.02。 272 273 flac比较特殊,需要根据如下表格进行设置。 274 275 | 采样率 | 样点数 | 276 | :----: | :----: | 277 | 8000 | 576 | 278 | 16000 | 1152 | 279 | 22050 | 2304 | 280 | 24000 | 2304 | 281 | 32000 | 2304 | 282 | 44100 | 4608 | 283 | 48000 | 4608 | 284 | 88200 | 8192 | 285 | 96000 | 8192 | 286 287 > **说明:** 288 > aac编码的每帧样点数建议使用20ms的PCM样点数,即采样率*0.02。flac编码的样点数建议根据采样率按照表格传入,大于这个值也会返回错误码,如果小于有可能出现编码文件损坏问题。 289 290 ```c++ 291 // 每帧样点数。 292 constexpr int32_t SAMPLES_PER_FRAME = DEFAULT_SAMPLERATE * TIME_PER_FRAME; 293 // 声道数,对于amr编码声道数只支持单声道的音频输入。 294 constexpr int32_t DEFAULT_CHANNEL_COUNT = 2; 295 // 每帧输入数据的长度,声道数 * 每帧样点数 * 每个样点的字节数(以采样格式SAMPLE_S16LE为例)。 296 // 如果最后一帧数据不满足长度,建议进行丢弃或填充处理。 297 constexpr int32_t INPUT_FRAME_BYTES = DEFAULT_CHANNEL_COUNT * SAMPLES_PER_FRAME * sizeof(short); 298 uint32_t index = signal_->inQueue_.front(); 299 auto buffer = signal_->inBufferQueue_.front(); 300 OH_AVCodecBufferAttr attr = {0}; 301 if (!inputFile_->eof()) { 302 inputFile_->read((char *)OH_AVBuffer_GetAddr(buffer), INPUT_FRAME_BYTES); 303 attr.size = INPUT_FRAME_BYTES; 304 attr.flags = AVCODEC_BUFFER_FLAGS_NONE; 305 } else { 306 attr.size = 0; 307 attr.flags = AVCODEC_BUFFER_FLAGS_EOS; 308 } 309 OH_AVBuffer_SetBufferAttr(buffer, &attr); 310 // 送入编码输入队列进行编码, index为对应队列下标。 311 ret = OH_AudioCodec_PushInputBuffer(audioEnc_, index); 312 if (ret != AV_ERR_OK) { 313 // 异常处理。 314 } 315 ``` 316 在上方案例中,attr.flags代表缓冲区标记的类别。 317 318 如果是结束,需要将flags标识成AVCODEC_BUFFER_FLAGS_EOS。 319 320 | 枚举值 | 描述 | 321 | -------- | -------- | 322 | AVCODEC_BUFFER_FLAGS_NONE | 表示为普通帧。 | 323 | AVCODEC_BUFFER_FLAGS_EOS | 表示缓冲区是流结束帧。 | 324 | AVCODEC_BUFFER_FLAGS_CODEC_DATA | 表示缓冲区包含编解码特定数据。 | 325 3268. 调用OH_AudioCodec_FreeOutputBuffer(),释放编码后的数据。 327 328 在取走编码码流后,就应及时调用OH_AudioCodec_FreeOutputBuffer()进行释放。 329 330 ```c++ 331 uint32_t index = signal_->outQueue_.front(); 332 OH_AVBuffer *avBuffer = signal_->outBufferQueue_.front(); 333 // 获取buffer attributes。 334 OH_AVCodecBufferAttr attr = {0}; 335 ret = OH_AVBuffer_GetBufferAttr(avBuffer, &attr); 336 if (ret != AV_ERR_OK) { 337 // 异常处理。 338 } 339 // 将编码完成数据data写入到对应输出文件中。 340 outputFile_->write(reinterpret_cast<char *>(OH_AVBuffer_GetAddr(avBuffer)), attr.size); 341 // 释放已完成写入的数据。 342 ret = OH_AudioCodec_FreeOutputBuffer(audioEnc_, index); 343 if (ret != AV_ERR_OK) { 344 // 异常处理。 345 } 346 if (attr.flags == AVCODEC_BUFFER_FLAGS_EOS) { 347 // 结束。 348 } 349 ``` 350 3519. (可选)调用OH_AudioCodec_Flush()刷新编码器。 352 353 调用OH_AudioCodec_Flush()后,编码器处于Flush状态,会将当前编码队列清空。 354 355 此时需要调用OH_AudioCodec_Start()重新开始编码。 356 357 使用情况: 358 359 * 在文件EOS之后,需要调用刷新。 360 * 在执行过程中遇到可继续执行的错误时(即OH_AudioCodec_IsValid 为true)可以调用,然后重新调用OH_AudioCodec_Start。 361 362 ```c++ 363 // 刷新编码器 audioEnc_。 364 ret = OH_AudioCodec_Flush(audioEnc_); 365 if (ret != AV_ERR_OK) { 366 // 异常处理。 367 } 368 // 重新开始编码。 369 ret = OH_AudioCodec_Start(audioEnc_); 370 if (ret != AV_ERR_OK) { 371 // 异常处理。 372 } 373 ``` 374 37510. (可选)调用OH_AudioCodec_Reset()重置编码器。 376 377 调用OH_AudioCodec_Reset()后,编码器回到初始化的状态,需要调用OH_AudioCodec_Configure()重新配置,然后调用OH_AudioCodec_Start()重新开始编码。 378 379 ```c++ 380 // 重置编码器 audioEnc_。 381 ret = OH_AudioCodec_Reset(audioEnc_); 382 if (ret != AV_ERR_OK) { 383 // 异常处理。 384 } 385 // 重新配置编码器参数。 386 ret = OH_AudioCodec_Configure(audioEnc_, format); 387 if (ret != AV_ERR_OK) { 388 // 异常处理。 389 } 390 ``` 391 39211. 调用OH_AudioCodec_Stop()停止编码器。 393 394 停止后,可以通过Start重新进入已启动状态(started),但需要注意的是,如果编码器之前已输入数据,则需要重新输入编码器数据。 395 396 ```c++ 397 // 终止编码器 audioEnc_。 398 ret = OH_AudioCodec_Stop(audioEnc_); 399 if (ret != AV_ERR_OK) { 400 // 异常处理。 401 } 402 ``` 403 40412. 调用OH_AudioCodec_Destroy()销毁编码器实例,释放资源。 405 406 > **说明:** 407 > 资源不能重复销毁 408 409 ```c++ 410 // 调用OH_AudioCodec_Destroy, 注销编码器。 411 ret = OH_AudioCodec_Destroy(audioEnc_); 412 if (ret != AV_ERR_OK) { 413 // 异常处理。 414 } else { 415 audioEnc_ = NULL; // 不可重复destroy。 416 } 417 ``` 418 419## 相关实例 420 421针对音频编码,有以下相关实例可供参考: 422 423- [音频编码](https://gitee.com/openharmony/multimedia_av_codec/blob/master/test/nativedemo/audio_demo/avcodec_audio_avbuffer_aac_encoder_demo.cpp) 424