• Home
  • Line#
  • Scopes#
  • Navigate#
  • Raw
  • Download
1# 音频编码
2
3开发者可以调用本模块的Native API接口,完成音频编码,即将音频PCM编码压缩成不同的格式。
4
5接口不限制PCM数据的来源,开发者可以调用麦克风录制获取、也可以导入编辑后的PCM数据,通过音频编码,输出对应格式的码流,最后封装为目标格式文件。
6
7当前支持的编码能力请参考[AVCodec支持的格式](avcodec-support-formats.md#音频编码)。
8
9**适用场景**
10
11- 音频录制
12
13  通过录制传入PCM,然后编码出对应格式的码流,最后[封装](audio-video-muxer.md#媒体数据封装)成想要的格式。
14- 音频编辑
15
16  编辑PCM后导出音频文件的场景,需要编码成对应音频格式后再[封装](audio-video-muxer.md#媒体数据封装)成文件。
17> **说明:**
18>
19> AAC编码器默认采用的VBR可变码率模式,与配置的预期参数可能存在偏差。
20
21## 开发指导
22
23详细的API说明请参考[API文档](../../reference/apis-avcodec-kit/_audio_codec.md)。
24
25参考以下示例代码,完成音频编码的全流程,包括:创建编码器、设置编码参数(采样率/码率/声道数等)、开始、刷新、重置、销毁资源。
26
27在应用开发过程中,开发者应按一定顺序调用方法,执行对应操作,否则系统可能会抛出异常或生成其他未定义的行为。具体顺序可参考下列开发步骤及对应说明。
28
29如下为音频编码调用关系图:
30
31- 虚线表示可选。
32
33- 实线表示必选。
34
35![Invoking relationship of audio encode stream](figures/audio-codec.png)
36
37### 在 CMake 脚本中链接动态库
38
39```cmake
40target_link_libraries(sample PUBLIC libnative_media_codecbase.so)
41target_link_libraries(sample PUBLIC libnative_media_core.so)
42target_link_libraries(sample PUBLIC libnative_media_acodec.so)
43```
44
45### 开发步骤
46
471. 添加头文件。
48
49    ```cpp
50    #include <multimedia/player_framework/native_avcodec_audiocodec.h>
51    #include <multimedia/native_audio_channel_layout.h>
52    #include <multimedia/player_framework/native_avcapability.h>
53    #include <multimedia/player_framework/native_avcodec_base.h>
54    #include <multimedia/player_framework/native_avformat.h>
55    #include <multimedia/player_framework/native_avbuffer.h>
56    ```
57
582. 创建编码器实例对象,OH_AVCodec *为编码器实例指针。
59
60   应用可以通过名称或媒体类型创建编码器。
61
62    ```cpp
63    // c++标准库命名空间。
64    using namespace std;
65    // 通过 codecname 创建编码器。
66    OH_AVCapability *capability = OH_AVCodec_GetCapability(OH_AVCODEC_MIMETYPE_AUDIO_AAC, true);
67    const char *name = OH_AVCapability_GetName(capability);
68    OH_AVCodec *audioEnc_ = OH_AudioCodec_CreateByName(name);
69    ```
70
71    ```cpp
72    // 设置判定是否为编码;设置true表示当前是编码。
73    bool isEncoder = true;
74    // 通过媒体类型创建编码器。
75    OH_AVCodec *audioEnc_ = OH_AudioCodec_CreateByMime(OH_AVCODEC_MIMETYPE_AUDIO_AAC, isEncoder);
76    ```
77
78    ```cpp
79    // 初始化队列。
80    class AEncBufferSignal {
81    public:
82        std::mutex inMutex_;
83        std::mutex outMutex_;
84        std::mutex startMutex_;
85        std::condition_variable inCond_;
86        std::condition_variable outCond_;
87        std::condition_variable startCond_;
88        std::queue<uint32_t> inQueue_;
89        std::queue<uint32_t> outQueue_;
90        std::queue<OH_AVBuffer *> inBufferQueue_;
91        std::queue<OH_AVBuffer *> outBufferQueue_;
92    };
93    AEncBufferSignal *signal_;
94    ```
95
963. 调用OH_AudioCodec_RegisterCallback()注册回调函数。
97
98   注册回调函数指针集合OH_AVCodecCallback,包括:
99
100   - OH_AVCodecOnError:编码器运行错误。
101   - OH_AVCodecOnStreamChanged:音频编码器暂未支持此回调。
102   - OH_AVCodecOnNeedInputBuffer:运行过程中需要新的输入数据,即编码器已准备好,可以输入PCM数据。
103   - OH_AVCodecOnNewOutputBuffer:运行过程中产生了新的输出数据,即编码完成。
104
105   开发者可以通过处理该回调报告的信息,确保编码器正常运转。
106
107   > **注意:**
108   > 回调中不建议进行耗时操作。
109
110    ```cpp
111    // OH_AVCodecOnError回调函数的实现。
112    static void OnError(OH_AVCodec *codec, int32_t errorCode, void *userData)
113    {
114        (void)codec;
115        (void)errorCode;
116        (void)userData;
117    }
118    // OH_AVCodecOnStreamChanged回调函数的实现。
119    static void OnOutputFormatChanged(OH_AVCodec *codec, OH_AVFormat *format, void *userData)
120    {
121        (void)codec;
122        (void)format;
123        (void)userData;
124    }
125    // OH_AVCodecOnNeedInputBuffer回调函数的实现。
126    static void OnInputBufferAvailable(OH_AVCodec *codec, uint32_t index, OH_AVBuffer *data, void *userData)
127    {
128        (void)codec;
129        // 编码输入码流送入InputBuffer队列。
130        AEncBufferSignal *signal = static_cast<AEncBufferSignal *>(userData);
131        unique_lock<mutex> lock(signal->inMutex_);
132        signal->inQueue_.push(index);
133        signal->inBufferQueue_.push(data);
134        signal->inCond_.notify_all();
135    }
136    // OH_AVCodecOnNewOutputBuffer回调函数的实现。
137    static void OnOutputBufferAvailable(OH_AVCodec *codec, uint32_t index, OH_AVBuffer *data, void *userData)
138    {
139        (void)codec;
140        // 将对应输出buffer的index送入OutputQueue_队列。
141        // 将对应编码完成的数据data送入outBuffer队列。
142        AEncBufferSignal *signal = static_cast<AEncBufferSignal *>(userData);
143        unique_lock<mutex> lock(signal->outMutex_);
144        signal->outQueue_.push(index);
145        signal->outBufferQueue_.push(data);
146    }
147    signal_ = new AEncBufferSignal();
148    OH_AVCodecCallback cb_ = {&OnError, &OnOutputFormatChanged, &OnInputBufferAvailable, &OnOutputBufferAvailable};
149    // 配置异步回调。
150    int32_t ret = OH_AudioCodec_RegisterCallback(audioEnc_, cb_, signal_);
151    if (ret != AV_ERR_OK) {
152        // 异常处理。
153    }
154    ```
155
1564. 调用OH_AudioCodec_Configure设置编码器。
157
158   设置必选项:采样率,码率,以及声道数,声道类型、位深。
159
160   可选项:最大输入长度。
161
162   flac编码: 需要额外标识兼容性级别(Compliance Level)和采样精度。
163
164   各音频编码类型参数范围说明:
165   | 音频编码类型 | 采样率(Hz)                                                                       |       声道数       |
166   | ----------- | ------------------------------------------------------------------------------- | :----------------: |
167   | <!--DelRow-->AAC         | 8000、11025、12000、16000、22050、24000、32000、44100、48000、64000、88200、96000 | 1、2、3、4、5、6、8 |
168   | Flac        | 8000、11025、12000、16000、22050、24000、32000、44100、48000、64000、88200、96000 |        1~8         |
169   | MP3         | 8000、11025、12000、16000、22050、24000、32000、44100、48000                     |        1~2         |
170   | G711mu      | 8000                                                                            |         1          |
171   <!--RP3--><!--RP3End-->
172
173   例如对一个44100Hz采样率、2声道立体声、SAMPLE_S16LE采样格式的PCM音频,以32000bps的码率进行AAC编码的调用流程如下:
174    <!--RP4-->
175    ```cpp
176    int32_t ret;
177    // 配置音频采样率(必须)。
178    constexpr uint32_t DEFAULT_SAMPLERATE = 44100;
179    // 配置音频码率(必须)。
180    constexpr uint64_t DEFAULT_BITRATE = 32000;
181    // 配置音频声道数(必须)。
182    constexpr uint32_t DEFAULT_CHANNEL_COUNT = 2;
183    // 配置音频声道类型(必须)。
184    constexpr OH_AudioChannelLayout CHANNEL_LAYOUT = OH_AudioChannelLayout::CH_LAYOUT_STEREO;
185    // 配置音频位深(必须)。
186    constexpr OH_BitsPerSample SAMPLE_FORMAT = OH_BitsPerSample::SAMPLE_S16LE;
187    // 每20ms一帧音频数据。
188    constexpr float TIME_PER_FRAME = 0.02;
189    // 配置最大输入长度, 每帧音频数据的大小(可选)。
190    constexpr uint32_t DEFAULT_MAX_INPUT_SIZE = DEFAULT_SAMPLERATE * TIME_PER_FRAME * DEFAULT_CHANNEL_COUNT * sizeof(short); // aac
191    OH_AVFormat *format = OH_AVFormat_Create();
192    // 写入format。
193    OH_AVFormat_SetIntValue(format,OH_MD_KEY_AUD_CHANNEL_COUNT, DEFAULT_CHANNEL_COUNT);
194    OH_AVFormat_SetIntValue(format,OH_MD_KEY_AUD_SAMPLE_RATE, DEFAULT_SAMPLERATE);
195    OH_AVFormat_SetLongValue(format,OH_MD_KEY_BITRATE, DEFAULT_BITRATE);
196    OH_AVFormat_SetIntValue(format, OH_MD_KEY_AUDIO_SAMPLE_FORMAT, SAMPLE_FORMAT);
197    OH_AVFormat_SetLongValue(format,OH_MD_KEY_CHANNEL_LAYOUT, CHANNEL_LAYOUT);
198    OH_AVFormat_SetIntValue(format,OH_MD_KEY_MAX_INPUT_SIZE, DEFAULT_MAX_INPUT_SIZE);
199    // 配置编码器。
200    ret = OH_AudioCodec_Configure(audioEnc_, format);
201    if (ret != AV_ERR_OK) {
202        // 异常处理。
203    }
204    ```
205    <!--RP4End-->
206    例FLAC调用流程:
207
208    ```cpp
209    int32_t ret;
210    // 配置音频采样率(必须)。
211    constexpr uint32_t DEFAULT_SAMPLERATE = 44100;
212    // 配置音频码率(必须)。
213    constexpr uint64_t DEFAULT_BITRATE = 261000;
214    // 配置音频声道数(必须)。
215    constexpr uint32_t DEFAULT_CHANNEL_COUNT = 2;
216    // 配置音频声道类型(必须)。
217    constexpr OH_AudioChannelLayout CHANNEL_LAYOUT = OH_AudioChannelLayout::CH_LAYOUT_STEREO;
218    // 配置音频位深(必须) flac只有SAMPLE_S16LE和SAMPLE_S32LE。
219    constexpr OH_BitsPerSample SAMPLE_FORMAT = OH_BitsPerSample::SAMPLE_S32LE;
220    // 配置音频compliance level (默认值0,取值范围-2~2)。
221    constexpr int32_t COMPLIANCE_LEVEL = 0;
222    // 配置音频精度(必须) SAMPLE_S16LE和SAMPLE_S24LE和SAMPLE_S32LE。
223    constexpr OH_BitsPerSample BITS_PER_CODED_SAMPLE = OH_BitsPerSample::SAMPLE_S24LE;
224    OH_AVFormat *format = OH_AVFormat_Create();
225    // 写入format。
226    OH_AVFormat_SetIntValue(format, OH_MD_KEY_AUD_CHANNEL_COUNT, DEFAULT_CHANNEL_COUNT);
227    OH_AVFormat_SetIntValue(format, OH_MD_KEY_AUD_SAMPLE_RATE, DEFAULT_SAMPLERATE);
228    OH_AVFormat_SetLongValue(format, OH_MD_KEY_BITRATE, DEFAULT_BITRATE);
229    OH_AVFormat_SetIntValue(format, OH_MD_KEY_BITS_PER_CODED_SAMPLE, BITS_PER_CODED_SAMPLE);
230    OH_AVFormat_SetIntValue(format, OH_MD_KEY_AUDIO_SAMPLE_FORMAT, SAMPLE_FORMAT);
231    OH_AVFormat_SetLongValue(format, OH_MD_KEY_CHANNEL_LAYOUT, CHANNEL_LAYOUT);
232    OH_AVFormat_SetLongValue(format, OH_MD_KEY_COMPLIANCE_LEVEL, COMPLIANCE_LEVEL);
233    // 配置编码器。
234    ret = OH_AudioCodec_Configure(audioEnc_, format);
235    if (ret != AV_ERR_OK) {
236        // 异常处理。
237    }
238    ```
239
240    <!--RP2--><!--RP2End-->
241
2425. 调用OH_AudioCodec_Prepare(),编码器就绪。
243
244    ```cpp
245    ret = OH_AudioCodec_Prepare(audioEnc_);
246    if (ret != AV_ERR_OK) {
247        // 异常处理。
248    }
249    ```
250
2516. 调用OH_AudioCodec_Start()启动编码器,进入运行态。
252
253    ```c++
254    unique_ptr<ifstream> inputFile_ = make_unique<ifstream>();
255    unique_ptr<ofstream> outFile_ = make_unique<ofstream>();
256    // 打开待编码二进制文件路径(此处以输入为PCM文件为例)。
257    inputFile_->open(inputFilePath.data(), ios::in | ios::binary);
258    // 配置编码文件输出路径(此处以输出为编码码流文件为例)。
259    outFile_->open(outputFilePath.data(), ios::out | ios::binary);
260    // 开始编码。
261    ret = OH_AudioCodec_Start(audioEnc_);
262    if (ret != AV_ERR_OK) {
263        // 异常处理。
264    }
265    ```
266
2677. 调用OH_AudioCodec_PushInputBuffer(),写入待编码器的数据。需开发者填充完整的输入数据后调用。
268
269   每帧样点数(SAMPLES_PER_FRAME)取值:
270
271   aac建议使用20ms的PCM样点数,即采样率*0.02。
272
273   flac比较特殊,需要根据如下表格进行设置。
274
275   | 采样率 | 样点数 |
276   | :----: | :----: |
277   |  8000  |  576  |
278   | 16000 |  1152  |
279   | 22050 |  2304  |
280   | 24000 |  2304  |
281   | 32000 |  2304  |
282   | 44100 |  4608  |
283   | 48000 |  4608  |
284   | 88200 |  8192  |
285   | 96000 |  8192  |
286
287   > **说明:**
288   > aac编码的每帧样点数建议使用20ms的PCM样点数,即采样率*0.02。flac编码的样点数建议根据采样率按照表格传入,大于这个值也会返回错误码,如果小于有可能出现编码文件损坏问题。
289
290   ```c++
291    // 每帧样点数。
292    constexpr int32_t SAMPLES_PER_FRAME = DEFAULT_SAMPLERATE * TIME_PER_FRAME;
293    // 声道数,对于amr编码声道数只支持单声道的音频输入。
294    constexpr int32_t DEFAULT_CHANNEL_COUNT = 2;
295    // 每帧输入数据的长度,声道数 * 每帧样点数 * 每个样点的字节数(以采样格式SAMPLE_S16LE为例)。
296    // 如果最后一帧数据不满足长度,建议进行丢弃或填充处理。
297    constexpr int32_t INPUT_FRAME_BYTES = DEFAULT_CHANNEL_COUNT * SAMPLES_PER_FRAME * sizeof(short);
298    uint32_t index = signal_->inQueue_.front();
299    auto buffer = signal_->inBufferQueue_.front();
300    OH_AVCodecBufferAttr attr = {0};
301    if (!inputFile_->eof()) {
302        inputFile_->read((char *)OH_AVBuffer_GetAddr(buffer), INPUT_FRAME_BYTES);
303        attr.size = INPUT_FRAME_BYTES;
304        attr.flags = AVCODEC_BUFFER_FLAGS_NONE;
305    } else {
306        attr.size = 0;
307        attr.flags = AVCODEC_BUFFER_FLAGS_EOS;
308    }
309    OH_AVBuffer_SetBufferAttr(buffer, &attr);
310    // 送入编码输入队列进行编码, index为对应队列下标。
311    ret = OH_AudioCodec_PushInputBuffer(audioEnc_, index);
312    if (ret != AV_ERR_OK) {
313        // 异常处理。
314    }
315    ```
316   在上方案例中,attr.flags代表缓冲区标记的类别。
317
318   如果是结束,需要将flags标识成AVCODEC_BUFFER_FLAGS_EOS。
319
320   | 枚举值 | 描述 |
321   | -------- | -------- |
322   | AVCODEC_BUFFER_FLAGS_NONE | 表示为普通帧。 |
323   | AVCODEC_BUFFER_FLAGS_EOS | 表示缓冲区是流结束帧。 |
324   | AVCODEC_BUFFER_FLAGS_CODEC_DATA | 表示缓冲区包含编解码特定数据。 |
325
3268. 调用OH_AudioCodec_FreeOutputBuffer(),释放编码后的数据。
327
328   在取走编码码流后,就应及时调用OH_AudioCodec_FreeOutputBuffer()进行释放。
329
330    ```c++
331    uint32_t index = signal_->outQueue_.front();
332    OH_AVBuffer *avBuffer = signal_->outBufferQueue_.front();
333    // 获取buffer attributes。
334    OH_AVCodecBufferAttr attr = {0};
335    ret = OH_AVBuffer_GetBufferAttr(avBuffer, &attr);
336    if (ret != AV_ERR_OK) {
337        // 异常处理。
338    }
339    // 将编码完成数据data写入到对应输出文件中。
340    outputFile_->write(reinterpret_cast<char *>(OH_AVBuffer_GetAddr(avBuffer)), attr.size);
341    // 释放已完成写入的数据。
342    ret = OH_AudioCodec_FreeOutputBuffer(audioEnc_, index);
343    if (ret != AV_ERR_OK) {
344        // 异常处理。
345    }
346    if (attr.flags == AVCODEC_BUFFER_FLAGS_EOS) {
347        // 结束。
348    }
349    ```
350
3519. (可选)调用OH_AudioCodec_Flush()刷新编码器。
352
353   调用OH_AudioCodec_Flush()后,编码器处于Flush状态,会将当前编码队列清空。
354
355   此时需要调用OH_AudioCodec_Start()重新开始编码。
356
357   使用情况:
358
359   * 在文件EOS之后,需要调用刷新。
360   * 在执行过程中遇到可继续执行的错误时(即OH_AudioCodec_IsValid 为true)可以调用,然后重新调用OH_AudioCodec_Start。
361
362    ```c++
363    // 刷新编码器 audioEnc_。
364    ret = OH_AudioCodec_Flush(audioEnc_);
365    if (ret != AV_ERR_OK) {
366        // 异常处理。
367    }
368    // 重新开始编码。
369    ret = OH_AudioCodec_Start(audioEnc_);
370    if (ret != AV_ERR_OK) {
371        // 异常处理。
372    }
373    ```
374
37510. (可选)调用OH_AudioCodec_Reset()重置编码器。
376
377    调用OH_AudioCodec_Reset()后,编码器回到初始化的状态,需要调用OH_AudioCodec_Configure()重新配置,然后调用OH_AudioCodec_Start()重新开始编码。
378
379    ```c++
380    // 重置编码器 audioEnc_。
381    ret = OH_AudioCodec_Reset(audioEnc_);
382    if (ret != AV_ERR_OK) {
383        // 异常处理。
384    }
385    // 重新配置编码器参数。
386    ret = OH_AudioCodec_Configure(audioEnc_, format);
387    if (ret != AV_ERR_OK) {
388        // 异常处理。
389    }
390    ```
391
39211. 调用OH_AudioCodec_Stop()停止编码器。
393
394    停止后,可以通过Start重新进入已启动状态(started),但需要注意的是,如果编码器之前已输入数据,则需要重新输入编码器数据。
395
396    ```c++
397    // 终止编码器 audioEnc_。
398    ret = OH_AudioCodec_Stop(audioEnc_);
399    if (ret != AV_ERR_OK) {
400        // 异常处理。
401    }
402    ```
403
40412. 调用OH_AudioCodec_Destroy()销毁编码器实例,释放资源。
405
406    > **说明:**
407    > 资源不能重复销毁
408
409    ```c++
410    // 调用OH_AudioCodec_Destroy, 注销编码器。
411    ret = OH_AudioCodec_Destroy(audioEnc_);
412    if (ret != AV_ERR_OK) {
413        // 异常处理。
414    } else {
415        audioEnc_ = NULL; // 不可重复destroy。
416    }
417    ```
418
419## 相关实例
420
421针对音频编码,有以下相关实例可供参考:
422
423- [音频编码](https://gitee.com/openharmony/multimedia_av_codec/blob/master/test/nativedemo/audio_demo/avcodec_audio_avbuffer_aac_encoder_demo.cpp)
424