• Home
  • Line#
  • Scopes#
  • Navigate#
  • Raw
  • Download
1# 音频编码
2
3开发者可以调用本模块的Native API接口,完成音频编码,即将音频PCM编码压缩成不同的格式。
4
5接口不限制PCM数据的来源,开发者可以调用麦克风录制获取、也可以导入编辑后的PCM数据,通过音频编码,输出对应格式的码流,最后封装为目标格式文件。
6
7当前支持的编码能力如下:
8
9| 容器规格 | 音频编码类型       |
10| -------- | :--------------- |
11| mp4      | AAC、Flac        |
12| m4a      | AAC              |
13| flac     | Flac             |
14| aac      | AAC              |
15| mp3      | MP3              |
16| raw      | G711mu           |
17<!--RP1--><!--RP1End-->
18
19**适用场景**
20
21- 音频录制
22
23  通过录制传入PCM,然后编码出对应格式的码流,最后封装成想要的格式。
24- 音频编辑
25
26  编辑PCM后导出音频文件的场景,需要编码成对应音频格式后再封装成文件。
27> **说明:**
28>
29> AAC编码器默认采用的VBR可变码率模式,与配置的预期参数可能存在偏差。
30
31## 开发指导
32
33详细的API说明请参考[API文档](../../reference/apis-avcodec-kit/_audio_codec.md)。
34
35参考以下示例代码,完成音频编码的全流程,包括:创建编码器、设置编码参数(采样率/码率/声道数等)、开始、刷新、重置、销毁资源。
36
37在应用开发过程中,开发者应按一定顺序调用方法,执行对应操作,否则系统可能会抛出异常或生成其他未定义的行为。具体顺序可参考下列开发步骤及对应说明。
38
39如下为音频编码调用关系图:
40
41- 虚线表示可选。
42
43- 实线表示必选。
44
45![Invoking relationship of audio encode stream](figures/audio-codec.png)
46
47### 在 CMake 脚本中链接动态库
48
49```cmake
50target_link_libraries(sample PUBLIC libnative_media_codecbase.so)
51target_link_libraries(sample PUBLIC libnative_media_core.so)
52target_link_libraries(sample PUBLIC libnative_media_acodec.so)
53```
54
55### 开发步骤
56
571. 添加头文件。
58
59    ```cpp
60    #include <multimedia/player_framework/native_avcodec_audiocodec.h>
61    #include <multimedia/native_audio_channel_layout.h>
62    #include <multimedia/player_framework/native_avcapability.h>
63    #include <multimedia/player_framework/native_avcodec_base.h>
64    #include <multimedia/player_framework/native_avformat.h>
65    #include <multimedia/player_framework/native_avbuffer.h>
66    ```
67
682. 创建编码器实例对象,OH_AVCodec *为编码器实例指针。
69
70   应用可以通过名称或媒体类型创建编码器。
71
72    ```cpp
73    // c++标准库命名空间
74    using namespace std;
75    // 通过 codecname 创建编码器
76    OH_AVCapability *capability = OH_AVCodec_GetCapability(OH_AVCODEC_MIMETYPE_AUDIO_AAC, true);
77    const char *name = OH_AVCapability_GetName(capability);
78    OH_AVCodec *audioEnc_ = OH_AudioCodec_CreateByName(name);
79    ```
80
81    ```cpp
82    // 设置判定是否为编码;设置true表示当前是编码。
83    bool isEncoder = true;
84    // 通过媒体类型创建编码器
85    OH_AVCodec *audioEnc_ = OH_AudioCodec_CreateByMime(OH_AVCODEC_MIMETYPE_AUDIO_AAC, isEncoder);
86    ```
87
88    ```cpp
89    // 初始化队列
90    class AEncBufferSignal {
91    public:
92        std::mutex inMutex_;
93        std::mutex outMutex_;
94        std::mutex startMutex_;
95        std::condition_variable inCond_;
96        std::condition_variable outCond_;
97        std::condition_variable startCond_;
98        std::queue<uint32_t> inQueue_;
99        std::queue<uint32_t> outQueue_;
100        std::queue<OH_AVBuffer *> inBufferQueue_;
101        std::queue<OH_AVBuffer *> outBufferQueue_;
102    };
103    AEncBufferSignal *signal_;
104    ```
105
1063. 调用OH_AudioCodec_RegisterCallback()注册回调函数。
107   注册回调函数指针集合OH_AVCodecCallback,包括:
108
109   - OH_AVCodecOnError:编码器运行错误。
110   - OH_AVCodecOnStreamChanged:码流信息变化,如声道变化等。
111   - OH_AVCodecOnNeedInputBuffer:运行过程中需要新的输入数据,即编码器已准备好,可以输入PCM数据。
112   - OH_AVCodecOnNewOutputBuffer:运行过程中产生了新的输出数据,即编码完成。
113
114   开发者可以通过处理该回调报告的信息,确保编码器正常运转。
115
116    ```cpp
117    // OH_AVCodecOnError回调函数的实现
118    static void OnError(OH_AVCodec *codec, int32_t errorCode, void *userData)
119    {
120        (void)codec;
121        (void)errorCode;
122        (void)userData;
123    }
124    // OH_AVCodecOnStreamChanged回调函数的实现
125    static void OnOutputFormatChanged(OH_AVCodec *codec, OH_AVFormat *format, void *userData)
126    {
127        (void)codec;
128        (void)format;
129        (void)userData;
130    }
131    // OH_AVCodecOnNeedInputBuffer回调函数的实现
132    static void OnInputBufferAvailable(OH_AVCodec *codec, uint32_t index, OH_AVBuffer *data, void *userData)
133    {
134        (void)codec;
135        // 编码输入码流送入InputBuffer队列
136        AEncBufferSignal *signal = static_cast<AEncBufferSignal *>(userData);
137        unique_lock<mutex> lock(signal->inMutex_);
138        signal->inQueue_.push(index);
139        signal->inBufferQueue_.push(data);
140        signal->inCond_.notify_all();
141    }
142    // OH_AVCodecOnNewOutputBuffer回调函数的实现
143    static void OnOutputBufferAvailable(OH_AVCodec *codec, uint32_t index, OH_AVBuffer *data, void *userData)
144    {
145        (void)codec;
146        // 将对应输出buffer的index送入OutputQueue_队列
147        // 将对应编码完成的数据data送入outBuffer队列
148        AEncBufferSignal *signal = static_cast<AEncBufferSignal *>(userData);
149        unique_lock<mutex> lock(signal->outMutex_);
150        signal->outQueue_.push(index);
151        signal->outBufferQueue_.push(data);
152    }
153    signal_ = new AEncBufferSignal();
154    OH_AVCodecCallback cb_ = {&OnError, &OnOutputFormatChanged, &OnInputBufferAvailable, &OnOutputBufferAvailable};
155    // 配置异步回调
156    int32_t ret = OH_AudioCodec_RegisterCallback(audioEnc_, cb_, signal_);
157    if (ret != AV_ERR_OK) {
158        // 异常处理
159    }
160    ```
161
1624. 调用OH_AudioCodec_Configure设置编码器。
163
164   设置必选项:采样率,码率,以及声道数,声道类型、位深。
165
166   可选项:最大输入长度。
167
168   flac编码: 需要额外标识兼容性级别(Compliance Level)和采样精度。
169
170   各音频编码类型参数范围说明:
171   | 音频编码类型 | 采样率(Hz)                                                                       |       声道数       |
172   | ----------- | ------------------------------------------------------------------------------- | :----------------: |
173   | AAC         | 8000、11025、12000、16000、22050、24000、32000、44100、48000、64000、88200、96000 | 1、2、3、4、5、6、8 |
174   | Flac        | 8000、11025、12000、16000、22050、24000、32000、44100、48000、64000、88200、96000 |        1~8         |
175   | MP3         | 8000、11025、12000、16000、22050、24000、32000、44100、48000                     |        1~2         |
176   | G711mu      | 8000                                                                            |         1          |
177   <!--RP3--><!--RP3End-->
178
179   对于44100Hz采样率、2声道立体声、SAMPLE_S16LE采样格式的PCM音频,以32000bps的码率进行AAC编码的调用流程如下:
180
181    ```cpp
182    int32_t ret;
183    // 配置音频采样率(必须)
184    constexpr uint32_t DEFAULT_SAMPLERATE = 44100;
185    // 配置音频码率(必须)
186    constexpr uint64_t DEFAULT_BITRATE = 32000;
187    // 配置音频声道数(必须)
188    constexpr uint32_t DEFAULT_CHANNEL_COUNT = 2;
189    // 配置音频声道类型(必须)
190    constexpr OH_AudioChannelLayout CHANNEL_LAYOUT = OH_AudioChannelLayout::CH_LAYOUT_STEREO;
191    // 配置音频位深(必须)
192    constexpr OH_BitsPerSample SAMPLE_FORMAT = OH_BitsPerSample::SAMPLE_S16LE;
193    // 配置音频compliance level (默认值0,取值范围-2~2)
194    constexpr int32_t COMPLIANCE_LEVEL = 0;
195    // 配置音频精度(必须) SAMPLE_S16LE
196    constexpr OH_BitsPerSample BITS_PER_CODED_SAMPLE = OH_BitsPerSample::SAMPLE_S16LE;
197    // 每20ms一帧音频数据
198    constexpr float TIME_PER_FRAME = 0.02;
199    // 配置最大输入长度, 每帧音频数据的大小(可选)
200    constexpr uint32_t DEFAULT_MAX_INPUT_SIZE = DEFAULT_SAMPLERATE * TIME_PER_FRAME * DEFAULT_CHANNEL_COUNT * sizeof(short); // aac
201    OH_AVFormat *format = OH_AVFormat_Create();
202    // 写入format
203    OH_AVFormat_SetIntValue(format,OH_MD_KEY_AUD_CHANNEL_COUNT, DEFAULT_CHANNEL_COUNT);
204    OH_AVFormat_SetIntValue(format,OH_MD_KEY_AUD_SAMPLE_RATE, DEFAULT_SAMPLERATE);
205    OH_AVFormat_SetLongValue(format,OH_MD_KEY_BITRATE, DEFAULT_BITRATE);
206    OH_AVFormat_SetIntValue(format, OH_MD_KEY_AUDIO_SAMPLE_FORMAT, SAMPLE_FORMAT);
207    OH_AVFormat_SetLongValue(format,OH_MD_KEY_CHANNEL_LAYOUT, CHANNEL_LAYOUT);
208    OH_AVFormat_SetIntValue(format,OH_MD_KEY_MAX_INPUT_SIZE, DEFAULT_MAX_INPUT_SIZE);
209    // 配置编码器
210    ret = OH_AudioCodec_Configure(audioEnc_, format);
211    if (ret != AV_ERR_OK) {
212        // 异常处理
213    }
214    ```
215
216    例FLAC调用流程:
217
218    ```cpp
219    int32_t ret;
220    // 配置音频采样率(必须)
221    constexpr uint32_t DEFAULT_SAMPLERATE = 44100;
222    // 配置音频码率(必须)
223    constexpr uint64_t DEFAULT_BITRATE = 261000;
224    // 配置音频声道数(必须)
225    constexpr uint32_t DEFAULT_CHANNEL_COUNT = 2;
226    // 配置音频声道类型(必须)
227    constexpr OH_AudioChannelLayout CHANNEL_LAYOUT = OH_AudioChannelLayout::CH_LAYOUT_STEREO;
228    // 配置音频位深(必须) flac 只有SAMPLE_S16LE和SAMPLE_S32LE
229    constexpr OH_BitsPerSample SAMPLE_FORMAT = OH_BitsPerSample::SAMPLE_S32LE;
230    // 配置音频compliance level (默认值0,取值范围-2~2)
231    constexpr int32_t COMPLIANCE_LEVEL = 0;
232    // 配置音频精度(必须) SAMPLE_S16LE和SAMPLE_S24LE和SAMPLE_S32LE
233    constexpr OH_BitsPerSample BITS_PER_CODED_SAMPLE = OH_BitsPerSample::SAMPLE_S24LE;
234    OH_AVFormat *format = OH_AVFormat_Create();
235    // 写入format
236    OH_AVFormat_SetIntValue(format, OH_MD_KEY_AUD_CHANNEL_COUNT, DEFAULT_CHANNEL_COUNT);
237    OH_AVFormat_SetIntValue(format, OH_MD_KEY_AUD_SAMPLE_RATE, DEFAULT_SAMPLERATE);
238    OH_AVFormat_SetLongValue(format, OH_MD_KEY_BITRATE, DEFAULT_BITRATE);
239    OH_AVFormat_SetIntValue(format, OH_MD_KEY_BITS_PER_CODED_SAMPLE, BITS_PER_CODED_SAMPLE);
240    OH_AVFormat_SetIntValue(format, OH_MD_KEY_AUDIO_SAMPLE_FORMAT, SAMPLE_FORMAT);
241    OH_AVFormat_SetLongValue(format, OH_MD_KEY_CHANNEL_LAYOUT, CHANNEL_LAYOUT);
242    OH_AVFormat_SetLongValue(format, OH_MD_KEY_COMPLIANCE_LEVEL, COMPLIANCE_LEVEL);
243    // 配置编码器
244    ret = OH_AudioCodec_Configure(audioEnc_, format);
245    if (ret != AV_ERR_OK) {
246        // 异常处理
247    }
248    ```
249
250    <!--RP2--><!--RP2End-->
251
2525. 调用OH_AudioCodec_Prepare(),编码器就绪。
253
254    ```cpp
255    ret = OH_AudioCodec_Prepare(audioEnc_);
256    if (ret != AV_ERR_OK) {
257        // 异常处理
258    }
259    ```
260
2616. 调用OH_AudioCodec_Start()启动编码器,进入运行态。
262
263    ```c++
264    unique_ptr<ifstream> inputFile_ = make_unique<ifstream>();
265    unique_ptr<ofstream> outFile_ = make_unique<ofstream>();
266    // 打开待编码二进制文件路径(此处以输入为PCM文件为例)
267    inputFile_->open(inputFilePath.data(), ios::in | ios::binary);
268    // 配置编码文件输出路径(此处以输出为编码码流文件为例)
269    outFile_->open(outputFilePath.data(), ios::out | ios::binary);
270    // 开始编码
271    ret = OH_AudioCodec_Start(audioEnc_);
272    if (ret != AV_ERR_OK) {
273        // 异常处理
274    }
275    ```
276
2777. 调用OH_AudioCodec_PushInputBuffer(),写入待编码器的数据。
278
279   aac: 每帧样点数(SAMPLES_PER_FRAME)建议使用20ms的PCM样点数,即采样率*0.02。
280
281   flac: 每帧样点数(SAMPLES_PER_FRAME)比较特殊需要,根据如下表格进行设置。
282
283   | 采样率 | 样点数 |
284   | :----: | :----: |
285   |  8000  |  576  |
286   | 16000 |  1152  |
287   | 22050 |  2304  |
288   | 24000 |  2304  |
289   | 32000 |  2304  |
290   | 44100 |  4608  |
291   | 48000 |  4608  |
292   | 88200 |  8192  |
293   | 96000 |  8192  |
294
295   > **说明:**
296   > aac编码的每帧样点数建议使用20ms的PCM样点数,即采样率*0.02。flac编码的样点数建议根据采样率按照表格传入,大于这个值也会返回错误码,如果小于有可能出现编码文件损坏问题。
297
298   ```c++
299    // 每帧样点数
300    constexpr int32_t SAMPLES_PER_FRAME = DEFAULT_SAMPLERATE * TIME_PER_FRAME;
301    // 声道数,对于amr编码声道数只支持单声道的音频输入
302    constexpr int32_t DEFAULT_CHANNEL_COUNT = 2;
303    // 每帧输入数据的长度,声道数 * 每帧样点数 * 每个样点的字节数(以采样格式SAMPLE_S16LE为例)
304    constexpr int32_t INPUT_FRAME_BYTES = DEFAULT_CHANNEL_COUNT * SAMPLES_PER_FRAME * sizeof(short);
305    uint32_t index = signal_->inQueue_.front();
306    auto buffer = signal_->inBufferQueue_.front();
307    OH_AVCodecBufferAttr attr = {0};
308    if (!inputFile_->eof()) {
309        inputFile_->read((char *)OH_AVBuffer_GetAddr(buffer), INPUT_FRAME_BYTES);
310        attr.size = INPUT_FRAME_BYTES;
311        attr.flags = AVCODEC_BUFFER_FLAGS_NONE;
312    } else {
313        attr.size = 0;
314        attr.flags = AVCODEC_BUFFER_FLAGS_EOS;
315    }
316    OH_AVBuffer_SetBufferAttr(buffer, &attr);
317    // 送入编码输入队列进行编码, index为对应队列下标
318    ret = OH_AudioCodec_PushInputBuffer(audioEnc_, index);
319    if (ret != AV_ERR_OK) {
320        // 异常处理
321    }
322    ```
323   在上方案例中,attr.flags代表缓冲区标记的类别。
324   如果是结束,需要将flags标识成AVCODEC_BUFFER_FLAGS_EOS。
325   | 枚举值 | 描述 |
326   | -------- | -------- |
327   | AVCODEC_BUFFER_FLAGS_NONE | 表示为普通帧。 |
328   | AVCODEC_BUFFER_FLAGS_EOS | 表示缓冲区是流结束帧。 |
329   | AVCODEC_BUFFER_FLAGS_CODEC_DATA | 表示缓冲区包含编解码特定数据。 |
330
3318. 调用OH_AudioCodec_FreeOutputBuffer(),输出编码格式码流。
332
333    ```c++
334    uint32_t index = signal_->outQueue_.front();
335    OH_AVBuffer *avBuffer = signal_->outBufferQueue_.front();
336    // 获取buffer attributes
337    OH_AVCodecBufferAttr attr = {0};
338    ret = OH_AVBuffer_GetBufferAttr(avBuffer, &attr);
339    if (ret != AV_ERR_OK) {
340        // 异常处理
341    }
342    // 将编码完成数据data写入到对应输出文件中
343    outputFile_->write(reinterpret_cast<char *>(OH_AVBuffer_GetAddr(avBuffer)), attr.size);
344    // 释放已完成写入的数据
345    ret = OH_AudioCodec_FreeOutputBuffer(audioEnc_, index);
346    if (ret != AV_ERR_OK) {
347        // 异常处理
348    }
349    if (attr.flags == AVCODEC_BUFFER_FLAGS_EOS) {
350        // 结束
351    }
352    ```
353
3549. (可选)调用OH_AudioCodec_Flush()刷新编码器。
355   调用OH_AudioCodec_Flush()后,编码器处于Flush状态,会将当前编码队列清空。
356   此时需要调用OH_AudioCodec_Start()重新开始编码。
357   使用情况:
358
359   * 在文件EOS之后,需要调用刷新
360   * 在执行过程中遇到可继续执行的错误时(即OH_AudioCodec_IsValid 为true)可以调用,然后重新调用OH_AudioCodec_Start
361
362    ```c++
363    // 刷新编码器 audioEnc_
364    ret = OH_AudioCodec_Flush(audioEnc_);
365    if (ret != AV_ERR_OK) {
366        // 异常处理
367    }
368    // 重新开始编码
369    ret = OH_AudioCodec_Start(audioEnc_);
370    if (ret != AV_ERR_OK) {
371        // 异常处理
372    }
373    ```
374
37510. (可选)调用OH_AudioCodec_Reset()重置编码器。
376    调用OH_AudioCodec_Reset()后,编码器回到初始化的状态,需要调用OH_AudioCodec_Configure()重新配置,然后调用OH_AudioCodec_Start()重新开始编码。
377
378    ```c++
379    // 重置编码器 audioEnc_
380    ret = OH_AudioCodec_Reset(audioEnc_);
381    if (ret != AV_ERR_OK) {
382        // 异常处理
383    }
384    // 重新配置编码器参数
385    ret = OH_AudioCodec_Configure(audioEnc_, format);
386    if (ret != AV_ERR_OK) {
387        // 异常处理
388    }
389    ```
390
39111. 调用OH_AudioCodec_Stop()停止编码器。
392
393    ```c++
394    // 终止编码器 audioEnc_
395    ret = OH_AudioCodec_Stop(audioEnc_);
396    if (ret != AV_ERR_OK) {
397        // 异常处理
398    }
399    ```
400
40112. 调用OH_AudioCodec_Destroy()销毁编码器实例,释放资源。
402
403    > **说明:**
404    > 资源不能重复销毁
405
406    ```c++
407    // 调用OH_AudioCodec_Destroy, 注销编码器
408    ret = OH_AudioCodec_Destroy(audioEnc_);
409    if (ret != AV_ERR_OK) {
410        // 异常处理
411    } else {
412        audioEnc_ = NULL; // 不可重复destroy
413    }
414    ```
415
416## 相关实例
417
418针对音频编码,有以下相关实例可供参考:
419
420- [音频编码](https://gitee.com/openharmony/multimedia_av_codec/blob/master/test/nativedemo/audio_demo/avcodec_audio_avbuffer_aac_encoder_demo.cpp)
421