• Home
  • Line#
  • Scopes#
  • Navigate#
  • Raw
  • Download
1# 时域可分层视频编码
2
3## 基础概念
4
5### 时域可分层视频编码介绍
6
7**可分层视频编码**,又叫可分级视频编码、可伸缩视频编码,是视频编码的扩展标准,目前常用的包含SVC(H.264编码标准采用的可伸缩扩展)和SHVC(H.265编码标准采用的可扩展标准)。
8
9其特点是能一次编码出时域分层、空域分层、质量域分层的码流结构,满足因网络、终端能力和用户需求不同带来的差异化需求。
10
11**时域可分层视频编码**,是指能编码出时域分层码流的视频编码,下图是通过参考关系构建的4层时域分层码流结构。
12
13![Temporal scalability 4 layers](figures/temporal-scalability-4layers.png)
14
15从高到低逐层丢弃部分层级的码流(丢弃顺序L3->L2->L1),能实现不同程度的帧率伸缩,以满足传输和解码能力的变化需求。
16
17如下图所示,是上述4层时域分层码流结构丢弃L3后组成的新的码流结构,能在解码正常的情况下实现帧率减半的效果。其他层的丢弃同理。
18
19![Temporal scalability 4 layers L3 dropped](figures/temporal-scalability-4layers-L3-dropped.png)
20
21### 时域分层码流结构介绍
22基础码流是由一个或多个独立图像组(Group Of Pictures,简称GOP)组合而成的。GOP是在编码中一组从I帧开始到I帧结束的连续的可独立解码的图像组。
23
24时域分层码流可以在GOP内继续细分为独立的一个或多个时域图像组(Temporal Group Of Pictures,简称TGOP),每一个TGOP由一个基本层和后续的一个或多个增强层组合而成,如上述4层时域分层码流结构中的帧0到帧7是一个TGOP。
25
26- **基本层(Base Layer,简称BL):** 是GOP中的最底层(L0)。在时域分层中,该层用最低帧率进行编码。
27
28- **增强层(Enhance Layer,简称EL):** 是BL之上的层级,由低到高可以分为多层(L1、L2、L3)。在时域分层中,最低层的EL依据BL获得的编码信息,进一步编码帧率更高的层级,更高层的EL会依据BL或低层EL,来编码比低层更高帧率的视频。
29
30### 如何实现时域分层码流结构
31
32时域分层码流结构的实现是依靠参考关系逐帧指定实现的,参考帧根据在解码图像缓存区(Decoded Picture Buffer,简称DPB)驻留的时长分为短期参考帧和长期参考帧。
33
34- **短期参考帧(Short-Term Reference,简称STR):** 是不能长期驻留在DPB中的参考帧,更新方式是先进先出,如果DPB满,旧的短期参考帧会被移出DPB。
35
36- **长期参考帧(Long-Term Reference,简称LTR):** 是能长期驻留在DPB中的参考帧,通过标记替换的方式更新,不主动标记替换就不会更新。
37
38虽然STR个数大于1时,也能实现一定的跨帧参考结构,但受限于存在时效过短,时域分层结构支持的跨度有限。LTR则不存在上述问题,也能覆盖短期参考帧跨帧场景。优选使用LTR实现时域分层码流结构。
39
40## 适用场景
41基于上述描述的时域分层编码特点,推荐以下场景使用:
42
43- 场景1:播放侧无缓存或低缓存的实时编码传输场景,例如视频会议、视频直播、协同办公等。
44
45- 场景2:有视频预览播放或倍速播放需求的视频编码录制场景。
46
47若开发场景不涉及动态调整时域参考结构,且分层结构简单,则推荐使用[全局时域可分层特性](#全局时域可分层特性feature_temporal_scalability),否则使能[长期参考帧特性](#长期参考帧特性feature_long-term_reference)。
48
49## 约束和限制
50
51- 不可以混用全局时域可分层特性和长期参考帧特性。
52
53  由于底层实现归一,全局时域可分层特性和长期参考帧特性不能同时开启。
54
55- 叠加强制IDR配置时,请使用随帧通路配置。
56
57  参考帧仅在GOP内有效,刷新I帧后,DPB随之清空,参考帧也会被清空,因此参考关系的指定受I帧刷新位置影响很大。
58
59  使能时域分层能力后,若需要通过`OH_MD_KEY_REQUEST_I_FRAME`临时请求I帧,应使用生效时机确定的随帧通路配置方式准确告知系统I帧刷新位置以避免参考关系错乱,参考随帧通路配置相关指导,避免使用生效时机不确定的`OH_VideoEncoder_SetParameter`方式。详情请参考[视频编码Surface模式](video-encoding.md#surface模式)"步骤-4:调用OH_VideoEncoder_RegisterParameterCallback()在Configur接口之前注册随帧通路回调。"。
60
61- 支持`OH_AVBuffer`回调通路,不支持`OH_AVMemory`回调通路。
62
63   新特性依赖随帧特性,应避免使用`OH_AVMemory`回调`OH_AVCodecAsyncCallback`,应使用`OH_AVBuffer`回调`OH_AVCodecCallback`。
64
65- 支持时域P分层,不支持时域B分层。
66
67  时域可分层编码按分层帧类型分为基于P帧的时域分层和基于B帧的时域编码,当前支持分层P编码,不支持分层B编码。
68
69- 均匀分层模式当前只支持TGOP为2或4。
70
71## 全局时域可分层特性(Feature_Temporal_Scalability)
72
73### 接口介绍
74
75全局时域可分层特性,适用于编码稳定和简单的时域分层结构,初始配置,全局生效,不支持动态修改。开发配置参数如下:
76
77| 配置参数 | 语义                         |
78| -------- | ---------------------------- |
79| OH_MD_KEY_VIDEO_ENCODER_ENABLE_TEMPORAL_SCALABILITY  |  全局时域分层编码使能参数 |
80| OH_MD_KEY_VIDEO_ENCODER_TEMPORAL_GOP_SIZE  | 全局时域分层编码TGOP大小参数 |
81| OH_MD_KEY_VIDEO_ENCODER_TEMPORAL_GOP_REFERENCE_MODE  | 全局时域分层编码TGOP参考模式  |
82
83- **全局时域分层编码使能参数:** 在配置阶段配置,仅特性支持才会真正使能成功。
84
85- **全局时域分层编码TGOP大小参数:** 可选配置,影响时域关键帧之间的间隔,用户需要基于自身业务场景下抽帧需求自定义关键帧密度,可在[2, GopSize)范围内配置,若不配置则使用默认值。
86
87- **全局时域分层编码TGOP参考模式参数:** 可选配置,影响非关键帧参考模式。包括相邻参考`ADJACENT_REFERENCE`、跨帧参考`JUMP_REFERENCE` 和均匀分层`UNIFORMLY_SCALED_REFERENCE`。相邻参考相对跨帧参考拥有更好的压缩性能,跨帧参考相对相邻参考拥有更好的丢帧自由度,均匀分层模式丢帧后的码流分布更均匀,如不配置则使用默认值。
88
89    > **说明:**
90    > 均匀分层模式当前只支持TGOP为2或4。
91    >
92
93使用举例1:TGOP=4,相邻参考模式。
94
95![Temporal gop 4 adjacent reference](figures/temporal-scalability-tgop4-adjacent.png)
96
97使用举例2:TGOP=4,跨帧参考模式。
98
99![TGOP4 jump reference](figures/temporal-scalability-tgop4-jump.png)
100
101使用举例3:TGOP=4,均匀分层模式。
102
103![TGOP4 uniformly scaled reference](figures/temporal-scalability-tgop4-uniformly.png)
104
105### 开发指导
106
107基础编码流程请参考[视频编码开发指导](video-encoding.md),下面仅针对与基础视频编码过程中存在的区别做具体说明。
108
1091. 在初始阶段创建编码实例时,校验当前视频编码器是否支持全局时域可分层特性。
110
111    ```c++
112    // 1.1 获取对应视频编码器能力实例,此处以H.264为例。
113    OH_AVCapability *cap = OH_AVCodec_GetCapability(OH_AVCODEC_MIMETYPE_VIDEO_AVC, true);
114    // 1.2 通过特性能力查询接口校验是否支持全局时域可分层特性。
115    bool isSupported = OH_AVCapability_IsFeatureSupported(cap, VIDEO_ENCODER_TEMPORAL_SCALABILITY);
116    ```
117
118    若支持,则可以使能全局时域可分层特性。
119
1202. 在配置阶段,配置全局时域分层编码特性参数。
121
122    ```c++
123    constexpr int32_t TGOP_SIZE = 3;
124    // 2.1 创建配置用临时AVFormat。
125    OH_AVFormat *format = OH_AVFormat_Create();
126    // 2.2 填充使能参数键值对。
127    OH_AVFormat_SetIntValue(format, OH_MD_KEY_VIDEO_ENCODER_ENABLE_TEMPORAL_SCALABILITY, 1);
128    // 2.3 (可选)填充TGOP大小和TGOP内参考模式键值对。
129    OH_AVFormat_SetIntValue(format, OH_MD_KEY_VIDEO_ENCODER_TEMPORAL_GOP_SIZE, TGOP_SIZE);
130    OH_AVFormat_SetIntValue(format, OH_MD_KEY_VIDEO_ENCODER_TEMPORAL_GOP_REFERENCE_MODE, ADJACENT_REFERENCE);
131    // 2.4 参数配置。
132    int32_t ret = OH_VideoEncoder_Configure(videoEnc, format);
133    if (ret != AV_ERR_OK) {
134        // 异常处理。
135    }
136    // 2.5 配置完成后销毁临时AVFormat。
137    OH_AVFormat_Destroy(format);
138    ```
139
1403. (可选)在运行阶段输出轮转中,获取码流对应时域层级信息。
141
142    开发者可基于已配置的TGOP参数,按编码出帧数目周期性获取。
143
144    通过配置周期获取示例代码如下:
145
146    ```c++
147    uint32_t outPoc = 0;
148    // 通过输出回调中有效帧数,获取TGOP内相对位置,对照配置确认层级。
149    static void OnNewOutputBuffer(OH_AVCodec *codec, uint32_t index, OH_AVBuffer *buffer, void *userData)
150    {
151        // 注:若涉及复杂处理流程,建议相关。
152        struct OH_AVCodecBufferAttr attr;
153        (void)buffer->GetBufferAttr(attr);
154        // 刷新I帧后POC归零。
155        if (attr.flags & AVCODEC_BUFFER_FLAG_KEY_FRAME) {
156            outPoc = 0;
157        }
158        // 只有XPS的输出需要跳过。
159        if (attr.flags != AVCODEC_BUFFER_FLAG_CODEC_DATA) {
160            int32_t tGopInner = outPoc % TGOP_SIZE;
161            if (tGopInner == 0) {
162                // 时域关键帧,后续传输、解码流程不可丢弃。
163            } else {
164                // 时域非关键帧,后续传输、解码流程可以丢弃。
165            }
166            outPoc++;
167        }
168    }
169    ```
170
1714. (可选)在运行阶段输出轮转中,使用步骤3获取的时域层级信息,自适应传输或自适应解码。
172
173    基于获取的时域可分层码流和对应的层级信息,开发者可选择需要的层级进行传输,或携带至对端自适应选帧解码。
174
175## 长期参考帧特性(Feature_Long-Term_Reference)
176
177### 接口介绍
178
179长期参考帧特性提供帧级灵活的参考关系配置。适用于灵活和复杂的时域分层结构。
180
181| 配置参数 | 语义                 |
182| -------- | ---------------------------- |
183| OH_MD_KEY_VIDEO_ENCODER_LTR_FRAME_COUNT  |  长期参考帧个数参数 |
184| OH_MD_KEY_VIDEO_ENCODER_PER_FRAME_MARK_LTR  | 当前帧标记为LTR帧 |
185| OH_MD_KEY_VIDEO_ENCODER_PER_FRAME_USE_LTR   | 当前帧参考的LTR帧的POC号  |
186
187- **长期参考帧个数参数:** 在配置阶段配置,应小于等于查询到的最大支持数目,查询方式详见下文开发指导“步骤-3”。
188- **当前帧标记为LTR帧:** BL层标记为LTR,被跳跃参考的EL层也标记为LTR。
189- **当前帧参考的LTR帧的POC号:** 如当前帧需要跳跃参考前面已被标记为LTR帧的POC号。
190
191使用举例,实现[时域可分层视频编码介绍](#时域可分层视频编码介绍)中的4层时域分层结构的配置如下:
192
1931. 在配置阶段,将`OH_MD_KEY_VIDEO_ENCODER_LTR_FRAME_COUNT` 配置为5。
194
1952. 在运行阶段输入轮转中,按如下表所示随帧配置LTR相关参数,下表中`\`表示不做配置。
196
197    | 配置\POC | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 |
198    | -------- |---|---|---|---|---|---|---|---|---|---|----|----|----|----|----|----|----|
199    | MARK_LTR | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 | 0  | 0  | 1  | 0  | 0  | 0  | 1  |
200    | USE_LTR  | \ | \ | 0 | \ | 0 | \ | 4 | \ | 0 | \ | 8  | \  | 8  | \  | 12 | \  | 8  |
201
202### 开发指导
203
204基础编码流程请参考[视频编码开发指导](video-encoding.md),下面仅针对基础视频编码过程中存在的区别做具体说明。
205
2061. 在初始阶段创建编码实例时,校验当前视频编码器是否支持LTR特性。
207
208    ```c++
209    constexpr int32_t NEEDED_LTR_COUNT = 5;
210    bool isSupported = false;
211    int32_t supportedLTRCount = 0;
212    // 1.1 获取对应编码器能力实例,此处以H.264为例。
213    OH_AVCapability *cap = OH_AVCodec_GetCapability(OH_AVCODEC_MIMETYPE_VIDEO_AVC, true);
214    // 1.2 通过特性能力查询接口校验是否支持LTR特性。
215    isSupported = OH_AVCapability_IsFeatureSupported(cap, VIDEO_ENCODER_LONG_TERM_REFERENCE);
216    // 1.3 确定支持的LTR数目。
217    if (isSupported) {
218        OH_AVFormat *properties = OH_AVCapability_GetFeatureProperties(cap, VIDEO_ENCODER_LONG_TERM_REFERENCE);
219        OH_AVFormat_GetIntValue(properties, OH_FEATURE_PROPERTY_KEY_VIDEO_ENCODER_MAX_LTR_FRAME_COUNT, &supportedLTRCount);
220        OH_AVFormat_Destroy(properties);
221        // 1.4 判断LTR是否满足结构需求。
222        isSupported = supportedLTRCount >= NEEDED_LTR_COUNT;
223    }
224    ```
225
226    若支持,且支持的LTR数目满足自身码流结构需求,则可以使能LTR特性。
227
2282. 在配置之前注册回调时,注册随帧通路回调。
229
230    Buffer输入模式示例:
231
232    ```c++
233    // 2.1 编码输入回调OH_AVCodecOnNeedInputBuffer实现。
234    static void OnNeedInputBuffer(OH_AVCodec *codec, uint32_t index, OH_AVBuffer *buffer, void *userData)
235    {
236        // 输入帧buffer对应的index,送入InIndexQueue队列。
237        // 输入帧的数据buffer送入InBufferQueue队列。
238        // 数据处理,请参考:
239        // - 写入编码码流。
240        // - 通知编码器码流结束。
241        // - 随帧参数写入。
242        OH_AVFormat *format = OH_AVBuffer_GetParameter(buffer);
243        OH_AVFormat_SetIntValue(format, OH_MD_KEY_VIDEO_ENCODER_PER_FRAME_MARK_LTR, 1);
244        OH_AVFormat_SetIntValue(format, OH_MD_KEY_VIDEO_ENCODER_PER_FRAME_USE_LTR, 4);
245        OH_AVBuffer_SetParameter(buffer, format);
246        OH_AVFormat_Destroy(format);
247        // 通知编码器buffer输入完成。
248        OH_VideoEncoder_PushInputBuffer(codec, index);
249    }
250
251    // 2.2 编码输出回调OH_AVCodecOnNewOutputBuffer实现。
252    static void OnNewOutputBuffer(OH_AVCodec *codec, uint32_t index, OH_AVBuffer *buffer, void *userData)
253    {
254        // 完成帧buffer对应的index,送入outIndexQueue队列。
255        // 完成帧的数据buffer送入outBufferQueue队列。
256        // 数据处理,请参考:
257        // - 释放编码帧。
258        // - 记录POC和LTR生效情况。
259    }
260
261    // 2.3 注册数据回调。
262    OH_AVCodecCallback cb;
263    cb.onNeedInputBuffer = OnNeedInputBuffer;
264    cb.onNewOutputBuffer = OnNewOutputBuffer;
265    OH_VideoEncoder_RegisterCallback(codec, cb, nullptr);
266    ```
267
268    Surface输入模式示例:
269
270    ```c++
271    // 2.1 编码输入参数回调OH_VideoEncoder_OnNeedInputParameter实现。
272    static void OnNeedInputParameter(OH_AVCodec *codec, uint32_t index, OH_AVFormat *parameter, void *userData)
273    {
274        // 输入帧buffer对应的index,送入InIndexQueue队列。
275        // 输入帧的数据avformat送入InFormatQueue队列。
276        // 数据处理,请参考:
277        // - 写入编码码流。
278        // - 通知编码器码流结束。
279        // - 随帧参数写入。
280        OH_AVFormat_SetIntValue(parameter, OH_MD_KEY_VIDEO_ENCODER_PER_FRAME_MARK_LTR, 1);
281        OH_AVFormat_SetIntValue(parameter, OH_MD_KEY_VIDEO_ENCODER_PER_FRAME_USE_LTR, 4);
282        // 通知编码器随帧参数配置输入完成。
283        OH_VideoEncoder_PushInputParameter(codec, index);
284    }
285
286    // 2.2 编码输出回调OH_AVCodecOnNewOutputBuffer实现
287    static void OnNewOutputBuffer(OH_AVCodec *codec, uint32_t index, OH_AVBuffer *buffer, void *userData)
288    {
289        // 完成帧buffer对应的index,送入outIndexQueue队列。
290        // 完成帧的数据buffer送入outBufferQueue队列。
291        // 数据处理,请参考:
292        // - 释放编码帧。
293        // - 记录POC和LTR生效情况。
294    }
295
296    // 2.3 注册数据回调。
297    OH_AVCodecCallback cb;
298    cb.onNewOutputBuffer = OnNewOutputBuffer;
299    OH_VideoEncoder_RegisterCallback(codec, cb, nullptr);
300    // 2.4 注册随帧参数回调。
301    OH_VideoEncoder_OnNeedInputParameter inParaCb = OnNeedInputParameter;
302    OH_VideoEncoder_RegisterParameterCallback(codec, inParaCb, nullptr);
303    ```
304
3053. 在配置阶段,配置同时存在LTR最大数目。
306
307    ```c++
308    constexpr int32_t TGOP_SIZE = 3;
309    // 3.1 创建配置用临时AVFormat。
310    OH_AVFormat *format = OH_AVFormat_Create();
311    // 3.2 填充使能LTR个数键值对。
312    OH_AVFormat_SetIntValue(format, OH_MD_KEY_VIDEO_ENCODER_LTR_FRAME_COUNT, NEEDED_LTR_COUNT);
313    // 3.3 参数配置。
314    int32_t ret = OH_VideoEncoder_Configure(videoEnc, format);
315    if (ret != AV_ERR_OK) {
316        // 异常处理。
317    }
318    // 3.4 配置完成后销毁临时AVFormat。
319    OH_AVFormat_Destroy(format);
320    ```
321
3224. (可选)在运行阶段输出轮转中,获取码流对应时域层级信息。
323
324    同全局时域分层特性。
325
326    因在输入轮转有配置LTR参数,也可在输入轮转中记录,输出轮转中找到对应的输入参数。
327
3285. (可选)在运行阶段输出轮转中,使用步骤4获取的时域层级信息,自适应传输或自适应解码。
329
330    同全局时域分层特性。