• Home
  • Line#
  • Scopes#
  • Navigate#
  • Raw
  • Download
1# Function Flow Runtime图依赖并发(C++)
2
3<!--Kit: Function Flow Runtime Kit-->
4<!--Subsystem: Resourceschedule-->
5<!--Owner: @chuchihtung; @yanleo-->
6<!--Designer: @geoffrey_guo; @huangyouzhong-->
7<!--Tester: @lotsof; @sunxuhao-->
8<!--Adviser: @foryourself-->
9
10## 概述
11
12FFRT图依赖并发范式支持任务依赖和数据依赖两种方式构建任务依赖图。任务依赖图中每个节点表示一个任务,边表示任务之间的依赖关系。任务依赖分为输入依赖`in_deps`和输出依赖`out_deps`。
13
14构建任务依赖图的两种不同方式:
15
16- 当使用任务依赖方式构建任务依赖图时,使用任务句柄`handle`来对应一个任务对象。
17- 当使用数据依赖方式构建任务依赖图时,数据对象表达抽象为数据签名,每个数据签名唯一对应一个数据对象。
18
19### 任务依赖
20
21> **说明:**
22>
23> 当任务句柄出现在一个任务的`in_deps`中时,任务句柄对应的任务是该任务的前置任务;当任务句柄出现在一个任务的`out_deps`中时,任务句柄对应的任务是该任务的后继任务。
24
25任务依赖适用于任务之间有明确顺序或逻辑流程要求的场景,例如:
26
27- 顺序执行的任务,例如:先进行数据预处理任务,然后再进行模型训练任务。
28- 逻辑流程控制,例如:商品交易过程中,通常是先下单,然后是制作,最后是物流运输。
29- 多级任务链,例如:流媒体视频处理过程中,视频解析后可以进行视频转码和视频生成缩略图,然后是视频添加水印,最后是视频发布。
30
31### 数据依赖
32
33> **说明:**
34>
35> 当数据对象的签名出现在一个任务的`in_deps`中时,该任务称为数据对象的消费者任务,消费者任务执行不改变其输入数据对象的内容;
36> 当数据对象的签名出现在任务的`out_deps`中时,该任务称为数据对象的生产者任务,生产者任务执行改变其输出数据对象的内容,从而生成该数据对象的一个新的版本。
37
38数据依赖适用于任务之间通过数据生产和消费关系来触发执行的场景。
39
40一个数据对象可能存在多个版本,每个版本对应一个生产者任务和零个,一个或多个消费者任务,根据生产者任务和消费者任务的下发顺序定义数据对象的多个版本的顺序,以及每个版本所对应的生产者和消费者任务。
41
42数据依赖解除的任务进入就绪状态允许被调度执行,依赖解除状态指任务所有输入数据对象版本的生产者任务执行完成,且所有输出数据对象版本的所有消费者任务执行完成的状态。
43
44FFRT在运行时可动态构建任务之间的基于生产者/消费者的数据依赖关系并遵循任务数据依赖状态执行调度,包括:
45
46- Producer-Consumer依赖
47
48  一个数据对象版本的生产者任务和该数据对象版本的消费者任务之间形成的依赖关系,也称为Read-after-Write依赖。
49
50- Consumer-Producer依赖
51
52  一个数据对象版本的消费者任务和该数据对象的下一个版本的生产者任务之间形成的依赖关系,也称为Write-after-Read依赖。
53
54- Producer-Producer依赖
55
56  一个数据对象版本的生产者任务和该数据对象的下一个版本的生产者任务之间形成的依赖关系,也称为Write-after-Write依赖。
57
58例如,存在一组任务与数据A的关系表述为:
59
60```cpp
61task1(OUT A);
62task2(IN A);
63task3(IN A);
64task4(OUT A);
65task5(OUT A);
66```
67
68![image](figures/ffrt_figure3.png)
69
70为表述方便,本文中的数据流图均以圆圈表示Task,方块表示数据。
71
72可以得出以下结论:
73
74- task1与task2/task3构成Producer-Consumer依赖,即:task2/task3需要等到task1写完A之后才能读A。
75- task2/task3与task4构成Consumer-Producer依赖,即:task4需要等到task2/task3读完A之后才能写A。
76- task4与task5构成Producer-Producer依赖,即:task5需要等到task4写完A之后才能写A。
77
78## 示例:流媒体视频处理
79
80用户上传视频到流媒体平台,处理步骤包含:视频解析A、视频转码B、视频缩略图生成C、视频水印添加D和视频发布E,其中步骤B和步骤C可以并行执行。任务流程如下图所示:
81
82![image](figures/ffrt_figure1.png)
83
84借助FFRT提供了图依赖并发范式,可以描述任务依赖关系,同时并行化上述视频处理流程,代码如下所示:
85
86```cpp
87#include <iostream>
88#include "ffrt/ffrt.h" // 来自 OpenHarmony 第三方库 "@ppd/ffrt"
89
90int main()
91{
92    // 提交任务
93    auto handle_A = ffrt::submit_h([] () { std::cout << "视频解析" << std::endl; });
94    auto handle_B = ffrt::submit_h([] () { std::cout << "视频转码" << std::endl; }, {handle_A});
95    auto handle_C = ffrt::submit_h([] () { std::cout << "视频生成缩略图" << std::endl; }, {handle_A});
96    auto handle_D = ffrt::submit_h([] () { std::cout << "视频添加水印" << std::endl; }, {handle_B, handle_C});
97    ffrt::submit([] () { std::cout << "视频发布" << std::endl; }, {handle_D});
98
99    // 等待所有任务完成
100    ffrt::wait();
101    return 0;
102}
103```
104
105预期的输出可能为:
106
107```plain
108视频解析
109视频转码
110视频生成缩略图
111视频添加水印
112视频发布
113```
114
115## 示例:斐波那契数列
116
117斐波那契数列中每个数字是前两个数字之和,计算斐波那契数的过程可以很好地通过数据对象来表达任务依赖关系。使用FFRT并发编程框架计算斐波那契数的代码如下所示:
118
119```cpp
120#include <iostream>
121#include "ffrt/ffrt.h" // 来自 OpenHarmony 第三方库 "@ppd/ffrt"
122
123void Fib(int x, int& y)
124{
125    if (x <= 1) {
126        y = x;
127    } else {
128        int y1, y2;
129
130        // 提交任务并构建数据依赖
131        ffrt::submit([&]() { Fib(x - 1, y1); }, {&x}, {&y1});
132        ffrt::submit([&]() { Fib(x - 2, y2); }, {&x}, {&y2});
133
134        // 等待任务完成
135        ffrt::wait({&y1, &y2});
136        y = y1 + y2;
137    }
138}
139
140int main()
141{
142    int y;
143    Fib(5, y);
144    std::cout << "Fibonacci(5) is " << y << std::endl;
145}
146```
147
148预期输出为:
149
150```plain
151Fibonacci(5) is 5
152```
153
154示例中将`fibonacci(x-1)`和`fibonacci(x-2)`作为两个任务提交给FFRT,在两个任务完成之后将结果进行累加。虽然单个任务只是拆分成两个子任务,但是子任务又可以继续进行拆分,因此整个计算图的并行度是非常高的。
155
156各个任务在FFRT内部形成了一颗调用树:
157
158![image](figures/ffrt_figure2.png)
159
160## 接口说明
161
162上述样例中涉及到主要的FFRT的接口包括:
163
164| 名称                                                                                                                | 描述                             |
165| ------------------------------------------------------------------------------------------------------------------- | -------------------------------- |
166| [submit](https://gitee.com/openharmony/resourceschedule_ffrt/blob/master/docs/ffrt-api-guideline-cpp.md#submit)     | 提交任务调度执行。               |
167| [submit_h](https://gitee.com/openharmony/resourceschedule_ffrt/blob/master/docs/ffrt-api-guideline-cpp.md#submit_h) | 提交任务调度执行并返回任务句柄。 |
168| [wait](https://gitee.com/openharmony/resourceschedule_ffrt/blob/master/docs/ffrt-api-guideline-cpp.md#wait)         | 等待上下文所有任务完成。         |
169
170> **说明:**
171>
172> - 如何使用FFRT C++ API详见:[FFRT C++接口三方库使用指导](ffrt-development-guideline.md#using-ffrt-c-api-1)。
173> - 使用FFRT C接口或C++接口时,都可以通过FFRT C++接口三方库简化头文件包含,即使用`#include "ffrt/ffrt.h"`头文件包含语句。
174
175## 约束限制
176
177- 使用`submit`接口进行任务提交时,每个任务的输入依赖和输出依赖的数量之和不能超过8个。
178- 使用`submit_h`接口进行任务提交时,每个任务的输入依赖和输出依赖的数量之和不能超过7个。
179- 参数既作为输入依赖又作为输出依赖的时候,统计依赖数量时只统计一次,如输入依赖是`{&x}`,输出依赖也是`{&x}`,实际依赖的数量是 1。
180