1# ARKTS数据说明 2 3TraceStreamer支持解析arkTs的数据,arkTs数据分为JS内存和cpu Profiler两部分,其中JS内存数据又有Snapshot和Timeline两种类型,解析结果输出js_heap_edges, js_heap_files, js_heap_info, js_heap_location, js_heap_nodes, js_heap_sample, js_heap_string, js_heap_trace_function_info, js_heap_trace_node共计九张表分别记录边缘信息,文件信息,数据类型, location节点信息,node节点信息,Timeline模式下的时间轴信息,字符串信息,Timeline模式下的调用栈函数信息,Timeline模式下的调用栈信息。cpu Profiler数据解析结果输出js_cpu_profiler_node和js_cpu_profiler_sample两张表,分别记录cpu profiler的node节点信息和sample节点相关的信息。 4 5## JS数据格式说明 6 7数据采集时,Snapshot和Timeline只能选择其中一种,其中Snapshot为堆内存数据,可设置数据采集间隔,上报的数据为多组,以{"id":1,"result":{}}做为一次数据的结束标识。 8 9![1682579112175](image/js_memory/1682579112175.png) 10 11*Snapshot模式下在下发start命令后立马开始上报数据直到本次抓取结束,数据上报完成之前都属于数据抓取过程。* 12 13Timeline为时间轴数据,一个数据文件中只存在一组Timeline数据。以{"id":1,"result":{}}作为数据采集起始,{"id":2,"result":{}}作为数据采集结束。 14 15![1682579181701](image/js_memory/1682579181701.png) 16 17*Timeline模式下发start命令后开始抓取,插件结束时下发stop命令停止抓取并开始上报数据。Start命令下发到stop命令下发之间属于数据抓取过程。* 18 19## cpu profiler数据格式说明 20 21cpu profiler文件是json格式,包含以下主要节点: 22 23![1690619219886](image/arkTs/1690619219886.png) 24 25其中nodes,samples,timeDeltas节点是数组,数组结构如下: 26nodes: 27 28![1690619306323](image/arkTs/1690619306323.png) 29 30id:函数id。 31functionName:函数名称。 32scriptId:关联到的类对象所在文件的绝对路径ID。 33url:关联到的类对象所在文件的绝对路径名称在data_dict中的索引号。 34lineNumber:类对象所在文件的行号。 35columnNumber:类对象所在文件的列号。 36hitCount:采样次数。 37children:数组格式,表示该函数下的子节点ID。 38 39samples: 40 41![1690619375510](image/arkTs/1690619375510.png) 42数组格式,表示在当前数据中每个id对应的函数出现的顺序。 43 44timeDeltas: 45 46![1690619462650](image/arkTs/1690619462650.png) 47数组格式,下标和samples对应,表示samples中每个下标对应函数的持续时间。 48 49## proto文件说明 50 51arkTs数据解析对应两个proto文件 52 53![1682579300950](image/js_memory/1682579300950.png) 54 55![1682579350993](image/js_memory/1682579350993.png) 56 57其中ArkTsConfig中的数据保存在js_config表中,用来说明当前数据的配置。表字段的对应关系如下: 58pid:目标进程ID。 59type:JS数据类型,取值与枚举HeapType对应,0表示JS内存数据为snapshot类型,1表示JS内存数据为timeline类型,-1表示没有JS内存数据。 60interval:当type=0时生效,单位是秒,表示一次snapshot事件和下一次snapshot事件之间的间隔。 61capture_numeric_value:当type=0时生效,表示是否同时抓取numeric。 62track_allocation:当type=1时生效,表示是否抓取allocations。 63enable_cpu_profiler:表示是否存在cpuprofiler的数据。 64cpu_profiler_interval:表示cpuprofiler数据的采集间隔。 65 66JsHeapResult外层有时间戳可以获取,用来同步trace_range的时间。 67 68## Snapshot 69 70一个Snapshot模式的文件包含有多组Snapshot数据,每一组以{"id":1,"result":{}}作为结束标识,Snapshot数据包含在json[params][ chunk]节点下,一条完整的Snapshot的数据会发送多次result,在收到结束标识之前,拼装所有的[chunk]节点下的result,即为一条完整的Snapshot数据。以此类推,解析至文件结束,可获取多条Snapshot数据。再用json库进行数据解析。 71 72## Timeline 73 74一个Timeline模式的文件包含有一组Timeline数据,以{"id":1,"result":{}}作为起始标识,以{"id":2,"result":{}}作为结束标识。Timeline数据包含在json[params][chunk]节点下,一条完整的Timeline数据会发送多次result,从收到起始标识开始,拼装每一条json[params][chunk]下的数据,直到收到结束标识,即可获取一条完整的Timeline数据。 75 76## CPU Profiler 77 78cpu profiler的数据一次上报完成,以{"id":3,"result":{}}作为起始标识,包含在json[profile]节点下,取上报外层的数据作为结束时间。 79 80### 数据解析 81 82--- 83 84arkts-plugin的数据包含在htrace文件中,由proto文件定义数据格式,解析规则如下: 85 86#### JS内存解析 87 881.js-memory相关数据携带js-memory_config和js-memory插件头,先通过接口ParseJSMemoryConfig获取对应的type和pid,其中type=0为snapshot类型数据,type=1为timeline数据。js-memory数据为json格式,json包含以下节点:snapshot,nodes,edges,locations,strings,samples,trace_function_infos,trace_tree。使用第三方json库nlohmann::json进行解析。 89 902.json解析:snapshot和timeline两种数据类型json的解析规则是相同的。 91 92snapshot:该节点包含js_heap_info表的信息,节点包括node、edge等节点对应的字段名称,数据类型和个数。 93 94nodes:该节点包含了js_heap_nodes表的信息,每一行为7个int类型数字,分别表示type,name,id,self_size,edge_count,trace_node_id,detachedness。 95 96edges:该节点包含了js_heap_edges表的信息,每一行为3个int类型数字,分别表示type,name_or_index,to_node。表中from_node_id是通过nodes节点的id和edgecount计算出的,nodes节点的每个edgecount对应的id即为edges节点的from_node_id。 97 98![1683533864357](image/js_memory/1683533864357.png) 99 100例:"nodes" 101 102| type | name | id | self_size | edge_count | trace_node_id | datachedness | 103| ---- | ---- | -- | --------- | ---------- | ------------- | ------------ | 104| 9 | 1 | 1 | 0 | 3 | 0 | 0 | 105| 9 | 2 | 3 | 0 | 2 | 0 | 0 | 106 107则edges每个节点对应的from_node_id应为: 108 109| from_node_id | 110| ------------ | 111| 1 | 112| 1 | 113| 1 | 114| 3 | 115| 3 | 116 117locations:该节点包含了js_heap_location表的信息,目前尚无数据,暂不关注。 118 119samples:该节点包含了js_heap_sample表的信息,每一行为两个int类型数字,分别表示timestam_us,last_assigned_id。 120 121strings:该节点包含了js_heap_string表的信息,每一行为一个string类型的字符串,是js内存中字符串的集合,对应表中的string字段。 122 123trace_function_infos:该节点包含了js_heap_trace_function_info表的信息,每一行为6个int类型的字符串,分别表示function_id,name,script_name,script_id,line,column。 124 125trace_tree:该节点包含了js_heap_trace_node表的信息,是一个多维数组,每个数组由5个元素组成,分别为id,function_info_index,count,size和对应的子节点数组信息。由于不知道trace_tree节点的嵌套层数,需用递归方式解析每一层嵌套的节点。 126 127#### CPU Profiler解析 128 129js_cpu_profiler_node表是通过json解析出node节点对应的数据进行入库即可。js_cpu_profiler_sample表中时间的计算方法如下: 130取cpu profiler文件中startTime作为起始时间,sample中每个下标对应的时间为startTime+ timeDeltas中每个下标对应的时间。 131