1# XML解析 2<!--Kit: ArkTS--> 3<!--Subsystem: CommonLibrary--> 4<!--Owner: @xliu-huanwei; @shilei123; @huanghello--> 5<!--Designer: @yuanyao14--> 6<!--Tester: @kirl75; @zsw_zhushiwei--> 7<!--Adviser: @ge-yafang--> 8 9 10对于以XML作为载体传递的数据,实际使用中需要对相关的元素进行解析,一般包括[解析XML标签和标签值](#解析xml标签和标签值)、[解析XML属性和属性值](#解析xml属性和属性值)、[解析XML事件类型和元素信息](#解析xml事件类型和元素信息)三类操作。如在Web服务中,XML是SOAP(Simple Object Access Protocol)协议的基础,SOAP消息通常以XML格式封装,包含请求和响应参数,通过解析这些XML消息,Web服务可以处理来自客户端的请求并生成相应的响应。 11 12 13XML模块提供XmlPullParser类用于解析XML文本,输入为包含XML数据的ArrayBuffer或DataView,输出为结构化的解析结果。 14 15 16 **表1** XML解析选项,其详细介绍请参见[ParseOptions](../reference/apis-arkts/js-apis-xml.md#parseoptions)。 17 18| 名称 | 类型 | 必填 | 说明 | 19| -------- | -------- | -------- | -------- | 20| supportDoctype | boolean | 否 | 是否解析文档类型,false表示不解析文档类型,true表示解析文档类型,默认false。 | 21| ignoreNameSpace | boolean | 否 | 是否忽略命名空间,忽略命名空间后,将不会对其进行解析。true表示忽略命名空间,false表示不忽略命名空间,默认false。| 22| tagValueCallbackFunction | (name: string, value: string) => boolean | 否 | 获取tagValue回调函数,打印XML标签及标签值。默认为undefined,表示不解析XML标签和标签值。 | 23| attributeValueCallbackFunction | (name: string, value: string) => boolean | 否 | 获取attributeValue回调函数,打印XML属性及属性值。默认为undefined,表示不解析XML属性和属性值。 | 24| tokenValueCallbackFunction | (eventType: EventType, value: ParseInfo) => boolean | 否 | 获取tokenValue回调函数,打印XML事件类型及parseInfo对应属性。默认为undefined,表示不解析XML事件类型。 | 25 26 27## 注意事项 28 29- 确保传入的XML数据符合标准格式。 30 31- 目前不支持解析指定节点的值。 32 33 34## 解析XML标签和标签值 35 361. 引入模块。 37 38 ```ts 39 import { xml, util } from '@kit.ArkTS'; // 需要使用util模块函数对文本编码 40 ``` 41 422. 对XML文本编码后调用XmlPullParser。 43 44 可以基于ArrayBuffer创建XmlPullParser对象,也可以基于DataView创建XmlPullParser对象(两种创建方式返回结果无区别可任选一种)。 45 46 ```ts 47 let strXml: string = 48 '<?xml version="1.0" encoding="utf-8"?>' + 49 '<note importance="high" logged="true">' + 50 '<title>Play</title>' + 51 '<lens>Work</lens>' + 52 '</note>'; 53 let textEncoder: util.TextEncoder = new util.TextEncoder(); 54 let arrBuffer: Uint8Array = textEncoder.encodeInto(strXml); // 对数据进行编码,防止中文字符乱码 55 // 方式1:基于ArrayBuffer构造XmlPullParser对象 56 let xmlParser: xml.XmlPullParser = new xml.XmlPullParser(arrBuffer.buffer as object as ArrayBuffer, 'UTF-8'); 57 58 // 方式2:基于DataView构造XmlPullParser对象 59 // let dataView: DataView = new DataView(arrBuffer.buffer as object as ArrayBuffer); 60 // let xmlParser: xml.XmlPullParser = new xml.XmlPullParser(dataView, 'UTF-8'); 61 ``` 62 633. 自定义回调函数,本例直接打印出标签及标签值。 64 65 ```ts 66 function func(name: string, value: string): boolean { 67 if (name == 'note') { 68 console.info(name); 69 } 70 if (value == 'Play' || value == 'Work') { 71 console.info(' ' + value); 72 } 73 if (name == 'title' || name == 'lens') { 74 console.info(' ' + name); 75 } 76 return true; //true:继续解析 false:停止解析 77 } 78 ``` 79 804. 设置解析选项,调用parseXml函数。 81 82 ```ts 83 let options: xml.ParseOptions = {supportDoctype:true, ignoreNameSpace:true, tagValueCallbackFunction:func}; 84 xmlParser.parseXml(options); 85 ``` 86 87 输出结果如下所示: 88 89 ``` 90 note 91 title 92 Play 93 title 94 lens 95 Work 96 lens 97 note 98 ``` 99 100 101 102 103## 解析XML属性和属性值 104 1051. 引入模块。 106 107 ```ts 108 import { xml, util } from '@kit.ArkTS'; // 使用util模块对文本编码 109 ``` 110 1112. 对XML文本编码后调用XmlPullParser。 112 113 ```ts 114 let strXml: string = 115 '<?xml version="1.0" encoding="utf-8"?>' + 116 '<note importance="high" logged="true">' + 117 ' <title>Play</title>' + 118 ' <title>Happy</title>' + 119 ' <lens>Work</lens>' + 120 '</note>'; 121 let textEncoder: util.TextEncoder = new util.TextEncoder(); 122 let arrBuffer: Uint8Array = textEncoder.encodeInto(strXml); // 对数据进行编码,防止中文字符乱码 123 let xmlParser: xml.XmlPullParser = new xml.XmlPullParser(arrBuffer.buffer as object as ArrayBuffer, 'UTF-8'); 124 ``` 125 1263. 自定义回调函数,示例直接打印出属性及属性值。 127 128 ```ts 129 let str: string = ''; 130 function func(name: string, value: string): boolean { 131 str += name + ' ' + value + ' '; 132 return true; // true:继续解析 false:停止解析 133 } 134 ``` 135 1364. 设置解析选项,调用parseXml函数。 137 138 ```ts 139 let options: xml.ParseOptions = {supportDoctype:true, ignoreNameSpace:true, attributeValueCallbackFunction:func}; 140 xmlParser.parseXml(options); 141 console.info(str); // 打印所有属性及其值 142 ``` 143 144 输出结果如下所示: 145 ``` 146 importance high logged true // note节点的属性及属性值 147 ``` 148 149 150## 解析XML事件类型和元素信息 151 1521. 引入模块。 153 154 ```ts 155 import { xml, util } from '@kit.ArkTS'; // 使用util模块函数对文本编码 156 ``` 157 1582. 对XML文本编码后调用XmlPullParser。 159 160 ```ts 161 let strXml: string = 162 '<?xml version="1.0" encoding="utf-8"?>' + 163 '<note importance="high" logged="true">' + 164 '<title>Play</title>' + 165 '</note>'; 166 let textEncoder: util.TextEncoder = new util.TextEncoder(); 167 let arrBuffer: Uint8Array = textEncoder.encodeInto(strXml); // 对数据进行编码,防止中文字符乱码 168 let xmlParser: xml.XmlPullParser = new xml.XmlPullParser(arrBuffer.buffer as object as ArrayBuffer, 'UTF-8'); 169 ``` 170 1713. 自定义回调函数,示例直接打印元素事件类型及元素深度。 172 173 ```ts 174 let str: string = ''; 175 function func(name: xml.EventType, value: xml.ParseInfo): boolean { 176 str = name + ' ' + value.getDepth(); // getDepth 获取元素在XML文档中的当前深度 177 console.info(str); 178 return true; // true:继续解析 false:停止解析 179 } 180 ``` 181 1824. 设置解析选项,调用parseXml函数。 183 184 ```ts 185 let options: xml.ParseOptions = {supportDoctype:true, ignoreNameSpace:true, tokenValueCallbackFunction:func}; 186 xmlParser.parseXml(options); 187 ``` 188 189 输出结果如下所示: 190 191 ``` 192 0 0 // 0:<?xml version="1.0" encoding="utf-8"?> 对应事件类型START_DOCUMENT值为0 0:起始深度为0 193 2 1 // 2:<note importance="high" logged="true"> 对应事件类型START_TAG值为2 1:深度为1 194 2 2 // 2:<title>对应事件类型START_TAG值为2 2:深度为2 195 4 2 // 4:Play对应事件类型TEXT值为4 2:深度为2 196 3 2 // 3:</title>对应事件类型END_TAG值为3 2:深度为2 197 3 1 // 3:</note>对应事件类型END_TAG值为3 1:深度为1(与<note对应>) 198 1 0 // 1:对应事件类型END_DOCUMENT值为1 0:深度为0 199 ``` 200 201 202 203 204## 场景示例 205 206此处以调用所有解析选项为例,提供解析XML标签、属性和事件类型的开发示例。 207 208 209```ts 210import { xml, util } from '@kit.ArkTS'; 211 212let strXml: string = 213 '<?xml version="1.0" encoding="UTF-8"?>' + 214 '<book category="COOKING">' + 215 '<title lang="en">Everyday</title>' + 216 '<author>Giana</author>' + 217 '</book>'; 218let textEncoder: util.TextEncoder = new util.TextEncoder(); 219let arrBuffer: Uint8Array = textEncoder.encodeInto(strXml); 220let xmlParser: xml.XmlPullParser = new xml.XmlPullParser(arrBuffer.buffer as object as ArrayBuffer, 'UTF-8'); 221let str: string = ''; 222 223function tagFunc(name: string, value: string): boolean { 224 str = name + value; 225 console.info('tag-' + str); 226 return true; 227} 228 229function attFunc(name: string, value: string): boolean { 230 str = name + ' ' + value; 231 console.info('attri-' + str); 232 return true; 233} 234 235function tokenFunc(name: xml.EventType, value: xml.ParseInfo): boolean { 236 str = name + ' ' + value.getDepth(); 237 console.info('token-' + str); 238 return true; 239} 240 241let options: xml.ParseOptions = { 242 supportDoctype: true, 243 ignoreNameSpace: true, 244 tagValueCallbackFunction: tagFunc, 245 attributeValueCallbackFunction: attFunc, 246 tokenValueCallbackFunction: tokenFunc 247}; 248xmlParser.parseXml(options); 249``` 250 251输出结果如下所示: 252 253``` 254tag- 255token-0 0 256tag-book 257token-2 1 258attri-category COOKING 259tag-title 260token-2 2 261attri-lang en 262tag-Everyday 263token-4 2 264tag-title 265token-3 2 266tag-author 267token-2 2 268tag-Giana 269token-4 2 270tag-author 271token-3 2 272tag-book 273token-3 1 274tag- 275token-1 0 276``` 277