8.4 KiB
#7.1 XML处理 XML作为一种数据交换和信息传递的格式已经十分普及。而随着Web服务日益广泛的应用,现在XML在日常的开发工作中也扮演了愈发重要的角色。这一小节, 我们将就Go语言标准包中的XML相关处理的包进行介绍。
这个小节不会涉及XML规范相关的内容(如需了解相关知识请参考其他文献),而是介绍如何用Go语言来编解码XML文件相关的知识。
假如你是一名运维人员,你为你所管理的所有服务器生成了如下内容的xml的配置文件:
<?xml version="1.0" encoding="utf-8"?>
<servers version="1">
<server>
<serverName>Shanghai_VPN</serverName>
<serverIP>127.0.0.1</serverIP>
</server>
<server>
<serverName>Beijing_VPN</serverName>
<serverIP>127.0.0.2</serverIP>
</server>
</servers>
上面的XML文档描述了两个服务器的信息,包含了服务器名和服务器的IP信息,接下来的Go例子以此XML描述的信息进行操作。
##解析XML
如何解析如上这个XML文件喃呢? 我们可以通过xml包的Unmarshal函数来达到我们的目的
func Unmarshal(data []byte, v interface{}) error
data接收的是XML数据流,v是需要输出的结构,定义为interface,也就是可以把XML转换为任意的格式。我们这里主要介绍struct的转换,因为struct和XML都有类似树结构的特征。
示例代码如下:
package main
import (
"encoding/xml"
"fmt"
"io/ioutil"
"os"
)
type Recurlyservers struct {
XMLName xml.Name `xml:"servers"`
Version string `xml:"version,attr"`
Svs []server `xml:"server"`
Description string `xml:",innerxml"`
}
type server struct {
XMLName xml.Name `xml:"server"`
ServerName string `xml:"serverName"`
ServerIP string `xml:"serverIP"`
}
func main() {
file, err := os.Open("servers.xml") // For read access.
defer file.Close()
if err != nil {
fmt.Printf("error: %v", err)
return
}
data, err := ioutil.ReadAll(file)
if err != nil {
fmt.Printf("error: %v", err)
return
}
v := Recurlyservers{}
err = xml.Unmarshal(data, &v)
if err != nil {
fmt.Printf("error: %v", err)
return
}
fmt.Println(v)
}
XML本质上是一种树形的数据格式,而我们可以定义与之匹配的go 语言的 struct类型,然后通过xml.Unmarshal来将xml中的数据解析成对应的struct对象。如上例子输出如下数据
{{ servers} 1 [{{ server} Shanghai_VPN 127.0.0.1} {{ server} Beijing_VPN 127.0.0.2}]
<server>
<serverName>Shanghai_VPN</serverName>
<serverIP>127.0.0.1</serverIP>
</server>
<server>
<serverName>Beijing_VPN</serverName>
<serverIP>127.0.0.2</serverIP>
</server>
}
上面的例子中,将xml文件解析成对应的strcut对象是通过xml.Unmarshal来完成的,这个过程是如何实现的?可以看到我们的struct定义后面多了一些类似于xml:"serverName"这样的内容,这个是strcut的一个特性,它们被称为 strcut tag,它们是用来辅助反射的,Go语言的反射机制,可以利用这些tag信息来将来自XML文件中的数据反射成对应的struct对象,关于反射如何利用struct tag的更多内容请参阅reflect中的相关内容。在定义struct的时候,应该如何设置 struct tag呢?
- 如果struct中一个string或者[]type类型的字段中tag定义了
",innerxml",那么这个字段会累计把这些原始的XML数据累计起来,如上Description定义。 - 如果strcut中有一个字段类型xml.Name,叫做XMLName,那么在解析的时候就会这个element的名字
- 如果strcut里面字段后面的tag里面定义了XML的element,那么解析的时候就会把相应的element值赋值给struct字段,如上servername和serverip定义。
- 如果strcut里面字段后面的tag定义了
",attr",那么会读取该element下面的属性字段,如上version定义。 - 如果strcut字段后面的tag定义了
"a>b>c",那么会解析xml元素的结构a下面的b下面的c元素。 - 如果strcut字段后面的tag定义了
"-",那么这个字段不会被解析到任何数据。 - 如果strcut字段后面的tag定义了
",any",如果他的子元素在不满足其他的规则的时候就会匹配到这个字段。 - 如果strcut字段后面的tag定义了
",comments",这个字段一般都是[]byte或者string类型,那么在这个元素下面的注释会累积在这个字段里面。
上上面详细讲述了如何定义struct的tag。 只要设置对了tag,那么XML解析就如上面示例般简单,tag和xml的element是一一对应的关系,如上所示,我们可以通过slice来表示多个同级元素。
注意: 为了正确解析,go语言的xml包要求struct定义中的所有字段必须是可导出的(即首字母大写)
##输出XML
假若我们不是要解析如上所示的XML文件,而是生成它,那么在go语言中又该如何实现呢? xml包中提供了Marshal和MarshalIndent两个函数,来满足我们的需求。这两个函数主要的区别是第二个函数会增加前缀和缩进,函数的定义如下所示:
func Marshal(v interface{}) ([]byte, error)
func MarshalIndent(v interface{}, prefix, indent string) ([]byte, error)
两个函数第一个参数是用来生成XML的结构定义类型数据,都是返回生成的XML数据流。
下面我们来看一下如何输出如上的XML:
package main
import (
"encoding/xml"
"fmt"
"os"
)
type Servers struct {
XMLName xml.Name `xml:"servers"`
Version string `xml:"version,attr"`
Svs []server `xml:"server"`
}
type server struct {
ServerName string `xml:"serverName"`
ServerIP string `xml:"serverIP"`
}
func main() {
v := &Servers{Version: "1"}
v.Svs = append(v.Svs, server{"Shanghai_VPN", "127.0.0.1"})
v.Svs = append(v.Svs, server{"Beijing_VPN", "127.0.0.2"})
output, err := xml.MarshalIndent(v, " ", " ")
if err != nil {
fmt.Printf("error: %v\n", err)
}
os.Stdout.Write([]byte(xml.Header))
os.Stdout.Write(output)
}
上面的代码输出如下信息:
<?xml version="1.0" encoding="UTF-8"?>
<servers version="1">
<server>
<serverName>Shanghai_VPN</serverName>
<serverIP>127.0.0.1</serverIP>
</server>
<server>
<serverName>Beijing_VPN</serverName>
<serverIP>127.0.0.2</serverIP>
</server>
</servers>
和我们之前定义的文件的格式一模一样,之所以会有os.Stdout.Write([]byte(xml.Header)) 这句代码的出现,是因为xml.MarshalIndent或者xml.Marshal输出的信息都是不带XML头的,为了生成正确的xml文件,我们使用了xml包预定义的Header变量,另外生成的xml文件的无层次结构,也是由struct tag来控制的。
那么生成的XML文件中的element名字是通过获取的呢?他有如下几种方式获取:
- 字段名XMLName,类型xml.Name
- 通过strcut的字段中定义的tag来获取
- 通过strcut的字段名用来获取
而那么里面的结构和数据是如何输出的呢?我们需要如何设置struct里面的tag信息呢?
-
XMLName不会被输出
-
tag中含有
"-"的字段不会输出 -
tag中含有
"name,attr",会以name作为属性名,字段值作为值输出为这个XML元素的属性,如上version字段所描述 -
tag中含有
",attr",会以这个struct的字段名作为属性名输出为XML元素的属性,类似上一条,只是这个name默认是字段名了。 -
tag中含有
",chardata",写为xml的data数据 -
tag中含有
",innerxml",里面保存的是所有数据,而不会输出到XML -
tag中含有
",comment",这个用来写XML的注释 -
tag中含有
"omitempty",这是是如果该字段的值为空值那么就不会被输出到XML,空值包括:false、0、nil或者"" -
tag中含有
"a>b>c",那么就会循环输出三个元素a包含b,b包含c,例如如下代码就会输出FirstName string `xml:"name>first"` LastName string `xml:"name>last"` <name> <first>Asta</first> <last>Xie</last> </name>
上面我们介绍了如何使用Go语言的xml包来编/解码XML文件,重要的一点是对XML的所有操作都是通过struct tag来实现的,所以学会对struct tag的运用变得非常重要,在文章中我们简要的列举了如何定义tag。更多内容请参看相应的官方资料。
links
LastModified
Id