Files
build-web-application-with-…/7.1.md
2012-09-29 14:50:51 +08:00

197 lines
8.4 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
#7.1 XML处理
XML作为一种数据交换和信息传递的格式已经十分普及。而随着Web服务日益广泛的应用现在XML在日常的开发工作中也扮演了愈发重要的角色。这一小节 我们将就Go语言标准包中的XML相关处理的包进行介绍。
这个小节不会涉及XML规范相关的内容如需了解相关知识请参考其他文献而是介绍如何用Go语言来编解码XML文件相关的知识。
假如你是一名运维人员你为你所管理的所有服务器生成了如下内容的xml的配置文件
<?xml version="1.0" encoding="utf-8"?>
<servers version="1">
<server>
<serverName>Shanghai_VPN</serverName>
<serverIP>127.0.0.1</serverIP>
</server>
<server>
<serverName>Beijing_VPN</serverName>
<serverIP>127.0.0.2</serverIP>
</server>
</servers>
上面的XML文档描述了两个服务器的信息包含了服务器名和服务器的IP信息接下来的Go例子以此XML描述的信息进行操作。
##解析XML
如何解析如上这个XML文件喃呢 我们可以通过xml包的`Unmarshal`函数来达到我们的目的
func Unmarshal(data []byte, v interface{}) error
data接收的是XML数据流v是需要输出的结构定义为interface也就是可以把XML转换为任意的格式。我们这里主要介绍struct的转换因为struct和XML都有类似树结构的特征。
示例代码如下:
package main
import (
"encoding/xml"
"fmt"
"io/ioutil"
"os"
)
type Recurlyservers struct {
XMLName xml.Name `xml:"servers"`
Version string `xml:"version,attr"`
Svs []server `xml:"server"`
Description string `xml:",innerxml"`
}
type server struct {
XMLName xml.Name `xml:"server"`
ServerName string `xml:"serverName"`
ServerIP string `xml:"serverIP"`
}
func main() {
file, err := os.Open("servers.xml") // For read access.
defer file.Close()
if err != nil {
fmt.Printf("error: %v", err)
return
}
data, err := ioutil.ReadAll(file)
if err != nil {
fmt.Printf("error: %v", err)
return
}
v := Recurlyservers{}
err = xml.Unmarshal(data, &v)
if err != nil {
fmt.Printf("error: %v", err)
return
}
fmt.Println(v)
}
XML本质上是一种树形的数据格式而我们可以定义与之匹配的go 语言的 struct类型然后通过xml.Unmarshal来将xml中的数据解析成对应的struct对象。如上例子输出如下数据
{{ servers} 1 [{{ server} Shanghai_VPN 127.0.0.1} {{ server} Beijing_VPN 127.0.0.2}]
<server>
<serverName>Shanghai_VPN</serverName>
<serverIP>127.0.0.1</serverIP>
</server>
<server>
<serverName>Beijing_VPN</serverName>
<serverIP>127.0.0.2</serverIP>
</server>
}
上面的例子中将xml文件解析成对应的strcut对象是通过`xml.Unmarshal`来完成的这个过程是如何实现的可以看到我们的struct定义后面多了一些类似于`xml:"serverName"`这样的内容,这个是strcut的一个特性它们被称为 strcut tag它们是用来辅助反射的Go语言的反射机制可以利用这些tag信息来将来自XML文件中的数据反射成对应的struct对象关于反射如何利用struct tag的更多内容请参阅reflect中的相关内容。在定义struct的时候应该如何设置 struct tag呢
- 如果struct中一个string或者[]type类型的字段中tag定义了`",innerxml"`,那么这个字段会累计把这些原始的XML数据累计起来如上Description定义。
- 如果strcut中有一个字段类型xml.Name叫做XMLName那么在解析的时候就会这个element的名字
- 如果strcut里面字段后面的tag里面定义了XML的element那么解析的时候就会把相应的element值赋值给struct字段如上servername和serverip定义。
- 如果strcut里面字段后面的tag定义了`",attr"`那么会读取该element下面的属性字段如上version定义。
- 如果strcut字段后面的tag定义了`"a>b>c"`,那么会解析xml元素的结构a下面的b下面的c元素。
- 如果strcut字段后面的tag定义了`"-"`,那么这个字段不会被解析到任何数据。
- 如果strcut字段后面的tag定义了`",any"`,如果他的子元素在不满足其他的规则的时候就会匹配到这个字段。
- 如果strcut字段后面的tag定义了`",comments"`,这个字段一般都是[]byte或者string类型那么在这个元素下面的注释会累积在这个字段里面。
上上面详细讲述了如何定义struct的tag。 只要设置对了tag那么XML解析就如上面示例般简单tag和xml的element是一一对应的关系如上所示我们可以通过slice来表示多个同级元素。
>注意: 为了正确解析go语言的xml包要求struct定义中的所有字段必须是可导出的即首字母大写
##输出XML
假若我们不是要解析如上所示的XML文件而是生成它那么在go语言中又该如何实现呢 xml包中提供了`Marshal``MarshalIndent`两个函数,来满足我们的需求。这两个函数主要的区别是第二个函数会增加前缀和缩进,函数的定义如下所示:
func Marshal(v interface{}) ([]byte, error)
func MarshalIndent(v interface{}, prefix, indent string) ([]byte, error)
两个函数第一个参数是用来生成XML的结构定义类型数据都是返回生成的XML数据流。
下面我们来看一下如何输出如上的XML
package main
import (
"encoding/xml"
"fmt"
"os"
)
type Servers struct {
XMLName xml.Name `xml:"servers"`
Version string `xml:"version,attr"`
Svs []server `xml:"server"`
}
type server struct {
ServerName string `xml:"serverName"`
ServerIP string `xml:"serverIP"`
}
func main() {
v := &Servers{Version: "1"}
v.Svs = append(v.Svs, server{"Shanghai_VPN", "127.0.0.1"})
v.Svs = append(v.Svs, server{"Beijing_VPN", "127.0.0.2"})
output, err := xml.MarshalIndent(v, " ", " ")
if err != nil {
fmt.Printf("error: %v\n", err)
}
os.Stdout.Write([]byte(xml.Header))
os.Stdout.Write(output)
}
上面的代码输出如下信息:
<?xml version="1.0" encoding="UTF-8"?>
<servers version="1">
<server>
<serverName>Shanghai_VPN</serverName>
<serverIP>127.0.0.1</serverIP>
</server>
<server>
<serverName>Beijing_VPN</serverName>
<serverIP>127.0.0.2</serverIP>
</server>
</servers>
和我们之前定义的文件的格式一模一样,之所以会有`os.Stdout.Write([]byte(xml.Header))` 这句代码的出现,是因为`xml.MarshalIndent`或者`xml.Marshal`输出的信息都是不带XML头的为了生成正确的xml文件我们使用了xml包预定义的Header变量另外生成的xml文件的无层次结构也是由struct tag来控制的。
那么生成的XML文件中的element名字是通过获取的呢他有如下几种方式获取
- 字段名XMLName类型xml.Name
- 通过strcut的字段中定义的tag来获取
- 通过strcut的字段名用来获取
而那么里面的结构和数据是如何输出的呢我们需要如何设置struct里面的tag信息呢
- XMLName不会被输出
- tag中含有`"-"`的字段不会输出
- tag中含有`"name,attr"`会以name作为属性名字段值作为值输出为这个XML元素的属性如上version字段所描述
- tag中含有`",attr"`会以这个struct的字段名作为属性名输出为XML元素的属性类似上一条只是这个name默认是字段名了。
- tag中含有`",chardata"`写为xml的data数据
- tag中含有`",innerxml"`里面保存的是所有数据而不会输出到XML
- tag中含有`",comment"`这个用来写XML的注释
- tag中含有`"omitempty"`,这是是如果该字段的值为空值那么就不会被输出到XML空值包括false、0、nil或者""
- tag中含有`"a>b>c"`那么就会循环输出三个元素a包含bb包含c例如如下代码就会输出
FirstName string `xml:"name>first"`
LastName string `xml:"name>last"`
<name>
<first>Asta</first>
<last>Xie</last>
</name>
上面我们介绍了如何使用Go语言的xml包来编/解码XML文件重要的一点是对XML的所有操作都是通过struct tag来实现的所以学会对struct tag的运用变得非常重要在文章中我们简要的列举了如何定义tag。更多内容请参看相应的官方资料。
## links
* [目录](<preface.md>)
* 上一节: [文本处理](<7.md>)
* 下一节: [Json处理](<7.2.md>)
## LastModified
* $Id$