diff --git a/7.1.md b/7.1.md index bb1160f7..ac8ee229 100644 --- a/7.1.md +++ b/7.1.md @@ -1,13 +1,177 @@ #7.1 XML处理 - +XML作为一种数据交换和信息传递的格式已经得到了普及。随着Web服务日益广泛的应用,XML在开发人员的日常工作中扮演了愈来愈重要的角色。Go语言标准包里面已经有了XML包让我们可以在各种应用中实现对XML的操纵。 + +本小节并不是介绍XML是什么,如果要了解XML可以参考其他文献,本小节主要是介绍如何用Go语言来解析XML以及如何输出XML。 + +下面我们就来看一个例子:假如你是一名系统维护员,想把所有的服务器转换为XML文件,那么我们就可以从以下基本的XML标签开始做起: + + + + + Shanghai_VPN + 127.0.0.1 + + + Beijing_VPN + 127.0.0.2 + + + +以此为基础,我们就可以添加新的元素或者修改现有的元素,例如可以分成地区和服务器编号。 ##解析XML -###解析基本的XML -###解析复杂的XML - -##输出XML - +假如有了上面这个XML,那么我们如何来解析这个XML呢?Go的XML包可以通过`xml.Unmarshal`函数来做解析,请看下面的例子: + + package main + + import ( + "encoding/xml" + "fmt" + "io/ioutil" + "os" + ) + + type Recurlyservers struct { + XMLName xml.Name `xml:"servers"` + Version string `xml:"version,attr"` + Svs []server `xml:"server"` + Description string `xml:",innerxml"` + } + + type server struct { + XMLName xml.Name `xml:"server"` + ServerName string `xml:"serverName"` + ServerIP string `xml:"serverIP"` + } + + func main() { + file, err := os.Open("servers.xml") // For read access. + if err != nil { + fmt.Printf("error: %v", err) + return + } + data, err := ioutil.ReadAll(file) + if err != nil { + fmt.Printf("error: %v", err) + return + } + v := Recurlyservers{} + err = xml.Unmarshal(data, &v) + if err != nil { + fmt.Printf("error: %v", err) + return + } + + fmt.Println(v) + } + + +我们知道XML其实就是一种树形的数据格式,这个和我们Go语言里面的struct类似,所以在Go语言里面XML都是被转换成struct结构的。如上例子输出如下数据 + + {{ servers} 1 [{{ server} Shanghai_VPN 127.0.0.1} {{ server} Beijing_VPN 127.0.0.2}] + + Shanghai_VPN + 127.0.0.1 + + + Beijing_VPN + 127.0.0.2 + + } + + +通过上面的例子我们可以看到我们调用了`xml.Unmarshal`,就可以把数据解析到strcut里面,那么他是怎么解析进去的呢?我们看到我们的struct定义后面多了一个类似注释的东西`xml:"serverName"`,这个是strcut的一个特性,这个定义叫做tag,主要是用来反射用的,当反射的时候可以读取到这个信息,XML解析利用的就是reflect包,通过反射读取到这个tag的定义,然后利用这个tag的定义和XML数据存到里面。那么struct需要怎么设置这个tag呢? + +- 如果struct中一个string或者[]type类型的字段中tag定义了`",innerxml"`,那么这个字段会累计把这些原始的XML数据累计起来,如上Description定义。 +- 如果strcut中有一个字段类型xml.Name,叫做XMLName,那么在解析的时候就会这个element的名字 +- 如果strcut里面字段后面的tag里面定义了XML的element,那么解析的时候就会把相应的element值赋值给struct字段,如上servername和serverip定义。 +- 如果strcut里面字段后面的tag定义了`",attr"`,那么会读取该element下面的属性字段,如上version定义。 +- 如果strcut字段后面的tag定义了`"a>b>c"`,那么会解析xml元素的结构a下面的b下面的c元素。 +- 如果strcut字段后面的tag定义了`"-"`,那么这个字段不会被解析到任何数据。 +- 如果strcut字段后面的tag定义了`",any"`,如果他的子元素在不满足其他的规则的时候就会匹配到这个字段。 +- 如果strcut字段后面的tag定义了`",comments"`,这个字段一般都是[]byte或者string类型,那么在这个元素下面的注释会累积在这个字段里面。 + +上面详细讲述了如何设置我们的struct的tag,只要设置对了tag,那么XML解析是非常简单的,tag和xml的element是一一对应的关系,然后多个元素我们可以利用struct的slice实现,如上例子所示。 + +>Go解析的XML文件都要首字母大写,不然在解析的时候会比较的麻烦。那我们就规范全部用大写开头。 +##输出XML +假如我们想要输出如上所示的XML文件,那么Go如何来处理呢?Go语言的XML包里面有如下两个函数来处理`Marshal`和`MarshalIndent`,这两个函数主要的区别是第二个函数会增加前缀和缩进。下面我们来看一下如何输出如上的XML: + + package main + + import ( + "encoding/xml" + "fmt" + "os" + ) + + type Servers struct { + XMLName xml.Name `xml:"servers"` + Version string `xml:"version,attr"` + Svs []server `xml:"server"` + } + + type server struct { + ServerName string `xml:"serverName"` + ServerIP string `xml:"serverIP"` + } + + func main() { + v := &Servers{Version: "1"} + v.Svs = append(v.Svs, server{"Shanghai_VPN", "127.0.0.1"}) + v.Svs = append(v.Svs, server{"Beijing_VPN", "127.0.0.2"}) + output, err := xml.MarshalIndent(v, " ", " ") + if err != nil { + fmt.Printf("error: %v\n", err) + } + os.Stdout.Write([]byte(xml.Header)) + + os.Stdout.Write(output) + } +通过上面struct组织了xml的结构,上面的代码输出如下信息: + + + + + Shanghai_VPN + 127.0.0.1 + + + Beijing_VPN + 127.0.0.2 + + +和我们定义的文件的格式一模一样,通过上面的例子我们知道`xml.MarshalIndent`或者`xml.Marshal`返回的信息都是不带XML头的,XML头信息XML包里面定义了Header变量,而输出的xml格式也是根据struct的tag信息。 + +XML的element名字通过如下方式获取: + +- 字段名XMLName,类型xml.Name +- 通过strcut的字段中定义的tag来获取 +- 通过strcut的字段名用来获取 + +那么里面的结构和数据是如何输出的呢?我们需要如何设置struct里面的tag信息呢? + +- XMLName不会被输出 +- tag中含有`"-"`的不会输出 +- tag中含有`"name,attr"`,会以name作为字段作为名称被输出为这个XML元素的属性 +- tag中含有`",attr"`,会以这个struct的字段名作为名称作为XML元素的属性 +- tag中含有`",chardata"`,写为data数据 +- tag中含有`",innerxml"`,里面保存的是所有数据,而不会输出到XML +- tag中含有`",comment"`,这个用来写XML的注释 +- tag中含有`"omitempty"`,这是是如果该字段的值为空值那么就不会被输出到XML,空值包括:false、0、nil或者"" +- tag中含有`"a>b>c"`,那么就会循环输出三个元素a包含b,b包含c,例如如下代码就会输出 + + FirstName string `xml:"name>first"` + LastName string `xml:"name>last"` + + + Asta + Xie + + + +通过上面的介绍我们了解了如何通过Go语言的XML包来解析XML和生成XML,XML包的这个操作都是通过反射来获取struct中的tag定义,然后来操作XML的,所以struct的tag定义非常重要,上面也列举了一些如何定义这个tag,这样我们在将来用XML开发Web应用的时候就非常方便了。 ## links * [目录]() diff --git a/7.2.md b/7.2.md index f27adc7c..8bd4e3b0 100644 --- a/7.2.md +++ b/7.2.md @@ -1,4 +1,55 @@ -#7.2 Json处理 +#7.2 JSON处理 +JSON(Javascript Object Notation)是一种轻量级的数据交换语言,以文字为基础,具有自我描述性且易于让人阅读。尽管JSON是在Javascript的一个子集,但JSON是独立于语言的文本格式,并且采用了类似于C语言家族的一些习惯。JSON与XML最大的不同在于XML是一个完整的标记语言,而JSON不是。JSON由于比XML更小、更快,更易解析,以及浏览器的内建快速解析支持,使得其更适用于网络数据传输领域。目前我们看到很多的开放平台,基本上所有的接口都是采用了JSON作为他们的数据交互。那么JSON在Web开发中如此重要,Go语言对于JSON支持的怎么样呢?其实Go语言的标准库里面已经非常好的支持了JSON,可以对JSON包进行解析、生成JSON数据。 + +我们还是假设目前想要描述所有的服务器列表,通过JSON如何来表达,请看下面的描述 + + {"servers":[{"serverName":"Shanghai_VPN","serverIP":"127.0.0.1"},{"serverName":"Beijing_VPN","serverIP":"127.0.0.2"}]} + +接下来的例子以此JSON数据为基础,我们来进行JSON的解析和生成。 +##解析JSON + +###解析到结构体 +假如有了上面的JSON串,那么我们如何来解析这个JSON串呢?Go的JSON包中有如下函数 + + func Unmarshal(data []byte, v interface{}) error + +通过这个函数我们就可以实现解析的目的,详细的解析例子请看如下代码: + + package main + + import ( + "encoding/json" + "fmt" + ) + + type Server struct { + ServerName string + ServerIP string + } + + type Serverslice struct { + Servers []Server + } + + func main() { + var s Serverslice + str := `{"servers":[{"serverName":"Shanghai_VPN","serverIP":"127.0.0.1"},{"serverName":"Beijing_VPN","serverIP":"127.0.0.2"}]}` + json.Unmarshal([]byte(str), &s) + fmt.Println(s) + } + +通过上面的例子我们可以看到我们首先定义了结构体,结构体和JSON的数据一一对应,数组对应slice,字段名对应JSON里面的KEY,那么解析的时候如何解析到对应的字段的呢?例如JSON的key是`Foo`,那么怎么找对应的字段呢? + +- 首先查找字段的tag里面带有`Foo`的导出字段(首字母大写) +- 其次查找字段名是`Foo`的导出字段 +- 最后查找类似`FOO`或者`FoO`这样的除了首字母之外其他大小写不敏感的导出字段 + +聪明的你一定注意到了一点,能够输出的数据必须是导出字段,其他字段是不能输出的。同时JSON解析的时候只会解析能找得到的字段,如果找不到的字段会被忽略,这样的一个好处是在于当你接收到一个很大的JSON数据的时候,你如果只想部分数据,那么用这种方式就可以轻松的解决了。 + +###解析到interface +我们知道上面哪种解析方式是当我们了解了JSON的数据结构的情况下来进行的解析,那么如果我们在不知道JSON格式的情况下,如何来解析JSON呢? + +##生成JSON ## links * [目录]() diff --git a/7.md b/7.md index abd4cb9f..79885167 100644 --- a/7.md +++ b/7.md @@ -5,7 +5,7 @@ XML是目前很多标准接口的交互语言,很多时候和一些Java编写 ## 目录 * 1. [XML处理](7.1.md) - * 2. [Json处理](7.2.md) + * 2. [JSON处理](7.2.md) * 3. [正则处理](7.3.md) * 4. [模板处理](7.4.md) * 5. [小结](7.5.md) diff --git a/preface.md b/preface.md index c292cd2f..30b335f2 100644 --- a/preface.md +++ b/preface.md @@ -42,7 +42,7 @@ - 6.5 [小结](6.5.md) * 7.[文本处理](7.md) - 7.1 [XML处理](7.1.md) - - 7.2 [Json处理](7.2.md) + - 7.2 [JSON处理](7.2.md) - 7.3 [正则处理](7.3.md) - 7.4 [模板处理](7.4.md) - 7.5 [小结](7.5.md)