fixed markdown format

This commit is contained in:
yetist
2012-10-28 21:00:50 +08:00
parent c3abc9b6c7
commit 81a61b9ced
59 changed files with 280 additions and 280 deletions

6
7.3.md
View File

@@ -1,4 +1,4 @@
#7.3 正则处理
# 7.3 正则处理
正则表达式是一种进行模式匹配和文本操纵的复杂而又强大的工具。虽然正则表达式比纯粹的文本匹配效率低但是它却更灵活。按照它的语法规则随需构造出的匹配模式就能够从原始文本中筛选出几乎任何想你要得到的字符组合。如果你在Web开发中需要从一些文本数据源中获取数据,那么你只需要按照它的语法规则,随需构造出正确的模式字符串就能够从原数据源提取出有意义的文本信息。
Go语言通过`regexp`标准包为正则表达式提供了官方支持如果你已经使用过其他编程语言提供的正则相关功能那么你应该对Go语言版本的不会太陌生但是它们之间也有一些小的差异因为Go实现的是RE2标准除了\C详细的语法描述参考http://code.google.com/p/re2/wiki/Syntax。
@@ -7,7 +7,7 @@ Go语言通过`regexp`标准包为正则表达式提供了官方支持,如果
如果你还记得在前面表单验证的小节里我们已经接触过正则处理在那里我们利用了它来验证输入的信息是否满足某些预设的条件。在使用中需要注意的一点就是所有的字符都是UTF-8编码的。接下来让我们更加深入的来学习Go语言的`regexp`包相关知识吧。
##通过正则判断是否匹配
## 通过正则判断是否匹配
`regexp`包中含有三个函数用来判断是否匹配如果匹配返回true否则返回false
func Match(pattern string, b []byte) (matched bool, error error)
@@ -40,7 +40,7 @@ Go语言通过`regexp`标准包为正则表达式提供了官方支持,如果
在上面的两个小例子中我们采用了Match(Reader|String)来判断一些字符串是否符合我们的描述需求,它们使用起来非常方便。
##通过正则获取内容
## 通过正则获取内容
Match模式只能用来对字符串的判断而无法截取字符串的一部分、过滤字符串、或者提取出符合条件的一批字符串。如果想要满足这些需求那就需要使用正则表达式的复杂模式。
我们经常需要一些爬虫程序,下面就以爬虫为例来说明如何使用正则来过滤或截取抓取到的数据: