ZZ: 55分钟学会正则表达式

出处http://blog.jobbole.com/63398/

伯乐在线补充：推荐几个正则表达式编辑器

正则表达式是一种查找以及字符串替换操作。正则表达式在文本编辑器中广泛使用，比如正则表达式被用于：

检查文本中是否含有指定的特征词
找出文中匹配特征词的位置
从文本中提取信息，比如：字符串的子串
修改文本

与文本编辑器相似，几乎所有的高级编程语言都支持正则表达式。在这样的语境下，“文本”也就是一个字符串，可以执行的操作都是类似的。一些编程语言（比如Perl，JavaScript）会检查正则表达式的语法。

正则表达式是什么？

正则表达式只是一个字符串。没有长度限制，但是，这样的正则表达式长度往往较短。如下所示是一些正则表达式的例子：

I had a \S+ day today
[A-Za-z0-9\-_]{3,16}
\d\d\d\d-\d\d-\d\d
v(\d+)(\.\d+)*
TotalMessages="(.*?)"
<[^<>]>

这些字符串实际上都是微型计算机程序。正则表达式的语法，实际上是一种轻量级、简洁、适用于特定领域的编程语言。记住这一点，那么你就很容易理解下面的事情：

@H_502_88@

每一个正则表达式，都可以分解为一个指令序列，比如“先找到这样的字符，再找到那样的字符，再从中找到一个字符。。。”
每一个正则表达式都有输入（文本）和输出（匹配规则的输出，有时是修改后的文本）
正则表达式有可能出现语法错误——不是所有的字符串都是正则表达式
正则表达式语法很有个性，也可以说很恐怖
有时可以通过编译，使得正则表达式执行更快

在实现中，正则表达式还有其他的特点。本文将重点讨论正则表达式的核心语法，在几乎所有的正则表达式中都可以见到这些规则。

特别提示：正则表达式与文件通配语法无关，比如 *.xml

正则表达式的基础语法

字符

正则表达式中包含了一系列的字符，这些字符只能匹配它们本身。有一些被称为“元字符”的特殊字符，可以匹配一些特殊规则。

如下所示的例子中，我用红色标出了元字符。

I had a\S+day today
[A-Za-z0-9\-_]{3,16}
\d\d\d\d-\d\d-\d\d
v(\d+)(\.\d+)*
TotalMessages="(.*?)"
<[^<>]*>

大部分的字符，包括所有的字母和数字字符，是普通字符。也就意味着，它们只能匹配它们自己，如下所示的正则表达式：

cat

意味着，只能匹配一个字符串，以“c”开头，然后是字符“a”，紧跟着是字符“t”的字符串。

到目前为止，正则表达式的功能类似于

常规的Find功能
Java中的String.indexOf()函数
PHP中的strpos()函数
等等

ZZ: 55分钟学会正则表达式

正则表达式的基础语法

字符

点“.”

字符类

字符类的范围

练习

答案

练习

字符类的反义

练习

答案

转义字符类

练习

答案

重复

练习

答案

指定重复次数范围

练习

答案

关于重复的转义字符

练习

答案

练习

非贪婪匹配

选择匹配

练习

分组

练习

.∗ . 然后是,136)"> [()]∗ .

练习

答案

单词分隔符

练习

答案

换行符

练习

答案

文本分界

捕捉和替换

捕获组

替换

练习

答案

练习

答案

反向引用

练习

使用正则表达式编程

过度使用的反斜杠

动态正则表达式

循环中的正则表达式

其他建议

输入验证

信用卡号

练习

\D*(\d\D*){16}is one of several variations which would accomplish this.

名字

电子邮件地址

注意

这就是55分钟的全部内容

致谢

练习

选择正则表达式的某种实现，阅读相关文档。我保证，你会学到更多。

猜你在找的正则表达式相关文章

`.∗`. 然后是,136)"> [()]∗ .

\D(\d\D){16}is one of several variations which would accomplish this.