`
BradyZhu
  • 浏览: 249107 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

perl总结(3)

 
阅读更多

七、正则表达式

这次对perl的正则表达式做一个总结。

正则表达式是perl在文本处理时最为简洁方便的功能。可以迅速地查找/替换字符串,提取字符串中想要的部分做处理。一般都说正则表达式是一个描述模式(pattern)的字符串,而所谓模式,其实是我们需要寻找的特定的字符序列,由一对反斜杠包起来,例如/def/即模式def。


一、匹配操作符
有两对匹配操作符=~和!~。

=~检验匹配是否成功:$var=~/abc/;若在该字符串中找到了该模式(abc),则返回true,不匹配则返回false。!~则相反。
一个小例子:
if($sentence=~/please/){
print("Thankyouforbeingpolite!\n");
}
else{
print("Thatwasnotverypolite!\n");
}


二、基本模式匹配知识
1、字符+
+意味着一个或多个相同的字符(串),如:/ab+c/指abc、abbc、abbbc等。+在匹配字符的时候会尽可能匹配更多的相同字符,如/ad+/在字符串addddf中匹配的将是adddd,而不是ad或者add。
2、字符[]和[^]
[]中包含一组字符,在匹配时匹配其中的任一个,如/a[mnpqrst]c/将匹配a加m-t中的一个字符再加c的字符串。
它常与+联合使用:/a[bB]+c/匹配abc、aBc、abbc、aBbc、aBbBBBbc等。

^表示除括号内之外的所有字符,如:/a[^bB]+c/匹配a加非b/B字符加c的字符串。
3、字符*和?
字符*用于匹配0个、1个或多个相同字符

字符?匹配0个或1个该字符。

例/ab*c/匹配ac、abc、abbbbc等;/ab?c/匹配ac或abc。

4、“.”字符
字符"."用于匹配除换行外的所有字符,最常与*一起使用。
5、转义字符
对于上述提到的+*?等具有特殊意义的字符,如果想在串中匹配包含其的模式,须在其前加斜线"\"。

如:/\*+/中\*即表示字符*,/\\/表示斜杆。

6、匹配指定数目的字符
之前提到的"*",".","?"字符都是匹配不确定量的字符,我们可以使用{}指定所匹配字符出现的次数。如:/ab{1,3}c/匹配a和c之间有1到3个b的字符串;/ab{3}c/匹配abbbc;/ab{3,}c/匹配不少于3个b在a和c之间的字符串。

7、特殊转义字符
perl里有一些特殊的转移字符,能用于快速简洁地表示一些字符,如下表所示。

转义字符

描述

范围

\d

任意数字

[0-9]

\D

除数字外的任意字符

[^0-9]

\w

任意单词字符

[_0-9a-zA-Z]

\W

任意非单词字符

[^_0-9a-zA-Z]

\s

空白

[\r\t\n\f]

\S

非空白

[^\r\t\n\f]

例:/[\da-z]/匹配任意数字或小写字母。
8、选择模式
字符"|"用于指定两个或多个串中的一个用于匹配模式。如:/def|ghi/匹配defhi或deghi,要是想匹配def或者ghi怎么办呢,请加上括号,即/(def)|(ghi)/。

9、锚模式

这是perl正则表达式中一个很重要的东西,锚可以用来指定匹配的串在原带匹配串中的位置。具体的锚及其描述见下表:

描述

^或\A

仅匹配串首

$或\Z

仅匹配串尾

\b

匹配单词边界

\B

单词内部匹配

例1:/^abc/只匹配以abc打头的字符串,/abc$/只匹配以abc结尾的字符串,结合起来的/^abc$/只匹配字符串abc。

例2:检验变量名的类型:
if($varname=~/^\$[A-Za-z][_0-9a-zA-Z]*$/){
print("$varnameisalegalscalarvariable\n");
}elsif($varname=~/^@[A-Za-z][_0-9a-zA-Z]*$/){
print("$varnameisalegalarrayvariable\n");
}elsif($varname=~/^[A-Za-z][_0-9a-zA-Z]*$/){
print("$varnameisalegalfilevariable\n");
}else{
print("Idon'tunderstandwhat$varnameis.\n");
}
例3:\b在单词边界匹配:/\bdef/匹配def和defghi等以def打头的单词,但不匹配abcdef。/def\b/匹配def和abcdef等以def结尾的单词,但不匹配defghi,/\babc\b/只匹配字符串abc。注意:/\babc/可匹配$abcghi,因为$并不被看作是单词的部分。
例4:\B在单词内部匹配:/\Babc/匹配mabcdef等,但不匹配abc;/def\B/匹配defghi等;/\Bdef\B/匹配cdefg、abcdefghi等,但不匹配def,defghi,abcdef。
10、提取匹配的文本


三、模式匹配选项

选项

描述

g

匹配所有可能的模式

i

忽略大小写

m

将串视为多行

o

只赋值一次

s

将串视为单行

x

忽略模式中的空白


1、匹配所有可能的模式(g选项)
@matches="balata"=~/.a/g;#now@matches=("ba","la","ta")
匹配的循环:
while("balata"=~/.a/g){
$match=$&;
print("$match\n");
}
结果为:
ba
la
ta
当使用了选项g时,可用函数pos来控制下次匹配的偏移:
$offset=pos($string);
pos($string)=$newoffset;
2、忽略大小写(i选项)例
/de/i匹配de,dE,De和DE。
3、将字符串看作多行(m选项)
在此情况下,^符号匹配字符串的起始或新的一行的起始;$符号匹配任意行的末尾。
4、只执行一次变量替换例
$var=1;
$line=<STDIN>;
while($var<10){
$result=$line=~/$var/o;
$line=<STDIN>;
$var++;
}
每次均匹配/1/。
5、将字符串看作单行例
/a.*bc/s匹配字符串axxxxx\nxxxxbc,但/a.*bc/则不匹配该字符串。
6、在模式中忽略空格
/\d{2}([\W])\d{2}\1\d{2}/x等价于/\d{2}([\W])\d{2}\1\d{2}/。


四、替换操作符
上面提到的都是匹配字符串的方法和方式,perl可以在匹配到相应的模式后对串进行处理,其中非常强大的就是替换操作符。其语法为s/pattern/replacement/,其效果为将字符串中与pattern匹配的部分换成replacement。如:
$string="abc123def";
$string=~s/123/456/;#now$string="abc456def";
在替换部分可使用模式次序变量$n,如s/(\d+)/[$1]/,但在替换部分不支持模式的特殊字符,如{},*,+等,如s/abc/[def]/将把abc替换为[def]。
替换操作符的选项如下表:

选项

描述

g

改变模式中的所有匹配

i

忽略模式中的大小写

e

替换字符串作为表达式

m

将待匹配串视为多行

o

仅赋值一次

s

将待匹配串视为单行

x

忽略模式中的空白

注:e选项把替换部分的字符串看作表达式,在替换之前先计算其值,如:
$string="0abc1";
$string=~s/[a-zA-Z]+/$&x2/e;#now$string="0abcabc1"


五、翻译操作符
翻译操作符是perl的另一种替换方式,语法如:tr/string1/string2/。同样,string2为替换部分,但其效果是把string1中的第一个字符替换为string2中的第一个字符,把string1中的第二个字符替换为string2中的第二个字符,依此类推。如:
$string="abcdefghicba";
$string=~tr/abc/def/;#nowstring="defdefghifed"
当string1比string2长时,其多余字符替换为string2的最后一个字符;当string1中同一个字符出现多次时,将使用第一个替换字符。
翻译操作符的选项如下:

选项

描述

c

翻译所有未指定字符

d

删除所有指定字符

s

把多个相同的输出字符缩成一个

如$string=~tr/\d//c;把所有非数字字符替换为空格。$string=~tr/\t//d;删除tab和空格;$string=~tr/0-9//cs;把数字间的其它字符替换为一个空格。


六、扩展模式匹配
PERL支持PERL4和标准UNIX模式匹配操作所没有的一些模式匹配能力。其语法为:(?<c>pattern),其中c是一个字符,pattern是起作用的模式或子模式。
1、不存贮括号内的匹配内容
在PERL的模式中,括号内的子模式将存贮在内存中,此功能即取消存贮该括号内的匹配内容,如/(?:a|b|c)(d|e)f\1/中的\1表示已匹配的d或e,而不是a或b或c。
2、内嵌模式选项
通常模式选项置于其后,有四个选项:i、m、s、x可以内嵌使用,语法为:/(?option)pattern/,等价于/pattern/option。
3、肯定的和否定的预见匹配
肯定的预见匹配语法为/pattern(?=string)/,其意义为匹配后面为string的模式,相反的,(?!string)意义为匹配后面非string的模式,如:
$string="25abc8";
$string=~/abc(?=[0-9])/;
$matched=$&;#$&为已匹配的模式,此处为abc,而不是abc8
4、模式注释
PERL5中可以在模式中用?#来加注释,如:
if($string=~/(?i)[a-z]{2,3}(?#matchtwoorthreealphabeticcharacters)/{
...
}

分享到:
评论

相关推荐

    Perl学习总结 - 副本.docx

    Perl学习总结 - 副本.docx

    perl语言个人学习总结教程

    主要总结了perl语言的基础内容以及个人的学习体会,为初学者提供一定的参考与借鉴。

    perl语言中的变量类型

    perl语言中的变量类型 PERL 学习中总结

    Perl函数小结

    Perl函数小结,本人自己总结的,简单易懂

    Perl程序如何调用C代码

    此文档详细讲解Perl程序对C代码的调用,是对自己工作内容的一个总结,亲自操作,正确无误,欢迎下载。

    perl程序员应该知道的事

    不知道是谁总结的,总结的很好,可以帮助很快入手perl。很感谢作者

    perl脚本语言学习笔记心得

    这个文档中记录和总结了我学习perl脚本语言的一些经验和初学者需要注意的事情

    Perl函数集及内置变量锦集

    perl的内置特殊变量还有很多的,例如常用的还有@_、@ARGV、$ARGV、%INC、%ENV等等,有很多,不可能一一列举了,这里给出一个比较有总结性的列表,是chinaunix上perl社区的一个网友总结的,还算比较全。

    perl 函数 总结

    perl 语言 初学者 适合看 复习 回顾之用

    Perl语言参考手册(中文html).CHM

    比较全面的perl参考手册,实用, 很多是前辈的经验总结,有需要的朋友可以使用,很珍贵的资源 初入门的朋友,还有不想看英文文档的朋友,有需要的朋友可以使用,很珍贵的资源

    grep、sed、awk、perl等对正则表达式的支持的差别

    grep、sed、awk、perl等对正则表达式的支持的差别,大牛总结的,适合高手参考用。

    Perl高级教程人称“大骆驼”(免费)

    第一章 Perl概述............................................................................................................................10 1.1 从头开始.................................................

    perl学习资料

    有关于perl语言的比较详细的资料详细介绍perl的语法和经验总结

    Perl对象总结

    NULL 博文链接:https://fantaxy025025.iteye.com/blog/784762

    perl正则表达式学习手册

    perl的正则表达式,总结的一个小手册,用着还是挺方便的。

    Perl/C#连接Oracle/SQL Server

    先将我用到的总结一下。  1. Perl 连接数据库  Perl 连接数据库的思路都是:  1)使用DBI模块; 2)创建数据库连接句柄dbh; 3)利用dbh创建语句句柄sth; 4)利用sth执行sql语句; 5)利用sth处理数据。  ...

    PHP扩展模块Pecl、Pear以及Perl的区别

    一、简短总结:pear:一个书写的比较规范,国外较流行的工具箱代码集pecl:php扩展包,但不属于php基本扩展范围perl:一种早于php出现的脚本级语言,php借鉴了他的正则表达式部分 二、Pear、Pecl都是PHP扩展模块的...

    watchdog:看门狗写在perl上

    看门狗的此自述文件在perl上编写。 该存储库是做什么用的? 快速总结 版本1.7 去做 核心功能: :check_mark_button: Craft.io检查 :check_mark_button: 检查日志是否正在更新(文件刷新) :check_mark_button: ...

    openLDAPb部署目录服务

    还没有正式开始学习要学的东西就已经被环境搞得很头疼,总结如下 安装perl支持 yum install perl* (yum安装perl相关支持) yum install cpan (perl需要的程序库,需要cpan的支持,详细自行百度) 下载perl并安装 ...

Global site tag (gtag.js) - Google Analytics