在python处理文本时,采用正则表达式替换,可以方便很多。主要用到 re 模块。
1、一个简单的文本替换例子:
import re
msg=file("test.htm","r+").read()
pattern = '<[^>]*?>'
rpl = ''
msg = re.sub(pattern,rpl,msg)
以上代码过滤掉一个html文件中的所有标记信息(<>中的内容),只保留文本信息
2、(?P<name>[0-9]{1}) 和\g<name>:
pattern = """<img src="\.\.\/images\/[a-b]{1}(?P<name>[0-9]{1})\.gif" width="\d+" height="\d+">"""
rpl = """image_\g<name>"""
msg = re.sub(pattern,rpl,msg)
在pattern中使用(?P<name>)匹配搜索内容,然后在rpl中采用 \g<name> 来代表原文中的内容,这样可以达到一些比较特殊的用途,比如重新安排显示格式等。如下例转换日期格式:
import re
msg = "03/24/2004" # convert to 2004-03-24
print msg
pattern = """(?P<month>\d{1,2})/(?P<day>\d{1,2})/(?P<year>\d{2,4})"""
rpl = """\g<year>-\g<month>-\g<day>"""
msg = re.sub(pattern,rpl,msg)
print msg
参考资料:
【PDF】搜集整理:wwwit586com:一个pdf格式的详细介绍
正则表达式校验工具 - 我爱啦查询:可以马上看到正则表达式可以马上看到替换结果
分享到:
相关推荐
python之常用正则表达式.pdfpython之常用正则表达式.pdfpython之常用正则表达式.pdfpython之常用正则表达式.pdfpython之常用正则表达式.pdfpython之常用正则表达式.pdf
这时个人经验,用例子来分析正则表达式的应用,里面的例子都时我的实践经验,所以很具有代表性
学习python正则表达式的应用,用python编写,其中包含部分pdf文章
正则表达式的应用原理... 241 应用之前的优化措施... 242 通过传动装置进行优化... 246 优化正则表达式本身... 247 提高表达式速度的诀窍... 252 常识性优化... 254 将文字文本独立出来... 255 将锚点独立...
如果用户熟悉Linux下的sed、awk、grep或vi,那么对正则表达式这一概念肯定不会陌生。...千万不要以为正则表达式只是Perl、Python、Bash等脚本语言的专利,作为C语言程序员,用户同样可以在自己的程序中运用正则表达式。
代码给出了正则表达式应用的案例,帮助理解正则表达式的用法
这个很基础,就是对正则表达式的最基本的应用,先进阶的就不用看这个了,初学者可以看一下
(4)选作部分:为了提高C++源程序的可读性,C++程序在书写过程中加入了空行、空格、缩进、注释等。假设你想牺牲可读性,以节省磁盘空间,那么你可以存贮一个删除了所有不必要空格和注释的C++源程序的压缩文本。因此...
第3 版在前面的章节中增加了PHP的相关内容,并专门为理解和应用PHP的正则表达式增加了一章全新的内容。另外,该版对Java的章节也进行了修订,做了可观的扩充,反映了Java1.5和Java1.6的新特性。
正则表达式应用非常广泛,例如:php,Python,java等,但在linux中最常用的正则表达式的命令就是grep(egrep),sed,awk等,换句话 说linux三剑客要想能工作的更高效,就一定离不开正则表达式的配合。 1、什么是正则...
下面列出Python正则表达式的几种匹配用法,具体内容如下所示: 此外,关于正则的一切http://deerchao.net/tutorials/regex/regex.htm 1.测试正则表达式是否匹配字符串的全部或部分 regex=ur #正则表达式 if re....
之前我们讲解了 正则表达式 的起源、发展、流派、语法、引擎、优化等相关知识,今天我们主要来学习一下 正则表达式在 Python语言 中的应用! 大多数编程语言的正则表达式设计都师从Perl,所以语法基本相似,不同的是...
正则表达式(Regular Expression,简称:Regex)是一种文本模式的表示方法,它使用单个字符串来描述、匹配一系列...正则表达式在不同的编程语言和工具中都有广泛的应用,例如Python、JavaScript、Perl、grep、sed等。
Python爬虫(二十一) 学习Python爬虫过程中的心得体会以及知识点的整理,方便我自己查找,也希望可以和...正则表达式在文本处理中十分常用 表达文本类型的特征(病毒、入侵等) 同时查找或替换一组字符串 匹配字符串
在Sun的Java JDK 1.40版本中,Java自带了支持正则表达式的包,本文就抛砖引玉地介绍了如何使用java.util.regex包。 可粗略估计一下,除了偶尔用Linux的外,其他Linu x用户都会遇到正则表达式。正则表达式是个极端...
python_正则表达式_应用案例_compile、findall、finditer等
django book 2.0 中文官方文档 汉化版 。 本书所讲的是Django:一个可以使Web开发工作愉快并且高效的Web开发框架。 使用Django,使你能够以 最小的代价构建和维护高质量的Web应用。
Python正则表达式re模块简明笔记(实用应用文)
实验报告