如何理解Python中的正则表达式(3)
今天马哥教育要跟大家分享的文章是如何理解Python中的正则表达式(3)?通过上节课的学习,我们对Python正则表达式有了更进一步的认识,你有没有再找些其他练习进行实践操作呢?今天我们来解决两个问题,Python入门新手和正在Python学习的小伙伴快来看一看吧,希望能够对大家有所帮助 !
这节课我们来解决上节课我们留下的练习题以及学习如何用正则表达式来抓取手机号吧。
先来公布上一课习题的答案
\bs\S*?e\b
有的同学给出的答案是"\bs.*?e\b"。测试一下就会发现,有奇怪的'sea sue'和'sweet see'混进来了。既然是单词,我们就不要空格,所以需要用"\S"而不是"."
昨天有位同学说,用正则表达式匹配出了文件中的手机号。这样现学现用很不错。匹配的规则是"1.*?\n",在这个文件的条件下,是可行的。但这规则不够严格,且依赖于手机号结尾有换行符。今天我来讲讲其他的方法。
匹配手机号,其实就是找出一串连续的数字。更进一步,是11位,以1开头的数字。
还记得正则第1讲里提到的[]符号吗?它表示其中任意一个字符。所以要匹配数字,我们可以用
[0123456789]
由于它们是连续的字符,有一种简化的写法:[0-9]。类似的还有[a-zA-Z]的用法。
还有另一种表示数字的方法
\d
要表示任意长度的数字,就可以用
[0-9]*
或者
\d*
但要注意的是,*表示的任意长度包括0,也就是没有数字的空字符也会被匹配出来。一个与*类似的符号+,表示的则是1个或更长。
所以要匹配出所有的数字串,应当用
[0-9]+
或者
\d+
如果要限定长度,就用{}代替+,大括号里写上你想要的长度。比如11位的数字:
\d{11}
想要再把第一位限定为1,就在前面加上1,后面去掉一位:
1\d{10}
总结一下今天提到的符号
[0-9] \d + {}
现在你可以去一个混杂着各种数据的文件里,抓出里面的手机号,或是其他你感兴趣的数字了。
恭喜您在Python的道路上又坚持了一天,跟大家一起学到现在,终于等到大家知道去拓展所学知识的一天了,对于你们这是一个莫大的进步,如果坚持这样举一反三、学以致用,那么出道指日可待!
以上就是马哥教育今天为大家分享的关于如何理解Python中的正则表达式(3)的文章,希望本篇文章能够对正在 Python学习 和从事Python相关工作的小伙伴们有所帮助,想要了解更多相关知识记得关注马哥教育官网,每天都会有大量优质内容与大家分享!
声明:文章来源于网络,如有侵权请联系删除!