本文主要是介绍python常用的正则表达式及作用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
《python常用的正则表达式及作用》正则表达式是处理字符串的强大工具,Python通过re模块提供正则表达式支持,本文给大家介绍python常用的正则表达式及作用详解,感兴趣的朋友跟随小编一起看看吧...
Python常用正则表达式及作用
正则表达式是处理字符串的强大工具,Python通过jsre模块提供正则表达式支持:
基本匹配模式
匹配数字
\d:匹配任意数字,等价于[0-9]\D:匹配任意非数字,等价于[^0-9]- 示例:
r'\d+'匹配一个或多个连续数字
匹配字母和数字
\w:匹配字母、数字或下划线,等价于[a-zA-Z0-9_]\W:匹配非字母、数字、下划线,等价于[^a-zA-Z0-9_]
匹配空白字符
\s:匹配任意空白字符(空格、制表符、换行等)\S:匹配任意非空白字符
匹配任意字符
.:匹配除换行符外的任意单个字符
常用正则表达式示例
匹配邮箱地址
r'[\w\.-]+@[\w\.-]+\.\w+'
匹配URL
r'https?://(?:[-\w.]|(?:%[\da-fA-F]{2}))+'匹配IP地址
r'\b(?:\d{1,3}\.){3}\d{1,3}\b'匹配中文
r'[\u4e00-\u9fa5]'
匹配日期(YYYY-MM-DD格式)
r'\d{4}-\d{1,2}-\d{1,2}'匹配手机号码(中国大陆)
r'1[3-9]\d{9}'匹配html标签
r'<[^>]+>'
匹配身份证号(18位)
r'[1-9]\d{5}(18|19|20)\d{2}(0[1-9]|1[0-2])(0[1-9]|[12]\d|3[01])\d{3}[\dXx]'
常用量词
*:匹配前一个字符0次或多次+:匹配前一个字符1次或多次?:匹配前一个字符0次或1次{n}:匹配前一个字符恰好n次{n,}:匹配前一个字符至少n次{n,m}:匹配前一个字符n到m次
边界匹配
^:匹配字符串开头$:匹配字符串结尾\bChina编程:匹配单词边界\B:匹配非单词边界
分组和捕获
():创建捕获组(?:):创建非捕获组(?P<name>):命名捕获组
常用re模块方法
re.match():从字符stlDI串开头匹配re.search():搜索整个字符串re.findall():返回所有匹配结果re.finditer():返回匹配结果的迭代器re.sub():替换匹配的字符串re.split():根据模式分割字符串
示例代码
import re # 查找所有数字 text = "我有3个苹果和5个橙子" numbers = re.findall(r'\d+', text) # ['3', '5'] # 验证邮箱格式 javascriptemail = "test@example.com" if re.match(r'[\w\.-]+@[\w\.-]+\.\w+', email): print("邮箱格式正确") # 提取URL html = '<a href="https://www.example.com" rel="external nofollow" >链接</a>' url = re.search(r'href="(htjavascripttps?://[^" rel="external nofollow" ]+)"', html).group(1)
到此这篇关于python常用的正则表达式及作用的文章就介绍到这了,更多相关python正则表达式内容请搜索编程China编程(www.chinasem.cn)以前的文章或继续浏览下面的相关文章希望大家以后多多支持China编程(www.chinasem.cn)!
这篇关于python常用的正则表达式及作用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!