python常用的正则表达式及作用

2025-06-27 17:50

本文主要是介绍python常用的正则表达式及作用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

《python常用的正则表达式及作用》正则表达式是处理字符串的强大工具,Python通过re模块提供正则表达式支持,本文给大家介绍python常用的正则表达式及作用详解,感兴趣的朋友跟随小编一起看看吧...

Python常用正则表达式及作用

正则表达式是处理字符串的强大工具,Python通过jsre模块提供正则表达式支持:

基本匹配模式

  1. 匹配数字

    • \d:匹配任意数字,等价于[0-9]
    • \D:匹配任意非数字,等价于[^0-9]
    • 示例:r'\d+'匹配一个或多个连续数字
  2. 匹配字母和数字

    • \w:匹配字母、数字或下划线,等价于[a-zA-Z0-9_]
    • \W:匹配非字母、数字、下划线,等价于[^a-zA-Z0-9_]
  3. 匹配空白字符

    • \s:匹配任意空白字符(空格、制表符、换行等)
    • \S:匹配任意非空白字符
  4. 匹配任意字符

    • .:匹配除换行符外的任意单个字符

常用正则表达式示例

  1. 匹配邮箱地址

    r'[\w\.-]+@[\w\.-]+\.\w+'
  2. 匹配URL

    r'https?://(?:[-\w.]|(?:%[\da-fA-F]{2}))+'
  3. 匹配IP地址

    r'\b(?:\d{1,3}\.){3}\d{1,3}\b'
    
  4. 匹配中文

    r'[\u4e00-\u9fa5]'
  5. 匹配日期(YYYY-MM-DD格式)

    r'\d{4}-\d{1,2}-\d{1,2}'
  6. 匹配手机号码(中国大陆)

    r'1[3-9]\d{9}'
  7. 匹配html标签

    r'<[^>]+>'
  8. 匹配身份证号(18位)

    r'[1-9]\d{5}(18|19|20)\d{2}(0[1-9]|1[0-2])(0[1-9]|[12]\d|3[01])\d{3}[\dXx]'

常用量词

  1. *:匹配前一个字符0次或多次
  2. +:匹配前一个字符1次或多次
  3. ?:匹配前一个字符0次或1次
  4. {n}:匹配前一个字符恰好n次
  5. {n,}:匹配前一个字符至少n次
  6. {n,m}:匹配前一个字符n到m次

边界匹配

  1. ^:匹配字符串开头
  2. $:匹配字符串结尾
  3. \bChina编程:匹配单词边界
  4. \B:匹配非单词边界

分组和捕获

  1. ():创建捕获组
  2. (?:):创建非捕获组
  3. (?P<name>):命名捕获组

常用re模块方法

  1. re.match():从字符stlDI串开头匹配
  2. re.search():搜索整个字符串
  3. re.findall():返回所有匹配结果
  4. re.finditer():返回匹配结果的迭代器
  5. re.sub():替换匹配的字符串
  6. re.split():根据模式分割字符串

示例代码

import re
# 查找所有数字
text = "我有3个苹果和5个橙子"
numbers = re.findall(r'\d+', text)  # ['3', '5']
# 验证邮箱格式
javascriptemail = "test@example.com"
if re.match(r'[\w\.-]+@[\w\.-]+\.\w+', email):
    print("邮箱格式正确")
# 提取URL
html = '<a href="https://www.example.com" rel="external nofollow" >链接</a>'
url = re.search(r'href="(htjavascripttps?://[^" rel="external nofollow" ]+)"', html).group(1)

到此这篇关于python常用的正则表达式及作用的文章就介绍到这了,更多相关python正则表达式内容请搜索编程China编程(www.chinasem.cn)以前的文章或继续浏览下面的相关文章希望大家以后多多支持China编程(www.chinasem.cn)!

这篇关于python常用的正则表达式及作用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1155234

相关文章

Python用Flask封装API及调用详解

《Python用Flask封装API及调用详解》本文介绍Flask的优势(轻量、灵活、易扩展),对比GET/POST表单/JSON请求方式,涵盖错误处理、开发建议及生产环境部署注意事项... 目录一、Flask的优势一、基础设置二、GET请求方式服务端代码客户端调用三、POST表单方式服务端代码客户端调用四

基于Python实现数字限制在指定范围内的五种方式

《基于Python实现数字限制在指定范围内的五种方式》在编程中,数字范围限制是常见需求,无论是游戏开发中的角色属性值、金融计算中的利率调整,还是传感器数据处理中的异常值过滤,都需要将数字控制在合理范围... 目录引言一、基础条件判断法二、数学运算巧解法三、装饰器模式法四、自定义类封装法五、NumPy数组处理

Python中经纬度距离计算的实现方式

《Python中经纬度距离计算的实现方式》文章介绍Python中计算经纬度距离的方法及中国加密坐标系转换工具,主要方法包括geopy(Vincenty/Karney)、Haversine、pyproj... 目录一、基本方法1. 使用geopy库(推荐)2. 手动实现 Haversine 公式3. 使用py

Python WSGI HTTP服务器Gunicorn使用详解

《PythonWSGIHTTP服务器Gunicorn使用详解》Gunicorn是Python的WSGI服务器,用于部署Flask/Django应用,性能高且稳定,支持多Worker类型与配置,可处... 目录一、什么是 Gunicorn?二、为什么需要Gunicorn?三、安装Gunicorn四、基本使用启

python urllib模块使用操作方法

《pythonurllib模块使用操作方法》Python提供了多个库用于处理URL,常用的有urllib、requests和urlparse(Python3中为urllib.parse),下面是这些... 目录URL 处理库urllib 模块requests 库urlparse 和 urljoin编码和解码

使用Python提取PDF大纲(书签)的完整指南

《使用Python提取PDF大纲(书签)的完整指南》PDF大纲(Outline)​​是PDF文档中的导航结构,通常显示在阅读器的侧边栏中,方便用户快速跳转到文档的不同部分,大纲通常以层级结构组织,包含... 目录一、PDF大纲简介二、准备工作所需工具常见安装问题三、代码实现完整代码核心功能解析四、使用效果控

Java Stream流以及常用方法操作实例

《JavaStream流以及常用方法操作实例》Stream是对Java中集合的一种增强方式,使用它可以将集合的处理过程变得更加简洁、高效和易读,:本文主要介绍JavaStream流以及常用方法... 目录一、Stream流是什么?二、stream的操作2.1、stream流创建2.2、stream的使用2.

Python自定义异常的全面指南(入门到实践)

《Python自定义异常的全面指南(入门到实践)》想象你正在开发一个银行系统,用户转账时余额不足,如果直接抛出ValueError,调用方很难区分是金额格式错误还是余额不足,这正是Python自定义异... 目录引言:为什么需要自定义异常一、异常基础:先搞懂python的异常体系1.1 异常是什么?1.2

更改linux系统的默认Python版本方式

《更改linux系统的默认Python版本方式》通过删除原Python软链接并创建指向python3.6的新链接,可切换系统默认Python版本,需注意版本冲突、环境混乱及维护问题,建议使用pyenv... 目录更改系统的默认python版本软链接软链接的特点创建软链接的命令使用场景注意事项总结更改系统的默

Linux升级或者切换python版本实现方式

《Linux升级或者切换python版本实现方式》本文介绍在Ubuntu/Debian系统升级Python至3.11或更高版本的方法,通过查看版本列表并选择新版本进行全局修改,需注意自动与手动模式的选... 目录升级系统python版本 (适用于全局修改)对于Ubuntu/Debian系统安装后,验证Pyt