Python 正则表达式(高级用法)- search、findall、sub 、split

2024-08-21 04:58

本文主要是介绍Python 正则表达式(高级用法)- search、findall、sub 、split,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

仅供学习,转载请注明出处

re模块的高级用法

search

需求:匹配胖子老板说出的香烟价格

In [95]: re.search(r"\d+","胖子老板:一包蓝利群17元啦").group()                      
Out[95]: '17'In [96]:  

findall

前面寻找smoke的故事中,我用来最终解决胖子老板的smoke次数寻找问题。
因为findall找出来返回的是一个list,那么只要用len()方法就可以知道次数了。

In [96]: str1 = "asdjkasldkjsmokelaksjdklasjdlasmokel;kajsdlkjasdsmoke"              In [97]: ret = re.findall(r"smoke",str1) In [100]: print(ret)                                                                 
['smoke', 'smoke', 'smoke']In [101]: print(len(ret))                                                            
3In [102]:  

sub 将匹配到的数据进行替换

例如将上面的smoke进行替换为hello

In [104]: ret = re.sub(r"smoke","hello",str1)                                        In [105]: print(ret)                                                                 
asdjkasldkjhellolaksjdklasjdlahellol;kajsdlkjasdhelloIn [106]:    

这种替换在爬虫的时候,我经常用来拼接替换图片的url地址这类的事项。

还有一个有趣的方式,修改的地方可以使用函数方法,如下:

需求:将匹配到的 整数+1

#coding=utf-8
import redef add(temp):strNum = temp.group()num = int(strNum) + 1return str(num)ret = re.sub(r"\d+", add, "python = 997")
print(ret)ret = re.sub(r"\d+", add, "python = 99")
print(ret)

运行结果:

python = 998
python = 100

split 根据匹配进行切割字符串,并返回一个列表

#coding=utf-8
import re# 使用冒号进行切割
In [106]: ret = re.split(r":","胖子老板:一包烟17元啦")                               In [107]: print(ret)                                                                 
['胖子老板', '一包烟17元啦']# 那么能不能根据多个条件进行切割呢?
In [108]:  # 使用 | 增加切割条件,这里我增加了 \s 空格或者tab的切割。
In [108]: ret = re.split(r":|\s","胖子老板:一包烟17元啦 肥仔白: 这么贵啊!")         In [109]: print(ret)                                                                 
['胖子老板', '一包烟17元啦', '肥仔白', '', '这么贵啊!']In [110]:     
13423234-7907ae6344e86e8a.png

关注微信公众号,回复【资料】、Python、PHP、JAVA、web,则可获得Python、PHP、JAVA、前端等视频资料。

这篇关于Python 正则表达式(高级用法)- search、findall、sub 、split的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1092190

相关文章

使用Python实现可恢复式多线程下载器

《使用Python实现可恢复式多线程下载器》在数字时代,大文件下载已成为日常操作,本文将手把手教你用Python打造专业级下载器,实现断点续传,多线程加速,速度限制等功能,感兴趣的小伙伴可以了解下... 目录一、智能续传:从崩溃边缘抢救进度二、多线程加速:榨干网络带宽三、速度控制:做网络的好邻居四、终端交互

Python中注释使用方法举例详解

《Python中注释使用方法举例详解》在Python编程语言中注释是必不可少的一部分,它有助于提高代码的可读性和维护性,:本文主要介绍Python中注释使用方法的相关资料,需要的朋友可以参考下... 目录一、前言二、什么是注释?示例:三、单行注释语法:以 China编程# 开头,后面的内容为注释内容示例:示例:四

Python中win32包的安装及常见用途介绍

《Python中win32包的安装及常见用途介绍》在Windows环境下,PythonWin32模块通常随Python安装包一起安装,:本文主要介绍Python中win32包的安装及常见用途的相关... 目录前言主要组件安装方法常见用途1. 操作Windows注册表2. 操作Windows服务3. 窗口操作

MySQL数据库中ENUM的用法是什么详解

《MySQL数据库中ENUM的用法是什么详解》ENUM是一个字符串对象,用于指定一组预定义的值,并可在创建表时使用,下面:本文主要介绍MySQL数据库中ENUM的用法是什么的相关资料,文中通过代码... 目录mysql 中 ENUM 的用法一、ENUM 的定义与语法二、ENUM 的特点三、ENUM 的用法1

JavaSE正则表达式用法总结大全

《JavaSE正则表达式用法总结大全》正则表达式就是由一些特定的字符组成,代表的是一个规则,:本文主要介绍JavaSE正则表达式用法的相关资料,文中通过代码介绍的非常详细,需要的朋友可以参考下... 目录常用的正则表达式匹配符正则表China编程达式常用的类Pattern类Matcher类PatternSynta

Python中re模块结合正则表达式的实际应用案例

《Python中re模块结合正则表达式的实际应用案例》Python中的re模块是用于处理正则表达式的强大工具,正则表达式是一种用来匹配字符串的模式,它可以在文本中搜索和匹配特定的字符串模式,这篇文章主... 目录前言re模块常用函数一、查看文本中是否包含 A 或 B 字符串二、替换多个关键词为统一格式三、提

python常用的正则表达式及作用

《python常用的正则表达式及作用》正则表达式是处理字符串的强大工具,Python通过re模块提供正则表达式支持,本文给大家介绍python常用的正则表达式及作用详解,感兴趣的朋友跟随小编一起看看吧... 目录python常用正则表达式及作用基本匹配模式常用正则表达式示例常用量词边界匹配分组和捕获常用re

python实现对数据公钥加密与私钥解密

《python实现对数据公钥加密与私钥解密》这篇文章主要为大家详细介绍了如何使用python实现对数据公钥加密与私钥解密,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录公钥私钥的生成使用公钥加密使用私钥解密公钥私钥的生成这一部分,使用python生成公钥与私钥,然后保存在两个文

python删除xml中的w:ascii属性的步骤

《python删除xml中的w:ascii属性的步骤》使用xml.etree.ElementTree删除WordXML中w:ascii属性,需注册命名空间并定位rFonts元素,通过del操作删除属... 可以使用python的XML.etree.ElementTree模块通过以下步骤删除XML中的w:as

MySQL之InnoDB存储引擎中的索引用法及说明

《MySQL之InnoDB存储引擎中的索引用法及说明》:本文主要介绍MySQL之InnoDB存储引擎中的索引用法及说明,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐... 目录1、背景2、准备3、正篇【1】存储用户记录的数据页【2】存储目录项记录的数据页【3】聚簇索引【4】二