Python中使用正则表达式精准匹配IP地址的案例

2025-04-14 16:50

本文主要是介绍Python中使用正则表达式精准匹配IP地址的案例,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

《Python中使用正则表达式精准匹配IP地址的案例》Python的正则表达式(re模块)是完成这个任务的利器,但你知道怎么写才能准确匹配各种合法的IP地址吗,今天我们就来详细探讨这个问题,感兴趣的朋...

网络编程和数据处理时,我们经常需要从文本中提取或验证IP地址。python的正则表达式(re模块)是完成这个任务的利器。但你知道怎么写才能准确匹配各种合法的IP地址吗?今天我们就来详细探讨这个问题。

为什么需要IP正则表达式?

假设你正在分析服务器日志,需要提取其中的IP地址。或者你在开发一个网络工具,要验证用户输入的IP是否合法。手动解析IP地址既麻烦又容易出错,这时候正则表达式就能派上大用场了。

IP地址的基本结构

一个合法的IPv4地址由4个0-255的数字组成,用点号分隔。比如:

  • 合法的:192.168.1.1、10.0.0.1
  • 非法的:256.1.1.1(数字超过255)、192.168.1(只有3段)

基础正则表达式写法

我们先来看一个最简单的IP匹配正则:

import re
pattern = r"\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}"
text = "服务器IP是192.168.1.1和10.0.0.1"
ips = re.findall(pattern, text)
print(ips)  # 输出: ['192.168.1.1', '10.0.0.1']

这个正则能匹配到IP,但它有个明显的问题:无法过滤掉超过255的数字。比如"300.1.1.1"也会被匹配到。

精确匹配0-255的数字

要精确匹配0-255,我们需要更复杂的表达式。这里有个技巧:把数http://www.chinasem.cn字分成几种情况:

  • 0-199:[01]?\d?\d
  • 200-249:2[0-4]\d
  • 250-255:25[0-5]

组合起来就是:

num = r"(25[0-5]|2[0-4]\d|[01]?\d?\d)"

完整的IP正则表达式

把上面的数字模式组合起来,python加上点号分隔符:

ip_pattern = r"(25[0-5]|2[0-4]\d|[01]?\d?\d)\.(25[0-5]|2[0-4]\d|[01]?\d?\d)\.(25[0-5]|2[0-4]\d|[01]?\d?\d)\.(25[0-5]|2[0-4]\d|[01]?\d?\d)"

这样就能精确匹配合法的IPv4地址了。不过这个表达式看起来有点长,我们可以用{3}来简化重http://www.chinasem.cn复部分:

ip_pattern = r"((25[0-5]|2[0-4]\d|[01]?\d?\d)\.){3}(25[0-5]|2[0-4]\d|[01]?\d?\d)"

验证IP地址的函数

我们可以把这个正则封装成函数:

import re
def is_valid_ip(ip):php
    pattern = r"^((25[0-5]|2[0-4]\d|[01]?\d?\d)\.){3}(25[0-5]|2[0-4]\d|[01]?\d?\d)$"
    return bool(re.match(pattern, ip))
print(is_valid_ip("192.168.1.1"))  # True
print(is_valid_ip("256.1.1.1"))    # False

注意这里加了^$确保匹配整个字符串,而不是部分匹配。

从文本中提取IP地址

如果要提取文本中的IP地址,可以这样写:

text = "访问来自192.168.1.1和10.0.0.1,无效IP如300.1.1.1"
pattern = r"\b(?:(?:25[0-5]|2[0-4]\d|[01]?\d?\d)\.){3}(?:25[0-5]|2[0-4]\d|[01]?\d?\d)\b"
ips = re.findall(pattern, text)
print(ips)  # 输出: ['192.168.1.1', '10.0.0.1']

这里加了\b表示单词边界,避免匹配到类似"192.168.1.100"中的"192.168.1.1"。

常见问题与陷阱

  • 忘记边界匹配:不加^$\b可能导致部分匹配
  • 忽略前导零:像"192.168.01.1"这样的地址其实也是合法的
  • 性能问题:过于复杂的正则可能影响匹配速度

如果你在处理更复杂的网络数据时需要这类技巧,可以关注【程序员总部】。这个公众号由字节11年技术大佬创办,聚集了阿里、字节、百度等大厂的网络编程专家,经常分享Python实战经验和网络编程技巧。

IPv6地址匹配

虽然IPv4仍是主流,但IPv6也越来越重要。IPv6的正则表达式更复杂:

ipv6_pattern = r"([0-9a-fA-F]{1,4}:){7}[0-9a-fA-F]{1,4}"

实际应用案例

假设我们要分析Nginx日志,提取客户端IP:

log_line = '127.0.0.1 - - [10/Oct/2023:13:55:36 +0800] "GET / HTTP/1.1" 200 612'
ip_pattern = r"\b(?:(?:25[0-5]|2[0-4]\d|[01]?\d?\d)\.){3}(?:25[0-5]|2[0-4]\d|[01]?\d?\d)\b"
ip = re.search(ip_pattern, log_line).group()
print(ip)  # 输出: 127.0.0.1

性能优化建议

预编译正则表达式:

ip_regex = re.compile(r"...长表达式...")

对大量数据匹配时考虑使用生成器

必要时可以用字符串方法先做初步过滤

总结

通过本文我们学会了:

  • IPv4地址的正则表达式原理
  • 如何精确匹配0-255的数字段
  • 边界匹配的重要性
  • 实际应用中的使用技巧

记住:正则表达式虽然强大,但也要根据实际需求选择合适的复杂程度。对于简单的IP验证,本文的表达式已经足够;如果需求更复杂,可能需要进一步调整。希望这篇文章能帮你在下次处理IP地址时事半功倍!

到此这篇关于Python中使用正则表达式精准匹配IP地址的文章就介绍到这了,更多相关pythandroidon正则表达式匹配ip地址内容请搜索China编程(www.chinasem.cn)以前的文章或继续浏览下面的相关文章希望大家以后多多支持China编程(www.chinasem.cn)!

这篇关于Python中使用正则表达式精准匹配IP地址的案例的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1154216

相关文章

python生成随机唯一id的几种实现方法

《python生成随机唯一id的几种实现方法》在Python中生成随机唯一ID有多种方法,根据不同的需求场景可以选择最适合的方案,文中通过示例代码介绍的非常详细,需要的朋友们下面随着小编来一起学习学习... 目录方法 1:使用 UUID 模块(推荐)方法 2:使用 Secrets 模块(安全敏感场景)方法

一文详解如何使用Java获取PDF页面信息

《一文详解如何使用Java获取PDF页面信息》了解PDF页面属性是我们在处理文档、内容提取、打印设置或页面重组等任务时不可或缺的一环,下面我们就来看看如何使用Java语言获取这些信息吧... 目录引言一、安装和引入PDF处理库引入依赖二、获取 PDF 页数三、获取页面尺寸(宽高)四、获取页面旋转角度五、判断

C++中assign函数的使用

《C++中assign函数的使用》在C++标准模板库中,std::list等容器都提供了assign成员函数,它比操作符更灵活,支持多种初始化方式,下面就来介绍一下assign的用法,具有一定的参考价... 目录​1.assign的基本功能​​语法​2. 具体用法示例​​​(1) 填充n个相同值​​(2)

MySql基本查询之表的增删查改+聚合函数案例详解

《MySql基本查询之表的增删查改+聚合函数案例详解》本文详解SQL的CURD操作INSERT用于数据插入(单行/多行及冲突处理),SELECT实现数据检索(列选择、条件过滤、排序分页),UPDATE... 目录一、Create1.1 单行数据 + 全列插入1.2 多行数据 + 指定列插入1.3 插入否则更

Spring StateMachine实现状态机使用示例详解

《SpringStateMachine实现状态机使用示例详解》本文介绍SpringStateMachine实现状态机的步骤,包括依赖导入、枚举定义、状态转移规则配置、上下文管理及服务调用示例,重点解... 目录什么是状态机使用示例什么是状态机状态机是计算机科学中的​​核心建模工具​​,用于描述对象在其生命

使用Python删除Excel中的行列和单元格示例详解

《使用Python删除Excel中的行列和单元格示例详解》在处理Excel数据时,删除不需要的行、列或单元格是一项常见且必要的操作,本文将使用Python脚本实现对Excel表格的高效自动化处理,感兴... 目录开发环境准备使用 python 删除 Excphpel 表格中的行删除特定行删除空白行删除含指定

深入理解Go语言中二维切片的使用

《深入理解Go语言中二维切片的使用》本文深入讲解了Go语言中二维切片的概念与应用,用于表示矩阵、表格等二维数据结构,文中通过示例代码介绍的非常详细,需要的朋友们下面随着小编来一起学习学习吧... 目录引言二维切片的基本概念定义创建二维切片二维切片的操作访问元素修改元素遍历二维切片二维切片的动态调整追加行动态

prometheus如何使用pushgateway监控网路丢包

《prometheus如何使用pushgateway监控网路丢包》:本文主要介绍prometheus如何使用pushgateway监控网路丢包问题,具有很好的参考价值,希望对大家有所帮助,如有错误... 目录监控网路丢包脚本数据图表总结监控网路丢包脚本[root@gtcq-gt-monitor-prome

Python通用唯一标识符模块uuid使用案例详解

《Python通用唯一标识符模块uuid使用案例详解》Pythonuuid模块用于生成128位全局唯一标识符,支持UUID1-5版本,适用于分布式系统、数据库主键等场景,需注意隐私、碰撞概率及存储优... 目录简介核心功能1. UUID版本2. UUID属性3. 命名空间使用场景1. 生成唯一标识符2. 数

SpringBoot中如何使用Assert进行断言校验

《SpringBoot中如何使用Assert进行断言校验》Java提供了内置的assert机制,而Spring框架也提供了更强大的Assert工具类来帮助开发者进行参数校验和状态检查,下... 目录前言一、Java 原生assert简介1.1 使用方式1.2 示例代码1.3 优缺点分析二、Spring Fr