Python 流静态文件过滤、端口过滤、同域过滤(host过滤)、代理拦截

2024-01-25 21:44

本文主要是介绍Python 流静态文件过滤、端口过滤、同域过滤(host过滤)、代理拦截,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

静态文件过滤

需求

代码

端口过滤

需求

代码

同域过滤(host过滤)

需求

代码


静态文件过滤

需求

流量中的url包含大量静态文件请求信息,过滤掉

代码

def __is_static(self, flow: http.HTTPFlow) -> bool:static_ext = ['.js', '.css', '.png', '.jpg', '.jpeg', '.gif', '.ico','.svg', '.woff', '.woff2', '.ttf', '.eot', '.map', '.ico',         '.webp', 'htm', 'html']return any(flow.request.path.endswith(ext) for ext in static_ext)if not self.__is_static(flow):print("处理被过滤后的流")

端口过滤

需求

过滤掉不进行处理的端口url

代码

import redef __check_port(self, flow: http.HTTPFlow) -> bool:ports = [80, '1\\d{4}', '.*']    # .*匹配所有, 1\\d{4}表示以1开头的最多5位的端口port = flow.request.portfor p in ports:if type(p) == type(0) and p == port:return Trueif type(p) == type('') and re.match(p, str(port)):return Truereturn Falseif self.__check_port(flow):print("开始处理流")

同域过滤(host过滤)

需求

过滤掉非同源的url

代码

# 过滤host、子域是否属同域
def __check_host(self, flow: http.HTTPFlow) -> bool:hosts = ['localhost', '.*\\.aaa\\.com', '127.0.0.1']host = flow.request.pretty_hostfor h in hosts:try:pattern = re.compile(h)     # 这两行测试子域是否在同一hostif re.match(pattern, host):return Trueexcept Exception:if host == pattern:return Truereturn False

这篇关于Python 流静态文件过滤、端口过滤、同域过滤(host过滤)、代理拦截的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/644710

相关文章

Python文件操作与IO流的使用方式

《Python文件操作与IO流的使用方式》:本文主要介绍Python文件操作与IO流的使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、python文件操作基础1. 打开文件2. 关闭文件二、文件读写操作1.www.chinasem.cn 读取文件2. 写

使用Python自动化生成PPT并结合LLM生成内容的代码解析

《使用Python自动化生成PPT并结合LLM生成内容的代码解析》PowerPoint是常用的文档工具,但手动设计和排版耗时耗力,本文将展示如何通过Python自动化提取PPT样式并生成新PPT,同时... 目录核心代码解析1. 提取 PPT 样式到 jsON关键步骤:代码片段:2. 应用 JSON 样式到

python通过curl实现访问deepseek的API

《python通过curl实现访问deepseek的API》这篇文章主要为大家详细介绍了python如何通过curl实现访问deepseek的API,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编... API申请和充值下面是deepeek的API网站https://platform.deepsee

Python Selenium动态渲染页面和抓取的使用指南

《PythonSelenium动态渲染页面和抓取的使用指南》在Web数据采集领域,动态渲染页面已成为现代网站的主流形式,本文将从技术原理,环境配置,核心功能系统讲解Selenium在Python动态... 目录一、Selenium技术架构解析二、环境搭建与基础配置1. 组件安装2. 驱动配置3. 基础操作模

Python将字库文件打包成可执行文件的常见方法

《Python将字库文件打包成可执行文件的常见方法》在Python打包时,如果你想将字库文件一起打包成一个可执行文件,有几种常见的方法,具体取决于你使用的打包工具,下面就跟随小编一起了解下具体的实现方... 目录使用 PyInstaller基本方法 - 使用 --add-data 参数使用 spec 文件(

Python MCPInspector调试思路详解

《PythonMCPInspector调试思路详解》:本文主要介绍PythonMCPInspector调试思路详解,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋... 目录python-MCPInspector调试1-核心知识点2-思路整理1-核心思路2-核心代码3-参考网址

将图片导入Python的turtle库的详细过程

《将图片导入Python的turtle库的详细过程》在Python编程的世界里,turtle库以其简单易用、图形化交互的特点,深受初学者喜爱,随着项目的复杂度增加,仅仅依靠线条和颜色来绘制图形可能已经... 目录开篇引言正文剖析1. 理解基础:Turtle库的工作原理2. 图片格式与支持3. 实现步骤详解第

Python的pip在命令行无法使用问题的解决方法

《Python的pip在命令行无法使用问题的解决方法》PIP是通用的Python包管理工具,提供了对Python包的查找、下载、安装、卸载、更新等功能,安装诸如Pygame、Pymysql等Pyt... 目录前言一. pip是什么?二. 为什么无法使用?1. 当我们在命令行输入指令并回车时,一般主要是出现以

Python解决雅努斯问题实例方案详解

《Python解决雅努斯问题实例方案详解》:本文主要介绍Python解决雅努斯问题实例方案,雅努斯问题是指AI生成的3D对象在不同视角下出现不一致性的问题,即从不同角度看物体时,物体的形状会出现不... 目录一、雅努斯简介二、雅努斯问题三、示例代码四、解决方案五、完整解决方案一、雅努斯简介雅努斯(Janu

使用Python和SQLAlchemy实现高效的邮件发送系统

《使用Python和SQLAlchemy实现高效的邮件发送系统》在现代Web应用中,邮件通知是不可或缺的功能之一,无论是订单确认、文件处理结果通知,还是系统告警,邮件都是最常用的通信方式之一,本文将详... 目录引言1. 需求分析2. 数据库设计2.1 User 表(存储用户信息)2.2 CustomerO