Java 正则表达式URL 匹配与源码全解析

2025-04-19 04:50

本文主要是介绍Java 正则表达式URL 匹配与源码全解析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

《Java正则表达式URL匹配与源码全解析》在Web应用开发中,我们经常需要对URL进行格式验证,今天我们结合Java的Pattern和Matcher类,深入理解正则表达式在实际应用中...

在 Web 应用开发中,我们经常需要对 URL 进行格式验证。今天我们结合 JavaPatternMatcher 类,深入理解正则表达式在实际应用中的强大功能,并剖析一段实际的 Java 示例源码。

Java 正则表达式URL 匹配与源码全解析

package com.RegExpInfo;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Exercise02 {
    public static void main(String[] args) {
//        String content="https://";
//        String content="http://";
//        String content="https://" +
//                "www.bilibili.com/";
//        String content="https://" +
//                "www.bilibili.com/" +
//                "video/" +
China编程//                "BV1fh411y7R8?spm_id_from=333.788.player.switch&vd_" +
//           http://www.chinasem.cn     "source=6fe96DB28441a84c79edc35a022cf1c5&p=895" ;
//        String content="https://" +
//                "www.bilibili.com" ;
        String content="https://blog.csdn.net/keshi12354?spm=1000.2115.3001.5343";
//        String regExp="^((https|http)://)";
//        (2)
//        String regExp="^((https|http)://)([\\w-]+\\.)+[\\w-]+\\/";
//        (3)
        String regExp="^((https|http)://)([\\w-]+\\.)+[\\w-]+(\\/([\\w-_?=&./]*))?$";
//        String regExp="^((https|http)://)([\\w-]+\\.)+[\\w-]+(\\/([\\w-_?=&./]*))?$";
        Pattern pattern = Pattern.compile(regExp);
        Matcher matcher = pattern.matcher(content);
        while (matcher.find()) {
            System.out.println(matcher.group(0));
        }
    }
}

1.正则表达式分解:

分布实现:
1. 基础协议匹配 (1)

 String regExp="^((https|http)://)";

功能:只匹配URL开头的协议部分

匹配内容http:// 或 https://

结构

^ 表示字符串开始

(https|http) 匹配"https"或"http"

:// 匹配协议分隔符

目的:先确保能正确识别URL的协议部分

2. 添加域名匹配 (2)

 String regExjavascriptp="^((https|http)://)([\\w-]+\\.)+[\\w-]+\\/";

新增功能:在协议后添加域名和路径的基本匹配

匹配内容:如 http://example.com/

新增结构

([\\w-]+\\.)+ 匹配一个或多个域名部分(如"www."或"sub.")

\\w 匹配单词字符(字母、数字、下划线)

- 匹配连字符

+ 表示一次或多次

\\. 匹配点号

[\\w-]+ 匹配顶级域名(如"com")

\\/ 匹配结尾的斜杠

目的:扩展匹配完整的域名结构

3. 添加路径和查询参数匹配 (3)

 String regExp="^((https|http)://)([\\w-]+\\.)+[\\w-]+(\\/([\\w-_?=&./]*))?$";

新增功能:支持可选的路径和查询参数

匹配内容:如 http://example.com/path?param=value

新增结构

(\\/([\\w-_?=&./]*))?

\\/ 匹配路径开始的斜杠

[\\w-_?=&./]* 匹配路径和查询参数

包含字母、数字、下划线、连字符、问号、等号、&、点和斜杠

? 表示整个路径部分是可选的

$ 表示字符串结束

目的:使正则表达式能够匹配带路径和参数的完整URL

 4. 最终优化版本

String regExp="^((https|http)://)?([\\w-]+\\.)+[\\w-]+(\\/([\\w-_?=&./]*))?$";

关键改进:使协议部分变为可选

匹配内容:现在可以匹配:

带协议的URL:http://example.com/path

不带协议的URL:example.com/path

修改点

在协议部分 ((https|http)://) 后添加了 ? 使其变为可选

目的:提高正则表达式的灵活性,适应更多使用场景

5.设计思想总结

渐进式开发:从简单到复杂逐步构建正则表达式

模块化设计:每个部分都有明确的功能划分(协议、域名、路径)

灵活性增强:通过添加可选标记(?)使表达式更通用

边界明确:始终使用^$确保匹配整个字符串

字符集合理定义:使用[\wChina编程-]等字符集准确描述允许的字符

这种分步构建的方法不仅使正则表达式更易于理解和维护,也方便在开发过程中逐步测试每个部分的匹配效果。

到此这篇关于Java 正则表达式综合实战:URL 匹配与源码解析的文章就介绍到这了,更多相关java正则表达式URL 匹配内容请搜索编程China编程(www.chinasem.cn)以前的文章或继续浏览下面的相关文章希望大家以后多多支持China编程(www.cppcnChina编程s.com)!

这篇关于Java 正则表达式URL 匹配与源码全解析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1154290

相关文章

SpringSecurity显示用户账号已被锁定的原因及解决方案

《SpringSecurity显示用户账号已被锁定的原因及解决方案》SpringSecurity中用户账号被锁定问题源于UserDetails接口方法返回值错误,解决方案是修正isAccountNon... 目录SpringSecurity显示用户账号已被锁定的解决方案1.问题出现前的工作2.问题出现原因各

Java继承映射的三种使用方法示例

《Java继承映射的三种使用方法示例》继承在Java中扮演着重要的角色,它允许我们创建一个类(子类),该类继承另一个类(父类)的所有属性和方法,:本文主要介绍Java继承映射的三种使用方法示例,需... 目录前言一、单表继承(Single Table Inheritance)1-1、原理1-2、使用方法1-

Spring @Scheduled注解及工作原理

《Spring@Scheduled注解及工作原理》Spring的@Scheduled注解用于标记定时任务,无需额外库,需配置@EnableScheduling,设置fixedRate、fixedDe... 目录1.@Scheduled注解定义2.配置 @Scheduled2.1 开启定时任务支持2.2 创建

SpringBoot中使用Flux实现流式返回的方法小结

《SpringBoot中使用Flux实现流式返回的方法小结》文章介绍流式返回(StreamingResponse)在SpringBoot中通过Flux实现,优势包括提升用户体验、降低内存消耗、支持长连... 目录背景流式返回的核心概念与优势1. 提升用户体验2. 降低内存消耗3. 支持长连接与实时通信在Sp

Spring Boot 实现 IP 限流的原理、实践与利弊解析

《SpringBoot实现IP限流的原理、实践与利弊解析》在SpringBoot中实现IP限流是一种简单而有效的方式来保障系统的稳定性和可用性,本文给大家介绍SpringBoot实现IP限... 目录一、引言二、IP 限流原理2.1 令牌桶算法2.2 漏桶算法三、使用场景3.1 防止恶意攻击3.2 控制资源

Mac系统下卸载JAVA和JDK的步骤

《Mac系统下卸载JAVA和JDK的步骤》JDK是Java语言的软件开发工具包,它提供了开发和运行Java应用程序所需的工具、库和资源,:本文主要介绍Mac系统下卸载JAVA和JDK的相关资料,需... 目录1. 卸载系统自带的 Java 版本检查当前 Java 版本通过命令卸载系统 Java2. 卸载自定

springboot下载接口限速功能实现

《springboot下载接口限速功能实现》通过Redis统计并发数动态调整每个用户带宽,核心逻辑为每秒读取并发送限定数据量,防止单用户占用过多资源,确保整体下载均衡且高效,本文给大家介绍spring... 目录 一、整体目标 二、涉及的主要类/方法✅ 三、核心流程图解(简化) 四、关键代码详解1️⃣ 设置

Java Spring ApplicationEvent 代码示例解析

《JavaSpringApplicationEvent代码示例解析》本文解析了Spring事件机制,涵盖核心概念(发布-订阅/观察者模式)、代码实现(事件定义、发布、监听)及高级应用(异步处理、... 目录一、Spring 事件机制核心概念1. 事件驱动架构模型2. 核心组件二、代码示例解析1. 事件定义

SpringMVC高效获取JavaBean对象指南

《SpringMVC高效获取JavaBean对象指南》SpringMVC通过数据绑定自动将请求参数映射到JavaBean,支持表单、URL及JSON数据,需用@ModelAttribute、@Requ... 目录Spring MVC 获取 JavaBean 对象指南核心机制:数据绑定实现步骤1. 定义 Ja

javax.net.ssl.SSLHandshakeException:异常原因及解决方案

《javax.net.ssl.SSLHandshakeException:异常原因及解决方案》javax.net.ssl.SSLHandshakeException是一个SSL握手异常,通常在建立SS... 目录报错原因在程序中绕过服务器的安全验证注意点最后多说一句报错原因一般出现这种问题是因为目标服务器