Java 正则表达式URL 匹配与源码全解析

2025-04-19 04:50

本文主要是介绍Java 正则表达式URL 匹配与源码全解析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

《Java正则表达式URL匹配与源码全解析》在Web应用开发中,我们经常需要对URL进行格式验证,今天我们结合Java的Pattern和Matcher类,深入理解正则表达式在实际应用中...

在 Web 应用开发中,我们经常需要对 URL 进行格式验证。今天我们结合 JavaPatternMatcher 类,深入理解正则表达式在实际应用中的强大功能,并剖析一段实际的 Java 示例源码。

Java 正则表达式URL 匹配与源码全解析

package com.RegExpInfo;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Exercise02 {
    public static void main(String[] args) {
//        String content="https://";
//        String content="http://";
//        String content="https://" +
//                "www.bilibili.com/";
//        String content="https://" +
//                "www.bilibili.com/" +
//                "video/" +
China编程//                "BV1fh411y7R8?spm_id_from=333.788.player.switch&vd_" +
//           http://www.chinasem.cn     "source=6fe96DB28441a84c79edc35a022cf1c5&p=895" ;
//        String content="https://" +
//                "www.bilibili.com" ;
        String content="https://blog.csdn.net/keshi12354?spm=1000.2115.3001.5343";
//        String regExp="^((https|http)://)";
//        (2)
//        String regExp="^((https|http)://)([\\w-]+\\.)+[\\w-]+\\/";
//        (3)
        String regExp="^((https|http)://)([\\w-]+\\.)+[\\w-]+(\\/([\\w-_?=&./]*))?$";
//        String regExp="^((https|http)://)([\\w-]+\\.)+[\\w-]+(\\/([\\w-_?=&./]*))?$";
        Pattern pattern = Pattern.compile(regExp);
        Matcher matcher = pattern.matcher(content);
        while (matcher.find()) {
            System.out.println(matcher.group(0));
        }
    }
}

1.正则表达式分解:

分布实现:
1. 基础协议匹配 (1)

 String regExp="^((https|http)://)";

功能:只匹配URL开头的协议部分

匹配内容http:// 或 https://

结构

^ 表示字符串开始

(https|http) 匹配"https"或"http"

:// 匹配协议分隔符

目的:先确保能正确识别URL的协议部分

2. 添加域名匹配 (2)

 String regExjavascriptp="^((https|http)://)([\\w-]+\\.)+[\\w-]+\\/";

新增功能:在协议后添加域名和路径的基本匹配

匹配内容:如 http://example.com/

新增结构

([\\w-]+\\.)+ 匹配一个或多个域名部分(如"www."或"sub.")

\\w 匹配单词字符(字母、数字、下划线)

- 匹配连字符

+ 表示一次或多次

\\. 匹配点号

[\\w-]+ 匹配顶级域名(如"com")

\\/ 匹配结尾的斜杠

目的:扩展匹配完整的域名结构

3. 添加路径和查询参数匹配 (3)

 String regExp="^((https|http)://)([\\w-]+\\.)+[\\w-]+(\\/([\\w-_?=&./]*))?$";

新增功能:支持可选的路径和查询参数

匹配内容:如 http://example.com/path?param=value

新增结构

(\\/([\\w-_?=&./]*))?

\\/ 匹配路径开始的斜杠

[\\w-_?=&./]* 匹配路径和查询参数

包含字母、数字、下划线、连字符、问号、等号、&、点和斜杠

? 表示整个路径部分是可选的

$ 表示字符串结束

目的:使正则表达式能够匹配带路径和参数的完整URL

 4. 最终优化版本

String regExp="^((https|http)://)?([\\w-]+\\.)+[\\w-]+(\\/([\\w-_?=&./]*))?$";

关键改进:使协议部分变为可选

匹配内容:现在可以匹配:

带协议的URL:http://example.com/path

不带协议的URL:example.com/path

修改点

在协议部分 ((https|http)://) 后添加了 ? 使其变为可选

目的:提高正则表达式的灵活性,适应更多使用场景

5.设计思想总结

渐进式开发:从简单到复杂逐步构建正则表达式

模块化设计:每个部分都有明确的功能划分(协议、域名、路径)

灵活性增强:通过添加可选标记(?)使表达式更通用

边界明确:始终使用^$确保匹配整个字符串

字符集合理定义:使用[\wChina编程-]等字符集准确描述允许的字符

这种分步构建的方法不仅使正则表达式更易于理解和维护,也方便在开发过程中逐步测试每个部分的匹配效果。

到此这篇关于Java 正则表达式综合实战:URL 匹配与源码解析的文章就介绍到这了,更多相关java正则表达式URL 匹配内容请搜索编程China编程(www.chinasem.cn)以前的文章或继续浏览下面的相关文章希望大家以后多多支持China编程(www.cppcnChina编程s.com)!

这篇关于Java 正则表达式URL 匹配与源码全解析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1154290

相关文章

Java实现字节字符转bcd编码

《Java实现字节字符转bcd编码》BCD是一种将十进制数字编码为二进制的表示方式,常用于数字显示和存储,本文将介绍如何在Java中实现字节字符转BCD码的过程,需要的小伙伴可以了解下... 目录前言BCD码是什么Java实现字节转bcd编码方法补充总结前言BCD码(Binary-Coded Decima

SpringBoot全局域名替换的实现

《SpringBoot全局域名替换的实现》本文主要介绍了SpringBoot全局域名替换的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 目录 项目结构⚙️ 配置文件application.yml️ 配置类AppProperties.Ja

Java使用Javassist动态生成HelloWorld类

《Java使用Javassist动态生成HelloWorld类》Javassist是一个非常强大的字节码操作和定义库,它允许开发者在运行时创建新的类或者修改现有的类,本文将简单介绍如何使用Javass... 目录1. Javassist简介2. 环境准备3. 动态生成HelloWorld类3.1 创建CtC

JavaScript中的高级调试方法全攻略指南

《JavaScript中的高级调试方法全攻略指南》什么是高级JavaScript调试技巧,它比console.log有何优势,如何使用断点调试定位问题,通过本文,我们将深入解答这些问题,带您从理论到实... 目录观点与案例结合观点1观点2观点3观点4观点5高级调试技巧详解实战案例断点调试:定位变量错误性能分

Java实现将HTML文件与字符串转换为图片

《Java实现将HTML文件与字符串转换为图片》在Java开发中,我们经常会遇到将HTML内容转换为图片的需求,本文小编就来和大家详细讲讲如何使用FreeSpire.DocforJava库来实现这一功... 目录前言核心实现:html 转图片完整代码场景 1:转换本地 HTML 文件为图片场景 2:转换 H

Java使用jar命令配置服务器端口的完整指南

《Java使用jar命令配置服务器端口的完整指南》本文将详细介绍如何使用java-jar命令启动应用,并重点讲解如何配置服务器端口,同时提供一个实用的Web工具来简化这一过程,希望对大家有所帮助... 目录1. Java Jar文件简介1.1 什么是Jar文件1.2 创建可执行Jar文件2. 使用java

SpringBoot实现不同接口指定上传文件大小的具体步骤

《SpringBoot实现不同接口指定上传文件大小的具体步骤》:本文主要介绍在SpringBoot中通过自定义注解、AOP拦截和配置文件实现不同接口上传文件大小限制的方法,强调需设置全局阈值远大于... 目录一  springboot实现不同接口指定文件大小1.1 思路说明1.2 工程启动说明二 具体实施2

Java实现在Word文档中添加文本水印和图片水印的操作指南

《Java实现在Word文档中添加文本水印和图片水印的操作指南》在当今数字时代,文档的自动化处理与安全防护变得尤为重要,无论是为了保护版权、推广品牌,还是为了在文档中加入特定的标识,为Word文档添加... 目录引言Spire.Doc for Java:高效Word文档处理的利器代码实战:使用Java为Wo

SpringBoot日志级别与日志分组详解

《SpringBoot日志级别与日志分组详解》文章介绍了日志级别(ALL至OFF)及其作用,说明SpringBoot默认日志级别为INFO,可通过application.properties调整全局或... 目录日志级别1、级别内容2、调整日志级别调整默认日志级别调整指定类的日志级别项目开发过程中,利用日志

Java中的抽象类与abstract 关键字使用详解

《Java中的抽象类与abstract关键字使用详解》:本文主要介绍Java中的抽象类与abstract关键字使用详解,本文通过实例代码给大家介绍的非常详细,感兴趣的朋友跟随小编一起看看吧... 目录一、抽象类的概念二、使用 abstract2.1 修饰类 => 抽象类2.2 修饰方法 => 抽象方法,没有