2.3 词法分析の正则表达式

2024-04-05 04:32

本文主要是介绍2.3 词法分析の正则表达式,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

引:
算数表达式 1,2,3
算符 + - * /
由这些来构造更复杂的表达式 1+2+3 …

正则表达式

对给定字符集 ∑ = { c1,c2,…,cn};
∑ 由要编译的语言决定,如果在编译的语言是C语言,那么∑ 是ASCII 如果要编译的语言是Java 那么∑ 是Unicode …
但作为数学语言的抽象性,我们就把 ∑ 给抽象作为公共的字符集定义。
归纳定义(1,2 可以看作一个基本情况,剩下是归纳情况):

  • 空串 ε 是正则表达式
  • 对于 C ∑ ,c 是正则表达式
    3.如果M和N 是正则表达式,则以下也是正则表达式
  • 选择 M | N = { M,N }
  • 链接 MN = {mn | m M, n m} //m 取自 M 集合
  • 闭包 M* = { ε ,M,MM,MMM,…} //M* 是一元算族,他生成的元素是{空串,M(M所生成所有的串),MM(先从M中找一个元素,再从M中找一个函数做并运算),MMM,…}

NODE:在文献中闭包非常有名 被叫做Kleene闭包

正则表达式的形式表示(构造)

e --->  ε |    c|    e | e|    e e |    e*问题:对给定的字符集 ∑ = {a,b} ,可以写出那些正则表达式1.  ε
2.  对于单独的任意字符都属于 ε : a,b
3.  如果左边的 e 和右边的 e 分别都是正则表达式,那么用一个选择算符 | 把二者连接起来,他的整体也是正则表达式
3.  "ε | ε","ε|a" ...
4.  如果两个正则表达式都存在,那么把他们都链接在一块任然是正则表达式
4.  "εa","εb","ab"."εε",... 和第三个公式结合起来可以构造成一个更复杂的正则表达式 "ε(ε|a)" 
5.  "ε*","(a(ε|a))*" 

引入正则表达式是为了表达程序语言中词法的规则,从而有自动工具来生成词法分析,下面示例是如何用正则表达式来表达程序设计语言中我们所涉及到的词法规则。
例子:关键字
C 语言中的关键字,例如if,while 等,如何用 正则表达式 表示
汉字 属于代替符号 因为下面代码插入打不出这个符号

= ASCII 
if 中间是链接符链接起来,它只需要前面的 i 和 f 分别是正则表达式,前面的 i 属于 ∑ ,f 属于 ∑  
do  中 d 属于 ∑ , o 属于 ∑  这两个字符都属于 ∑  后,我们对他使用链接符链接起来,构成 do  它还是属于正则表达式 

例子:标识符
C语言中的标识符:以字母或下划线开头,后跟零个或多个字母,数组或下划线。如何使用正则表达式表示?

1.理解:  标识符由两部分拼接而成,
1.1 第一部分是 字母或下划线开头 =  26小写字母 + 26大写字母 + 1下划线 = 53 种情况  -> (a|b|c|...|z|A|B|C|...|Z|_) 只选择其中一个
1.2 第二部分是 零个或多个字母   =  26小写字母 + 26大写字母 + 1下划线 + 10个数字 = 63 种情况 (a|b|c|...|z|A|B|C|...|Z|_|0|...|9)

例子:C语言中的无符号整数
(十进制整数型)规则: 或者是0; 或者是是以1到9开头,后跟0个或多个0到9如何用正则表达式表示?

理解: 或者是 0 或者是1-9 说明 是0的情况不同于是1-9的情况
1.  ((0)|(1|2|...|9))

语法糖
可以引入更多的语法糖,来简化构造。

∑ 中的字符 c1 和 ∑ 中的字符cn,其中 对c1和cn 是有要求的,他必须是在 ∑ 之中按顺序排列的,
运算中正则表达式概念 c1 或 c2 或..cn 他是只选择其中一种情况,[a-z] = a|b|c|...|z 
[c1-cn] == c1|c2|...|cn  [e+] == 一个或多个e
[e?] == 零个或一个e == ε | e
"a*" == a* 自身,不是 a 的 Kleen 闭包
e{i,j} == i 到 j 个 e 的链接
. =='\n' 外的任意字符

这篇关于2.3 词法分析の正则表达式的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/877633

相关文章

Python正则表达式匹配和替换的操作指南

《Python正则表达式匹配和替换的操作指南》正则表达式是处理文本的强大工具,Python通过re模块提供了完整的正则表达式功能,本文将通过代码示例详细介绍Python中的正则匹配和替换操作,需要的朋... 目录基础语法导入re模块基本元字符常用匹配方法1. re.match() - 从字符串开头匹配2.

Java 正则表达式的使用实战案例

《Java正则表达式的使用实战案例》本文详细介绍了Java正则表达式的使用方法,涵盖语法细节、核心类方法、高级特性及实战案例,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要... 目录一、正则表达式语法详解1. 基础字符匹配2. 字符类([]定义)3. 量词(控制匹配次数)4. 边

Android 缓存日志Logcat导出与分析最佳实践

《Android缓存日志Logcat导出与分析最佳实践》本文全面介绍AndroidLogcat缓存日志的导出与分析方法,涵盖按进程、缓冲区类型及日志级别过滤,自动化工具使用,常见问题解决方案和最佳实... 目录android 缓存日志(Logcat)导出与分析全攻略为什么要导出缓存日志?按需过滤导出1. 按

Linux中的HTTPS协议原理分析

《Linux中的HTTPS协议原理分析》文章解释了HTTPS的必要性:HTTP明文传输易被篡改和劫持,HTTPS通过非对称加密协商对称密钥、CA证书认证和混合加密机制,有效防范中间人攻击,保障通信安全... 目录一、什么是加密和解密?二、为什么需要加密?三、常见的加密方式3.1 对称加密3.2非对称加密四、

MySQL中读写分离方案对比分析与选型建议

《MySQL中读写分离方案对比分析与选型建议》MySQL读写分离是提升数据库可用性和性能的常见手段,本文将围绕现实生产环境中常见的几种读写分离模式进行系统对比,希望对大家有所帮助... 目录一、问题背景介绍二、多种解决方案对比2.1 原生mysql主从复制2.2 Proxy层中间件:ProxySQL2.3

python使用Akshare与Streamlit实现股票估值分析教程(图文代码)

《python使用Akshare与Streamlit实现股票估值分析教程(图文代码)》入职测试中的一道题,要求:从Akshare下载某一个股票近十年的财务报表包括,资产负债表,利润表,现金流量表,保存... 目录一、前言二、核心知识点梳理1、Akshare数据获取2、Pandas数据处理3、Matplotl

python panda库从基础到高级操作分析

《pythonpanda库从基础到高级操作分析》本文介绍了Pandas库的核心功能,包括处理结构化数据的Series和DataFrame数据结构,数据读取、清洗、分组聚合、合并、时间序列分析及大数据... 目录1. Pandas 概述2. 基本操作:数据读取与查看3. 索引操作:精准定位数据4. Group

MySQL中EXISTS与IN用法使用与对比分析

《MySQL中EXISTS与IN用法使用与对比分析》在MySQL中,EXISTS和IN都用于子查询中根据另一个查询的结果来过滤主查询的记录,本文将基于工作原理、效率和应用场景进行全面对比... 目录一、基本用法详解1. IN 运算符2. EXISTS 运算符二、EXISTS 与 IN 的选择策略三、性能对比

MySQL 内存使用率常用分析语句

《MySQL内存使用率常用分析语句》用户整理了MySQL内存占用过高的分析方法,涵盖操作系统层确认及数据库层bufferpool、内存模块差值、线程状态、performance_schema性能数据... 目录一、 OS层二、 DB层1. 全局情况2. 内存占js用详情最近连续遇到mysql内存占用过高导致

深度解析Nginx日志分析与499状态码问题解决

《深度解析Nginx日志分析与499状态码问题解决》在Web服务器运维和性能优化过程中,Nginx日志是排查问题的重要依据,本文将围绕Nginx日志分析、499状态码的成因、排查方法及解决方案展开讨论... 目录前言1. Nginx日志基础1.1 Nginx日志存放位置1.2 Nginx日志格式2. 499