2.3 词法分析の正则表达式

2024-04-05 04:32

本文主要是介绍2.3 词法分析の正则表达式,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

引:
算数表达式 1,2,3
算符 + - * /
由这些来构造更复杂的表达式 1+2+3 …

正则表达式

对给定字符集 ∑ = { c1,c2,…,cn};
∑ 由要编译的语言决定,如果在编译的语言是C语言,那么∑ 是ASCII 如果要编译的语言是Java 那么∑ 是Unicode …
但作为数学语言的抽象性,我们就把 ∑ 给抽象作为公共的字符集定义。
归纳定义(1,2 可以看作一个基本情况,剩下是归纳情况):

  • 空串 ε 是正则表达式
  • 对于 C ∑ ,c 是正则表达式
    3.如果M和N 是正则表达式,则以下也是正则表达式
  • 选择 M | N = { M,N }
  • 链接 MN = {mn | m M, n m} //m 取自 M 集合
  • 闭包 M* = { ε ,M,MM,MMM,…} //M* 是一元算族,他生成的元素是{空串,M(M所生成所有的串),MM(先从M中找一个元素,再从M中找一个函数做并运算),MMM,…}

NODE:在文献中闭包非常有名 被叫做Kleene闭包

正则表达式的形式表示(构造)

e --->  ε |    c|    e | e|    e e |    e*问题:对给定的字符集 ∑ = {a,b} ,可以写出那些正则表达式1.  ε
2.  对于单独的任意字符都属于 ε : a,b
3.  如果左边的 e 和右边的 e 分别都是正则表达式,那么用一个选择算符 | 把二者连接起来,他的整体也是正则表达式
3.  "ε | ε","ε|a" ...
4.  如果两个正则表达式都存在,那么把他们都链接在一块任然是正则表达式
4.  "εa","εb","ab"."εε",... 和第三个公式结合起来可以构造成一个更复杂的正则表达式 "ε(ε|a)" 
5.  "ε*","(a(ε|a))*" 

引入正则表达式是为了表达程序语言中词法的规则,从而有自动工具来生成词法分析,下面示例是如何用正则表达式来表达程序设计语言中我们所涉及到的词法规则。
例子:关键字
C 语言中的关键字,例如if,while 等,如何用 正则表达式 表示
汉字 属于代替符号 因为下面代码插入打不出这个符号

∑ = ASCII 
if 中间是链接符链接起来,它只需要前面的 i 和 f 分别是正则表达式,前面的 i 属于 ∑ ,f 属于 ∑  
do  中 d 属于 ∑ , o 属于 ∑  这两个字符都属于 ∑  后,我们对他使用链接符链接起来,构成 do  它还是属于正则表达式 

例子:标识符
C语言中的标识符:以字母或下划线开头,后跟零个或多个字母,数组或下划线。如何使用正则表达式表示?

1.理解:  标识符由两部分拼接而成,
1.1 第一部分是 字母或下划线开头 =  26小写字母 + 26大写字母 + 1下划线 = 53 种情况  -> (a|b|c|...|z|A|B|C|...|Z|_) 只选择其中一个
1.2 第二部分是 零个或多个字母   =  26小写字母 + 26大写字母 + 1下划线 + 10个数字 = 63 种情况 (a|b|c|...|z|A|B|C|...|Z|_|0|...|9)

例子:C语言中的无符号整数
(十进制整数型)规则: 或者是0; 或者是是以1到9开头,后跟0个或多个0到9如何用正则表达式表示?

理解: 或者是 0 或者是1-9 说明 是0的情况不同于是1-9的情况
1.  ((0)|(1|2|...|9))

语法糖
可以引入更多的语法糖,来简化构造。

∑ 中的字符 c1 和 ∑ 中的字符cn,其中 对c1和cn 是有要求的,他必须是在 ∑ 之中按顺序排列的,
运算中正则表达式概念 c1 或 c2 或..cn 他是只选择其中一种情况,[a-z] = a|b|c|...|z 
[c1-cn] == c1|c2|...|cn  [e+] == 一个或多个e
[e?] == 零个或一个e == ε | e
"a*" == a* 自身,不是 a 的 Kleen 闭包
e{i,j} == i 到 j 个 e 的链接
. == 除 '\n' 外的任意字符

这篇关于2.3 词法分析の正则表达式的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/877633

相关文章

Android kotlin中 Channel 和 Flow 的区别和选择使用场景分析

《Androidkotlin中Channel和Flow的区别和选择使用场景分析》Kotlin协程中,Flow是冷数据流,按需触发,适合响应式数据处理;Channel是热数据流,持续发送,支持... 目录一、基本概念界定FlowChannel二、核心特性对比数据生产触发条件生产与消费的关系背压处理机制生命周期

怎样通过分析GC日志来定位Java进程的内存问题

《怎样通过分析GC日志来定位Java进程的内存问题》:本文主要介绍怎样通过分析GC日志来定位Java进程的内存问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、GC 日志基础配置1. 启用详细 GC 日志2. 不同收集器的日志格式二、关键指标与分析维度1.

JavaSE正则表达式用法总结大全

《JavaSE正则表达式用法总结大全》正则表达式就是由一些特定的字符组成,代表的是一个规则,:本文主要介绍JavaSE正则表达式用法的相关资料,文中通过代码介绍的非常详细,需要的朋友可以参考下... 目录常用的正则表达式匹配符正则表China编程达式常用的类Pattern类Matcher类PatternSynta

Python中re模块结合正则表达式的实际应用案例

《Python中re模块结合正则表达式的实际应用案例》Python中的re模块是用于处理正则表达式的强大工具,正则表达式是一种用来匹配字符串的模式,它可以在文本中搜索和匹配特定的字符串模式,这篇文章主... 目录前言re模块常用函数一、查看文本中是否包含 A 或 B 字符串二、替换多个关键词为统一格式三、提

python常用的正则表达式及作用

《python常用的正则表达式及作用》正则表达式是处理字符串的强大工具,Python通过re模块提供正则表达式支持,本文给大家介绍python常用的正则表达式及作用详解,感兴趣的朋友跟随小编一起看看吧... 目录python常用正则表达式及作用基本匹配模式常用正则表达式示例常用量词边界匹配分组和捕获常用re

MySQL中的表连接原理分析

《MySQL中的表连接原理分析》:本文主要介绍MySQL中的表连接原理分析,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、背景2、环境3、表连接原理【1】驱动表和被驱动表【2】内连接【3】外连接【4编程】嵌套循环连接【5】join buffer4、总结1、背景

python中Hash使用场景分析

《python中Hash使用场景分析》Python的hash()函数用于获取对象哈希值,常用于字典和集合,不可变类型可哈希,可变类型不可,常见算法包括除法、乘法、平方取中和随机数哈希,各有优缺点,需根... 目录python中的 Hash除法哈希算法乘法哈希算法平方取中法随机数哈希算法小结在Python中,

Java Stream的distinct去重原理分析

《JavaStream的distinct去重原理分析》Javastream中的distinct方法用于去除流中的重复元素,它返回一个包含过滤后唯一元素的新流,该方法会根据元素的hashcode和eq... 目录一、distinct 的基础用法与核心特性二、distinct 的底层实现原理1. 顺序流中的去重

关于MyISAM和InnoDB对比分析

《关于MyISAM和InnoDB对比分析》:本文主要介绍关于MyISAM和InnoDB对比分析,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录开篇:从交通规则看存储引擎选择理解存储引擎的基本概念技术原理对比1. 事务支持:ACID的守护者2. 锁机制:并发控制的艺

MyBatis Plus 中 update_time 字段自动填充失效的原因分析及解决方案(最新整理)

《MyBatisPlus中update_time字段自动填充失效的原因分析及解决方案(最新整理)》在使用MyBatisPlus时,通常我们会在数据库表中设置create_time和update... 目录前言一、问题现象二、原因分析三、总结:常见原因与解决方法对照表四、推荐写法前言在使用 MyBATis