【PL理论深化】(2) 语法分析 (Syntax) | 编程语言的语法结构:文法 | 语义结构 (Sematics)

本文主要是介绍【PL理论深化】(2) 语法分析 (Syntax) | 编程语言的语法结构:文法 | 语义结构 (Sematics),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  • 💬 写在前面:编程语言是由归纳法生成的程序的集合。定义属于该语言的程序的形式的规则,即编写程序的规则,称为编程语言的 语法分析 (syntax) 而定义属于该语言的程序的意义的规则称为 语义结构(semantics)。这两者都是归纳定义的。

目录

0x00 语法分析(syntax analysis)

0x01 编程语言的语法结构:文法(grammar)

0x02 语义结构(Semantics)


0x00 语法分析(syntax analysis)

下面是一个由整数和四则运算符所构成的整数表达式集合,即整数表达式语言。

比如,以下整数表达式属于该语言中的程序:

.

像上述那样,程序通常用一维字符串来编写。

但实际上,计算机程序具有树形的二维结构,例如字符串:

我们将程序表示为树结构:

对应于图 (a) 的程序:

而对应于图 (b) 的程序,将用字符串编写的一维程序转换为二维树结构的技术 ——

称为 语法分析 (syntax analysis) 或 解析 (parsing) 。

(我们不会详细讨论语法结构分析的方法,而是着重于程序的结构如何呈现为树形)

0x01 编程语言的语法结构:文法(grammar)

假设程序的结构以树形结构明确给出,

整数表达式语言的语法结构可以通过以下推导规则归纳定义:

编程语言的语法结构通常采用 文法 (grammar) ,而不是推理规则来定义。

整数表达式语言的语法结构用文法表示如下:

上述规则表示有 5 种方法可以生成整数表达式。

根据第一条规则,任意整数 (n) 都可以是一个整数表达式。

而其余的规则意味着,对于任意两个整数表达式 E_1E_2

可以用四则运算符连接它们,从而创建一个新的整数表达式。

.

由于归纳规则的特性,通过这五种有限规则,可以生成无限多个任意的整数表达式。

例如,整数表达式 1+(2*(3-4)) 就是这样创建的:

如果将证明树的上下颠倒,并强调树的结构,就得到了图 (A) 。

像这样通过归纳定义的编程语言的语法结构,具有生成二维程序的规则。

.

为了将二维结构清晰地写成一维形式,只需适当地使用括号,例如表达为  1+(2*(3-4)) 。

0x02 语义结构(Semantics

如果语法结构是定义编程语言中程序外观的规则。

那么 语义结构 (semantics) 则是决定程序执行意义的规则。

程序的含义可以有多种定义,但对于整数表达式而言,

以计算表达式得到的整数值来定义其含义是最自然的。

我们可以这样表达:"计算整数表达式 E 得到整数 n " 或者 "整数表达式 E 的含义是 n "。

E\Rightarrow n

.

例如,1+(2*(3-4))\Rightarrow -1 表示程序 1+(2*(3-4)) 的含义是等于 −1。

这里的 \Rightarrow 表示一个关于程序和整数之间的二元关系。

换言之,若将程序的集合表示为 \mathbb P,整数的集合表示为 \mathbb Z

\Rightarrow 是 \mathbb P \times \mathbb Z 的一个子集 (即 \Rightarrow \subseteq \mathbb P \times \mathbb Z),它定义了整数表达式的语义结构。

对于整数表达式,可以通过以下推理规则来定义集合 \Rightarrow :

.

第一条规则 (E-Num) 对于任意整数 n,表示 (n,n) 是集合 \Rightarrow 的元素。

这里,整数 n 的意义被定义为整数值 n

第二条规则 (E-Plus) 表示如果 (E_1, n_1)(E_2,n_2) 是 \Rightarrow 的元素,

则 (E_1 + E_2, n_1+n_2) 也是 \Rightarrow 的元素,其余规则类似地定义。

.

然而,对于除法,定义限定 n2 不为零时才有意义。

例如,根据上述规则定义的集合 \Rightarrow 包含元素 \big((1+2)(3/3), 3\big) 。

整数表达式 (1+2)(3/3) 的含义被定义为 3。

可以证明 \big((1+2)*(3/3), 3\big)  是集合 \Rightarrow 的元素如下所示:

.

相对地,有些表达式可能看起来是正确的,但实际上可能没有定义。

例如,整数表达式 (3*4)/\big((1*2)-(1+1)\big) 对于任何整数 n

都无法通过推理规则 (3*4)/\big((1*2)-(1+1)\big) \Rightarrow n 进行证明。

.

因为整个表达式涉及除法,如果要证明它,就只能应用规则 \textrm{E-Div}

但在这种情况下,由于分母计算结果为 0,因此无法应用 \textrm{ E-Div} 规则。

这说明,并非所有通过编程语言的语法结构定义的程序都具有执行的实际意义。

即使通过了编译器的语法分析阶段,仍可能存在无法正确执行的程序!

.

到目前为止,我们已经从定义推理规则的角度定义了语义结构,

但是也可以直接从程序执行规则的角度解释这些规则。

例如,规则 \textrm{E-Plus} 描述了计算表达式 E_1 + E_2  的过程。

我们首先递归地计算表达式 E_1E_2 的值,得到 n_1n_2

然后定义为将这两个整数相加的过程。

通过这种方式解释语义结构,证明树的生成过程就成为程序执行的过程,

并且通过将语义结构定义为递归函数,我们可以直接获得编程语言的解释器 (interpreter) 。

📌 [ 笔者 ]   王亦优
📃 [ 更新 ]   2022.9.14
❌ [ 勘误 ]   /* 暂无 */
📜 [ 声明 ]   由于作者水平有限,本文有错误和不准确之处在所难免,本人也很想知道这些错误,恳望读者批评指正!

📜 参考资料 

- R. Neapolitan, Foundations of Algorithms (5th ed.), Jones & Bartlett, 2015.

- T. Cormen《算法导论》(第三版),麻省理工学院出版社,2009年。

- T. Roughgarden, Algorithms Illuminated, Part 1~3, Soundlikeyourself Publishing, 2018.

- J. Kleinberg&E. Tardos, Algorithm Design, Addison Wesley, 2005.

- R. Sedgewick&K. Wayne,《算法》(第四版),Addison-Wesley,2011

- S. Dasgupta,《算法》,McGraw-Hill教育出版社,2006。

- S. Baase&A. Van Gelder, Computer Algorithms: 设计与分析简介》,Addison Wesley,2000。

- E. Horowitz,《C语言中的数据结构基础》,计算机科学出版社,1993

- S. Skiena, The Algorithm Design Manual (2nd ed.), Springer, 2008.

- A. Aho, J. Hopcroft, and J. Ullman, Design and Analysis of Algorithms, Addison-Wesley, 1974.

- M. Weiss, Data Structure and Algorithm Analysis in C (2nd ed.), Pearson, 1997.

- A. Levitin, Introduction to the Design and Analysis of Algorithms, Addison Wesley, 2003. - A. Aho, J. Hopcroft, and J. Ullman, Data Structures and Algorithms, Addison-Wesley, 1983.

- E. Horowitz, S. Sahni and S. Rajasekaran, Computer Algorithms/C++, Computer Science Press, 1997.

- R. Sedgewick, Algorithms in C: 第1-4部分(第三版),Addison-Wesley,1998

- R. Sedgewick,《C语言中的算法》。第5部分(第3版),Addison-Wesley,2002

这篇关于【PL理论深化】(2) 语法分析 (Syntax) | 编程语言的语法结构:文法 | 语义结构 (Sematics)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1087693

相关文章

Vite 打包目录结构自定义配置小结

《Vite打包目录结构自定义配置小结》在Vite工程开发中,默认打包后的dist目录资源常集中在asset目录下,不利于资源管理,本文基于Rollup配置原理,本文就来介绍一下通过Vite配置自定义... 目录一、实现原理二、具体配置步骤1. 基础配置文件2. 配置说明(1)js 资源分离(2)非 JS 资

Java集合中的链表与结构详解

《Java集合中的链表与结构详解》链表是一种物理存储结构上非连续的存储结构,数据元素的逻辑顺序的通过链表中的引用链接次序实现,文章对比ArrayList与LinkedList的结构差异,详细讲解了链表... 目录一、链表概念与结构二、当向单链表的实现2.1 准备工作2.2 初始化链表2.3 打印数据、链表长

创建springBoot模块没有目录结构的解决方案

《创建springBoot模块没有目录结构的解决方案》2023版IntelliJIDEA创建模块时可能出现目录结构识别错误,导致文件显示异常,解决方法为选择模块后点击确认,重新校准项目结构设置,确保源... 目录创建spChina编程ringBoot模块没有目录结构解决方案总结创建springBoot模块没有目录

SpringBoot利用树形结构优化查询速度

《SpringBoot利用树形结构优化查询速度》这篇文章主要为大家详细介绍了SpringBoot利用树形结构优化查询速度,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录一个真实的性能灾难传统方案为什么这么慢N+1查询灾难性能测试数据对比核心解决方案:一次查询 + O(n)算法解决

Oracle查询表结构建表语句索引等方式

《Oracle查询表结构建表语句索引等方式》使用USER_TAB_COLUMNS查询表结构可避免系统隐藏字段(如LISTUSER的CLOB与VARCHAR2同名字段),这些字段可能为dbms_lob.... 目录oracle查询表结构建表语句索引1.用“USER_TAB_COLUMNS”查询表结构2.用“a

Mysql中isnull,ifnull,nullif的用法及语义详解

《Mysql中isnull,ifnull,nullif的用法及语义详解》MySQL中ISNULL判断表达式是否为NULL,IFNULL替换NULL值为指定值,NULLIF在表达式相等时返回NULL,用... 目录mysql中isnull,ifnull,nullif的用法1. ISNULL(expr) → 判

MySQL中的索引结构和分类实战案例详解

《MySQL中的索引结构和分类实战案例详解》本文详解MySQL索引结构与分类,涵盖B树、B+树、哈希及全文索引,分析其原理与优劣势,并结合实战案例探讨创建、管理及优化技巧,助力提升查询性能,感兴趣的朋... 目录一、索引概述1.1 索引的定义与作用1.2 索引的基本原理二、索引结构详解2.1 B树索引2.2

如何使用Maven创建web目录结构

《如何使用Maven创建web目录结构》:本文主要介绍如何使用Maven创建web目录结构的问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录创建web工程第一步第二步第三步第四步第五步第六步第七步总结创建web工程第一步js通过Maven骨架创pytho

Python循环结构全面解析

《Python循环结构全面解析》循环中的代码会执行特定的次数,或者是执行到特定条件成立时结束循环,或者是针对某一集合中的所有项目都执行一次,这篇文章给大家介绍Python循环结构解析,感兴趣的朋友跟随... 目录for-in循环while循环循环控制语句break语句continue语句else子句嵌套的循

CnPlugin是PL/SQL Developer工具插件使用教程

《CnPlugin是PL/SQLDeveloper工具插件使用教程》:本文主要介绍CnPlugin是PL/SQLDeveloper工具插件使用教程,具有很好的参考价值,希望对大家有所帮助,如有错... 目录PL/SQL Developer工具插件使用安装拷贝文件配置总结PL/SQL Developer工具插