C语言源程序词法分析器(Java实现)

2023-12-28 13:48

本文主要是介绍C语言源程序词法分析器(Java实现),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一. 介绍

词法分析器,又称扫描器,输入源程序,进行词法分析,输出单词符号。词法分析仅仅是编译程序工作中的一部分,编译程序一般可以划分为5个阶段:词法分析,语法分析,语义分析与中间代码产生,优化,目标代码生成。我们这里编写一个简单的C语言源程序词法分析器。

二. 目的

设计并实现一个包含预处理功能的词法分析程序,加深对编译中词法分析过程的理解。

四. 要求

1、实现预处理功能

源程序中可能包含有对程序执行无意义的符号,要求将其剔除。
首先编制一个源程序的输入过程,从键盘、文件或文本框输入若干行语句,依次存入输入缓冲区(字符型数据);然后编制一个预处理子程序,去掉输入串中的回车符、换行符和跳格符等编辑性文字;把多个空白符合并为一个;去掉注释。

2、实现词法分析功能

输入:所给文法的源程序字符串。
输出:二元组(syn,token或sum)构成的序列。其中,
syn为单词种别码。
Token为存放的单词自身字符串。
Sum为整型常量。
具体实现时,可以将单词的二元组用结构进行处理。

3、待分析的C语言子集的词法

1)关键字
main if then while do static int double struct break else long switch case typedef char return const float short continue for void default sizeof do
所有的关键字都是小写。
2)运算符和界符
+ - * / : := < <> <= > >= = ; ( ) #
3)其他标记ID和NUM
通过以下正规式定义其他标记:
ID→letter(letter|digit)*
NUM→digit digit*
letter→a|…|z|A|…|Z
digit→0|…|9…
4)空格由空白、制表符和换行符组成
空格一般用来分隔ID、NUM、专用符号和关键字,词法分析阶段通常被忽略。

4、各种单词符号对应的种别码
单词符号    种别码        单词符号    种别码       
main        1            void       23     
if          2            sizeof     24     
then        3            ID         25  
while       4            NUM        26
do          5             +         27   
static      6             -         28     
int         7             *         29  
double      8             /         30     
struct      9            **         31   
break       10           ==         32  
else        11           <          33   
long        12           <>         34  
switch      13           <=         35 
case        14           >          36
typedef     15           >=         37
char        16           =          38
return      17           [          39
const       18           ]          40 
float       19           ;          41 
short       20           (          42 
continue   21            )          43 
for         22           #          0  

五. 源代码

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;public class LexicalAnalyzer {static String[] rwtab=new String[]{"main","if","then","while","do","static","int","double","struct","break","else","long","switch","case","typedef","char","return","const","float","short","continue","for","void","sizeof"};   //已经定义的24个关键字,种别码从1开始static String storage="";   //存储源程序字符串static StringBuilder token=new StringBuilder("");     //存储单词自身组成的字符串static char ch;static int index;static int syn, sum=0, row;//分析器static void analyzer(){token.delete(0, token.length());                //置空token对象,清除ch=storage.charAt(index++);while(ch==' '){ch=storage.charAt(index++);      //去除空格符号}if((ch>='a'&&ch<='z')||(ch>='A'&&ch<='Z')){         //可能是关键字或者自定义的标识符while((ch>='0'&&ch<='9')||(ch>='a'&&ch<='z')||(ch>='A'&&ch<='Z')){token.append(ch);ch=storage.charAt(index++);}index--;      //此次识别的最后一个字符未识别入,需要将标记退原处 syn=25;       //默认为识别出的字符串为自定义的标识符,种别码为25String s=token.toString();for(int i=0; i<rwtab.length; i++){if(s.equals(rwtab[i])){     syn=i+1;break;        //识别出是关键字}}}else if((ch>='0'&&ch<='9')){sum=0;while((ch>='0'&&ch<='9')){sum=sum*10+ch-'0';ch=storage.charAt(index++);}index--;syn=26;}else switch(ch){case '<':token.append(ch);ch=storage.charAt(index++);if(ch=='='){token.append(ch);syn=35;}else if(ch=='>'){token.append(ch);syn=34;}else{syn=33;index--;}break;case '>':token.append(ch);ch=storage.charAt(index++);if(ch=='='){token.append(ch);syn=37;}else{syn=36;index--;}break;case '*':token.append(ch);ch=storage.charAt(index++);if(ch=='*'){token.append(ch);syn=31;}else{syn=13;index--;}break;case '=':token.append(ch);ch=storage.charAt(index++);if(ch=='='){syn=32;token.append(ch);}else{syn=38;index--;}break;case '/':token.append(ch);ch=storage.charAt(index++);if(ch=='/'){while(ch!=' '){ch=storage.charAt(index++);  //忽略掉注释,以空格为界定}syn=-2;break;}else{syn=30;index--;}break;case '+':syn=27;token.append(ch);break;case '-':syn=28;token.append(ch);break;case ';':syn=41;token.append(ch);break;case '(':syn=42;token.append(ch);break;case ')':syn=43;token.append(ch);break;case '#':syn=0;token.append(ch);break;case '\n':syn=-2;token.append(ch);break;default:syn=-1;}}public static void main(String[] args) {// TODO Auto-generated method stubBufferedReader stdin=new BufferedReader(new InputStreamReader(System.in));index=0;row=1;String tempString;System.out.println("请输入C语言源程序字符串(以#结尾):");//输入过程try{do{tempString=stdin.readLine();storage+=tempString;ch=tempString.charAt(tempString.length()-1);  //得到一行中最后一个字符}while(ch!='#');        //输入以#字符结尾}catch(IOException e){e.printStackTrace();}index=0; //输出过程do{analyzer();switch(syn){case 26:System.out.println("("+syn+","+sum+")");break;case -1:System.out.println("Error in row"+row+"!");break;case -2:break;default:System.out.println("("+syn+","+token+")");}}while(syn!=0);}}

六. 运行结果

这里写图片描述

这篇关于C语言源程序词法分析器(Java实现)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/546148

相关文章

springboot集成easypoi导出word换行处理过程

《springboot集成easypoi导出word换行处理过程》SpringBoot集成Easypoi导出Word时,换行符n失效显示为空格,解决方法包括生成段落或替换模板中n为回车,同时需确... 目录项目场景问题描述解决方案第一种:生成段落的方式第二种:替换模板的情况,换行符替换成回车总结项目场景s

SpringBoot集成redisson实现延时队列教程

《SpringBoot集成redisson实现延时队列教程》文章介绍了使用Redisson实现延迟队列的完整步骤,包括依赖导入、Redis配置、工具类封装、业务枚举定义、执行器实现、Bean创建、消费... 目录1、先给项目导入Redisson依赖2、配置redis3、创建 RedissonConfig 配

SpringBoot中@Value注入静态变量方式

《SpringBoot中@Value注入静态变量方式》SpringBoot中静态变量无法直接用@Value注入,需通过setter方法,@Value(${})从属性文件获取值,@Value(#{})用... 目录项目场景解决方案注解说明1、@Value("${}")使用示例2、@Value("#{}"php

SpringBoot分段处理List集合多线程批量插入数据方式

《SpringBoot分段处理List集合多线程批量插入数据方式》文章介绍如何处理大数据量List批量插入数据库的优化方案:通过拆分List并分配独立线程处理,结合Spring线程池与异步方法提升效率... 目录项目场景解决方案1.实体类2.Mapper3.spring容器注入线程池bejsan对象4.创建

线上Java OOM问题定位与解决方案超详细解析

《线上JavaOOM问题定位与解决方案超详细解析》OOM是JVM抛出的错误,表示内存分配失败,:本文主要介绍线上JavaOOM问题定位与解决方案的相关资料,文中通过代码介绍的非常详细,需要的朋... 目录一、OOM问题核心认知1.1 OOM定义与技术定位1.2 OOM常见类型及技术特征二、OOM问题定位工具

Python的Darts库实现时间序列预测

《Python的Darts库实现时间序列预测》Darts一个集统计、机器学习与深度学习模型于一体的Python时间序列预测库,本文主要介绍了Python的Darts库实现时间序列预测,感兴趣的可以了解... 目录目录一、什么是 Darts?二、安装与基本配置安装 Darts导入基础模块三、时间序列数据结构与

基于 Cursor 开发 Spring Boot 项目详细攻略

《基于Cursor开发SpringBoot项目详细攻略》Cursor是集成GPT4、Claude3.5等LLM的VSCode类AI编程工具,支持SpringBoot项目开发全流程,涵盖环境配... 目录cursor是什么?基于 Cursor 开发 Spring Boot 项目完整指南1. 环境准备2. 创建

Python使用FastAPI实现大文件分片上传与断点续传功能

《Python使用FastAPI实现大文件分片上传与断点续传功能》大文件直传常遇到超时、网络抖动失败、失败后只能重传的问题,分片上传+断点续传可以把大文件拆成若干小块逐个上传,并在中断后从已完成分片继... 目录一、接口设计二、服务端实现(FastAPI)2.1 运行环境2.2 目录结构建议2.3 serv

C#实现千万数据秒级导入的代码

《C#实现千万数据秒级导入的代码》在实际开发中excel导入很常见,现代社会中很容易遇到大数据处理业务,所以本文我就给大家分享一下千万数据秒级导入怎么实现,文中有详细的代码示例供大家参考,需要的朋友可... 目录前言一、数据存储二、处理逻辑优化前代码处理逻辑优化后的代码总结前言在实际开发中excel导入很

Spring Security简介、使用与最佳实践

《SpringSecurity简介、使用与最佳实践》SpringSecurity是一个能够为基于Spring的企业应用系统提供声明式的安全访问控制解决方案的安全框架,本文给大家介绍SpringSec... 目录一、如何理解 Spring Security?—— 核心思想二、如何在 Java 项目中使用?——