尝试用GO写python编译器:创建互动式命令号窗口REPL

2024-04-30 21:48

本文主要是介绍尝试用GO写python编译器:创建互动式命令号窗口REPL,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

上一节完成的词法解析器存在一些明显问题,例如在识别数字时,面对字符串“123abc",它会识别为两者情况,分别为NUMBER:123,然后是IDENTIFIER:anc,实际上这样的字符串应该被认为是语法错误。另外我们还有一些”连号“操作符没有处理,例如“==, !=, – ,++"等。

本节我们将在上一节的基础上对词法解析器做进一步完善。首先在token.go里面添加新的操作符定义:
···
const (
ILLEGAL = “ILLEGAL”
EOF = “EOF”
IDENTIFIER = “IDENTIFIER” //变量类型对应的归类
NUMBER = “NUMBER” //数值类型对应的归类
ASSIGN = “=” //赋值操作符
PLUS = “+” //加号操作符
LPAR = “(”
RPAR = “)”
LBRACE = “{”
RBRACE = “}”
COMMA = “,”
COLON = “:”
DEF = “def” //关键字
INT = “int”
RETURN = “return”
ASSERT = “assert”
AND = “and”

//第三节添加
TRUE = "True"
FALSE = "False"
IF = "if"
ELSE = "else"
EQUAL = "=="
NOTEQUAL = "!="
GREATEREQUAL = ">="
LESSEQUAL = "<="
MINUS = "-"
BANG = "!"
ASTERISK = "*"
SLASH = "/"
LT = "<"
GT = ">"
//第三节添加

)

var keywords = map[string]TokenType {
“def” : DEF,
“int” : INT,
“return” : RETURN,
“assert” : ASSERT,
“and” : AND,
//第三节添加
“if” : IF ,
“else” : ELSE,
“True” : TRUE,
“False” : FALSE,
//第三节添加
}
···
现在有关问题在于,有些操作符必须读取双字符才能认定,在lexer.go中的NextToken函数,它的switch只能接收单个字符,因此要识别">=", "!="等这些符号时,我们需要在读取到第一个字符时,还需要再读取下一个字符,这样获取到两个字符后才能做出判断,于是我们在lexer.go里面再添加一个函数:

func (l *Lexer) peekChar() byte {if l.readPosition >= len(l.input) {return 0 } else {return l.input[l.readPosition]}
}

当解析器读取到符号"=", “!”, “<”, ">"时,它还需要借助上面的函数获取下一个字符,这样才能决定当前遇到的操作符是哪一种,代码如下:

func (l *Lexer) NextToken() token.Token{//读取一个字符,判断是否属于特定分类var tok token.Token//忽略空格,回车,换行等特定字符l.skipSpecialChar()switch l.ch {。。。。//第三节添加case '-':tok = newToken(token.MINUS, l.ch)case '*':tok = newToken(token.ASTERISK, l.ch)case '/':tok = newToken(token.SLASH, l.ch)case '=' :if l.peekChar() == '=' {//遇到==操作符ch := l.ch l.readChar()tok = token.Token{Type: token.EQUAL, Literal: string(ch) + string(l.ch}} else {tok = newToken(token.ASSIGN, l.ch)}case '!':if l.peekChar() == '=' {//操作符!=ch := l.ch l.readChar()tok = token.Token{Type: token.NOEQUAL, Literal: string(ch) + string(l.ch)}} else {tok = newToken(token.BANG, l.ch)}case '<':if l.peekChar() == '=' {//操作符!=ch := l.ch l.readChar()tok = token.Token{Type: token.LESSEQUAL, Literal: string(ch) + string(l.ch)}} else {tok = newToken(token.LT, l.ch)}case '>':if l.peekChar() == '=' {//操作符!=ch := l.ch l.readChar()tok = token.Token{Type: token.GREATEREQUAL, Literal: string(ch) + string(l.ch)}} else {tok = newToken(token.GT, l.ch)}。。。。}。。。。     
}

现在我们可以再次完善用于测试的python代码,在lexer_test.go里面进行修改如下:


func TestNextToken2(t *testing.T) {input := `def add(x, y):assert 0 <= x <= yz = x + yreturn z`tests := []struct {expectedType token.TokenType expectedLiteral string } {{token.DEF, "def"},{token.IDENTIFIER, "add"},{token.LPAR, "("},{token.IDENTIFIER, "x"},{token.COMMA, ","},{token.IDENTIFIER, "y"},{token.RPAR, ")"},{token.COLON, ":"},//第三节添加{token.ASSERT, "assert"},{token.NUMBER, "0"},{token.LESSEQUAL, "<="},{token.IDENTIFIER, "x"},{token.LESSEQUAL, "<="},{token.IDENTIFIER, "y"},//第三节添加{token.IDENTIFIER, "z"},{token.ASSIGN, "="},{token.IDENTIFIER, "x"},{token.PLUS, "+"},{token.IDENTIFIER, "z"},{token.RETURN, "return"},{token.IDENTIFIER, "z"},}l := New(input)for i, tt := range tests {tok := l.NextToken()if tok.Type != tt.expectedType {t.Fatalf("test[%d] - tokenType wrong. expected=%q, got=%q",i, tt.expectedType, tok.Type)if tok.Literal != tt.expectedLiteral {t.Fatalf("tests[%d] - literal wrong. expected=%q, got=%q",i, tt.expectedLiteral, tok.Literal)}}}
}

执行go test后,可以发现上面用例可以通过,这意味着我们的词法解析请求已经能够识别比较复杂的python代码了。

有过Python开发经验的同学都知道,在命令号行窗口输入命令python后,我们可以进入一个互动环境,在里面可以直接输入代码,点击回车就能直接运行,现在我们也来实现这个功能。在根目录创建文件夹repl,然后在里面创建文件repl.go,然后输入代码如下:

package repl import ("bufio""fmt""io""lexer""token"
)const PROMPT = ">>"func Start(in io.Reader, out io.Writer) {scanner := bufio.NewScanner(in) //从控制台获取输入for {fmt.Printf(PROMPT)scanned := scanner.Scan() //点击回车后返回输入内容if !scanned {return //没有输入内容}lien := scanner.Text() //当前输入的内容l := lexer.New(line) for tok := l.NextToken(); tok.Type != token.EOF; tok = l.NextToken() {fmt.Printf("%+v\n", tok) //输出解析的结果}}
}

接下来我们把main.go的内容输入如下:

package repl import ("bufio""fmt""io""lexer""token"
)const PROMPT = ">>"func Start(in io.Reader, out io.Writer) {scanner := bufio.NewScanner(in) //从控制台获取输入for {fmt.Printf(PROMPT)scanned := scanner.Scan() //点击回车后返回输入内容if !scanned {return //没有输入内容}line := scanner.Text() //当前输入的内容l := lexer.New(line) for tok := l.NextToken(); tok.Type != token.EOF; tok = l.NextToken() {fmt.Printf("%+v\n", tok) //输出解析的结果}}
}

上面代码运行后结果如下:
请添加图片描述
可以看到,我们当前完成的工作还真有一点Python编译环境的味道。完整代码请点击这里{https://github.com/wycl16514/-GO-python-REPL.git}

这篇关于尝试用GO写python编译器:创建互动式命令号窗口REPL的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/950007

相关文章

python panda库从基础到高级操作分析

《pythonpanda库从基础到高级操作分析》本文介绍了Pandas库的核心功能,包括处理结构化数据的Series和DataFrame数据结构,数据读取、清洗、分组聚合、合并、时间序列分析及大数据... 目录1. Pandas 概述2. 基本操作:数据读取与查看3. 索引操作:精准定位数据4. Group

Python pandas库自学超详细教程

《Pythonpandas库自学超详细教程》文章介绍了Pandas库的基本功能、安装方法及核心操作,涵盖数据导入(CSV/Excel等)、数据结构(Series、DataFrame)、数据清洗、转换... 目录一、什么是Pandas库(1)、Pandas 应用(2)、Pandas 功能(3)、数据结构二、安

Python使用Tenacity一行代码实现自动重试详解

《Python使用Tenacity一行代码实现自动重试详解》tenacity是一个专为Python设计的通用重试库,它的核心理念就是用简单、清晰的方式,为任何可能失败的操作添加重试能力,下面我们就来看... 目录一切始于一个简单的 API 调用Tenacity 入门:一行代码实现优雅重试精细控制:让重试按我

Python安装Pandas库的两种方法

《Python安装Pandas库的两种方法》本文介绍了三种安装PythonPandas库的方法,通过cmd命令行安装并解决版本冲突,手动下载whl文件安装,更换国内镜像源加速下载,最后建议用pipli... 目录方法一:cmd命令行执行pip install pandas方法二:找到pandas下载库,然后

Python实现网格交易策略的过程

《Python实现网格交易策略的过程》本文讲解Python网格交易策略,利用ccxt获取加密货币数据及backtrader回测,通过设定网格节点,低买高卖获利,适合震荡行情,下面跟我一起看看我们的第一... 网格交易是一种经典的量化交易策略,其核心思想是在价格上下预设多个“网格”,当价格触发特定网格时执行买

Python标准库之数据压缩和存档的应用详解

《Python标准库之数据压缩和存档的应用详解》在数据处理与存储领域,压缩和存档是提升效率的关键技术,Python标准库提供了一套完整的工具链,下面小编就来和大家简单介绍一下吧... 目录一、核心模块架构与设计哲学二、关键模块深度解析1.tarfile:专业级归档工具2.zipfile:跨平台归档首选3.

使用Python构建智能BAT文件生成器的完美解决方案

《使用Python构建智能BAT文件生成器的完美解决方案》这篇文章主要为大家详细介绍了如何使用wxPython构建一个智能的BAT文件生成器,它不仅能够为Python脚本生成启动脚本,还提供了完整的文... 目录引言运行效果图项目背景与需求分析核心需求技术选型核心功能实现1. 数据库设计2. 界面布局设计3

Linux如何查看文件权限的命令

《Linux如何查看文件权限的命令》Linux中使用ls-R命令递归查看指定目录及子目录下所有文件和文件夹的权限信息,以列表形式展示权限位、所有者、组等详细内容... 目录linux China编程查看文件权限命令输出结果示例这里是查看tomcat文件夹总结Linux 查看文件权限命令ls -l 文件或文件夹

idea的终端(Terminal)cmd的命令换成linux的命令详解

《idea的终端(Terminal)cmd的命令换成linux的命令详解》本文介绍IDEA配置Git的步骤:安装Git、修改终端设置并重启IDEA,强调顺序,作为个人经验分享,希望提供参考并支持脚本之... 目录一编程、设置前二、前置条件三、android设置四、设置后总结一、php设置前二、前置条件

Python进行JSON和Excel文件转换处理指南

《Python进行JSON和Excel文件转换处理指南》在数据交换与系统集成中,JSON与Excel是两种极为常见的数据格式,本文将介绍如何使用Python实现将JSON转换为格式化的Excel文件,... 目录将 jsON 导入为格式化 Excel将 Excel 导出为结构化 JSON处理嵌套 JSON: