内核级pyhon:编译python编译器和语法修改

2024-04-30 21:48

本文主要是介绍内核级pyhon:编译python编译器和语法修改,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

现在一涉及到编程语言几乎就离不开python,甚至这门语言已经成了割韭菜的手段,各种1元学习python的引流课程层出不穷,从这些现象可以体会到python语法设计之成功。它基本上实现了其创作者的初衷:简单易懂,它的优美就如同白居易的诗:“老妪能懂”。

事实上Python看似简单的外表下隐藏着蛮复杂的内核,我有一次面试被问到python语言如何创建一个对象,当时我就有点懵,平常写代码很少思考到python语言中一个对象如何构建,在后来的搜索过程中才了解到,每个python对象都可以定义一个__new__方法,由这个方法来预先给对象分配内存,然后__init__方法才作用在这块内存上,进行初始化。由此我意识到python语言比想象中复杂很多,同时python代码其实有特定的写法套路,也就是所谓的"pythony"方式,这些方式能够大大简化代码量,增强可读性,例如所谓的Comprehension。当意识到我对python语言理解的肤浅后,我决定重新研究和学习python语法。

我读了一些Python语言书,但总是觉得有点乏味,它就像背单词,需要你做一些死记硬背。我突然意识到,为何不深入到python编译器的实现,看看其是如何设计实现的,通过编译器的解读来理解python语法不是更有技术含量吗,而且我曾经设计过两门编译原理课程:这里就是课程链接,如果从编译原理的角度去检索Python语言,这个角度更加高层建瓴,对python语言的认知会更通透。

python本身就是开源项目,因此其编译器源码非常容易获得,而且整个项目考虑到在各个平台上开发的需求,因此都做了专门配置。我发现基于windows,利用vs2019来研究Python内核代码最为合适,首先我们看看它的下载和编译。第一步是要下载代码,利用git即可,命令如下:

git clone https://github.com/python/cpython

下载后在本地目录会有一个cpython文件夹,所有代码就在里面。我们需要针对代码的3.9.0b1分支进行研究,因此要执行如下分支切换命令:

cd cpython
git checkout tags/v3.9.0b1 -b v3.9.0b1

在使用vs2019编译Python内核时,需要做一下配置,我们需要通过visual studio installer安装一些与Python开发相关的组件,如下图:
请添加图片描述

然后进入到代码目录:/cpython/pcbuild/,点击里面的pcbuild.sln就能打开整个工程,接着打开vs的解决方案管理器,点击小房子右边的图标,将视图转换为文件夹视图,我们能看到整个python内核的代码层级结构:
请添加图片描述
现在我们还不能直接编译其代码,因为有不少依赖组件还没有下载。在pcbuild目录下有一个get_externals.bat脚本,它就是专门用来获取外部依赖组件的。但是这个脚本需要做一些修改,因为里面有一个组件由于版本问题不能直接下载,使用笔记本打开它,然后修改如下:
请添加图片描述
如上图选中那行,原来内容为libffi,在下载的时候我们需要指定一个版本,这里我们指定3.30版本,所以选中那行修改为libffi-3.3.0,然后打开控制台,输入get_externals.bat执行脚本,它会下载相关组件,完成后在目录cpython下会多了一个目录:externals,我们还需要做一些修改,进入externals目录,把里面的子目录libffi-3.3.0修改为libffi,要不然编译会出错,完成这些工作后,使用vs的“生成”->"生成解决方案“即可编译python编译器,整个项目很小,编译不到5分钟就可以完成。

接下来我们修改一下代码,让python编译器发生一些肉眼可见的变化。打开Grammar目录,然后打开文件Grammar,该文件是Python的语法定义文件,看过这里编译原理课程的同学应该对这个文件的内容很熟悉,如果是对编译原理还不理解的同学可能理解起来会吃力。打开后我们做如下修改:
请添加图片描述
看上图中选中那行,我们在pass后面添加一个新的关键字proceed,学过python的同学都知道pass是关键字,表示“直接越过”,这里我们添加了另外一个同等作用的关键字proceed,它的用法跟pass一样,这里你可以添加任何关键字,例如keepgoing等,完成后将项目重新编译一遍,这样python的语法解释器才会重新读取grammar文件,建立新的语法解析树,编译好后打开命令行窗口,执行如下操作:
请添加图片描述
从vs中启动命令行后,按理其路径应该在PCBuild下面,如果你的机器是64位,那么编译好的可执行文件就在amd64下,因此cd进去,然后执行python_d.exe -X oldparser,这样启动的python运行环境,其对应的编译器就使用了我们修改后的语法,然后如上图输入一段代码,使用proceed替换pass,执行后可以看到编译器能够识别关键字proceed,其作用跟pass一样。

在Grammar文件夹下,还有一个文件叫Token,同样如果你看过我的编译原理课程,你对该文件的内容一定很熟悉。python编译器本身附带词法解析功能,我们在PCBuild的父目录下创建一个源码文件如下:

#Demo application
def  my_function():proceed

如何执行如下命令:
请添加图片描述
可以看到python编译器读取源码后输出了一系列符号说明,这些符号对应所谓的token,它是编译原理中的关键概念,不了解的同学可以到我的课程去看看。在后续的深入研究中,我考虑用java和c两种语言来实现一下python编译器,如果我们能顺利完成,想必我们对python语法的理解一定足够深入。

更多精彩内容请看这里

这篇关于内核级pyhon:编译python编译器和语法修改的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/950002

相关文章

使用Python删除Excel中的行列和单元格示例详解

《使用Python删除Excel中的行列和单元格示例详解》在处理Excel数据时,删除不需要的行、列或单元格是一项常见且必要的操作,本文将使用Python脚本实现对Excel表格的高效自动化处理,感兴... 目录开发环境准备使用 python 删除 Excphpel 表格中的行删除特定行删除空白行删除含指定

MySQL 多列 IN 查询之语法、性能与实战技巧(最新整理)

《MySQL多列IN查询之语法、性能与实战技巧(最新整理)》本文详解MySQL多列IN查询,对比传统OR写法,强调其简洁高效,适合批量匹配复合键,通过联合索引、分批次优化提升性能,兼容多种数据库... 目录一、基础语法:多列 IN 的两种写法1. 直接值列表2. 子查询二、对比传统 OR 的写法三、性能分析

Python通用唯一标识符模块uuid使用案例详解

《Python通用唯一标识符模块uuid使用案例详解》Pythonuuid模块用于生成128位全局唯一标识符,支持UUID1-5版本,适用于分布式系统、数据库主键等场景,需注意隐私、碰撞概率及存储优... 目录简介核心功能1. UUID版本2. UUID属性3. 命名空间使用场景1. 生成唯一标识符2. 数

Python办公自动化实战之打造智能邮件发送工具

《Python办公自动化实战之打造智能邮件发送工具》在数字化办公场景中,邮件自动化是提升工作效率的关键技能,本文将演示如何使用Python的smtplib和email库构建一个支持图文混排,多附件,多... 目录前言一、基础配置:搭建邮件发送框架1.1 邮箱服务准备1.2 核心库导入1.3 基础发送函数二、

java使用protobuf-maven-plugin的插件编译proto文件详解

《java使用protobuf-maven-plugin的插件编译proto文件详解》:本文主要介绍java使用protobuf-maven-plugin的插件编译proto文件,具有很好的参考价... 目录protobuf文件作为数据传输和存储的协议主要介绍在Java使用maven编译proto文件的插件

Python包管理工具pip的升级指南

《Python包管理工具pip的升级指南》本文全面探讨Python包管理工具pip的升级策略,从基础升级方法到高级技巧,涵盖不同操作系统环境下的最佳实践,我们将深入分析pip的工作原理,介绍多种升级方... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核

基于Python实现一个图片拆分工具

《基于Python实现一个图片拆分工具》这篇文章主要为大家详细介绍了如何基于Python实现一个图片拆分工具,可以根据需要的行数和列数进行拆分,感兴趣的小伙伴可以跟随小编一起学习一下... 简单介绍先自己选择输入的图片,默认是输出到项目文件夹中,可以自己选择其他的文件夹,选择需要拆分的行数和列数,可以通过

Python中反转字符串的常见方法小结

《Python中反转字符串的常见方法小结》在Python中,字符串对象没有内置的反转方法,然而,在实际开发中,我们经常会遇到需要反转字符串的场景,比如处理回文字符串、文本加密等,因此,掌握如何在Pyt... 目录python中反转字符串的方法技术背景实现步骤1. 使用切片2. 使用 reversed() 函

Python中将嵌套列表扁平化的多种实现方法

《Python中将嵌套列表扁平化的多种实现方法》在Python编程中,我们常常会遇到需要将嵌套列表(即列表中包含列表)转换为一个一维的扁平列表的需求,本文将给大家介绍了多种实现这一目标的方法,需要的朋... 目录python中将嵌套列表扁平化的方法技术背景实现步骤1. 使用嵌套列表推导式2. 使用itert

使用Docker构建Python Flask程序的详细教程

《使用Docker构建PythonFlask程序的详细教程》在当今的软件开发领域,容器化技术正变得越来越流行,而Docker无疑是其中的佼佼者,本文我们就来聊聊如何使用Docker构建一个简单的Py... 目录引言一、准备工作二、创建 Flask 应用程序三、创建 dockerfile四、构建 Docker