python 中 pickle 模块学习笔记

2024-05-12 01:48

本文主要是介绍python 中 pickle 模块学习笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  1. 概要
  2. 和json 模块的比较
  3. 常用api说明
  4. 具体应用举例
  5. 总结
  6. 参考文档 pickle模块

    一. 概要

    用这个模块 可以创建Python对象的可移植序列化表示。
    Create portable serialized representations of Python objects.

    二.pickle 和json 模块对比
    1. json 模块实现序列化方式 一般是 unicode text ,而且序列化后, 人是可以看懂的. 但是 pickle 序列化方式是二进制的, 人是看不懂的.
    2. json 序列化更加广泛,并且json 是可以互操作的. pickle 仅是Python 独有的一种方式.
    3. json 可以序列化Python内置类型的子类. 但是我如果要序列化 自己写的类,显得无能为力. 但是pickle 模块是可以的,可以序列化 自己写的类,同时可以序列化Python内置类型的子类型.
There are fundamental differences between the pickle protocols and JSON (JavaScript Object Notation):JSON is a text serialization format (it outputs unicode text, although most of the time it is then encoded to utf-8), while pickle is a binary serialization format;
JSON is human-readable, while pickle is not;
JSON is interoperable and widely used outside of the Python ecosystem, while pickle is Python-specific;
JSON, by default, can only represent a subset of the Python built-in types, and no custom classes; pickle can represent an extremely large number of Python types (many of them automatically, by clever usage of Python’s introspection facilities; complex cases can be tackled by implementing specific object APIs).

1看一个小例子


import pickle
import jsonif __name__ == '__main__':d1 = dict(zip('frank', range(5)))print(d1)json_str = json.dumps(d1)pickle_str = pickle.dumps(d1)print(f'json_str: {json_str}')print(f'pickle_str: {pickle_str}')

结果如下:

{'f': 0, 'r': 1, 'a': 2, 'n': 3, 'k': 4}
json_str: {"f": 0, "r": 1, "a": 2, "n": 3, "k": 4}
pickle_str: b'\x80\x03}q\x00(X\x01\x00\x00\x00fq\x01K\x00X\x01\x00\x00\x00rq\x02K\x01X\x01\x00\x00\x00aq\x03K\x02X\x01\x00\x00\x00nq\x04K\x03X\x01\x00\x00\x00kq\x05K\x04u.'Process finished with exit code 0

可以看出来,json 序列化后,是人类能够看懂的.而pickle 模块序列化后,就看不懂了,因为是二进制的.

在看一个例子

#!/usr/bin/env python3
# -*- coding: UTF-8 -*-
"""
@author: Frank 
@contact: frank.chang@shoufuyou.com
@file: test_pickle.py
@time: 2018/7/22 上午9:06"""import pickle
import jsonclass Person:__tablename__ = 'person'table_flag = 'online'def __init__(self, name):self.name = name@classmethoddef pickup(cls, *args, **kwargs):print('pickup() is running.')kwargs.update({"name": "frank", "hobby": "swim"})return kwargsdef test_pickle():# 序列化类p1 = pickle.dumps(Person)# 反序列化P1 = pickle.loads(p1)# 打印Person类print(P1)p2 = P1('frank')print(p2.pickup())def test_json():p1 = json.dumps(Person)P1 = json.loads(p1)print(P1)p2 = P1('frank')print(p2.pickup())if __name__ == '__main__':# test_pickle()test_json()

报错如下:

TypeError: Object of type 'type' is not JSON serializable

这里就是 type 不可以json 序列化的.

而用 test_pickle() 是可以的.
结果如下:

<class '__main__.Person'>
pickup() is running.
{'name': 'frank', 'hobby': 'swim'}

##### 三. 常用api说明

提供了常用序列化,和反序列化的接口
dumps dump 前一个返回时一个bytes 对象 , 后一个直接序列化到文件里面

loads load 前一个 从二进制bytes对象读取对象, 后一个 从文件中读取对象

pickle.dump(obj, file, protocol=None, *, fix_imports=True)

pickle.dumps(obj, protocol=None, *, fix_imports=True)

pickle.load(file, *, fix_imports=True, encoding=”ASCII”, errors=”strict”)

pickle.loads(bytes_object, *, fix_imports=True, encoding=”ASCII”, errors=”strict”)

如果要有更多的空值, 可以使用下面的两个类 来定制你的 序列化对象
The pickle module exports two classes, Pickler and Unpickler:

如果要对序列化和反序列化进行更多控制,可以分别创建Pickler或Unpickler对象。

pickle 模块定义的异常
The pickle module defines three exceptions:

exception pickle.PickleErrorexception pickle.PicklingErrorexception pickle.UnpicklingError

来看一个例子

import pickleclass Person:__tablename__ = 'person'table_flag = 'online'def __init__(self, name):self.name = name@classmethoddef pickup(cls, *args, **kwargs):print('pickup() is running.')# 所有的参数直接返回,不做任何处理.kwargs.update({"name": "frank", "hobby": "swim"})return kwargs@classmethoddef extract(cls, value='frank'):"""获取写数据库必要数据:param value: pickup 方法的返回值:param context: pickup 方法的入参:return:"""print('extract() is running.')return valueclass Serialization:def __init__(self, obj):self.myclass = objdef serialize(self):with open('pickle.txt', 'wb+') as f:# 写入  序列化到文件pickle.dump(self.myclass, f)def deserialize(self):# 反序列化  从文件反序列化with open('pickle.txt', 'rb') as f:# 读取data = pickle.load(f)return dataif __name__ == '__main__':ser = Serialization(Person)ser.serialize()person = ser.deserialize()print(f'person.table_flag: {person.table_flag}')print(person.pickup())print(person.extract())

结果如下:

person.table_flag: online
pickup() is running.
{'name': 'frank', 'hobby': 'swim'}
extract() is running.
frank

这个例子就是把类序列化到文件里面, 之后再从文件中读出来.

四. 具体应用举例

这个模块具体有什么用呢? 比如 有一个系统需要动态加载类, (我的意思是类是通过代码生成的,然后要把这个类加载到内存里面)
但是有一天我担心,如果程序突然有意外的bug ,或者其他的情况崩溃了, 而之前加载的类,就会消失了,一旦重启了系统,所有动态生成的类就会消失了, 所以pickle 模块就给我提供非常好用的方法. 可以把类序列化写到文件,或者序列化到二进制bytes 对象. 之后如果系统重启后,我重新 反序列把类读取到内存里面,完成反序列化.

#!/usr/bin/env python3
# -*- coding: UTF-8 -*-
"""
@author: Frank 
@contact: frank.chang@shoufuyou.com
@file: serialization.py
@time: 2018/7/22 上午12:18"""import pickleclass Person:__tablename__ = 'person'table_flag = 'online'def __init__(self, name):self.name = name@classmethoddef pickup(cls, *args, **kwargs):print('pickup() is running.')# 所有的参数直接返回,不做任何处理.kwargs.update({"name": "frank", "hobby": "swim"})return kwargs@classmethoddef extract(cls, value='frank'):""":param value: pickup 方法的返回值:return:"""print('extract() is running.')return valueclass Serialization:def __init__(self):self.myclasses = []def resigester(self, obj):self.myclasses.append(obj)def serialize(self):# 写入 序列化pickle_strings = []for myclass in self.myclasses:pickle_string = pickle.dumps(myclass)pickle_strings.append(pickle_string)return pickle_strings@staticmethoddef deserialize(bytes_object):# 反序列化  从文件反序列化return pickle.loads(bytes_object)if __name__ == '__main__':serialization = Serialization()serialization.resigester(Person)# 序列化Person 类strings = serialization.serialize()# 打印 序列化的结果print(strings)for bytes_obj in strings:# 反序列,得到Person 类P = serialization.deserialize(bytes_obj)print(P)# 构造p1 对象p1 = P('frank')print(p1.pickup())

结果如下:

[b'\x80\x03c__main__\nPerson\nq\x00.']
<class '__main__.Person'>
pickup() is running.
{'name': 'frank', 'hobby': 'swim'}

通过Serialization 序列化 Person类,之后有把他反序列出来, 完成序列化, 与反序列化操作.

五.参考文档

本文简单介绍了pickle模块的常见用法,常用api , 比较了与pickle 模块的不同. 如果需要特殊定制序列化, 可以使用 接口提供的那两个类.Pickler and Unpickler 这两个类更多的参考官方文档, 一般用的比较少.

六.参考文档

https://docs.python.org/3/library/pickle.html


分享快乐,留住感动.2018-07-22 18:59:19 –frank

这篇关于python 中 pickle 模块学习笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/981267

相关文章

基于Linux的ffmpeg python的关键帧抽取

《基于Linux的ffmpegpython的关键帧抽取》本文主要介绍了基于Linux的ffmpegpython的关键帧抽取,实现以按帧或时间间隔抽取关键帧,文中通过示例代码介绍的非常详细,对大家的学... 目录1.FFmpeg的环境配置1) 创建一个虚拟环境envjavascript2) ffmpeg-py

python使用库爬取m3u8文件的示例

《python使用库爬取m3u8文件的示例》本文主要介绍了python使用库爬取m3u8文件的示例,可以使用requests、m3u8、ffmpeg等库,实现获取、解析、下载视频片段并合并等步骤,具有... 目录一、准备工作二、获取m3u8文件内容三、解析m3u8文件四、下载视频片段五、合并视频片段六、错误

Python中提取文件名扩展名的多种方法实现

《Python中提取文件名扩展名的多种方法实现》在Python编程中,经常会遇到需要从文件名中提取扩展名的场景,Python提供了多种方法来实现这一功能,不同方法适用于不同的场景和需求,包括os.pa... 目录技术背景实现步骤方法一:使用os.path.splitext方法二:使用pathlib模块方法三

Python打印对象所有属性和值的方法小结

《Python打印对象所有属性和值的方法小结》在Python开发过程中,调试代码时经常需要查看对象的当前状态,也就是对象的所有属性和对应的值,然而,Python并没有像PHP的print_r那样直接提... 目录python中打印对象所有属性和值的方法实现步骤1. 使用vars()和pprint()2. 使

使用Python和OpenCV库实现实时颜色识别系统

《使用Python和OpenCV库实现实时颜色识别系统》:本文主要介绍使用Python和OpenCV库实现的实时颜色识别系统,这个系统能够通过摄像头捕捉视频流,并在视频中指定区域内识别主要颜色(红... 目录一、引言二、系统概述三、代码解析1. 导入库2. 颜色识别函数3. 主程序循环四、HSV色彩空间详解

一文深入详解Python的secrets模块

《一文深入详解Python的secrets模块》在构建涉及用户身份认证、权限管理、加密通信等系统时,开发者最不能忽视的一个问题就是“安全性”,Python在3.6版本中引入了专门面向安全用途的secr... 目录引言一、背景与动机:为什么需要 secrets 模块?二、secrets 模块的核心功能1. 基

python常见环境管理工具超全解析

《python常见环境管理工具超全解析》在Python开发中,管理多个项目及其依赖项通常是一个挑战,下面:本文主要介绍python常见环境管理工具的相关资料,文中通过代码介绍的非常详细,需要的朋友... 目录1. conda2. pip3. uvuv 工具自动创建和管理环境的特点4. setup.py5.

Python常用命令提示符使用方法详解

《Python常用命令提示符使用方法详解》在学习python的过程中,我们需要用到命令提示符(CMD)进行环境的配置,:本文主要介绍Python常用命令提示符使用方法的相关资料,文中通过代码介绍的... 目录一、python环境基础命令【Windows】1、检查Python是否安装2、 查看Python的安

Python UV安装、升级、卸载详细步骤记录

《PythonUV安装、升级、卸载详细步骤记录》:本文主要介绍PythonUV安装、升级、卸载的详细步骤,uv是Astral推出的下一代Python包与项目管理器,主打单一可执行文件、极致性能... 目录安装检查升级设置自动补全卸载UV 命令总结 官方文档详见:https://docs.astral.sh/

Python并行处理实战之如何使用ProcessPoolExecutor加速计算

《Python并行处理实战之如何使用ProcessPoolExecutor加速计算》Python提供了多种并行处理的方式,其中concurrent.futures模块的ProcessPoolExecu... 目录简介完整代码示例代码解释1. 导入必要的模块2. 定义处理函数3. 主函数4. 生成数字列表5.