python 中 pickle 模块学习笔记

2024-05-12 01:48

本文主要是介绍python 中 pickle 模块学习笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  1. 概要
  2. 和json 模块的比较
  3. 常用api说明
  4. 具体应用举例
  5. 总结
  6. 参考文档 pickle模块

    一. 概要

    用这个模块 可以创建Python对象的可移植序列化表示。
    Create portable serialized representations of Python objects.

    二.pickle 和json 模块对比
    1. json 模块实现序列化方式 一般是 unicode text ,而且序列化后, 人是可以看懂的. 但是 pickle 序列化方式是二进制的, 人是看不懂的.
    2. json 序列化更加广泛,并且json 是可以互操作的. pickle 仅是Python 独有的一种方式.
    3. json 可以序列化Python内置类型的子类. 但是我如果要序列化 自己写的类,显得无能为力. 但是pickle 模块是可以的,可以序列化 自己写的类,同时可以序列化Python内置类型的子类型.
There are fundamental differences between the pickle protocols and JSON (JavaScript Object Notation):JSON is a text serialization format (it outputs unicode text, although most of the time it is then encoded to utf-8), while pickle is a binary serialization format;
JSON is human-readable, while pickle is not;
JSON is interoperable and widely used outside of the Python ecosystem, while pickle is Python-specific;
JSON, by default, can only represent a subset of the Python built-in types, and no custom classes; pickle can represent an extremely large number of Python types (many of them automatically, by clever usage of Python’s introspection facilities; complex cases can be tackled by implementing specific object APIs).

1看一个小例子


import pickle
import jsonif __name__ == '__main__':d1 = dict(zip('frank', range(5)))print(d1)json_str = json.dumps(d1)pickle_str = pickle.dumps(d1)print(f'json_str: {json_str}')print(f'pickle_str: {pickle_str}')

结果如下:

{'f': 0, 'r': 1, 'a': 2, 'n': 3, 'k': 4}
json_str: {"f": 0, "r": 1, "a": 2, "n": 3, "k": 4}
pickle_str: b'\x80\x03}q\x00(X\x01\x00\x00\x00fq\x01K\x00X\x01\x00\x00\x00rq\x02K\x01X\x01\x00\x00\x00aq\x03K\x02X\x01\x00\x00\x00nq\x04K\x03X\x01\x00\x00\x00kq\x05K\x04u.'Process finished with exit code 0

可以看出来,json 序列化后,是人类能够看懂的.而pickle 模块序列化后,就看不懂了,因为是二进制的.

在看一个例子

#!/usr/bin/env python3
# -*- coding: UTF-8 -*-
"""
@author: Frank 
@contact: frank.chang@shoufuyou.com
@file: test_pickle.py
@time: 2018/7/22 上午9:06"""import pickle
import jsonclass Person:__tablename__ = 'person'table_flag = 'online'def __init__(self, name):self.name = name@classmethoddef pickup(cls, *args, **kwargs):print('pickup() is running.')kwargs.update({"name": "frank", "hobby": "swim"})return kwargsdef test_pickle():# 序列化类p1 = pickle.dumps(Person)# 反序列化P1 = pickle.loads(p1)# 打印Person类print(P1)p2 = P1('frank')print(p2.pickup())def test_json():p1 = json.dumps(Person)P1 = json.loads(p1)print(P1)p2 = P1('frank')print(p2.pickup())if __name__ == '__main__':# test_pickle()test_json()

报错如下:

TypeError: Object of type 'type' is not JSON serializable

这里就是 type 不可以json 序列化的.

而用 test_pickle() 是可以的.
结果如下:

<class '__main__.Person'>
pickup() is running.
{'name': 'frank', 'hobby': 'swim'}

##### 三. 常用api说明

提供了常用序列化,和反序列化的接口
dumps dump 前一个返回时一个bytes 对象 , 后一个直接序列化到文件里面

loads load 前一个 从二进制bytes对象读取对象, 后一个 从文件中读取对象

pickle.dump(obj, file, protocol=None, *, fix_imports=True)

pickle.dumps(obj, protocol=None, *, fix_imports=True)

pickle.load(file, *, fix_imports=True, encoding=”ASCII”, errors=”strict”)

pickle.loads(bytes_object, *, fix_imports=True, encoding=”ASCII”, errors=”strict”)

如果要有更多的空值, 可以使用下面的两个类 来定制你的 序列化对象
The pickle module exports two classes, Pickler and Unpickler:

如果要对序列化和反序列化进行更多控制,可以分别创建Pickler或Unpickler对象。

pickle 模块定义的异常
The pickle module defines three exceptions:

exception pickle.PickleErrorexception pickle.PicklingErrorexception pickle.UnpicklingError

来看一个例子

import pickleclass Person:__tablename__ = 'person'table_flag = 'online'def __init__(self, name):self.name = name@classmethoddef pickup(cls, *args, **kwargs):print('pickup() is running.')# 所有的参数直接返回,不做任何处理.kwargs.update({"name": "frank", "hobby": "swim"})return kwargs@classmethoddef extract(cls, value='frank'):"""获取写数据库必要数据:param value: pickup 方法的返回值:param context: pickup 方法的入参:return:"""print('extract() is running.')return valueclass Serialization:def __init__(self, obj):self.myclass = objdef serialize(self):with open('pickle.txt', 'wb+') as f:# 写入  序列化到文件pickle.dump(self.myclass, f)def deserialize(self):# 反序列化  从文件反序列化with open('pickle.txt', 'rb') as f:# 读取data = pickle.load(f)return dataif __name__ == '__main__':ser = Serialization(Person)ser.serialize()person = ser.deserialize()print(f'person.table_flag: {person.table_flag}')print(person.pickup())print(person.extract())

结果如下:

person.table_flag: online
pickup() is running.
{'name': 'frank', 'hobby': 'swim'}
extract() is running.
frank

这个例子就是把类序列化到文件里面, 之后再从文件中读出来.

四. 具体应用举例

这个模块具体有什么用呢? 比如 有一个系统需要动态加载类, (我的意思是类是通过代码生成的,然后要把这个类加载到内存里面)
但是有一天我担心,如果程序突然有意外的bug ,或者其他的情况崩溃了, 而之前加载的类,就会消失了,一旦重启了系统,所有动态生成的类就会消失了, 所以pickle 模块就给我提供非常好用的方法. 可以把类序列化写到文件,或者序列化到二进制bytes 对象. 之后如果系统重启后,我重新 反序列把类读取到内存里面,完成反序列化.

#!/usr/bin/env python3
# -*- coding: UTF-8 -*-
"""
@author: Frank 
@contact: frank.chang@shoufuyou.com
@file: serialization.py
@time: 2018/7/22 上午12:18"""import pickleclass Person:__tablename__ = 'person'table_flag = 'online'def __init__(self, name):self.name = name@classmethoddef pickup(cls, *args, **kwargs):print('pickup() is running.')# 所有的参数直接返回,不做任何处理.kwargs.update({"name": "frank", "hobby": "swim"})return kwargs@classmethoddef extract(cls, value='frank'):""":param value: pickup 方法的返回值:return:"""print('extract() is running.')return valueclass Serialization:def __init__(self):self.myclasses = []def resigester(self, obj):self.myclasses.append(obj)def serialize(self):# 写入 序列化pickle_strings = []for myclass in self.myclasses:pickle_string = pickle.dumps(myclass)pickle_strings.append(pickle_string)return pickle_strings@staticmethoddef deserialize(bytes_object):# 反序列化  从文件反序列化return pickle.loads(bytes_object)if __name__ == '__main__':serialization = Serialization()serialization.resigester(Person)# 序列化Person 类strings = serialization.serialize()# 打印 序列化的结果print(strings)for bytes_obj in strings:# 反序列,得到Person 类P = serialization.deserialize(bytes_obj)print(P)# 构造p1 对象p1 = P('frank')print(p1.pickup())

结果如下:

[b'\x80\x03c__main__\nPerson\nq\x00.']
<class '__main__.Person'>
pickup() is running.
{'name': 'frank', 'hobby': 'swim'}

通过Serialization 序列化 Person类,之后有把他反序列出来, 完成序列化, 与反序列化操作.

五.参考文档

本文简单介绍了pickle模块的常见用法,常用api , 比较了与pickle 模块的不同. 如果需要特殊定制序列化, 可以使用 接口提供的那两个类.Pickler and Unpickler 这两个类更多的参考官方文档, 一般用的比较少.

六.参考文档

https://docs.python.org/3/library/pickle.html


分享快乐,留住感动.2018-07-22 18:59:19 –frank

这篇关于python 中 pickle 模块学习笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/981267

相关文章

Python实现批量提取BLF文件时间戳

《Python实现批量提取BLF文件时间戳》BLF(BinaryLoggingFormat)作为Vector公司推出的CAN总线数据记录格式,被广泛用于存储车辆通信数据,本文将使用Python轻松提取... 目录一、为什么需要批量处理 BLF 文件二、核心代码解析:从文件遍历到数据导出1. 环境准备与依赖库

Python Web框架Flask、Streamlit、FastAPI示例详解

《PythonWeb框架Flask、Streamlit、FastAPI示例详解》本文对比分析了Flask、Streamlit和FastAPI三大PythonWeb框架:Flask轻量灵活适合传统应用... 目录概述Flask详解Flask简介安装和基础配置核心概念路由和视图模板系统数据库集成实际示例Stre

Python实现PDF按页分割的技术指南

《Python实现PDF按页分割的技术指南》PDF文件处理是日常工作中的常见需求,特别是当我们需要将大型PDF文档拆分为多个部分时,下面我们就来看看如何使用Python创建一个灵活的PDF分割工具吧... 目录需求分析技术方案工具选择安装依赖完整代码实现使用说明基本用法示例命令输出示例技术亮点实际应用场景扩

Python错误AttributeError: 'NoneType' object has no attribute问题的彻底解决方法

《Python错误AttributeError:NoneTypeobjecthasnoattribute问题的彻底解决方法》在Python项目开发和调试过程中,经常会碰到这样一个异常信息... 目录问题背景与概述错误解读:AttributeError: 'NoneType' object has no at

Python使用openpyxl读取Excel的操作详解

《Python使用openpyxl读取Excel的操作详解》本文介绍了使用Python的openpyxl库进行Excel文件的创建、读写、数据操作、工作簿与工作表管理,包括创建工作簿、加载工作簿、操作... 目录1 概述1.1 图示1.2 安装第三方库2 工作簿 workbook2.1 创建:Workboo

基于Python实现简易视频剪辑工具

《基于Python实现简易视频剪辑工具》这篇文章主要为大家详细介绍了如何用Python打造一个功能完备的简易视频剪辑工具,包括视频文件导入与格式转换,基础剪辑操作,音频处理等功能,感兴趣的小伙伴可以了... 目录一、技术选型与环境搭建二、核心功能模块实现1. 视频基础操作2. 音频处理3. 特效与转场三、高

Python实现中文文本处理与分析程序的示例详解

《Python实现中文文本处理与分析程序的示例详解》在当今信息爆炸的时代,文本数据的处理与分析成为了数据科学领域的重要课题,本文将使用Python开发一款基于Python的中文文本处理与分析程序,希望... 目录一、程序概述二、主要功能解析2.1 文件操作2.2 基础分析2.3 高级分析2.4 可视化2.5

一文解密Python进行监控进程的黑科技

《一文解密Python进行监控进程的黑科技》在计算机系统管理和应用性能优化中,监控进程的CPU、内存和IO使用率是非常重要的任务,下面我们就来讲讲如何Python写一个简单使用的监控进程的工具吧... 目录准备工作监控CPU使用率监控内存使用率监控IO使用率小工具代码整合在计算机系统管理和应用性能优化中,监

Python实现终端清屏的几种方式详解

《Python实现终端清屏的几种方式详解》在使用Python进行终端交互式编程时,我们经常需要清空当前终端屏幕的内容,本文为大家整理了几种常见的实现方法,有需要的小伙伴可以参考下... 目录方法一:使用 `os` 模块调用系统命令方法二:使用 `subprocess` 模块执行命令方法三:打印多个换行符模拟

Python实现MQTT通信的示例代码

《Python实现MQTT通信的示例代码》本文主要介绍了Python实现MQTT通信的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 目录1. 安装paho-mqtt库‌2. 搭建MQTT代理服务器(Broker)‌‌3. pytho