python实现将图片数据以LMDB方式存储

2023-10-29 09:44

本文主要是介绍python实现将图片数据以LMDB方式存储,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

以LMDB(Lightning Memory-Mapped Database)方式存储的优点

  1. 高效性:LMDB是一种内存映射数据库,可以在内存和磁盘之间实现高效的数据访问。它利用操作系统的虚拟内存机制,将数据文件映射到内存中,从而避免了频繁的磁盘IO操作,提高了数据的读取和写入效率

  2. 低内存占用:LMDB使用了页面缓存和写时复制(Copy-on-Write)的技术,可以在内存中保持数据的快速访问同时占用较少的内存空间。这对于处理大规模数据集或内存有限的环境非常有用

  3. 并发支持:LMDB支持多线程或多进程的并发读取和写入操作,可以在高并发的数据访问场景下保持数据的一致性和可靠性

  4. 数据压缩:LMDB支持数据的压缩,可以减小数据文件的大小,节省存储空间

  5. 跨平台兼容:LMDB是一个跨平台的数据库,可以在不同的操作系统上使用,并提供了多种编程语言的接口,如C、Python等

代码示例

将目标分类的数据存储成“.lmdb”文件,

import pickle, lmdb
from tqdm import tqdmimg_paths = []
images, labels = [], []
for img_path in img_paths:images.append(img_path)labels.append(1)  ## 假设数据的label为1combined = list(zip(images, labels))
random.shuffle(combined)
images, labels = zip(*combined)
images = list(images)
labels = list(labels)def create_lmdb(images, labels, lmdb_path):assert len(images) == len(labels), "All lists must have the same length"db = lmdb.open(lmdb_path, map_size=int(1e12))with db.begin(write=True) as txn:bar = tqdm(images)for i, img_path in enumerate(bar):with open(img_path, 'rb') as f:img_data = f.read()meta_data = {'label': labels[i], 'size': len(img_data)}data = pickle.dumps((meta_data, img_data))txn.put(str(i).encode('utf-8'), data)txn.put('length'.encode('utf-8'), str(len(img_paths)).encode('utf-8'))print(f"Created LMDB dataset at {lmdb_path} with {len(img_paths)} images")create_lmdb(images=images, labels=labels, lmdb_path="xxx.lmdb")

这篇关于python实现将图片数据以LMDB方式存储的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/299822

相关文章

Python中注释使用方法举例详解

《Python中注释使用方法举例详解》在Python编程语言中注释是必不可少的一部分,它有助于提高代码的可读性和维护性,:本文主要介绍Python中注释使用方法的相关资料,需要的朋友可以参考下... 目录一、前言二、什么是注释?示例:三、单行注释语法:以 China编程# 开头,后面的内容为注释内容示例:示例:四

Python中win32包的安装及常见用途介绍

《Python中win32包的安装及常见用途介绍》在Windows环境下,PythonWin32模块通常随Python安装包一起安装,:本文主要介绍Python中win32包的安装及常见用途的相关... 目录前言主要组件安装方法常见用途1. 操作Windows注册表2. 操作Windows服务3. 窗口操作

Python中re模块结合正则表达式的实际应用案例

《Python中re模块结合正则表达式的实际应用案例》Python中的re模块是用于处理正则表达式的强大工具,正则表达式是一种用来匹配字符串的模式,它可以在文本中搜索和匹配特定的字符串模式,这篇文章主... 目录前言re模块常用函数一、查看文本中是否包含 A 或 B 字符串二、替换多个关键词为统一格式三、提

java实现docker镜像上传到harbor仓库的方式

《java实现docker镜像上传到harbor仓库的方式》:本文主要介绍java实现docker镜像上传到harbor仓库的方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录1. 前 言2. 编写工具类2.1 引入依赖包2.2 使用当前服务器的docker环境推送镜像2.2

C++20管道运算符的实现示例

《C++20管道运算符的实现示例》本文简要介绍C++20管道运算符的使用与实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧... 目录标准库的管道运算符使用自己实现类似的管道运算符我们不打算介绍太多,因为它实际属于c++20最为重要的

Java easyExcel实现导入多sheet的Excel

《JavaeasyExcel实现导入多sheet的Excel》这篇文章主要为大家详细介绍了如何使用JavaeasyExcel实现导入多sheet的Excel,文中的示例代码讲解详细,感兴趣的小伙伴可... 目录1.官网2.Excel样式3.代码1.官网easyExcel官网2.Excel样式3.代码

Java中调用数据库存储过程的示例代码

《Java中调用数据库存储过程的示例代码》本文介绍Java通过JDBC调用数据库存储过程的方法,涵盖参数类型、执行步骤及数据库差异,需注意异常处理与资源管理,以优化性能并实现复杂业务逻辑,感兴趣的朋友... 目录一、存储过程概述二、Java调用存储过程的基本javascript步骤三、Java调用存储过程示

python常用的正则表达式及作用

《python常用的正则表达式及作用》正则表达式是处理字符串的强大工具,Python通过re模块提供正则表达式支持,本文给大家介绍python常用的正则表达式及作用详解,感兴趣的朋友跟随小编一起看看吧... 目录python常用正则表达式及作用基本匹配模式常用正则表达式示例常用量词边界匹配分组和捕获常用re

MyBatisPlus如何优化千万级数据的CRUD

《MyBatisPlus如何优化千万级数据的CRUD》最近负责的一个项目,数据库表量级破千万,每次执行CRUD都像走钢丝,稍有不慎就引起数据库报警,本文就结合这个项目的实战经验,聊聊MyBatisPl... 目录背景一、MyBATis Plus 简介二、千万级数据的挑战三、优化 CRUD 的关键策略1. 查

python实现对数据公钥加密与私钥解密

《python实现对数据公钥加密与私钥解密》这篇文章主要为大家详细介绍了如何使用python实现对数据公钥加密与私钥解密,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录公钥私钥的生成使用公钥加密使用私钥解密公钥私钥的生成这一部分,使用python生成公钥与私钥,然后保存在两个文