Caffe——hdf5文件的生成

2023-10-13 08:30
文章标签 生成 caffe hdf5

本文主要是介绍Caffe——hdf5文件的生成,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

      • 一、图片标签工具
        • (1)labelimg安装:
        • (2)labelme安装:
      • 二、hdf5文件的生成
        • (1)预准备
        • (2)hdf5制作代码实现
        • (3)知识点补充
        • (4)最后生成效果如下

一、图片标签工具

关键点坐标获取:
尝试一:labelimg(电脑之前把python卸载了,现在需重新安装)
尝试二:labelme

(1)labelimg安装:

方法1:(失败)
1步骤一:
按照下列参考网址进行安装:

https://jingyan.baidu.com/article/5225f26ba428fee6fa090829.html

2步骤二
安装完成后执行labelimg仍然报错如下,需安装PyQt4包
在这里插入图片描述
2步骤三
打开镜像库:

https://www.lfd.uci.edu/~gohlke/pythonlibs/

下载对应版本的whl文件,cmd进入下载目录,pip进行安装。
安装完成后可以在D:\Anaconda3\Lib\site-packages进行查看,可以将whl文件删除。
4步骤四
再次输入labelimg,仍然报错
在这里插入图片描述
方法2:(重新选择一种方式,安装成功)
下载windows版本的labelimg压缩包:

https://github.com/tzutalin/labelImg/releases

下载完成后,直接双击exe文件即可使用,很方便。将路径配置环境变量,即可在终端直接打开。
在这里插入图片描述

(2)labelme安装:

安装时也遇到一些问题,干脆就直接用老师的例子直接生成hdf5文件,其它的先放一放

二、hdf5文件的生成

(1)预准备

准备好图片及关键点对应的txt文件(此处的图片时人脸,关键点为鼻子、眼睛、嘴,几个关键点xy坐标)
在这里插入图片描述在这里插入图片描述

(2)hdf5制作代码实现
import h5py
import os
import cv2
import math
import numpy as np
import random
import reroot_path = "./image"with open("./hdf5.txt", 'r') as f:lines = f.readlines()  # ['1.jpg 11 78 62 71 84 65 26 51 46 89\n', '2.jpg 13 25 62 53 53 65 26 32 42 13\n', '3.jpg 15 78 66 13 84 65 32 41 51 65\n']
num = len(lines)  # num表示有多少张照片
random.shuffle(lines)imgs = np.zeros([num, 3, 224, 224])
labels = np.zeros([num, 10])
for i in range(num):line = lines[i]segments = re.split('\\s+', line)[:-1]  # \\s表示   空格,回车,换行等空白符, +号表示一个或多个的意思print(segments[0])img = cv2.imread(os.path.join(root_path, segments[0]))img = cv2.resize(img, (224, 224))print(img.shape)img = img.transpose(2, 0, 1)  # 把224*224*3变成imgs[i, :, :, :] = img.astype(np.float32)  # 变成float32for j in range(10):labels[i, j] = float(segments[j + 1]) * 224 / 256  # 原始图片就是256*256batchSize = 1  # batchsize最多8000个数据为好
batchNum = int(math.ceil(1.0 * num / batchSize))  # math.ceil向上取整,进一法
# 每一个文件构造成一个.h5的文件imgsMean = np.mean(imgs, axis=0)  # imgs一共又四维,第一维是数量,axis为0也就是对每一张图片求均值
# imgs = (imgs - imgsMean)/255.0
labelsMean = np.mean(labels, axis=0)  # 对每一个标签求均值
labels = (labels - labelsMean) / 10  # 减mean值,以0为中心化if os.path.exists('trainlist.txt'):os.remove('trainlist.txt')
if os.path.exists('testlist.txt'):os.remove('testlist.txt')comp_kwargs = {'compression': 'gzip', 'compression_opts': 1}
for i in range(batchNum):start = i * batchSizeend = min((i + 1) * batchSize, num)if i < batchNum - 1:filename = './h5/train{0}.h5'.format(i)else:  # 在此处改训练集和测试集的尺寸filename = './h5/test{0}.h5'.format(i - batchNum + 1)  # 把最后一个作为测试集print(filename)with h5py.File(filename, 'w') as f:f.create_dataset('data', data=np.array((imgs[start:end] - imgsMean) / 255.0).astype(np.float32), **comp_kwargs)f.create_dataset('label', data=np.array(labels[start:end]).astype(np.float32), **comp_kwargs)if i < batchNum - 1:with open('./h5/trainlist.txt', 'a') as f:f.write(os.path.join(os.getcwd(), 'train{0}.h5').format(i) + '\n')else:with open('./h5/testlist.txt', 'a') as f:f.write(os.path.join(os.getcwd(), 'test{0}.h5').format(i - batchNum + 1) + '\n')imgsMean = np.mean(imgsMean, axis=(1, 2))
with open('mean.txt', 'w') as f:f.write(str(imgsMean[0]) + '\n' + str(imgsMean[1]) + '\n' + str(imgsMean[2]))
(3)知识点补充
# 补充1
import re
line = '\n'
print(re.split('\\s+', line))  # ['', '']
line = '1.jpg 11 78 62 71 84 65 26 51 46 89\n'
print(re.split('\\s+', line))  # ['1.jpg', '11', '78', '62', '71', '84', '65', '26', '51', '46', '89', '']
# \\s表示   空格,回车,换行等空白符, +号表示一个或多个的意思,所以# 补充2
*args 是可变参数, args 接收的是一个 tuple**kw 是关键字参数, kw 接收的是一个 dict。
以及调用函数时如何传入可变参数和关键字参数的语法:
可变参数既可以直接传入: func(1, 2, 3),又可以先组装 listtuple,再通过*args 传入:
func(*(1, 2, 3));
关键字参数既可以直接传入: func(a=1, b=2),又可以先组装 dict,再通过**kw 传入: func
(**{'a': 1, 'b': 2})
(4)最后生成效果如下

在这里插入图片描述
trianlist.txt、testlist里面存放的是h5文件所在的地址,在下图中红色箭头位置替换掉train.txt即可使用
在这里插入图片描述

这篇关于Caffe——hdf5文件的生成的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/201986

相关文章

Python从Word文档中提取图片并生成PPT的操作代码

《Python从Word文档中提取图片并生成PPT的操作代码》在日常办公场景中,我们经常需要从Word文档中提取图片,并将这些图片整理到PowerPoint幻灯片中,手动完成这一任务既耗时又容易出错,... 目录引言背景与需求解决方案概述代码解析代码核心逻辑说明总结引言在日常办公场景中,我们经常需要从 W

C#使用Spire.XLS快速生成多表格Excel文件

《C#使用Spire.XLS快速生成多表格Excel文件》在日常开发中,我们经常需要将业务数据导出为结构清晰的Excel文件,本文将手把手教你使用Spire.XLS这个强大的.NET组件,只需几行C#... 目录一、Spire.XLS核心优势清单1.1 性能碾压:从3秒到0.5秒的质变1.2 批量操作的优雅

Python使用python-pptx自动化操作和生成PPT

《Python使用python-pptx自动化操作和生成PPT》这篇文章主要为大家详细介绍了如何使用python-pptx库实现PPT自动化,并提供实用的代码示例和应用场景,感兴趣的小伙伴可以跟随小编... 目录使用python-pptx操作PPT文档安装python-pptx基础概念创建新的PPT文档查看

在ASP.NET项目中如何使用C#生成二维码

《在ASP.NET项目中如何使用C#生成二维码》二维码(QRCode)已广泛应用于网址分享,支付链接等场景,本文将以ASP.NET为示例,演示如何实现输入文本/URL,生成二维码,在线显示与下载的完整... 目录创建前端页面(Index.cshtml)后端二维码生成逻辑(Index.cshtml.cs)总结

Python实现数据可视化图表生成(适合新手入门)

《Python实现数据可视化图表生成(适合新手入门)》在数据科学和数据分析的新时代,高效、直观的数据可视化工具显得尤为重要,下面:本文主要介绍Python实现数据可视化图表生成的相关资料,文中通过... 目录前言为什么需要数据可视化准备工作基本图表绘制折线图柱状图散点图使用Seaborn创建高级图表箱线图热

SQLServer中生成雪花ID(Snowflake ID)的实现方法

《SQLServer中生成雪花ID(SnowflakeID)的实现方法》:本文主要介绍在SQLServer中生成雪花ID(SnowflakeID)的实现方法,文中通过示例代码介绍的非常详细,... 目录前言认识雪花ID雪花ID的核心特点雪花ID的结构(64位)雪花ID的优势雪花ID的局限性雪花ID的应用场景

Django HTTPResponse响应体中返回openpyxl生成的文件过程

《DjangoHTTPResponse响应体中返回openpyxl生成的文件过程》Django返回文件流时需通过Content-Disposition头指定编码后的文件名,使用openpyxl的sa... 目录Django返回文件流时使用指定文件名Django HTTPResponse响应体中返回openp

python生成随机唯一id的几种实现方法

《python生成随机唯一id的几种实现方法》在Python中生成随机唯一ID有多种方法,根据不同的需求场景可以选择最适合的方案,文中通过示例代码介绍的非常详细,需要的朋友们下面随着小编来一起学习学习... 目录方法 1:使用 UUID 模块(推荐)方法 2:使用 Secrets 模块(安全敏感场景)方法

Python实现自动化Word文档样式复制与内容生成

《Python实现自动化Word文档样式复制与内容生成》在办公自动化领域,高效处理Word文档的样式和内容复制是一个常见需求,本文将展示如何利用Python的python-docx库实现... 目录一、为什么需要自动化 Word 文档处理二、核心功能实现:样式与表格的深度复制1. 表格复制(含样式与内容)2

python如何生成指定文件大小

《python如何生成指定文件大小》:本文主要介绍python如何生成指定文件大小的实现方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录python生成指定文件大小方法一(速度最快)方法二(中等速度)方法三(生成可读文本文件–较慢)方法四(使用内存映射高效生成