pytorch的mask-rcnn的模型参数解释

2024-04-22 17:52

本文主要是介绍pytorch的mask-rcnn的模型参数解释,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

输入图像1920x1080,batch_size=8为例.

训练阶段

loss_dict = model(images,targets)

  • 入参
    • images: List(Tensor(3,1920,1080))[8]
    • targets: List(dict()[3])[8] dict详情见下表:
keytypedtypesizeremark
boxesTensorfloat32(n,4)1the ground-truth boxes in [x1, y1, x2, y2] format, with 0 <= x1 < x2 <= W and 0 <= y1 < y2 <= H.
labelsTenosrint64(n,)the class label for each ground-truth box
maskesTensoruint8(n,1920,1080)[N,H,W]the segmentation binary masks for each instance,实际就是0和1,有对象的区域就是1,否则就是0,这个照片有多少个对象就有多少个mask
area*Tensorfloat32(n,)对象面积
iscrowd*Tensorint64(n,)是否为一群对象(coco数据集会标注)
image_id*int图像编号

*为非必要参数,有一些数据集合处理的时候会标注上去*

  • 返回 loss_dict dict()[5] dict详情见下表:
keytypedtypesize损失函数remark
loss_classiferTensorfloat32()CrossEntropyLoss对象分类损失(Classification Loss):
loss_box_regTensorfloat32()Smooth L1 Loss/MSE边界框回归损失(Bounding Box Regression Loss):
loss_maskTensorfloat32()Binary Cross-Entropy Loss掩膜损失(Mask Loss):
loss_objectnessTensorfloat32()CrossEntropyLossRPN分类损失(RPN Classification Loss):前景/背景二分类损失
loss_rpn_box_regTensorfloat32()Smooth L1/MSERPN边界框回归损失(RPN Bounding Box Regression Loss)

推理阶段

predict = model(images)

  • 入参 images: List(Tensor(3,1920,1080))[8] 不变
  • 返回 predict:List(dict()[4])[8] dict详情见下表:
keytypedtypesizeremark
boxesTensorfloat32(m,4)2the predicted boxes in [x1, y1, x2, y2] format,预测的所有的边界框
labelsTensorint64(m,)the predicted labels for each instance
boxesTensorfloat32(m,)the scores or each instance
boxesTensorfloat32(m,1,1920,1080)[M, 1, H, W]the predicted masks for each instance, in 0-1 range. In order to obtain the final segmentation masks, the soft masks can be thresholded, generally with a value of 0.5 (mask >= 0.5).实际存储的是一个软掩膜,0.5以下的也有,存在比较平滑的过度

参考官方文档
maskrcnn_resnet50_fpn


  1. n为此图像上的实例个数 ↩︎

  2. m为此图像 ↩︎

这篇关于pytorch的mask-rcnn的模型参数解释的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/926458

相关文章

Pytorch介绍与安装过程

《Pytorch介绍与安装过程》PyTorch因其直观的设计、卓越的灵活性以及强大的动态计算图功能,迅速在学术界和工业界获得了广泛认可,成为当前深度学习研究和开发的主流工具之一,本文给大家介绍Pyto... 目录1、Pytorch介绍1.1、核心理念1.2、核心组件与功能1.3、适用场景与优势总结1.4、优

conda安装GPU版pytorch默认却是cpu版本

《conda安装GPU版pytorch默认却是cpu版本》本文主要介绍了遇到Conda安装PyTorchGPU版本却默认安装CPU的问题,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的... 目录一、问题描述二、网上解决方案罗列【此节为反面方案罗列!!!】三、发现的根本原因[独家]3.1 p

详解如何使用Python从零开始构建文本统计模型

《详解如何使用Python从零开始构建文本统计模型》在自然语言处理领域,词汇表构建是文本预处理的关键环节,本文通过Python代码实践,演示如何从原始文本中提取多尺度特征,并通过动态调整机制构建更精确... 目录一、项目背景与核心思想二、核心代码解析1. 数据加载与预处理2. 多尺度字符统计3. 统计结果可

SpringBoot整合Sa-Token实现RBAC权限模型的过程解析

《SpringBoot整合Sa-Token实现RBAC权限模型的过程解析》:本文主要介绍SpringBoot整合Sa-Token实现RBAC权限模型的过程解析,本文给大家介绍的非常详细,对大家的学... 目录前言一、基础概念1.1 RBAC模型核心概念1.2 Sa-Token核心功能1.3 环境准备二、表结

PyTorch中cdist和sum函数使用示例详解

《PyTorch中cdist和sum函数使用示例详解》torch.cdist是PyTorch中用于计算**两个张量之间的成对距离(pairwisedistance)**的函数,常用于点云处理、图神经网... 目录基本语法输出示例1. 简单的 2D 欧几里得距离2. 批量形式(3D Tensor)3. 使用不

一文详解PostgreSQL复制参数

《一文详解PostgreSQL复制参数》PostgreSQL作为一款功能强大的开源关系型数据库,其复制功能对于构建高可用性系统至关重要,本文给大家详细介绍了PostgreSQL的复制参数,需要的朋友可... 目录一、复制参数基础概念二、核心复制参数深度解析1. max_wal_seChina编程nders:WAL

PyTorch高级特性与性能优化方式

《PyTorch高级特性与性能优化方式》:本文主要介绍PyTorch高级特性与性能优化方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、自动化机制1.自动微分机制2.动态计算图二、性能优化1.内存管理2.GPU加速3.多GPU训练三、分布式训练1.分布式数据

Linux高并发场景下的网络参数调优实战指南

《Linux高并发场景下的网络参数调优实战指南》在高并发网络服务场景中,Linux内核的默认网络参数往往无法满足需求,导致性能瓶颈、连接超时甚至服务崩溃,本文基于真实案例分析,从参数解读、问题诊断到优... 目录一、问题背景:当并发连接遇上性能瓶颈1.1 案例环境1.2 初始参数分析二、深度诊断:连接状态与

史上最全nginx详细参数配置

《史上最全nginx详细参数配置》Nginx是一个轻量级高性能的HTTP和反向代理服务器,同时也是一个通用代理服务器(TCP/UDP/IMAP/POP3/SMTP),最初由俄罗斯人IgorSyso... 目录基本命令默认配置搭建站点根据文件类型设置过期时间禁止文件缓存防盗链静态文件压缩指定定错误页面跨域问题

判断PyTorch是GPU版还是CPU版的方法小结

《判断PyTorch是GPU版还是CPU版的方法小结》PyTorch作为当前最流行的深度学习框架之一,支持在CPU和GPU(NVIDIACUDA)上运行,所以对于深度学习开发者来说,正确识别PyTor... 目录前言为什么需要区分GPU和CPU版本?性能差异硬件要求如何检查PyTorch版本?方法1:使用命