【目标检测】原始的 YOLOv1 网络结构(GoogLeNet 作为 backbone 的实现)

本文主要是介绍【目标检测】原始的 YOLOv1 网络结构(GoogLeNet 作为 backbone 的实现),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

现在看网上的很多 YOLOv1 的代码实现,基本都是使用新的 backbone,例如 ResNet 或者 VGG 来实现的,因为这些后面的通用的 backbone 可能比较方便的获得预训练模型,不需要从头开始训练。

但是我就是想看一下,一开始 YOLOv1 网络结构是咋样的,所以就当做学习了,来还原一下最初的 YOLOv1 网络结构。

比较常见的图有两张:

在这里插入图片描述
这张是原论文里面的图片,我后面根据下面的卷积参数进行复现的时候,发现如果严格按照上面的输出的话,有输出张量的通道数,图上应该是标错了的。

在这里插入图片描述
这里张图应该也是网友制作的图,但是其中的一个张量的尺寸也是错误的。

首先我们根据论文提供的第一张图的网络结构参数来复原一下:

layeroutput sizemodule
448x448x3
1224x224x64Conv 7x7x64, s-2, p-3modified GoogLeNet backbone
112x112x64Maxpool 2x2, s-2, p-0modified GoogLeNet backbone
2112x112x192Conv 3x3x192, s-1, p-1modified GoogLeNet backbone
56x56x192Maxpool 2x2, s-2, p-0modified GoogLeNet backbone
356x56x128Conv 1x1x128, s-1, p-0modified GoogLeNet backbone
456x56x256Conv 3x3x256, s-1, p-1modified GoogLeNet backbone
556x56x256Conv 1x1x256, s-1, p-0modified GoogLeNet backbone
656x56x512Conv 3x3x512, s-1, p-1modified GoogLeNet backbone
28x28x512Maxpool 2x2, s-2, p-0modified GoogLeNet backbone
7,9,11,1328x28x256Conv 1x1x256, s-1, p-0modified GoogLeNet backbone
8,10,12,1428x28x512Conv 3x3x512, s-1, p-1modified GoogLeNet backbone
1528x28x512Conv 1x1x512, s-1, p-0modified GoogLeNet backnone
1628x28x1024Conv 3x3x1024, s-1, p-1modified GoogLeNet backbone
14x14x1024Maxpool 2x2, s-2, p-0modified GoogLeNet backbone
17,1914x14x512Conv 1x1x512, s-1, p-0modified GoogLeNet backbone
18,2014x14x1024Conv 3x3x1024, s-1, p-1modified GoogLeNet backbone
2114x14x1024Conv 3x3x1024, s-1, p-1
227x7x1024Conv 3x3x1024, s-2, p-1
237x7x1024Conv 3x3x1024, s-1, p-1
247x7x1024Conv 3x3x1024, s-1, p-1
254096x1FC1
261470x1FC2
7x7x30reshape

从这个这个表格我们可以看到:

  • 前 20 层是 backbone,属于魔改之后的 GoogLeNet 网络,修改的细节后续会给出。
  • 在 backbone 后面,还接着 4 个卷积层和 2 个全连接层,最后进行 reshape,输出我们想要的张量维度。

YOLOv1 的 backbone 是根据 GoogLeNet 进行修改的。

首先看一下 GoogLeNet 的网络结构,之前出过一篇文章专门介绍 Inception 家族的,所以 GoogLeNet 的结构示意图如下:

在这里插入图片描述

具体来说,这里的 GoogLeNet modification(20 layers)就是采用 1×1 卷积层加 3×3 卷积层替换了
GoogLeNet 中的 Inception 模块,然后去掉了第二层 1x1 的卷积层和最后的 fc 层

在这里插入图片描述
这就是我们 YOLOv1 的网络结构图:

  • 左边部分就是魔改之后的 GoogLeNet backbone,其中 Inception 的部分都使用 1x1 和 3x3 卷积替代了。简单来说,相当于将 Inception 模块中多条分支,只保留了 1x1 和 3x3 卷积单条分支。
    在这里插入图片描述
  • 中间部分就是紫色 Stem 模块的展开,其中如同上面描述的那样,第二层的 1x1 卷积去掉了
  • 右边部分就是 YOLOv1 最后的输出部分

参考文献

  • 目标检测 YOLO 系列: 开宗立派 YOLO v1
  • You Only Look Once: Unified, Real-Time Object Detection

这篇关于【目标检测】原始的 YOLOv1 网络结构(GoogLeNet 作为 backbone 的实现)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/816418

相关文章

Redis客户端连接机制的实现方案

《Redis客户端连接机制的实现方案》本文主要介绍了Redis客户端连接机制的实现方案,包括事件驱动模型、非阻塞I/O处理、连接池应用及配置优化,具有一定的参考价值,感兴趣的可以了解一下... 目录1. Redis连接模型概述2. 连接建立过程详解2.1 连php接初始化流程2.2 关键配置参数3. 最大连

Python实现网格交易策略的过程

《Python实现网格交易策略的过程》本文讲解Python网格交易策略,利用ccxt获取加密货币数据及backtrader回测,通过设定网格节点,低买高卖获利,适合震荡行情,下面跟我一起看看我们的第一... 网格交易是一种经典的量化交易策略,其核心思想是在价格上下预设多个“网格”,当价格触发特定网格时执行买

python设置环境变量路径实现过程

《python设置环境变量路径实现过程》本文介绍设置Python路径的多种方法:临时设置(Windows用`set`,Linux/macOS用`export`)、永久设置(系统属性或shell配置文件... 目录设置python路径的方法临时设置环境变量(适用于当前会话)永久设置环境变量(Windows系统

Python对接支付宝支付之使用AliPay实现的详细操作指南

《Python对接支付宝支付之使用AliPay实现的详细操作指南》支付宝没有提供PythonSDK,但是强大的github就有提供python-alipay-sdk,封装里很多复杂操作,使用这个我们就... 目录一、引言二、准备工作2.1 支付宝开放平台入驻与应用创建2.2 密钥生成与配置2.3 安装ali

Spring Security 单点登录与自动登录机制的实现原理

《SpringSecurity单点登录与自动登录机制的实现原理》本文探讨SpringSecurity实现单点登录(SSO)与自动登录机制,涵盖JWT跨系统认证、RememberMe持久化Token... 目录一、核心概念解析1.1 单点登录(SSO)1.2 自动登录(Remember Me)二、代码分析三、

PyCharm中配置PyQt的实现步骤

《PyCharm中配置PyQt的实现步骤》PyCharm是JetBrains推出的一款强大的PythonIDE,结合PyQt可以进行pythion高效开发桌面GUI应用程序,本文就来介绍一下PyCha... 目录1. 安装China编程PyQt1.PyQt 核心组件2. 基础 PyQt 应用程序结构3. 使用 Q

Python实现批量提取BLF文件时间戳

《Python实现批量提取BLF文件时间戳》BLF(BinaryLoggingFormat)作为Vector公司推出的CAN总线数据记录格式,被广泛用于存储车辆通信数据,本文将使用Python轻松提取... 目录一、为什么需要批量处理 BLF 文件二、核心代码解析:从文件遍历到数据导出1. 环境准备与依赖库

linux下shell脚本启动jar包实现过程

《linux下shell脚本启动jar包实现过程》确保APP_NAME和LOG_FILE位于目录内,首次启动前需手动创建log文件夹,否则报错,此为个人经验,供参考,欢迎支持脚本之家... 目录linux下shell脚本启动jar包样例1样例2总结linux下shell脚本启动jar包样例1#!/bin

go动态限制并发数量的实现示例

《go动态限制并发数量的实现示例》本文主要介绍了Go并发控制方法,通过带缓冲通道和第三方库实现并发数量限制,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 目录带有缓冲大小的通道使用第三方库其他控制并发的方法因为go从语言层面支持并发,所以面试百分百会问到

Go语言并发之通知退出机制的实现

《Go语言并发之通知退出机制的实现》本文主要介绍了Go语言并发之通知退出机制的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧... 目录1、通知退出机制1.1 进程/main函数退出1.2 通过channel退出1.3 通过cont