C++卷积神经网络实例:tiny_cnn代码详解(5)——convolutional_layer类结构信息之其他成员函数

本文主要是介绍C++卷积神经网络实例:tiny_cnn代码详解(5)——convolutional_layer类结构信息之其他成员函数,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  在上一篇博客中我们介绍了convolutional_layer类的基本结构及其成员变量、构造函数的相关信息,在这篇博文中我们对其中剩余的其他成员函数进行分析。首先把convolutional_layer类的结构图给出来:

  可见,convolutional_layer类除了构造函数之外,还有另外两部分成员函数,一部分负责定义当前卷积层与前一层之间的连接关系,另一部分则完成convolutional_layer类的剩余辅助功能,例如返回相关属性、将权重矩阵和输出矩阵转换为图像格式输出等等。

  一、层间连接规划函数

  这部分函数主要负责定义连接矩阵,来设计卷积层与前一层之间的连接关系,主要包含两个函数和一个结构体类型,接下来它们进行一一介绍。

  1.1 connection_table结构体

  connection_table结构体实际上就是层间连接矩阵的基本原型,主要功能就是根据传入的参数来构建指定的连接矩阵。这个结构体提供了两个构造函数。其中一个构造函数算是缺省构造函数,另一个需要外部传入连接矩阵和对应矩阵的行数和列数:

  第一个构造函数没啥可说的,就是默认生成一个空的连接矩阵(rows_ == 0 && cols_ == 0),另一个构造函数则本质上完成一个复制操作,通过标准库中的copy实现将用户自定义的连接矩阵传入connection_table内部:

        connection_table(const bool *ar, size_t rows, size_t cols) : connected_(rows * cols), rows_(rows), cols_(cols) {std::copy(ar, ar + rows * cols, connected_.begin());    //拷贝对应的连接标志位}

  此外connection_table结构体中还用另外两个成员函数is_connected()和is_empty()函数。is_connected()的函数体如下:

        bool is_connected(size_t x, size_t y) const                 {return is_empty() ? true : connected_[y * cols_ + x];   //这里空connection_table默认为全连接}

  is_connected()函数的功能是判断当前坐标(size_t x, size_t y)下的连接情况。举个例子,在主程序中我们人工定义了一个层间连接矩阵:

  这个连接是遵循LeNet-5中第二卷积层与前一层的连接形式,这是一个6行16列矩阵,说明前一层的输出特征矩阵有6个、本层的卷积模板有16个,矩阵中“0”代表连接,“X”代表不连接,接下来举例分析一下这个矩阵的实际意义。比如,矩阵的第1行第2列为“0”,说明前一层的第一个输出特征矩阵和本层的第一个卷积核模板是连接的;再举个例子,矩阵中的第5行第6列为“X”,说明前一层的第5个输出特征矩阵和本层的第6个卷积模板是不连接的,没错,这个连接矩阵就是这个含义。而is_connected()这个函数的作用就是根据前一层和本层的索引来读取连接矩阵中对应的值(true or false)。

  至于is_empty()函数,作用只有一个:判断当前矩阵是否为零阵:

        bool is_empty() const {return rows_ == 0 && cols_ == 0;}

  1.2 connect_kernel函数

  connect_kernel()函数的作用是初始化卷积层的卷积核参数:

  1.3 init_connection函数

  init_connection()是初始化该卷积层的映射参数,包括卷积核权重和偏置,其中初始化卷积核权重是通过调用connect_kernel()函数来实现,初始化加性偏置则直接通过代码实现:

  二、其他函数

  接下来针对convolutional_layer类中的剩余成员函数做一下扫尾工作,主要包含weight_to_image()函数和一些属性返回函数。

  2.1 weight_to_image函数

  这个函数的作用是将该层卷积层中的卷积核权重转换成图像形式进行可视化显示。之所以添加这个函数,是因为在实际实验中经常需要将中间卷积层的卷积核权重进行输出,来判断网络的收敛情况、学习进度,同时借助卷积核来对卷积神经网络的特征提取原理做一些深入性的研究。这个函数大致可以分为两部分,首先需要对图像填充,然后在进行转换,在转换过程中涉及到工程中自定义中的image.h模块,有关image模块会在后续的博文中进行详细讲解。

  2.2 属性返回函数

  convolutional_layer类的最后一个部分,属性返回函数,顾名思义,返回类成员属性:

  三、注意事项

  1、连接矩阵的本质属性

  在这里需要稍稍纠正一个说法问题,在上文中我们一直说“连接矩阵”,其实这里的连接矩阵本质上并不是Mat类型的矩阵,而是存储一系列布尔值的vector变量,具体上图:

  至于connection变量,在connection_table结构体的内部给出了更为直接的定义:

  2、is_connected()函数实现

  is_connected()函数虽然功能很简单,但是其实现起来还是有一点小麻烦,比如说其主要的功能实现部分的代码:

  故名思议,如果矩阵为零阵,返回ture,否则按索引值返回,问题是这里的connected_变量是一个vector而非中规中矩的二维矩阵,因此我们要通过人工定义的列数(cols_)来辅助完成定位(y * cols_ + x)。

  3、“0”代表连接、“X”代表不连接

  这通过一个宏定义来实现:

  4、卷积网路的基本属性

  这篇博文中提到了很多卷积神经网络中的专用术语,例如卷积核权重、加性偏执、全连接等等,有关卷积神经网络的基本原理可以参考之前我上传的一个牛人写的PPT,我当时读完之后,受益良多。



如果觉得这篇文章对您有所启发,欢迎关注我的公众号,我会尽可能积极和大家交流,谢谢。


这篇关于C++卷积神经网络实例:tiny_cnn代码详解(5)——convolutional_layer类结构信息之其他成员函数的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/1115498

相关文章

HTML5 搜索框Search Box详解

《HTML5搜索框SearchBox详解》HTML5的搜索框是一个强大的工具,能够有效提升用户体验,通过结合自动补全功能和适当的样式,可以创建出既美观又实用的搜索界面,这篇文章给大家介绍HTML5... html5 搜索框(Search Box)详解搜索框是一个用于输入查询内容的控件,通常用于网站或应用程

Python中help()和dir()函数的使用

《Python中help()和dir()函数的使用》我们经常需要查看某个对象(如模块、类、函数等)的属性和方法,Python提供了两个内置函数help()和dir(),它们可以帮助我们快速了解代... 目录1. 引言2. help() 函数2.1 作用2.2 使用方法2.3 示例(1) 查看内置函数的帮助(

Python实例题之pygame开发打飞机游戏实例代码

《Python实例题之pygame开发打飞机游戏实例代码》对于python的学习者,能够写出一个飞机大战的程序代码,是不是感觉到非常的开心,:本文主要介绍Python实例题之pygame开发打飞机... 目录题目pygame-aircraft-game使用 Pygame 开发的打飞机游戏脚本代码解释初始化部

Python中使用uv创建环境及原理举例详解

《Python中使用uv创建环境及原理举例详解》uv是Astral团队开发的高性能Python工具,整合包管理、虚拟环境、Python版本控制等功能,:本文主要介绍Python中使用uv创建环境及... 目录一、uv工具简介核心特点:二、安装uv1. 通过pip安装2. 通过脚本安装验证安装:配置镜像源(可

C++ 函数 strftime 和时间格式示例详解

《C++函数strftime和时间格式示例详解》strftime是C/C++标准库中用于格式化日期和时间的函数,定义在ctime头文件中,它将tm结构体中的时间信息转换为指定格式的字符串,是处理... 目录C++ 函数 strftipythonme 详解一、函数原型二、功能描述三、格式字符串说明四、返回值五

LiteFlow轻量级工作流引擎使用示例详解

《LiteFlow轻量级工作流引擎使用示例详解》:本文主要介绍LiteFlow是一个灵活、简洁且轻量的工作流引擎,适合用于中小型项目和微服务架构中的流程编排,本文给大家介绍LiteFlow轻量级工... 目录1. LiteFlow 主要特点2. 工作流定义方式3. LiteFlow 流程示例4. LiteF

CSS3中的字体及相关属性详解

《CSS3中的字体及相关属性详解》:本文主要介绍了CSS3中的字体及相关属性,详细内容请阅读本文,希望能对你有所帮助... 字体网页字体的三个来源:用户机器上安装的字体,放心使用。保存在第三方网站上的字体,例如Typekit和Google,可以link标签链接到你的页面上。保存在你自己Web服务器上的字

MySQL存储过程之循环遍历查询的结果集详解

《MySQL存储过程之循环遍历查询的结果集详解》:本文主要介绍MySQL存储过程之循环遍历查询的结果集,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录前言1. 表结构2. 存储过程3. 关于存储过程的SQL补充总结前言近来碰到这样一个问题:在生产上导入的数据发现

Java中Map.Entry()含义及方法使用代码

《Java中Map.Entry()含义及方法使用代码》:本文主要介绍Java中Map.Entry()含义及方法使用的相关资料,Map.Entry是Java中Map的静态内部接口,用于表示键值对,其... 目录前言 Map.Entry作用核心方法常见使用场景1. 遍历 Map 的所有键值对2. 直接修改 Ma

MyBatis ResultMap 的基本用法示例详解

《MyBatisResultMap的基本用法示例详解》在MyBatis中,resultMap用于定义数据库查询结果到Java对象属性的映射关系,本文给大家介绍MyBatisResultMap的基本... 目录MyBATis 中的 resultMap1. resultMap 的基本语法2. 简单的 resul