C++卷积神经网络实例:tiny_cnn代码详解(4)——convolutional_layer类结构信息之成员变量与构造函数

本文主要是介绍C++卷积神经网络实例:tiny_cnn代码详解(4)——convolutional_layer类结构信息之成员变量与构造函数,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  在之前的博文中我们已经对tiny_cnn框架的整体类结构做了大致分析,阐明了各个类之间的继承依赖关系,在接下来的几篇博文中我们将分别对各个类进行更为详细的分析,明确其内部具体功能实现。在这篇博文中着重分析convolutional_layer类。convolutional_layer封装的是卷积神经网络中的卷积层网路结构,其在主程序中对应的初始化部分代码如下:

  可见在测试程序中我们构建了一个具有五层网络结构(不包括全连接层)的神经网络结构,这也正是LeNet-5的结构,在其中一共有三层为卷积层,因此可见卷积层在CNN中所起的重要中用,接下来就从“convolutional_layer<tan_h>(32, 32, 5, 1, 6)”这个代码入手对convolutional_layer类进行分析。首先给出convolutional_layer类的整体结构:

  一、成员变量

  convolutional_layer类一共有五个私有的成员变量,in_保存了输入数据矩阵的基本属性:行数、列数、维数;out_保存了输出特征矩阵的基本形式:函数、列数、维数;weight_保存了权重矩阵的基本形式。connection_保存了当前卷积层与上一层(下采样层)之间的连接关系,window_size_保存了当前层卷积核尺寸。

  这里有一点需要强调,in_、out_、weight_三个变量均是index3d<layer_size_t>形式,这里的index3d实际上指的是一个三元vector类型,其声明位于util.h文件中:

  所以index3d类型的变量能够保存三个数值信息,并能够在其内部做一些简要运算。

  二、构造函数

  在研究完类的成员变量之后,接下来需要分析其内部的函数实现形式,以求对这个类的功能以及相关结构有更好的理解。convolutional_layer类的成员函数大体上可以分为三部分:构造函数、层间连接构造函数、返回函数。其中构造函数承担了成员变量的初始化任务。

  2.1 构造函数的两种形式

  convolutional_layer类提供了两种构造函数的形式,一种是采用默认的连接方式,也就是和前一层的卷积输出进行全连接,定义如下:

  这里的connection_table()会返回一个默认的全零矩阵,然后init_connection()函数会将默认成员变量connection_初始化为全零矩阵,全零矩阵也就默认是全连接模式,这点稍后会给出详细分析。

  convolutional_layer的第二种构造函数需要人为指定与前一层的连接形式,具体如下:

  这里connection_table是由外部传入的、用户指定的连接矩阵,通过init_connection函数将其赋值给connection_。

  2.2 构造函数输入参数

  接来下对构造函数的参数以及与基类构造函数的继承关系进行分析。首先,convolutional_layer类在执行构造时一共需要以下几个参数: 

  in_width:输入图片宽度(矩阵行数);

  in_height:输入图片高度(矩阵列数);

  window_size:卷积窗口大小;

  in_channels:输入的模板数;

  out_channels:输出的模板数

  connection_table:矩阵的连接形式,可以默认生成也可以用户指定。

  由于convolutional_layer类是继承自partial_connected_layer类,因此在执行convolutional_layer构造函数的过程中,首先需要执行其基类partial_connected_layer类的构造函数:

partial_connected_layer<Activation>(in_width * in_height * in_channels, (in_width - window_size + 1) * (in_height - window_size + 1) * out_channels, sqr(window_size) * in_channels * out_channels, out_channels), 

  有关partial_connected_layer类的构造函数我会在介绍partial_connected_layer类的博文中专门进行分析,这里就先不做过多的表述,接下来需要分析的是在convolutional_layer的构造函数中是如何实现对其成员变量的初始化的,具体代码如下:

  (1)in_作为卷积层的输入参数,直接保存输入数据矩阵的尺寸以及通道数即可(单通道或者三通道);

  (2)out_作为卷积层的特征输出,由于存在滑动窗口卷积的缘故,导致其输出的特征矩阵的尺寸与输入的数据矩阵的尺寸不一致,具体值为“in_width - window_size + 1”和“in_height - window_size + 1”,并且输出的特征模板数量与指定的out_channels相当。

  (3)weight_作为卷积层的权重矩阵,其尺寸自然应当和卷积核的尺寸相当,至于个数,则为输入数据矩阵数量*输出特征模板数量,即每个映射核完成一个输入矩阵到一个输出矩阵之间的映射任务,这就是所谓的权值共享和感受野的概念。

  (4)connection_为卷积网络与前一层(下采样层)的连接形式矩阵,保存了表示连接与否标志位的矩阵,在LeNet-5网络中,第一个卷积层与输入层是全连接的,第二个卷积层和下采样层的连接情况如下所示:

  对应的,在MyTinyCnn的测试程序中给出了对应的定义:

  (5)window_size_保存了当前卷积层卷积核的尺寸,直接由用户指定即可。

  OK,这篇博客着重分析了convolutional_layer类中相关的成员变量和构造函数等信息,在下一篇博客中我们将着重对其中的成员函数进行分析,具体说明各个成员变量之间的初始化方式方法。

  三、注意事项

  1、类型别名问题

  在tiny_cnn中,作者通过typedef关键字定义了若干类型别名,位于util.h文件中:

  因此在分析代码的过程中若是遇到这些类型别名,只需知道其真实的类型即可。

  2、代码截图问题

  在这系列的博客中,我所分析的很多代码都是通过截图的方式来获得,这样做的原因有两个,一是这份tiny_cnn的工程文件大家都可以从网上下载得到,无需再粘贴源码;二是通过截图的方式能够方便对我想要强调的部分进行标记突出,便于大家理解,希望大家习惯这种代码截图的方式。不过这种方式也有一个缺点,就是会导致博文的图片过多,内容过长,大家勉强接受吧。



如果觉得这篇文章对您有所启发,欢迎关注我的公众号,我会尽可能积极和大家交流,谢谢。


这篇关于C++卷积神经网络实例:tiny_cnn代码详解(4)——convolutional_layer类结构信息之成员变量与构造函数的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1115497

相关文章

PHP轻松处理千万行数据的方法详解

《PHP轻松处理千万行数据的方法详解》说到处理大数据集,PHP通常不是第一个想到的语言,但如果你曾经需要处理数百万行数据而不让服务器崩溃或内存耗尽,你就会知道PHP用对了工具有多强大,下面小编就... 目录问题的本质php 中的数据流处理:为什么必不可少生成器:内存高效的迭代方式流量控制:避免系统过载一次性

C++右移运算符的一个小坑及解决

《C++右移运算符的一个小坑及解决》文章指出右移运算符处理负数时左侧补1导致死循环,与除法行为不同,强调需注意补码机制以正确统计二进制1的个数... 目录我遇到了这么一个www.chinasem.cn函数由此可以看到也很好理解总结我遇到了这么一个函数template<typename T>unsigned

C#实现千万数据秒级导入的代码

《C#实现千万数据秒级导入的代码》在实际开发中excel导入很常见,现代社会中很容易遇到大数据处理业务,所以本文我就给大家分享一下千万数据秒级导入怎么实现,文中有详细的代码示例供大家参考,需要的朋友可... 目录前言一、数据存储二、处理逻辑优化前代码处理逻辑优化后的代码总结前言在实际开发中excel导入很

SpringBoot+RustFS 实现文件切片极速上传的实例代码

《SpringBoot+RustFS实现文件切片极速上传的实例代码》本文介绍利用SpringBoot和RustFS构建高性能文件切片上传系统,实现大文件秒传、断点续传和分片上传等功能,具有一定的参考... 目录一、为什么选择 RustFS + SpringBoot?二、环境准备与部署2.1 安装 RustF

MySQL的JDBC编程详解

《MySQL的JDBC编程详解》:本文主要介绍MySQL的JDBC编程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录前言一、前置知识1. 引入依赖2. 认识 url二、JDBC 操作流程1. JDBC 的写操作2. JDBC 的读操作总结前言本文介绍了mysq

Python实现Excel批量样式修改器(附完整代码)

《Python实现Excel批量样式修改器(附完整代码)》这篇文章主要为大家详细介绍了如何使用Python实现一个Excel批量样式修改器,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一... 目录前言功能特性核心功能界面特性系统要求安装说明使用指南基本操作流程高级功能技术实现核心技术栈关键函

Redis 的 SUBSCRIBE命令详解

《Redis的SUBSCRIBE命令详解》Redis的SUBSCRIBE命令用于订阅一个或多个频道,以便接收发送到这些频道的消息,本文给大家介绍Redis的SUBSCRIBE命令,感兴趣的朋友跟随... 目录基本语法工作原理示例消息格式相关命令python 示例Redis 的 SUBSCRIBE 命令用于订

使用Python批量将.ncm格式的音频文件转换为.mp3格式的实战详解

《使用Python批量将.ncm格式的音频文件转换为.mp3格式的实战详解》本文详细介绍了如何使用Python通过ncmdump工具批量将.ncm音频转换为.mp3的步骤,包括安装、配置ffmpeg环... 目录1. 前言2. 安装 ncmdump3. 实现 .ncm 转 .mp34. 执行过程5. 执行结

Python中 try / except / else / finally 异常处理方法详解

《Python中try/except/else/finally异常处理方法详解》:本文主要介绍Python中try/except/else/finally异常处理方法的相关资料,涵... 目录1. 基本结构2. 各部分的作用tryexceptelsefinally3. 执行流程总结4. 常见用法(1)多个e

C++统计函数执行时间的最佳实践

《C++统计函数执行时间的最佳实践》在软件开发过程中,性能分析是优化程序的重要环节,了解函数的执行时间分布对于识别性能瓶颈至关重要,本文将分享一个C++函数执行时间统计工具,希望对大家有所帮助... 目录前言工具特性核心设计1. 数据结构设计2. 单例模式管理器3. RAII自动计时使用方法基本用法高级用法