常见的神经网络模型 AlexNet,VGGNet,GoogleNet,resNet,inceptionV3,Inception-v4,xception等论文下载链接

本文主要是介绍常见的神经网络模型 AlexNet,VGGNet,GoogleNet,resNet,inceptionV3,Inception-v4,xception等论文下载链接,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

LeNet 1986
AlexNet 2012 http://pan.baidu.com/s/1NpEG2,作者:Alex Krizhevsky,Ilya Sutskever,Geoffrey E.Hinton

VGGNet 2014 https://arxiv.org/pdf/1409.1556.pdf 6.8% test error,作者:Karen Simonyan,Andrew Zisserman

GoogleNet(inception v1) 2014 http://arxiv.org/pdf/1409.4842v1.pdf Going Deeper with Convolutions, 6.67% test error
作者:Christian Szegedy,Wei Liu,Yangqing Jia,Pierre Sermanet,Scott Reed,Dragomir Anguelov,Dumitru Erhan,Vincent Vanhoucke,Andrew Rabinovich

resNet 2015 https://arxiv.org/pdf/1512.03385.pdf 3.6% test error,作者:Kaiming He, Xiangyu Zhang,Shaoqing Ren,Jian Sun

inception V2-V3 2015 http://arxiv.org/abs/1512.00567 3.6% test error
作者:Christian Szegedy,Vincent Vanhoucke,Sergey Ioffe,Jonathon Shlens

BN layer https://arxiv.org/pdf/1502.03167.pdf 4.8% test error,作者:bn Sergey Ioffe,Christian Szegedy

Inception-v4, Inception-ResNet 2016 http://arxiv.org/abs/1602.07261 3.08% test error
作者:Christian Szegedy,Sergey Ioffe,Vincent Vanhoucke

xception 2017 https://arxiv.org/pdf/1610.02357.pdf 94.5% acc,作者:Francois Chollet

denseNet 2017(best) https://arxiv.org/abs/1608.06993 5.29% test error
MobileNet 2017 https://arxiv.org/pdf/1704.04861.pdf top1 70.6%
NasNet 2018 https://arxiv.org/abs/1707.07012 top1 82.7% top 5 96.2
SqueezeNet 2016 http://arxiv.org/abs/1602.07360 top1 60.4% top5 82.5%
FCN 2016 https://arxiv.org/abs/1605.06211 解决end-to-end image semantic segmentation
DCN 2017 https://arxiv.org/abs/1703.06211 可变形卷积

Object Detection
RCNN 2013 http://arxiv.org/abs/1311.2524
SPPNet 2014 https://arxiv.org/abs/1406.4729v2
fast RCNN 2015 https://arxiv.org/abs/1504.08083
faster RCNN 2015 https://arxiv.org/abs/1506.01497
YOLO 2015 https://arxiv.org/abs/1506.02640
SSD 2015 https://arxiv.org/abs/1512.02325
YOLO9000 2016 https://arxiv.org/abs/1612.08242
R-FCN 2016 https://arxiv.org/abs/1605.06409
Deformable-ConvNets 2017 https://arxiv.org/abs/1703.06211
Mask R-CNN 2017 https://arxiv.org/abs/1703.06870
FPN(Feature Pyramid Networks for Object Detection) 2017 https://arxiv.org/abs/1612.03144 对不同卷积层进行融合merge

GAN对抗生成网络
GAN 2014 https://arxiv.org/abs/1406.2661
DCGAN 2015 http://arxiv.org/abs/1511.06434
LSGAN 2016 https://arxiv.org/abs/1611.04076
WGAN 2017 https://arxiv.org/abs/1701.07875
WGAN-GP https://arxiv.org/abs/1704.00028 improved wgan
BEGAN https://arxiv.org/abs/1703.10717

词向量
word2vec,固定的词向量,词与词的距离关系
2013,Efficient Estimation of Word Representations in Vector Space,https://arxiv.org/abs/1301.3781 ,ICLR
2013,Distributed Representations of Words and Phrases and their Compositionality. https://arxiv.org/abs/1310.4546,NIPS

ELMo,动态的词向量,相同的词在不同的语境词向量不同
2018,Deep contextualized word representations https://arxiv.org/abs/1802.05365

BERT,从词向量变成了词向量+句向量+位置向量
2018 BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding https://arxiv.org/abs/1810.04805

attention
2014 Recurrent Models of Visual Attention https://arxiv.org/abs/1406.6247 从图片的识别方式开始引出attention,但不是真正的attention
2014 Neural Machine Translation by Jointly Learning to Align and Translate https://arxiv.org/abs/1409.0473 在NLP中第一个使用attention机制,Tensorflow中有BahdanauAttention
2015 Effective Approaches to Attention-based Neural Machine Translation https://arxiv.org/abs/1508.04025 Tensorflow中有LuongAttention
2017 Attention Is All You Need https://arxiv.org/abs/1706.03762 transformer中的self_attention,encode_decode_attention

这篇关于常见的神经网络模型 AlexNet,VGGNet,GoogleNet,resNet,inceptionV3,Inception-v4,xception等论文下载链接的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1030062

相关文章

python常见环境管理工具超全解析

《python常见环境管理工具超全解析》在Python开发中,管理多个项目及其依赖项通常是一个挑战,下面:本文主要介绍python常见环境管理工具的相关资料,文中通过代码介绍的非常详细,需要的朋友... 目录1. conda2. pip3. uvuv 工具自动创建和管理环境的特点4. setup.py5.

Python pip下载包及所有依赖到指定文件夹的步骤说明

《Pythonpip下载包及所有依赖到指定文件夹的步骤说明》为了方便开发和部署,我们常常需要将Python项目所依赖的第三方包导出到本地文件夹中,:本文主要介绍Pythonpip下载包及所有依... 目录步骤说明命令格式示例参数说明离线安装方法注意事项总结要使用pip下载包及其所有依赖到指定文件夹,请按照以

java中long的一些常见用法

《java中long的一些常见用法》在Java中,long是一种基本数据类型,用于表示长整型数值,接下来通过本文给大家介绍java中long的一些常见用法,感兴趣的朋友一起看看吧... 在Java中,long是一种基本数据类型,用于表示长整型数值。它的取值范围比int更大,从-922337203685477

详解Linux中常见环境变量的特点与设置

《详解Linux中常见环境变量的特点与设置》环境变量是操作系统和用户设置的一些动态键值对,为运行的程序提供配置信息,理解环境变量对于系统管理、软件开发都很重要,下面小编就为大家详细介绍一下吧... 目录前言一、环境变量的概念二、常见的环境变量三、环境变量特点及其相关指令3.1 环境变量的全局性3.2、环境变

Java中常见队列举例详解(非线程安全)

《Java中常见队列举例详解(非线程安全)》队列用于模拟队列这种数据结构,队列通常是指先进先出的容器,:本文主要介绍Java中常见队列(非线程安全)的相关资料,文中通过代码介绍的非常详细,需要的朋... 目录一.队列定义 二.常见接口 三.常见实现类3.1 ArrayDeque3.1.1 实现原理3.1.2

MyBatis设计SQL返回布尔值(Boolean)的常见方法

《MyBatis设计SQL返回布尔值(Boolean)的常见方法》这篇文章主要为大家详细介绍了MyBatis设计SQL返回布尔值(Boolean)的几种常见方法,文中的示例代码讲解详细,感兴趣的小伙伴... 目录方案一:使用COUNT查询存在性(推荐)方案二:条件表达式直接返回布尔方案三:存在性检查(EXI

Python struct.unpack() 用法及常见错误详解

《Pythonstruct.unpack()用法及常见错误详解》struct.unpack()是Python中用于将二进制数据(字节序列)解析为Python数据类型的函数,通常与struct.pa... 目录一、函数语法二、格式字符串详解三、使用示例示例 1:解析整数和浮点数示例 2:解析字符串示例 3:解

详解如何使用Python从零开始构建文本统计模型

《详解如何使用Python从零开始构建文本统计模型》在自然语言处理领域,词汇表构建是文本预处理的关键环节,本文通过Python代码实践,演示如何从原始文本中提取多尺度特征,并通过动态调整机制构建更精确... 目录一、项目背景与核心思想二、核心代码解析1. 数据加载与预处理2. 多尺度字符统计3. 统计结果可

SpringBoot整合Sa-Token实现RBAC权限模型的过程解析

《SpringBoot整合Sa-Token实现RBAC权限模型的过程解析》:本文主要介绍SpringBoot整合Sa-Token实现RBAC权限模型的过程解析,本文给大家介绍的非常详细,对大家的学... 目录前言一、基础概念1.1 RBAC模型核心概念1.2 Sa-Token核心功能1.3 环境准备二、表结

MySQL查看表的最后一个ID的常见方法

《MySQL查看表的最后一个ID的常见方法》在使用MySQL数据库时,我们经常会遇到需要查看表中最后一个id值的场景,无论是为了调试、数据分析还是其他用途,了解如何快速获取最后一个id都是非常实用的技... 目录背景介绍方法一:使用MAX()函数示例代码解释适用场景方法二:按id降序排序并取第一条示例代码解