Inception模型和Residual模型卷积操作的keras实现

love6tao 2018-03-09 原文

Inception模型和Residual残差模型是卷积神经网络中对卷积升级的两个操作。

一、 Inception模型(by google)

这个模型的trick是将大卷积核变成小卷积核，将多个卷积核的运算结果进行连接，充分利用多尺度信息，这也体现了这篇文章的标题

Going Deeper with Convolutions。更加深的卷积操作。

废话不多说，上图

注意输入层在底部，输出层在顶部。废话不多说，上keras代码。

 1 from keras.layers import Conv2D, MaxPooling2D, Input
 2 
 3 input_img = Input(shape=(256, 256, 3))
 4 
 5 tower_1 = Conv2D(64, (1, 1), padding='same', activation='relu')(input_img)
 6 tower_1 = Conv2D(64, (3, 3), padding='same', activation='relu')(tower_1)
 7 
 8 tower_2 = Conv2D(64, (1, 1), padding='same', activation='relu')(input_img)
 9 tower_2 = Conv2D(64, (5, 5), padding='same', activation='relu')(tower_2)
10 
11 tower_3 = MaxPooling2D((3, 3), strides=(1, 1), padding='same')(input_img)
12 tower_3 = Conv2D(64, (1, 1), padding='same', activation='relu')(tower_3)
13 
14 output = keras.layers.concatenate([tower_1, tower_2, tower_3], axis=1)

最后的concatenate是核心，其实就是连接在一起，比如两列向量和两列向量，连接成四列向量即可。

二、  Residual模型(by microsoft)

    这个模型的trick是将进行了一种跨连接操作，将特征跨过一定的操作后在后面进行求和。这个意义一个是减轻梯度消失，
还有个目的其实让后续的卷积结果变得越来越强。DenseNet 其实也是这种思想。

    废话不多说，上图

从上图看，输出的结果就是X+F(X) 直接相加，逐个元素对应相加，而不是连接。F(X) 是什么呢？看下图

F(X)实际上就是一个或者多个卷积操作，非常简单直观。废话不多说，上keras代码。下面代码只演示了一个卷积操作。

1 from keras.layers import Conv2D, Input
2 
3 # input tensor for a 3-channel 256x256 image
4 x = Input(shape=(256, 256, 3))
5 # 3x3 conv with 3 output channels (same as input channels)
6 y = Conv2D(3, (3, 3), padding='same')(x)
7 # this returns x + y.
8 z = keras.layers.add([x, y])

以上，就是现在目前最最有效的两种卷积升级操作的keras实现。

参考文献：

Keras文档

版权声明：本文为love6tao原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://www.cnblogs.com/love6tao/p/8532661.html

Inception模型和Residual模型卷积操作的keras实现的更多相关文章

【论文笔记】Malware Detection with Deep Neural Network Using Process Behavior
【论文笔记】Malware Detection with Deep Neural Network Using […]...
深入浅出了解OCR识别票据原理
欢迎大家前往云加社区，获取更多腾讯海量技术实践干货哦~ 译者：Mr.Geek 本文翻译自dzone 中Ivan […]...
AD分类论文研读（1）
转移性学习对阿尔茨海默病分类的研究原文链接摘要将cv用于研究需要大量的训练图片，同时需要对深层网络的体系结 […]...
写给程序员的机器学习入门 (八) – 卷积神经网络 (CNN) – 图片分类和验证码识别
这一篇将会介绍卷积神经网络 (CNN)，CNN 模型非常适合用来进行图片相关的学习，例如图片分类和验证码识别， […]...
CNN 模型压缩与加速算法综述
本文由云+社区发表导语：卷积神经网络日益增长的深度和尺寸为深度学习在移动端的部署带来了巨大的挑战，CNN模型 […]...
【机器学习】彻底搞懂CNN
之前通过各种博客视频学习CNN，总是对参数啊原理啊什么的懵懵懂懂。。这次上课终于弄明白了，O(∩_∩)O~ 上 […]...
DenseNet 论文阅读笔记
Densely Connected Convolutional Networks 原文链接摘要研究表明，如 […]...
[论文阅读] Residual Attention(Multi-Label Recognition)
Residual Attention 文章: Residual Attention: A Simple but […]...

随机推荐

CSR、SSR、NSR、ESR傻傻分不清楚，一文帮你理清前端渲染方案！
01 引言随着前端系统的越发复杂，前端的性能也受到越来越多的重视。Google也不断在推进新的性能相关指 […]...
小米运动App数据提取 – 多吃骨头儿
小米运动App数据提取陆陆续续手头已经有好多小米的设备了。我用的是红米5，还买了小米手环3，还有一个小米体重 […]...
那些牛逼的采集站都是怎么生存的
采集，整个网站采集都没事，我之前做的站整站全是采集，现在活的也不错，至于网站就不放出来了，以免有AD嫌疑，方法 […]...
快速傅里叶变换(FFT)
数学——快速傅里叶变换(FFT) Shan xizeng 1. 基础知识快速傅里叶变换，用来求出两个多项式相 […]...
kubernetes 之QoS服务质量管理
系列目录在kubernetes中，每个POD都有个QoS标记，通过这个Qos标记来对POD进行服务质量管理。 […]...
核心交换机、汇聚交换机是什么
无论是小型的网络企业部署还是大型的数据中心网络部署，交换机都是必不可少的重要组成部分，它能把各线路的功能单元根 […]...
现代 JavaScript 框架存在的主要原因
简评：现代 JavaScript 框架的出现最主要是解决哪个问题？这篇文章很好的解释了这个问题。我见过许多人 […]...
证书透明化的工作原理
目录日志基本功能日志基本操作监视器和审计的基本操作典型系统配置其他系统配置译：How Certif […]...

展开目录

目录导航