caffe+opencv3.3dnn模块完成手写数字图片识别

messier 2017-12-07 原文

最近由于项目需要用到caffe，学习了下caffe的用法，在使用过程中也是遇到了些问题，通过上网搜索和问老师的方法解决了，在此记录下过程，方便以后查看，也希望能为和我一样的新手们提供帮助。
顺带附上老师写的教程

安装Caffe并运行Mnist例程

我主要参考了这篇教程：Mac极简安装Caffe并训练MNIST。然后进行了examples文件夹里的Mnist的训练，期间并没有碰到什么问题。

将图片转换为LMDB文件

Mnist中已经给出了现成的LMDB数据文件，在实际项目中，需要我们将图片文件转换为LMDB文件。可以参考下examples里的imagenet，里面的readme写了完整的过程，也可以参考上面贴的教程。在这里就不复述了，主要说下注意点：
转换文件只要参考imagenet的create_imagenet.sh并更改相应路径即可，如下：

set -e
#生成的lmdb文件夹位置
EXAMPLE=examples/myMnistTest
#train.txt和val.txt位置
DATA=examples/myMnistTest/MNIST_Dataset
#tools文件夹位置,写相对位置的话要在caffe根目录运行
TOOLS=build/tools
#train图片位置
TRAIN_DATA_ROOT=/Users/messier/caffe/examples/myMnistTest/MNIST_Dataset/train_images/
#val图片位置
VAL_DATA_ROOT=/Users/messier/caffe/examples/myMnistTest/MNIST_Dataset/train_images/

# Set RESIZE=true to resize the images to 256x256. Leave as false if images have
# already been resized using another tool.
#这边写成false，我写了true结果生成了10个多GB的lmdb...不过训练出来的模型还是能用的
RESIZE=true
if $RESIZE; then
  RESIZE_HEIGHT=256
  RESIZE_WIDTH=256
else
  RESIZE_HEIGHT=0
  RESIZE_WIDTH=0

开始训练

这一步之前可以选择进行计算图像均值的操作。然后去mnist文件夹中把之前用到过的prototxt拿过来，更改路径，按之前的操作进行即可。
要注意的是，没进行过均值操作的话，要把所有的mean_pixel注释掉。

在opencv中调用训练好的模型

opencv3.3中将dnn模块从contrib中提到了主仓库中，可以直接调用caffe训练好的模型，且不需要任意依赖。
这里我主要参考了opencv中一个用caffe模型识别航空飞机的sample。
稍加修改即可。
首先要把几个文件的路径改下，如下：

    String modelTxt = "lenet_deploy.prototxt";
    String modelBin = "_iter_6714.caffemodel";
    String imageFile = (argc > 1) ? argv[1] : "3_00715.jpg";

需要注意的是，当时训练用的模型文件不能在这里直接用了，要把输入和输出改下，如下：

更改输入
原来：

name: "LeNet"
layer {
  name: "mnist"
  type: "Data"
  top: "data"
  top: "label"
  include {
    phase: TRAIN
  }
  transform_param {
    scale: 0.00390625
  }
  data_param {
    source: "./train_lmdb"
    batch_size: 64
    backend: LMDB
  }
}

更改为：

name: "LeNet"
input: "data"
input_dim: 1    #每次输入图片数
input_dim: 1    #channels
input_dim: 256  #width
input_dim: 256  #height

2.更改输出：
原来：

layer {
  name: "loss"
  type: "SoftmaxWithLoss"
  bottom: "ip2"
  bottom: "label"
  top: "loss"
}

更改为：

layer {
name: "prob"
type: "Softmax"
bottom: "ip2"
top: "prob"
}

在这里推荐下老师告诉我的caffe网络可视化工具Netscope
看下更改前后的网络：

更改后

最后程序运行结果如下：

之后有空了我会把代码和模型文件整理下发上来。

本文链接：http://www.cnblogs.com/messier/p/7997951.html

caffe+opencv3.3dnn模块完成手写数字图片识别的更多相关文章

Caffe 深度学习框架上手教程 – xueyoo

Caffe 深度学习框架上手教程 Caffe是一个清晰而高效的深度学习框架，本文详细介绍了caffe的优势、架 […]...

Caffe: gflag编译出现问题汇总

1. 使用Unicode字符集：出现问题 E:\CodeBase\ML\Caffe\ThirdPartySr […]...

Caffe 初识，揭开面纱

这一段时间把caffe官网上的例子跑了一下，对caffe有了一个大概的了解。如果你想对caffe有个比较清晰的 […]...

caffe中是如何运用protobuf构建神经网络的？

caffe这个框架设计的比较小巧精妙，它采用了protobuf来作为交互的媒介，避免了繁重的去设计各个语言的 […]...

Caffe源码理解3：Layer基类与template method设计模式

目录写在前面 template method设计模式 Layer 基类 Layer成员变量构造与析构 Se […]...

caffe中Makefile.config详解

## Refer to http://caffe.berkeleyvision.org/installatio […]...

[caffe] caffe训练tricks

404...

Caffe 深度学习框架上手教程

本文来源：http://suanfazu.com/t/caffe/281 本文的主要目的保存一个链接，建议阅读 […]...

随机推荐

企业级LNMP架构搭建实例基于Centos6.x

1.1 部署LNMP架构说明 1.1.1 LNMP架构内容　　01.部署linux系统　　02.部署ngi […]...

【LeetCode】23.合并K个排序链表

题目描述 23.合并K个排序链表合并k个排序链表，返回合并后的排序链表。请分析和描述算法的复杂度。示例： […]...

特征多项式

特征多项式与常系数线性齐次递推一般来说，这个东西是用来优化能用矩阵乘法优化的递推式子的。通常，这种递推式子 […]...

使用强大的DBPack处理分布式事务（PHP使用教程）

主流的分布式事务的处理方案近些年，随着微服务的广泛使用，业务对系统的分布式事务处理能力的要求越来越高。早期的基于XA协议的二阶段提交方案，将分布式事务的处理放在数据库驱动层，实现了对业务的无侵入，但是对数据的锁定时间很长，性能较低。...

页面的修改、添加，以及验证控件的常见应用

1.1. 同一页面，既实现修改，又需要添加 1) 根据ID参数，查询修改对象：对象=BLL. […]...

常用资源发布 – 明永成

常用资源发布 Address Taghttp://www.51goodjob.com.cn/TechManua […]...

Maven配置和创建一个Maven项目

Maven的好处： maven的两大核心： **依赖管理:对jar包管理过程 **项目构建：项目在编码完成后， […]...

【朝花夕拾】Android性能篇之（一）序言及JVM

android性能优化问题一直是android开发者遇到的难点之一。性能优化包含的内容广而且比较深，内存的分配 […]...

caffe+opencv3.3dnn模块完成手写数字图片识别

安装Caffe并运行Mnist例程

将图片转换为LMDB文件

开始训练

在opencv中调用训练好的模型