没接触过深度学习同学或者是已经踏上工作岗位的同仁,我相信当中有很多人对这个技术感兴趣,但不知从何下手,深度学习相对于计算机视觉而言,属于入门很难的,需要长时间的积累,但是如果你的科研团队在这方面有着丰富的积累,那入门要比你一个人摸索来着快得多,当然,大部分人都没有这个条件,很可能一个小问题就能卡主很长的时间依然得不到解决,,,而我作为一个深度学习技术一线的研究人员,希望将这个技术介绍给各位感兴趣的同学们,一个是帮你们节省大量入门这项技术的时间以及正确入门,另一个是让你们有相应的基础知识来实现一些论文中的项目,或者是开发自己的一些应用。
也是考虑到很多的同学不熟悉linux操作系统,为避免大家陷入学习linux的困境之中,因而制作了这套基于windows的caffe学习教程。当然用linux系统的同学也无妨,只是一些命令上稍有不同,绝大多数内容是一样的。
整个课程提供了两个caffe的深度学习项目,一个是《人脸检测》另一个是《验证码识别》。课程中在vs2013下新建caffe工程,讲解了caffe的基本数据结构,带大家修改了caffe源码使之满足多标签的输入,并讲明其中修改的原理,帮助同学们更加深入的了解caffe的源码,也对caffe特征提取工具 extract_features.cpp 源码进行详细的讲解和简单的修改。
在《人脸检测》中我们采用了全卷积的神经网络,能够输入不固定大小的图片,且对于感受野的计算、特征图上点的坐标与原图的对应关系及计算进行了详细的讲解,这两个概念是很多人比较模糊的概念,往往影响到了后续论文的阅读,因而我们用专门的章节进行讲解。
《手写数字识别》与《人脸检测》都属于单标记问题,而很多的竞赛项目或者平时科研所需的项目要求都不仅仅是单标记的训练,因而我以《验证码识别》项目像大家展示了如何设计多标记的训练任务,在我们的《验证码识别》项目中,取得了100%的识别率,是个很有意思的项目,鼓励大家去尝试!
此外,有同学是机电专业或者金融专业的,数据往往是非图像数据,常常在问能否用caffe进行训练?显然是可以的,用hdf5格式即可,因而我也详细介绍了如何把图片/非图片数据转化为hdf5格式以便进行网络训练!