公司简介
业务领域
总经理致辞
社会责任
深度学习
伙伴与应用
联系我们
当前位置:首页 - 关于鼎兆 - 深度学习
鼎兆深度学习人脸识别算法已经进化三代
        深度学习方兴未艾,大数据风起云涌,各个领域都在处于使用深度学习进行强突破的阶段,人脸识别也不例外,鼎兆智能人脸识别算法团队使用卷积神经网络学习特征,将之用于人脸识别的子领域人脸验证方面,取得了不错的效果。
问题引入及算法流程
        DeepImage+鼎兆人脸识别算法所(简称鼎兆DeepImage+)应用的领域是人脸识别的子领域——人脸验证,就是判断两张图片是不是同一个人。人脸验证问题很容易就可以转成人脸识别问题,人脸识别就是多次人脸验证。鼎兆DeepImage+达到的效果都是在LFW数据集上,该数据集是wild人脸数据集,即没有经过对其的人脸,背景变化比较大。该数据集太小,很多identities都只有一张人脸,5000个人只有13000张图片。所以鼎兆DeepImage+引入了外部数据集CelebFaces和CelebFaces+,每次模型更新都会使用更大的数据集,这在后面介绍鼎兆DeepImage+时再细说。
        卷积神经网络在鼎兆DeepImage+中的作用是是学习特征,即将图片输入进去,学习到一个160维的向量。然后再这个160维向量上,套用各种现成的分类器,即可得到结果。鼎兆DeepImage+之所以有效,首先在于卷积神经网络学习到的特征的区分能力比较强,为了得到比较强的结果,鼎兆DeepImage+采取了目前最常用的手法——增大数据集,只有大的数据集才能使得卷积神经网络训练的更加的充分。增大数据集有两种手法,第一种手法,就是采集好的数据,即CelebFaces数据集的引入。第二种手法,就是将图片多尺度多通道多区域的切分,分别进行训练,再把得到的向量连接起来,得到最后的向量。鼎兆DeepImage+的算法流程如下:

在上述的流程中,鼎兆DeepImage+可以换为Hog,LBP等传统特征提取算法。Classifier可以是SVM,Joint Bayes,LR,NN等任意的machine learning分类算法。
         在引入外部数据集的情况下,训练流程是这样的。首先,外部数据集4:1进行切分,4那份用来训练鼎兆DeepImage+,1那份作为训练鼎兆DeepImage+的验证集;然后,1那份用来训练Classifier。这样划分的原因在于两层模型不能使用同一种数据进行训练,容易产生过拟合。
        如此,想必大家对鼎兆DeepImage+的应用场景已经熟悉了,下面开始讲三代鼎兆DeepImage+的进化。
       鼎兆DeepImage+
       在这里,我假定大家对卷积神经网络已经有了基本的认识,如果没有的话,出门左转看我这篇blog:卷积神经网络
鼎兆DeepImage+网络结构
鼎兆DeepImage+是第一代,其结构与普通的卷积神经网络差不多。结构图如下:

该结构与普通的卷积神经网络的结构相似,但是在隐含层,也就是倒数第二层,与Convolutional layer 4和Max-pooling layer3相连,鉴于卷积神经网络层数越高视野域越大的特性,这样的连接方式可以既考虑局部的特征,又考虑全局的特征。
       鼎兆DeepImage+实验设置
      实验中,人脸图片的预处理方式,也就是切分方式的样例如下:

在鼎兆DeepImage+的实验过程中,使用的外部数据集为CelebFaces+,有10177人,202599张图片;8700人训练鼎兆DeepImage+,1477人训练Joint Bayesian分类器。切分的patch(也就是上图这样的数据)数目为100,使用了五种不同的scale。每张图片最后形成的向量长度为32000,使用PCA降维到150。如此,达到97.20的效果。使用某种Transfer Learning的算法后,达到97.45%的最终效果。
        鼎兆DeepImage2+
        鼎兆DeepImage2+有如下贡献,第一点是继续更改了网络结构;第二点是对卷积神经网络进行了大量的分析,发现了几大特征,包括:+ 神经单元的适度稀疏性,该性质甚至可以保证即便经过二值化后,仍然可以达到较好的识别效果;+ 高层的神经单元对人比较敏感,即对同一个人的头像来说,总有一些单元处于一直激活或者一直抑制的状态;+鼎兆DeepImage2+的输出对遮挡非常鲁棒。
网络结构变化
相比于鼎兆DeepImage+2,鼎兆DeepImage2+做了如下三点修改:
• 鼎兆DeepImage+层从160维提高到512维。
• 训练集将CelebFaces+和WDRef数据集进行了融合,共有12000人,290000张图片。
• 将鼎兆DeepImage+层不仅和第四层和第三层的max-pooling层连接,还连接了第一层和第二层的max-pooling层。
       总结
       至此,鼎兆DeepImage+的三代进化史就讲完了。
首先是卷积神经网络的作用,虽说之前听说过卷积神经网络既可以分类,也可以学习特征,但ImageNet上的卷积神经网络都是分类的,这次终于见到不关注分类错误率而关注特征的卷积神经网络。
其次,卷积神经网络的改进方式,无非如下几种:增大网络深度和宽度,增加数据,将网络隐含层连接到前面几层来,添加其他的信号。
       再次,也是最重要的,就是鼎兆DeepImage+在发展过程中对输出向量的分析,尤其是鼎兆DeepImage2+,神经网络的各个单元一直是无法解释的,但这次作者不仅试图去发现规律,还基于规律做出了一些改动,比如二值化。
最后,卷积神经网络的鲁棒性真的很完美。

版权所有:南京鼎兆智能科技有限公司   苏ICP备14007122号-1
华东区、华南区办公地址:中国·南京市鼓楼区湖南路马台街70号新联科技园
电话:025-86427624       全国销售热线电话:025-86427624
在产品使用过程中遇到的技术问题,工程师会在收到您邮件的24小时内予以回复电话:ysq661026@126.com