成果名称: | 视觉大数据的深度分析与挖掘技术研究与产业化 |
完成单位: | 中国科学院深圳先进技术研究院、香港中文大学 |
主要人员: | 乔宇、汤晓鸥、李志锋、王晓刚、陈世峰、Chen Change Loy、黄韡林 |
介绍: | 项目团队以深度学习方法作为主要工具,在海量复杂视觉信息的表示方法与识别术领域取得多项进展。主要研究内容包括一下几个方面: 1、在复杂场景下的人脸和文字检测方法研究方面:1)研究了复杂场景下人脸的检测方法,场景中文字的检测与识别方法。在人脸检测领域提出了MTCNN方法,在文本检测领域提出了CTPN方法。2)在文本检测技术方面, 针对文本具有序列的性质,我们设计了一种网络Connectionist Text Proposal Network (CTPN)去检测文本。通过修改RPN, 使RPN可以精确地定位文本行。因其能直接从特征图上检测最终的文本组件,不需要额外的CNN去进一步处理,因此本方法速度较快。 2、在场景的识别与理解方法研究方面:我们研究开发了面向复杂多类别场景图像的分类方法。我们的方法在ImageNet15场景分类任务中取得第二,在LSUN16场景分类任务中取得第一。 3、在人像识别方法方面:1)我们提出了聚集惩罚函数(Center Loss)来进行联合监督,该方法在数据著名数据集LFW和YTF上进行测试,在仅仅70万训练数据的情况下,我们的单模型识别效果在LFW数据库上超过了99.2,在YTF数据库上超过了94%。而其他人方法则需要通过大量的训练数据或者多模型融合,如Google的2亿数据和DeepID2+的25个模型。2)在跨年龄人脸识别方面,我们提出了一种基于隐因子引导的卷积神经网络(Latent Factor Guided Convolutional Neural Networks, 简称 LF-CNNs),在世界知名数据集Morph Album 2、FG-Net等上取得国际领先的结果。 |
批准登记号: | 粤科成登(2)字【2018】0151 |
登记日期: | 2018-04-16 |
研究起止时间: | 2015.01 至2017.08 |
所属行业: | 信息传输、软件和信息技术服务业 |
所属高新技术类别: | 电子信息 |
评价单位名称: | 广东省科技厅 |
评价日期: | 2017.12.20 |