iPhone X的推出,不仅引爆了手机行业全面屏+人脸解锁的革新浪潮,也加速了图像识别尤其是人脸识别技术在各行各业的应用落地。
而这些应用浪潮背后,隐藏着多家计算机视觉技术公司,旷视科技是其中最显眼的一家。
旷视科技成立于2011年,是国内最早一批成立的计算机视觉技术创业公司。
支付宝刷脸登录以及刷脸取款而被大众熟知,而Face++开放云平台成为其明星产品。
近日,网易智能采访了旷视科技首席科学家孙剑博士,与他聊了聊计算机视觉技术的发展以及给行业带来的不断的变革。
作为计算机视觉领域的年轻大牛,孙剑拥有40余项国际或美国专利,曾是微软亚研院首席研究员,主要研究方向是计算摄影学、人脸识别和基于深度学习的图像理解。
据孙剑介绍,Face++人工智能开放平台提供的人脸识别应用技术已经趋于成熟,包括人脸检测、比对、搜索、属性、情绪识别、颜值评分、肤质检测等。除此之外,这个平台还上线了人体识别、文字识别以及通用图像识别,包括银行卡、驾照在内的图像都能得以实现。据悉,加入旷视一年多以来,孙剑领导旷视研究院主要研究图像分类、物体检测、语义分割和序列学习四个视觉理解核心问题。
除此之外,旷视科技针对多个热门行业推出了Face ID在线身份验证服务,包括金融、出行、直播,甚至是目前手机人脸识别的应用。
据悉,在三星和苹果手机引入人脸解锁之后,国内厂商也快速跟进,其中小米和vivo两家厂商在手机上使用的人脸识别技术就是由旷视科技提供的。
不过,与苹果iPhone X使用3D传感器和红外传感器不同,小米和vivo用的是普通的RGB前置摄像头来进行解锁,用户甚至通过软件升级就可以使用。孙剑坦言,iPhone X的人脸识别方案确实比RGB的方案要好,可以在黑暗中解锁,而且安全性更高,但缺点是iPhone X的方案成本太高,产能上有很大的不确定性,目前还很难在手机中普及。
孙剑认为,任何技术没有绝对地安全,就手机产品来说,指纹识别也有不安全的地方。“这个取决于安全和应用性之间的平衡,”孙剑说,我们目前的人脸识别,在一定的应用环境中时候安全的,而并不是说所有的情况。
其实,目前的人脸识别技术距离成熟还有一段距离,比如说在人脸感知方面还有待提升等等。在孙剑看来,接下来的人脸识别需要从以下两方面取得突破:
一方面是硬件上的突破,要努力研发人脸识别新的传感器,它们不仅能够在光下感知,而且还能用深度摄像头和红外感知,这就突破了光照的影响。
另一方面是软件的突破,当你有一个巨大的数据库的时候,就可以不断的把性能提高。比如在非正常光照、侧脸/局部脸的数据上多做数据训练等等。
针对于目前很多企业开始做AI芯片的事情,孙剑在采访中透露,旷视科技也正在开发自由的FPGA芯片,它是一种可编程的芯片,可以将自家的神经网络算法放上去。“是否会做定制芯片,取决于这个应用的量是否能达到百万级。”孙剑补充到。
另外,旷视科技还开发了一款FPGA智能相机,叫做MegEye-C3S。据孙剑介绍,这是一款智能人像抓拍机,1080P全画幅,可以做到每秒30帧抓取。
据悉,旷视科技还自建了一个深度学习框架,孙剑称,这个框架内部叫Brain++,除了深度学习核心训练引擎之外,还有数据流入、GPU管理、模型发布等整套流水线过程,“Brain++是我们做计算机视觉的核心发动机。”孙剑说。
孙剑认为,对技术公司来说,行业的泡沫还没有来到。他的理由是,市场上80%的变革其实用的是现有的技术,一些新兴公司向利用AI等新技术会推翻传统公司,但是除了技术创新之外,还有很多其他方面需要跟进。