计算机视觉领域的商业化肉搏战愈演愈烈。

  去年该领域 AI创业公司的融资竞赛还历历在目,今天,两家计算机视觉独角兽又有新动作:

  专注于计算机视觉和深度学习技术的人工智能公司商汤科技宣布完成6亿美元C轮战略融资,再次刷新全球人工智能领域单轮融资纪录。本轮融资由阿里巴巴领投,苏宁、淡马锡等跟投,商汤科技在零售领域想必会有更多落地。

  人脸识别云服务平台旷视科技(face ++)全资收购艾瑞思机器人 (Ares robot),正式涉足智能机器人业务,考虑到富士康2016年参投了旷视C轮融资,仓储物流领域的 AI 应用可能将是旷视下一步的方向。

  不难看出,两家公司都在积极探索更多技术落地场景。

  不久前,iiMedia Research(艾媒咨询)发布数据显示,2017年中国计算机视觉市场规模为68亿元,预计2020年市场规模达到780亿元,年均复合增长率达125.5%。而在全球范围上,据Tractica预测,到2025年全球计算机视觉软件、硬件和服务收入将从2016年的11亿美元增长到262亿美元。

  百亿级的蛋糕吸引着创业公司蜂拥而入,计算机视觉商业落地全面开花。但究竟哪些是真痛点、哪些是伪需求?继去年的军备竞争后,场景化成为计算机视觉 AI 公司新焦点。

  “四大神兽”与“八大金刚”

  根据IT桔子数据,国内人工智能产业中,计算机视觉与图像领域的公司数量已达111家,仅次于自然语言处理类公司,位居第二。

  而在这111家公司中,又以“四大神兽”、“八大金刚”最为著名。

  “四大神兽”指的是国内计算机视觉领域四个独角兽:商汤科技、旷视科技、云从科技以及依图科技,“八大金刚”则是在此基础上增加云天励飞、深醒科技、格灵深瞳和纵目科技。

  去年下半年,上述4家独角兽掀起计算机视觉领域一场声势浩大的军备竞赛:

  2017年7月,商汤科技宣布完成4.1亿美元B轮融资,创下当时全球人工智能领域单轮融资最高纪录。

  而就三个月后,这一纪录旋即被旷视科技打破——2017年10月,旷视科技宣布获得4.6亿美元C 轮融资,刷新世界范围内AI 领域单轮融资最高纪录。今天,这一纪录再次被刷新,商汤科技重得桂冠。

  2017年11月,云从科技完成B轮5亿元人民币融资,加上此前广州市政府对云从科技的20亿政府资金支持,此次总计获得25亿元发展资金。

  相比上述三家竞争对手,依图科技显得有些低调。有消息传出,依图科技近期低调完成新一轮融资,红杉、高瓴、高榕等前几轮投资方均有跟投,公司整体估值已经破150亿人民币。

  至此,计算机视觉四大独角兽弹药上膛,集结完毕。

  旷视科技创始人印奇此前接受采访时称:“2018年会是行业整合的一年,输赢到2018年结束时候就能够看得很清楚。”

  计算机视觉的商业化抢位战,开始了。

  

  人脸识别:AI视觉的重点角逐区

  国人对人脸识别的兴趣一向浓厚,刷脸支付、刷脸安检、刷脸考勤甚至公共厕所刷脸取厕纸……每次当传统行为被冠上“刷脸”二字,就能在社交媒体上引起狂欢。不久前,深圳交警联合动态人像识别AI 公司云天励飞在十字路口的大屏幕上显示乱穿马路者头像与身份信息,再次在微博刷屏霸榜。

  而根据 IT桔子的数据,人脸识别确实是人工智能视觉与图像领域中最热门的应用,也是上述八家创业公司的重点角逐区。

  其中,我们最常见到的就是1:1等级的人脸识别,实现的是最初级的“证明你是你”。从字面上就可以看出,1:1是用户提前上传个人照片储存于系统中,每次验证时,线下拍照与系统中存储的照片信息进行对比,进而确定“你是不是你”。

  举个例子,我们在车站过安检时,检票员拿着你的身份证跟你本人做对比,证明你是不是身份证上的本人,这种场景就是1:1的场景。而在 AI 领域,1:1人脸识别重点应用在手机端和金融领域。手机解锁、刷脸支付以及各种互联网金融开户等,这都是1:1人脸识别的应用场景。同其他方式相比,1:1识别准确率高,对算力的要求也相对较低。

  

  据旷视科技吴文昊判断,世界上60%的摄像头用在手机上面,手机端的视觉识别势必是兵家必争之地。

  在手机端方面,商汤目前为 vivo 及 OPPO 提供人脸解锁方案。vivo X20 旗舰版使用了商汤科技的 Face Wak e面部识别,0.1秒即可便捷解锁。

  而旷视则吞下了 vivo 的海外市场。据媒体报道,vivo 在印度地区发售的手机上应用的人类解锁技术来自旷视科技,此外,旷视科技还是华为、小米手机的人类解锁方案提供商。

  从“证明你是你”到“找出你是谁”

  在具体的应用场景中,除了1:1,还有难度更大的1:N、N:N两种级别的人脸识别。

  1:N的人脸识别算法则主要用于人脸检索,“证明你是谁”。与1:1的一一对照不同,1:N需要一张照片同系统中的海量照片进行对比,根据相似度排列出多个对比结果。而排在第一顺位的结果,未必准确。

  1:N人脸识别算法主要应用在安防领域,如用于排查犯罪嫌疑人、寻找走失儿童等。很显然,这比1:1的人脸识别难度更大。

  专注于动态人像识别的云天励飞在2015年开始就与深圳龙岗区警方合作,在当地地铁口、火车站、城中村、商超等场所建设“深目”系统。上线几个月后,便协助警方成功告破两起命案。据云天励飞产品方案总监程冰介绍,这套云天深目动态人像平台已在深圳、北京、上海、杭州、新疆等落地。

  

  安防已经是人工智能创业公司竞争红海,云天励飞也在积极探索安防之外的新场景。据介绍,云天励飞正在打造云天慧眼产品,与深圳南山区、上海区进行合作建设智慧社区,基于人脸大数据分析,进行流动人口管理,并对独居老人等特殊家庭进行关爱、预警。此外,云天慧眼还可用于商业防损,如在大型商超内识别有偷窃前科的进入者,并向工作人员预警。

  应用在安防领域的1:N人脸识别,其特点是动态和非配合。所谓动态,即系统识别的不是图片,而是摄像头采集的视频。非配合是指识别对象不用感知到摄像头的位置并配合完成识别工作,识别对象处于被动状态。

  同1:1识别相比,使用地点、环境、光线、采集角度甚至是玻璃反射都会影响1:N识别的准确度,所以1:N相对更具有挑战性。

  至于N:N人脸识别,实际上相当于同时进行多个1:N识别,用于“证明谁是谁”。

  在这其中横亘在计算机识别面前的还有不少难点:光线条件差、角度不同、信息模糊或变形都有可能造成识别误差,此外,人脸遮盖物、帽子、胡须、发型、整容或者PS等也会干扰识别。这是在1:N级别的识别中,必须被扫除的障碍。

  人脸识别的应用要根据技术的成熟度结合具体落地场景。一位投资人向寻找中国创客(ID:xjbmaker)表示:“我更看好一些对效果要求不那么高的场景,比如消费、娱乐。”

  但显然,对于众多“粮草”充足的人工智能视觉公司来说,1:N级别的高效识别是一道不低的门槛,在这个领域的商业化,也是计算机视觉佼佼者们取胜的良机。

  记者 | 蔡浩爽