新京报贝壳财经讯(记者 罗亦丹)10月20日,讯飞输入法10周年沙龙活动在北京举行。科大讯飞消费者BG高级副总裁章继东在会上表示,讯飞输入法的日语音交互次数超过10亿次,语音输入累计服务设备超过5亿台,语音用户在市场上的占比超过70%。对于科大讯飞未来的发展方向,章继东对贝壳财经记者表示,希望使用人工智能技术帮助解决中国教育和医疗资源不均衡问题,此外美国的限制对科大讯飞“影响不大”。


活动现场,科大讯飞输入法业务部总经理程坤展示了讯飞输入法最新发布的10.0版本。这一版本搭载了“动态自适应编解码语音识别引擎”,新增唇形辅助输入,提高嘈杂环境及近距离多人说话的识别效果。


根据演示,如果有两个人交错说话,一般的语音识别难以辨识出单个人的声音,但科大讯飞唇形辅助可以通过摄像头拍摄讲话者的唇形,精确区分讲话者,并只录入讲话者自己的声音。


此外,科大讯飞邀请了相声表演艺术家、吉尼斯世界纪录普通话最快语速保持者方清平现场挑战讯飞输入法的快语速识别效果。根据现场公证员公布的数据显示,方清平成功挑战快语速朗读《木兰辞》,仅用17.81秒时间读出182字,而讯飞输入法全部准确识别并自动添加了标点。


会后采访环节,章继东对新京报贝壳财经记者表示,目前语音识别技术发展很快,接下来需要做好的是聚焦具体领域、聚焦场景,例如车载语音识别如何抗噪音等。


需要注意的是,作为一家人工智能企业,科大讯飞被美国列入了“实体清单”。对此,章继东表示,“目前语音识别技术已经发展到了深水区,中美人工智能技术的起步差不多,所以他们要遏制我们的发展。由于科大讯飞掌握的是源头核心技术,所以影响并不大。受到影响的只有部分芯片业务,在硬件的选择上,美国高通可能无法再进入科大讯飞的选择范围,但这只是降低了选择权而已,硬件上,科大讯飞有备货备料,业务上卡不了脖子。”


章继东告诉新京报贝壳财经记者,除了语音识别方面的人工智能外,科大讯飞最想做的是医疗与教育领域的人工智能发展。“中国的全科医生特别少,特别是乡村方面医疗资源匮乏,对此我们提供了一个叫做智医助理的工具,输入症状后,可以通过人工智能进行诊疗;而教育方面,我们做的讯飞智能学习机可以根据学生的学习情况推送相应的试题,形成个性化精准教学,给孩子肩负增效,不再频繁刷题。我们的想法是用技术去改变一个行业。”


此外,对于目前采用类似语音合成技术进行电销骚扰的“机器人骚扰电话”现象,章继东表示他已经关注到了这个问题,“根据我们掌握的技术,只要让一个人说十段话,就可以克隆此人的声音,我们有子公司使用这种技术研发了一款儿童玩具,父母输入自己的声音后,玩具就可以用父母的声音给孩子讲故事。但这个技术如果用在黑产上,那就坏了。技术本身是一个工具,用在什么场合上非常重要,正是基于这种顾虑,我们把该技术握在了自己的手上,不对外开放,我认为技术最重要的还是要做有意义有价值的东西。”


校对 李世辉