新京报贝壳财经讯(记者王雨晨)2022年12月30日,由中国计算机学会语音对话与听觉专委会、中国中文信息学会语音专委会主办,得意音通与声纹圈联合承办的第3届声纹识别产业发展与创新研讨会在京召开,多位业内人士出席并以“让声纹成为生产力”为主题共同探讨了声纹识别产业现状及未来发展趋势。中国科学院院士、清华大学人工智能研究院创始院长、名誉院长张钹在会上致辞,他指出,人工智能产业如何做大做强,是目前所有人工智能产业创业者在创业过程中遇到的最大问题。

张钹表示,跟信息产业相比,人工智能产业的发展速度和发展过程更加曲折。信息产业是在信息科学技术的理论完全建立完成的基础上发展,在产业发展之前,基础理论就已经非常完善,只需沿着理论指引的方向发展产业。因此,信息产业建立的硬件和软件都是通用的,跟应用领域和应用场景没有关系。所以它的市场很大,不存在如何做大做强的问题。他认为,人工智能产业的曲折发展主要有以下两个原因:

一是目前人工智能的软硬件与应用场景和应用领域密切相关。比如,人工智能的“智能芯片”与计算机的芯片完全不同,是为特定的算法和特定的领域服务,是专用的,所以它不具备计算机硬件那样的通用性,因此会遇到如何扩大市场的问题。

二是人工智能缺乏理论基础,所以算法也好,模型也好,都具有很大的缺陷和局限性,这也对它的应用领域产生了很大的限制。而由于它的方法本身的限制,比如安全性、隐私保护等问题,使得人工智能的应用领域也受到限制。

对此,张钹也提出了两点意见。

首先,人工智能要往各种维度上去发展。以声纹或语音信息处理(speech informationprocessing)为例,语音本身就是一个很广的应用环境,因为不仅嗓子能发出声波,人在呼吸时或机器在工作过程中都会发出声波。从这个维度看,语音信息处理就不仅是语音或说话人识别,完全可以扩展到很多其他的应用领域。不仅可以用来做人的身份鉴别,也可以用来诊断人的疾病,诊断机器的毛病或者观察机器的运行过程等。

其次,人工智能要有维度上的扩展,这是针对算法本身局限性而提出的。机器学习的方法是运用大数据处理。而大数据的处理方法虽然有很多的优点也很实用,但它本身是不安全的,是跟数据密切相关的。“我们需要通过算法上缺陷的改进,也就是我们现在提出的发展第三代人工智能的思路来扩展它的应用范围。”张钹称,这包括数据与知识的结合、多特征的融合,多种模态的结合,软件和硬件的结合等等,目的都是针对目前算法本身的局限性。

张钹表示,人工智能的算法,特别是基于深度学习或者机器学习的算法,本身存在着不安全和不可解释等缺点。这些缺点如果不加以克服,它应用的场景就会受到很大限制,所以今天的讨论非常重要,也有很普遍的意义。在跟应用场景密切结合的基础上,去改进人工智能的算法,这样才有可能把人工智能的产业做大做强。


编辑 黄鑫宇 校对 柳宝庆