新京报贝壳财经讯(记者许诺)2月9日,中国知名人工智能企业旷视科技研究院基础科研负责人张祥雨在接受新京报贝壳财经记者采访时表示,ChatGPT背后的关键技术底座是生成式大模型。人工智能作为新一轮科技革命和产业变革的核心力量,正从底层推动着社会生产力的提升。

张祥雨表示,人工智能会在未来几年更快速地发展和应用,并从两个方向改变我们的世界。一是“AI in Digital”(数字世界中的AI),即以 AIGC(人工智能生产内容)为代表的技术浪潮,通过重构内容生产力,让数字世界发生变革。二是“AI in Physical”(物理世界中的AI),即以特斯拉为代表的企业,通过构建不同形态的机器人载体,对物理世界进行改造。而ChatGPT在底层数据、核心技术、用户体验等各方面都可以说是里程碑式的AI产品。

张祥雨指出,ChatGPT的核心技术是 AI语言大模型,关键是如何让AI模型具备逻辑推理能力,以及如何让 AI学习全互联网的知识。ChatGPT基本都做到了,因此在决策和知识这个环节有了很大的突破。但是它基本上是没有跟物理世界发生关系,包括输入和输出。“我们会发现,人类在物理世界的生存能力和基础运动能力,看似简单,其实经过漫长的进化,底层机制是更难被破解的。某种意义上来说,是一种更难学习的智能。”张祥雨指出。

而在谈到旷视科技自身在生成式大模型方面的投入时,张祥雨表示,模型设计能力是旷视研究院多年以来积累的核心能力。旷视研究院的核心科研成果包括AI生产力平台Brain++、开源深度学习框架旷视天元等多项技术和产品。随着预训练大模型技术在近几年的快速成熟,旷视研究院围绕通用图像大模型、视频理解大模型、计算摄影大模型和自动驾驶感知大模型四个方向积极布局,并取得了多项突破。未来,旷视研究院还会继续坚定投入生成式大模型的研发,把底层技术研究更多应用在自动驾驶、机器人这样的复杂决策领域。

编辑 岳彩周
校对 卢茜