2023年年底的中央经济工作会议为2024年中国经济发展指明方向,其中,“科技创新”被列为明年经济工作“头号任务”。作为今年全球科技前沿的生成式预训练大模型(下称:大模型),在我国经历了怎样的“从追赶到并跑”的研发之路?明年又将如何走向商业化应用?


为此,新京报贝壳财经记者采访百川智能创始人、首席执行官王小川。在他看来,大模型是工业革命一样的变革,不仅将重塑现有行业,还将基于通用智能创造出前所未有的价值。大模型既是经济质的有效提升的催化剂,也是经济量合理增长的助推剂,将成为引领下一个经济增长周期的核心力量。“百川智能将持续加大在大模型基础技术上的投入,积极探索更多技术突破。还将更好地助力产业生态建设,推动国内大模型生态更丰富、更多元、更完善。”王小川说。


“过去一年面对大模型的飞速发展,中国公司经历了恐慌期、投入期和迭代期,到目前为止,在某些方面尤其是开源模型领域,我们的产品是能够替代国外产品的。”王小川说。在他看来,国内很多大模型在技术层面已经对齐了GPT-3.5(生成式预训练模型),今年中国公司将更多精力放在了模型本身,明年会开始在应用层面进行突破。


百川智能创始人、首席执行官王小川。图|受访者供图


对于用户期待的AI-native(人工智能原生)超级应用。王小川判断,这个应用不应该是新工具,而是新物种,是人类的伙伴,人类要接受它的缺点、优点。因此对超级应用的定义、方法论都应该有别于此前的要求。“我们在C端正在研发几款关键的超级应用,预计明年推出,主要针对健康、快乐、个人助理方向。”王小川透露。


对于提供面向企业级的服务,他认为让大模型的成本下降是前提。因此,应该从定制化逐渐走向产品化,“大模型+搜索增强”是他目前看好的方向,百川智能于近期推出的Baichuan2-Turbo系列API(应用程序编程接口)正是采用这个技术路径。


在他看来,有两个场景能在企业级服务领域集中发挥大模型无限供给能力,一个是有大量文本数据需要处理的,需要把文字的行业Know How(技术诀窍)进行归纳总结的场景。另一个是需要跟客户沟通,回答对方问题的,比如客服的场景。


本次大模型热潮是否会与2016年前后的人工智能热潮一样偃旗息鼓?“这次跟上次不一样,上一波由于模型能力不够通用,主要做图像处理。这带来两个问题:其一,大家都挤在同一个赛道,集中跑去做安防,不能赋能千行百业。其二,由于赛道很窄,每个项目都很重。现在美国证明大模型在很多行业都可以做,而且现在的实施成本会比2016年低很多,所以这一波我觉得是可行的。”王小川说。


王小川预计,未来能做ToB(面向企业级的)的参数较大的模型,同时还能做ToC(面向消费者)的超级应用公司不会有很多家,最后国内这样的玩家在五家左右。


新京报贝壳财经记者 白金蕾 编辑 王进雨 校对 刘军