2023年年底的中央经济工作会议为2024年中国经济发展指明方向，其中，“科技创新”被列为明年经济工作“头号任务”。作为今年全球科技前沿的生成式预训练大模型（下称：大模型），在我国经历了怎样的“从追赶到并跑”的研发之路？明年又将如何走向商业化应用？

为此，新京报贝壳财经记者采访百川智能创始人、首席执行官王小川。在他看来，大模型是工业革命一样的变革，不仅将重塑现有行业，还将基于通用智能创造出前所未有的价值。大模型既是经济质的有效提升的催化剂，也是经济量合理增长的助推剂，将成为引领下一个经济增长周期的核心力量。“百川智能将持续加大在大模型基础技术上的投入，积极探索更多技术突破。还将更好地助力产业生态建设，推动国内大模型生态更丰富、更多元、更完善。”王小川说。

“过去一年面对大模型的飞速发展，中国公司经历了恐慌期、投入期和迭代期，到目前为止，在某些方面尤其是开源模型领域，我们的产品是能够替代国外产品的。”王小川说。在他看来，国内很多大模型在技术层面已经对齐了GPT-3.5（生成式预训练模型），今年中国公司将更多精力放在了模型本身，明年会开始在应用层面进行突破。

百川智能创始人、首席执行官王小川。图|受访者供图

对于用户期待的AI-native（人工智能原生）超级应用。王小川判断，这个应用不应该是新工具，而是新物种，是人类的伙伴，人类要接受它的缺点、优点。因此对超级应用的定义、方法论都应该有别于此前的要求。“我们在C端正在研发几款关键的超级应用，预计明年推出，主要针对健康、快乐、个人助理方向。”王小川透露。

对于提供面向企业级的服务，他认为让大模型的成本下降是前提。因此，应该从定制化逐渐走向产品化，“大模型+搜索增强”是他目前看好的方向，百川智能于近期推出的Baichuan2-Turbo系列API（应用程序编程接口）正是采用这个技术路径。

在他看来，有两个场景能在企业级服务领域集中发挥大模型无限供给能力，一个是有大量文本数据需要处理的，需要把文字的行业Know How（技术诀窍）进行归纳总结的场景。另一个是需要跟客户沟通，回答对方问题的，比如客服的场景。

本次大模型热潮是否会与2016年前后的人工智能热潮一样偃旗息鼓？“这次跟上次不一样，上一波由于模型能力不够通用，主要做图像处理。这带来两个问题：其一，大家都挤在同一个赛道，集中跑去做安防，不能赋能千行百业。其二，由于赛道很窄，每个项目都很重。现在美国证明大模型在很多行业都可以做，而且现在的实施成本会比2016年低很多，所以这一波我觉得是可行的。”王小川说。

王小川预计，未来能做ToB（面向企业级的）的参数较大的模型，同时还能做ToC（面向消费者）的超级应用公司不会有很多家，最后国内这样的玩家在五家左右。

新京报贝壳财经记者白金蕾编辑王进雨校对刘军

点赞 +1

微博

微信