“百模大战”激战正酣。


今年以来,生成式大模型的热火越烧越旺,国内的企业以及科研机构纷纷下场,3月百度“文心一言”拉开序幕,4月阿里云“通义千问”、复旦大学“MOSS”、360“360智脑”上线。与此同时,科大讯飞、商汤等AI(人工智能)公司相继入局,百川智能等因大模型而创立的公司也开始涌现。据不完全统计,截至目前国内发布的大模型数量已经超过了230家。


8月31日,首批通过备案的生成式人工智能大模型开始陆续面向公众开放,当大模型正式进入应用阶段,此时此刻,究竟是如英伟达创始人黄仁勋所说,人类社会已经迎来了人工智能的“iPhone时刻”,还是未来会证明这只是一个“泡沫”,当风口退却潮水退去,盲目跟风投入大模型的公司才知道自己是在裸泳?


目前大模型“含金量”如何?

大多数还谈不上真正意义的创新


目前为止,国内究竟发布了多少家大模型?这一点众说纷纭,但大模型数量破百已经成为行业共识。


5月28日,中国科学技术信息研究所所长赵志耕在中关村论坛上发布《中国人工智能大模型地图研究报告》时表示,据不完全统计国内已经发布了79个大模型,从地区来看北京和广东最多。而7月,据腾讯研究院副秘书长杨望调研分析,目前国内的大模型数量已增加至116个,优刻得CEO季昕华则在2023世界人工智能大会上称,中国已有130家研发大模型的公司。


另一方面,有越来越多的大模型选择开源,7月19日,Meta联手微软宣布,继人工智能大模型LLaMA开源后,LLaMA 2正式开源商用。9月25日,阿里云开源通义千问140亿参数模型Qwen1B及其对话模型Qwen-14B-Chat,免费可商用。


多个大模型的开源意味着,想要入局“百模大战”,似乎技术并不是问题。


“现在外面许多公开发布的大模型,真正拥有自研创新技术的可能不超过十家。”9月25日,一位负责为企业提供大模型落地服务的科研院所AI从业者告诉贝壳财经记者,“如果要买大模型,只需要把我们的模型‘拷贝走’就行。”


在她看来,汹涌而来的大模型热潮中,企业客户的大模型能否具备差异性,核心点在于企业自身的数据质量,以及基于此对大模型进行的微调。


在采访中,多位企业家、专家都认为大模型本身的存在已经不再稀奇,这或许就是“百模大战”之所以能够出现的原因,在这一形势下,怎样能够“用好”大模型就相当考验智慧。


创新工场执行董事暨前沿科技基金总经理任博冰告诉贝壳财经记者,虽然当前多家企业在投入建设大模型基座,但是“百模大战”最终胜出的将是几家头部公司,包括巨头、初创公司等在内的技术产品都出类拔萃者。对于AI初创企业来说,应用层、中间层的创业机会更多。


在他看来,“百模大战”里面有很多的大模型技术,基本都是企业自己用或者给行业里面其他人用。“‘百模大战’并不是只有巨头才有入场券的比赛,大战的结果很可能是巨头、初创企业中屈指可数的技术产品领域的领先者。”


印象研究院负责人常诚对贝壳财经记者表示,在大语言模型的基础算法早已开源的今天,GPT4之所以能够做到当前的高度,并非在模型方面掌握了多少“独家秘籍”,而是在模型训练过程和训练数据整理加工等多方面的多年经验积累,“这些经验中涉及的技巧是从大量失败的实验中堆积出来的。”


被《时代周刊》评为“全球百大AI人物”之一的中国科学院自动化研究所研究员曾毅在接受贝壳财经记者采访时表示,国内目前绝大多数大模型还谈不上真正意义的创新,绝大多数的努力还是在工程优化方面。因此,未来在提升基础模型应对复杂问题的泛化性方面,要真正做到数据规模能耗更小,却表现出更高的智能,在模型算法结构和体系上实现协同创新,而不仅仅是提升用户体验,还需要一系列努力。


为什么要做大模型?

在交互方面的优势无可比拟


“我们从去年年底就开始关注ChatGPT(OpenAI研发的一款聊天机器人程序),我们发现,大模型和我们的研发路线以及在我们需要解决的一些产品问题上,有非常多的契合之处。”9月21日,容联云AI研究院院长刘杰告诉贝壳财经记者。


刘杰表示,大模型技术的落地实际上并不复杂,“大模型的技术方案是比较清晰的,但里面有一些技术细节,包括我们使用什么规格的模型,如何实现并行的多机多卡训练,以及需要多少数据、什么样的数据,以及数据的质量等工程细节上,我们花了比较多的时间。其中,一些技术细节需要反复摸索和调试。再之后,如何把大模型和具体的业务场景结合起来,进行更好的匹配,是我们后半段需要着力解决的。”


“这一波大模型为什么这么火?因为它确实实用,大模型在交互方面的优势无可比拟,这一点ChatGPT已经证明。此外,上一代人工智能,如计算机视觉在落地方面成本很高,需要装摄像头、软硬件都要做,并不好落地,相比之下大模型在多个行业都有落地的场景。”上述AI从业者表示。


她告诉贝壳财经记者,另一个国内企业必须研发自己大模型的理由是,国外能够开源的大模型“肯定不会是最好的”,要求不高的业务可以承担,但难以更进一步,此外其还存在可能的数据安全问题。


在刘杰看来,大模型技术确实可以转化成生产力,“大模型可以对企业原先就有的AI能力进行升级,如更高图像识别的精确度以及更好的文本生成,大模型具备了很好的基础知识和能力,可以在很少的数据训练上就适用新场景新业务。我们拥有AI大模型后,很多以前做得不够好,无法在产品中落地的一些能力已经可以实现落地了,比如灵活的问答和上下文理解。在业务逻辑上,我们不断深入AI能力和业务的紧密耦合,最后要实现一个真正AI原生的智能化产品。”


对于当前“百模大战”的行业现状,刘杰认为,竞争态势既然存在就有一定的合理性,“一项技术或某个商业模式在步入完全成熟期之前,大家可能对其抱有比较好的预期,希望在战略上抢得先机,所以切入到里面进行各种角度的探索。事实上,从AI技术发展的角度,如果没有谷歌和微软等从不同角度探索技术架构,可能也看不到现在的AI大模型,所以‘兄弟爬山,各自努力’,从不同的山坡向山顶进发,探索不同的方向也是有意义的。”


为何产品纷纷接入大模型?

处在AI产品爆发的“前夜”


贝壳财经记者注意到,截至目前,已经有多家公司在自己的产品中接入了大模型的能力。


9月26日,贝壳财经记者在打开百度搜索主页时,发现搜索框下面的最左侧已经不是“网页”选项,取而代之的是“AI对话”,点击进入后可以切入“AI助手”界面,直接向大模型提问,记者发现,如果进入“AI助手中心”,用户甚至可以和AI进行“高清写实图片”创作或“模拟恋爱体验”,其中前者有128.2万人使用,后者有12万人使用。


8月22日,钉钉总裁叶军公布了钉钉全面智能化的最新进展:已有17条产品线、55个场景全面接入大模型,完成智能化再造;钉钉同时面向生态伙伴和客户开放智能化底座AI PaaS(平台即服务),表示将“用大模型帮助生态把产品重新做一遍。”而早在4个月前,叶军就在北京展示了钉钉接入大模型后的一系列功能,包括使用AI生成推广文案、使用绘图方式创建应用、在视频会议中生成摘要等。


印象笔记也是悄然上线大模型能力的产品之一,早在4月21日,贝壳财经记者就发现,可以通过该App的“新建超级笔记”功能,使用AI进行文档的总结、续写、翻译等。在交互设计方面,AI的不少功能指明了具体场景,如“写作文”、“采访问题”等。


“我们不希望用户把大语言模型当做一个事实核查的知识库系统,因为它本质上是一个统计模型,我们更应该把大模型当做一个推理工具,如果你要写一个采访稿,大模型可以胜任单步推理,但对于特别专业的问题,用户应该至少能判断结果的质量,不能单纯指望语言模型完全替代用户本身。当然,我们也会持续调优印象AI模型。”印象笔记董事长、CEO唐毅告诉贝壳财经记者。


多个采访对象表示,目前,我们还处在AI产品爆发的“前夜”,也许目前生成式大模型已经开始改变人们的生活,但这一切都是悄然发生的,就如同iPhone出现后智能手机的普及过程一样。值得注意的是,8月31日首批通过备案的生成式人工智能大模型开始陆续面向公众开放后,不少大模型的访问量整体上升。


根据方正证券发布的研报,百度文心一言、讯飞星火和商汤商量在8月底可以观察到一波访问量的上升,主要由于政策批准大模型商用化落地。百度文心一言流量上升最为明显,可能由于百度在搜索引擎上的流量优势,具体来看,“文心一言及讯飞星火在页面浏览量上明显多于其他三家厂商,同时注意到商汤商量的平均访问停留时长更长,主要由于商汤大模型编程、图片生成、模型预标注等功能吸引更多专业使用者。字节豆包的页面浏览量和平均访问停留时长一度冲高,但是其后出现下滑。”


百度9月22日发布的首份《文心一言用户使用报告》显示,其最大的用户群体是一线、超一线城市的中青年打工人,占比最高的两大行业是IT互联网和教育,最高频的三大使用场景是知识问答、文本创作和代码能力,并且一天24小时每一分钟都有人向文心一言提问。从行业分布上来看,IT互联网、教育、社会公共管理、医药卫生、能源采矿化工、金融保险、日化百货等七大行业占比超5成,其中IT互联网和教育行业用户占比最高,每4名用户中会有1名工程师、老师。


目前,一些数据已经可以粗略展现出不同大模型在未来可能存在的差异。根据方正证券研报数据,从受众兴趣云图来看,讯飞星火、文心一言、字节豆包、通义千问在新闻及资讯、门户、检索等方面有较高的用户使用兴趣。字节豆包有较大比重是在书签栏、互联网、电视剧等偏兴趣的领域。商汤商量的用户兴趣中包含产品经理、数据库,互联网工具、云计算等,可以看出以工作为目的的用户相对较多。


大模型将如何改变社会?

将引领一场新工业革命


今年以来,大模型之所以火热,是因为有越来越多的观点认为,大模型将在根本上改变现有的行业和主流产品,正如英伟达创始人黄仁勋所说,就像当年iPhone的出现改变了手机市场一样,AI也已经来到了属于它的“iPhone时刻”。


创新工场董事长、首席执行官李开复也是该观点的赞同者之一,早在今年3月,创新工场就将“Project AI 2.0”(AI2.0项目)挂到了官网首页,并表示将在全球范围寻找具有 AI 大模型、语言生成模型、Multi-modality等领域能力的优秀技术人和研究员。


李开复在中关村论坛上表示,大模型改革的不仅仅是人工智能,还将让公司与公司之间产生平台式的巨大差距,脱颖而出的必是“没有AI大模型就不成立”的公司,即“AI first”。在他看来,AI大模型是绝对不能错过的历史机遇,它将是有史以来最大的平台,比windows和安卓的作用大10倍,它将改写每个应用,重构人类工作,将人的聪明才智放大10倍或更多,取代很多重复性劳动。


对此,任博冰表示,“我们把AI 2.0生态分为基础模型层、中间层(工具层)和应用层,相对而言,应用层、中间层创业机会更多。AI 2.0的平台生态一旦搭建起来,市场规模将比Windows、安卓等时代大十倍。我个人是PC时代出生的,在当时的互联网时代以及之后的移动互联网时代,接触新东西的能力还行,但是现在很多孩子是在AI时代出生的,他们的教育模式、择业观都需要革新,但好消息是,孩子们接受新事物的能力会强很多。AI 2.0的创业者在应用端也可以大胆琢磨研发一些关注更年轻一代需求的新应用。”


9月25日,360方面在给贝壳财经记者的采访回复中表示,大模型不是风口和泡沫,作为新一代的生产力工具,大模型将引领一场新工业革命,赋能产业数字化发展。未来也不会只有一个大模型,而是会像数据库一样,变成每个数字化系统的标配。


360方面认为,当前国家的重要战略之一是产业数字化,因此,中国发展大模型也要抓住产业机会,赋能百行千业,推动产业数字化向智能化升级,迈向数字化的顶峰。然而,通用大模型在企业级场景中无法直接使用,存在缺乏商业深度、不“懂”企业、数据安全隐患等六大问题。因此,大模型未来的发展趋势是“垂直化”,这也将成为中国在全球大模型技术竞争格局中的另一条突破路径。


“目前,大模型是一个可以把人的能力放大的一个工具,就如同互联网是一个很好的提供信息的工具,大模型是一个很好的智能化工具,它可以帮助我们处理信息,和外部世界进行实际的交互和响应,拥有很多的应用场景。它能表现得如何,根本上取决于使用工具的人和所在的场景,在相当长的一段时间里,行业仍然要聚焦如何研发和设计大模型的能力,再以合理的成本应用到合适的场景上去。”刘杰说。


新京报贝壳财经记者 罗亦丹

编辑 张冰 校对 贾宁