Sora(OpenAI推出的文生视频大模型)火爆的当下,国内大模型企业如何追赶Sora,难点在哪儿?


360集团创始人周鸿祎近日在接受新京报贝壳财经记者采访时表示,Sora的技术路线如果被开源,国内将能很快赶上,但在追赶Sora时,算力有可能成为门槛,对此,集中国内所有AI企业的算力或许是方法之一。


360集团创始人周鸿祎。受访者供图


Sora确定了技术路线,但工程化思路仍需探索


Sora发布后,周鸿祎曾一连发了十多条视频谈论这一文生视频大模型,他认为Sora对物理世界的很多描述符合常识,符合人类对世界的认识,因此不能把Sora仅看作一个文生视频的工具,而要看到背后人工智能的发展。


对于Sora采用的技术,周鸿祎称目前Pika、Runway等文生视频公司可能只是使用了文生图模型的相关技术,但Sora将文生图模型技术与文生文模型技术结合了起来,因此才能达到令人惊叹的效果。


周鸿祎对贝壳财经记者表示,Sora所代表的技术路线出炉后,国外也有两条路线的斗争,一条是OpenAI(美国开放人工智能研究中心)的闭源,另一条是以Meta(Facebook脸书母公司)为代表的开源,“开源路线的目标就是要打破闭源,他们会不断去猜测闭源是怎么做的,最后再开源出来。开源出来的好处是,很多小公司和大公司的个人成员会积极地在开源项目中借鉴他人成果,同时再贡献自己的成果,其化学作用会非常明显。”


在他看来,一旦Sora的技术被开源出来,国内就能很快赶上。一个可供参考的事实是,一年前的今天ChatGPT(人工智能聊天机器人)冲击科技圈,而国内企业仅用了不到一年的时间就达到了GPT3.5的技术水平。


周鸿祎告诉贝壳财经记者,他跟很多AI(人工智能)专家有过交流,发现目前许多技术里用到的模型和算法都是公开的,他认为OpenAI最大的能力一个是找方向,另一个就是工程化思路非常严谨。因此,现在需要把工程化的思路探索出来,“此前大家学习ChatGPT的过程中,同样也是在方向已确定的情况下,解决‘具体一个坎怎么过’‘碰到一个山怎么翻’,踩很多坑,验证许多具体的方法,这需要时间。”


周鸿祎坦言,和美国相比,中国在AI技术上存在差距是客观事实,“尽管在刷榜的成绩里,国产大模型基本垄断了Top1到Top10,GPT-4都被刷到10名开外去了。但是Sora的问世还是给了我们一桶清醒的冷水。”


“我觉得OpenAI手里还有一些秘密武器没有亮出来,比如GPT-5,这个什么时候发布,完全取决于山姆·奥特曼(OpenAI首席执行官)的心情和他的节奏感。”周鸿祎预测。


面对与OpenAI的差距,周鸿祎认为只有正视差距,才能进行追赶。在他看来,中国企业在AI领域与头部企业的差距并没有想象的那么大,因为无论是Transformer模型还是Sora,本质上还是软件,所以这个差距在掌握方向之后,可能用一到两年的时间就可以解决。


Sora可能会生成更长视频,国内追赶应集中算力


周鸿祎同时认为,在追赶Sora方面,算力可能也是一个坎。


此前,有专家分析称,Sora的参数规模不大,约为30亿。对此周鸿祎持反对态度,“这就弄错了一个概念,视频的参数和文本的参数是不能简单做对比的,文本有10万字,视频只有640×480,它两个所占的存储量完全不在一个数量级上,所以Sora可能不仅有30亿参数。第二就算只有30亿参数,视频分析对算力的消耗应该是远远超过千亿模型的。所以,当现在国内显卡都被卡脖子之后,算力就可能会是一个问题。”


“Sora为什么只能做1分钟视频,我猜测因为它和4秒6秒有本质的差别,4秒和6秒是因为全部用像素来生成,没有这个世界的知识。4、6秒之后这个图怎么样?你就想不出来了。”周鸿祎猜测,Sora能生成一分钟的视频,就意味着也能生成10分钟、60分钟的视频,但是为什么不做呢?是由于算力和成本的限制。


同样,算力问题也出现在中国的AI行业中。对此,周鸿祎表示,他正在思考是否要提出如下建议,“目前,Meta已经有50万块GPU,明年可能会买百万块,微软应该也会按照百万级别去下订单。而国内的所有人工智能公司加在一起可能有50万块GPU,但都分散在各个公司里。”


他在考虑,是否能够把国内的GPU算力都集中起来,“我之所以最近一直在科普,是因为Sora不仅仅是一个文生视频的工具,如果是的话我们落后就落后了,无非是广告落后一点、电影拍得慢一点,这些落后除了可能对娱乐业造成影响外,不会影响大国竞争,但实际上Sora预示着AGI(通用人工智能)的一个关键节点,所以我认为这对国家很重要。”


AI对行业有正向的推动,需要科普教育


此外,周鸿祎也谈及了当前公众对AI可能“颠覆行业”的焦虑,以及由此引发的AI“卖课”现象和网友拿李一舟比作山姆·奥特曼引发的争议。


在他看来,即便存在诸多问题,李一舟还能卖那么多课,说明大家需要科普教育,“许多人谈到AI时是有恐惧的,比如AI会带来行业崩溃,但只要去用AI就会发现AI是人类最好的朋友和工具,它可以让人们解锁技能,比如用AI画画、做视频等。AI不会带来行业的崩溃,而是会对行业有正向的推动,一定要自己去用才能知道AI是什么。”


但周鸿祎认为,有时讲这些道理“没有用”,因为“现在只要一个摄像头,人就可以去网上讲话,别人也不知道谁对谁错”。在他看来,目前有两种观点,AI恐惧论和AI万能论,这两种观点都是不可取的。


周鸿祎表示,现在企业对AI普遍都比较向往,但不知道从何切入,特别是非AI企业和AI距离还比较远。企业应该首先建立AI信仰,这要分三步走。


第一步,企业先不要着急把AI和自己的业务做整合,而是先熟悉AI。“企业可以先搞一个私有化的通用大模型,这个模型不解决任何直接业务问题,但它具备通用大模型常见的能力,目的是让企业员工和领导先用上,进而去熟悉和了解大模型。”


第二步,企业在定制AI前,要把企业大数据平台升级为企业的知识平台。因为企业要训练AI,首先要有相应的知识,但是很多知识都属于“暗知识”,这些知识在外面互联网上是找不到的,只有企业才有,但也分散在不同员工的电脑、邮件和聊天记录里,要把这些“暗知识”全部汇总起来。


第三步,有了知识平台后,企业要在业务中选择几个小场景,然后先训练一些垂直小模型来跟业务结合,后面再逐渐把企业的业务用大模型进行赋能。在周鸿祎看来,“做这件事的过程,就是提升新质生产力的一个重要体现”。


在他看来,大模型一定要进入到千行百业,与具体业务和产品功能相结合,不仅要有大脑,还要有专业领域知识,就像长出了“手”和“脚”,在一些垂直领域,大模型的能力超过GPT-4完全是有可能的,“不需要大家都去开发大千亿万亿的模型,只做百亿规模的模型也很有价值,同时这样的成本企业也能够负担。”


新京报贝壳财经记者 罗亦丹

编辑 张冰 校对 杨许丽