▲7月7日,华为技术有限公司在华为开发者大会2023上正式发布人工智能(AI)大模型华为云盘古大模型3.0。图/新华社


2023世界人工智能大会上,算力成为人工智能尤其是大模型发展的关键词之一。多位与会专家表示,随着大模型的发展,中国的算力已经成为一个越来越稀缺的资源。


实际上,大模型非常依赖庞大的算力与网络资源支持,而算力的核心又是人工智能芯片。


例如,ChatGPT的训练是基于微软为OpenAI打造的人工智能超级计算机,支撑其算力基础设施需要上万颗高性能芯片。据报道,该超级计算机拥有28.5万个高性能CPU核心、1万个GPU和400GB/s的GPU服务器网络传输带宽。


在大模型所引发的人工智能新技术热潮背后,算力在推进大模型能力和数字经济发展中,正发挥着越来越重要的作用。


智能算力需求迎来井喷的同时,相关城市该怎么加强智算中心(人工智能计算中心)建设?中小企业怎样能低成本获得算力支持?大模型出现对“东数西算”工程的算力建设有着怎样的影响?就这些问题,新京报新京智库采访了多位业内专家学者。


智算中心建设要采取正确策略


2020年4月,国家发改委将人工智能纳入新基建范围,算法、数据、算力是人工智能发展的“三驾马车”,尤其是算力更是人工智能基础设施核心组成部分,重要性日益凸显。


中国工程院院士郑纬民曾撰文指出,算力即生产力,算力能够推动经济发展方式变革。据埃森哲和经济学前沿公司分析,预计到2035年,AI将推动我国GDP增长21%。由此可见,算力将成为智能经济的发动机。


从国内城市来看,头部城市在算力综合实力上依然占据优势。


国际数据公司(IDC)在《2022全球计算力指数评估报告》中指出,中国的算力产业规模和多样性目前正持续高速增长,2018年-2022年,北京、杭州、深圳的算力规模位居全国前三。


以北京为例,近年来,北京持续加码人工智能算力基础设施布局。今年年初,北京首个人工智能计算中心——北京昇腾人工智能计算中心正式成立,落地中关村门头沟园。


新京报新京智库注意到,在此之前,门头沟区政府与华为、中发展等企业合作,聚焦算力基础设施,启动人工智能计算中心(智算中心)建设。


中国电子商务专家服务中心副主任郭涛曾对外表示,当下智算中心的发展正处于快速上升阶段,各地都掀起了项目建设运营高潮,全国已有超过30个城市正在建设或提出建设智算中心,同时一些城市的智算中心已经投入运营或即将投入运营。


全国政协委员、中国科学院计算所研究员张云泉在接受新京报新京智库采访时表示,智算中心有四个方面的优势。一是可以提供普惠算力和招商引资。二是可以打通大数据平行部门之间的分割,进行数据集中存储,保障数据安全。三是可以打通“政产学研用”的产业链,防止技术和产业的分割融合创新。四是智算中心一般都采用最新的制冷技术,就是用液冷技术PUE( 数据中心总能耗/IT设备能耗)低于1.1。


“正是因为智算中心有这四个好处,所以很多地方,尤其是比较发达的城市,都会优先上智算中心。因为智算中心对城市来说是人工智能产业发展的底座,它能推动整个人工智能产业链的发展,对当地的GDP的发展,人工智能产业的发展都会有很大的推动作用,是个很好的抓手。”张云泉说。


不过,张云泉也指出,对于城市来说,智算中心建设要选择成熟的技术路线。“今年上半年大模型的出现,导致前期投入智算中心的城市出现了一个分化。之前储备较多英伟达GPU A100的城市,在这一波大模型浪潮中就有明显的优势。”


张云泉表示,一个城市布局智算中心一定要注意技术路线的选择,要有前瞻性,之前选择国际上先进的主流的成熟技术,尤其是生态比较好的技术的城市,在产业推动上就取得了良好的效果。


不过,选择国际先进技术也面临国外“卡脖子”的风险。对此,张云泉认为可以采取“柔和”的策略。在前期可以先采取以国外先进技术为主,然后混合部分国产技术,拉动国产技术的发展,然后再逐渐进行国产化替代。


“这是一条比较理性的路径,千万不要过激,不能全盘是西方的东西,也不能全盘是国产的东西,这个度要把握好。”张云泉说。


大模型促进算力需求向西部转移


有观点认为,在目前中国整体算力分布上,东部算力规模仍远高于中西部地区,但依然无法满足日益增长的算力需求。


为了缓解区域算力资源紧张问题,相关部门牵头实施了“东数西算”工程,把东部密集的算力需求有序引导到西部,使数据要素跨域流动。这样既缓解了东部能源紧张的问题,也给西部开辟一条发展新路。


2022年3月,国家发改委、中央网信办等四部门联合印发通知,同意在京津冀、长三角、内蒙古等八地启动建设国家算力枢纽节点。


随着大模型的出现,对算力提出了更高的要求。中山大学管理学院副教授韦立坚在接受新京报新京智库采访时表示,ChatGPT需要用CPU和GPT融合的人工智能超级计算机来训练,对于GPU的性能和高速互联带宽要求特别高。目前的国内数据中心的设备大多数基于CPU或者一些普通GPU,难以满足大语言模型训练要求,急需进行升级。


“包括已有的‘东数西算’一体化算力服务平台,其所调度的算力,目前以传统的云计算以及部分高性能计算为主,缺少大规模高速互联的GPU集群。”韦立坚说。


对于算力存在的缺口,华南理工大学计算机学院院长陈俊龙也表示了同样的观点,他告诉新京报新京智库,随着大模型在各个领域和场景的广泛应用,对算力的需求将呈现高速增长态势。


中国工程院院士郑纬民今年在第三届中国IDC行业DISCOVERY大会上指出,预计到2025年,我国AI算力总量将超过1800EFLOPS(EFLOPS,即每秒一百京次(=10^18)浮点运算次数),人工智能算力占总算力比超过85%。


对于“东数西算”工程而言,陈俊龙表示,大模型对算力需求的增长既是机遇也是挑战。一方面,“东数西算”工程可以通过构建新型算力网络体系,将东部地区大量生产生活数据输送到西部地区进行存储、计算、反馈,并在西部地区建立国家算力枢纽节点,有助于改善数字基础设施不平衡的布局,最大限度发挥数据要素的价值。另一方面,“东数西算”工程也需要应对东部城市对算力需求的快速增长带来的压力和挑战,如怎样保证数据传输和计算的效率、安全、稳定等。


在陈俊龙看来,“东数西算”工程需要加强创新投入和政策支持,提升数据中心和云计算平台的建设和服务水平,满足不同场景下对高性能计算的需求。


不过,“东数西算”中的算力设施布局需进行相应的调整,也要注意盲目建设的问题。


对外经济贸易大学信息学院教授陈振娇在接受新京报新京智库采访时表示,算力建设要注意三个方面。首先,把握适度超前原则,充分考虑技术进步、产业发展的潜在需求,平衡未来算力的供给和需求。其次,优化算力结构。ChatGPT引爆智能算力需求,在下一步算力总体布局中,相比通用算力和超级算力,增加智能算力供给,或成超车关键。最后,加强“东数西算”网络安全。需建立主管部门、运营商与第三方安全公司合作担责的三级安防体系。


“第一级在算力节点层面实现全局监控;第二级在数据集群层面进行全局态势感知;第三级在主管部门层面实现‘东数西算’的动态防护。”陈振娇说。


算力券作用凸显


除了算力布局不均衡日趋明显,空间发展不均衡外,不同规模企业使用算力的成本也存在较大差异。


不同于大企业可以大手笔采购算力或自建算力中心,对于很多中小企业来说,由于自身综合实力有限,如何低成本获得算力支持也是目前算力市场亟须解决的突出问题。


例如,稍早前,上海市服务企业联席会议办公室印发《上海市助力中小微企业稳增长调结构强能力若干措施》。其中提出,加大数字能力供给。支持中小企业使用线上会议软件、工业软件等“小快轻准”数字化解决方案和产品。实施智评券、算力券等,支持中小企业购买智能工厂诊断咨询及人工智能算力等服务。


除了上海,其他城市也在通过采取发放算力券的方式,帮助中小企业低成本获取算力。


今年初,全国首个算力产业专项政策——《成都市围绕超算智算加快算力产业发展的政策措施》在成都落地,政策明确成都每年将发放总额不超过1000万元的算力券。支持科技型中小微企业和创客、科研机构、高校等使用国家超算成都中心、成都智算中心算力资源。


上海交通大学网络安全技术研究院院长李建华在接受新京报新京智库采访时表示,算力一直都是稀缺资源。目前各地方都建设了算力基础设施,还需要一个算力统一调度平台。这和电力资源调度是一样的道理。不同的地方,不同的企业对算力的需求具有一定的随机性,有峰有谷。统一的算力调度平台,就好比构建了连接各地方算力资源的高速公路,能够让算力和需求方,彼此快速对接。


“目前企业低成本获取算力支持主要通过科技创新券,通常补贴力度达到50%。针对中小企业,可以在审核企业资质的条件下,进一步提高补贴力度。”李建华说。


对于城市给中小企业发放低价算力券,张云泉也表示是个很好的举措,五折券是一个比较通用的优惠,对于那种特别有潜力的企业也可以有进一步的专项支持举措。


“我觉得这是挺好的一个举措,对有特殊需求的中小企业扶持力度还可以进一步加大。”张云泉说。


不过,人工智能基础设施,不仅包括算力,还包括数据、算法、算网和人才。


相关城市在加强算力建设的同时,韦立坚也建议,大语言模型是基于人类反馈的强化学习机制,因此需要庞大的带有人类反馈的语料库。即使是训练垂直领域的行业大语言模型,对于语料库的要求也很高,但由于各种限制,目前很多行业数据还存在数据孤岛,急需通过政策和技术的支持来打通。


此外,韦立坚也表示,在算法层面,目前基本还是基于国外开源的技术进行二次研发,还急需重视底层核心算法的研发。算网层面,急需打破传统的数据存储、算力和网络分离模式,实现算网深度融合。


新京报记者 查志远

编辑 柯锐

校对 刘军