▲8月19日,2023中国算力大会在银川开幕,与会人员参观“算力中国”创新成果展。图/新华社


随着ChatGPT大模型的火爆,算力建设也在快马加鞭。


8月19日,由工业和信息化部、宁夏回族自治区人民政府主办,以“算领新产业潮流 力赋高质量发展”为主题的 2023中国算力大会、第二届“西部数谷”算力产业大会在银川盛大启幕。大会聚焦算力前沿技术领域, 展示算力融合应用成果,推动算力产业加速发展。


稍早前,据北方网8月17日报道,近日,总投资12.7亿元的天津市人工智能计算中心二期扩容的100PFlops(1P等于每秒一千万亿(10^15)次的浮点运算算力)竣工上线。报道称,这是因为京津冀地区算力需求旺盛,预计未来五年将产生数万PFlops的算力需求规模。


科技日报报道,2023年7月中旬,科技部发布了国家新一代人工智能公共算力开放创新平台的批复通知。国家超级计算成都中心等16个平台获批筹建国家新一代人工智能公共算力开放创新平台。


为何要不断建设新的算力中心?


北京航空航天大学计算机科学技术系主任肖利民教授向新京智库解释,在数字经济时代,算力是核心生产力,数据是关键生产资料,而算力网络是支撑数字经济发展的新型信息基础设施。“这与第二次工业革命中的电力基础设施,在促进生产方式变革和支撑经济发展中的基础作用非常类似。”


其实,一张更大的算力“网”已在建设中。


2021年5月,国家发展改革委、中央网信办、工业和信息化部和国家能源局联合印发关于“东数西算”工程建设的文件提出,在京津冀、长三角、粤港澳大湾区、成渝,以及贵州、内蒙古、甘肃、宁夏等地布局建设全国一体化算力网络国家枢纽节点。该项工程于2022年2月正式全面启动。


中国信通院云计算与大数据研究所所长何宝宏曾表示,按照全国一体化大数据中心体系布局,八个国家算力枢纽节点将作为我国算力网络的骨干连接点,推动算力资源有序向西转移,促进解决东西部算力供需失衡问题。


我国算力资源是如何分布的,能否满足迅速增加的市场需求?以互联网为主要运用的格局是否将发生变化?


算力资源分布格局将变化


扩容的不仅有智算中心。作为算力中心的一种,超算中心也在继续扩容。


2023年5月24日,浙江(长三角)新一代全功能智能超算中心(“乌镇之光”超算中心)顺利通过科技部验收,正式纳入国家超算中心序列,成为浙江唯一的国家超算中心。浙江省科技厅转发的文章表示,这填补了浙江在国家超算中心领域的空白,建成浙北最大科学装置。


新京智库梳理发现,在“乌镇之光”超算中心通过验收之前,科技部已批准建立了13个超算中心,分别位于天津、广州、长沙、深圳、济南、无锡、郑州、昆山、成都和西安等地。


从地域分布来看,新京智库梳理发现,已投入运营或正在建设中的40个智算中心(不完全统计)也主要分布在经济较为发达的东部地区,少数分布在中部地区,还有个别在西部和东北。


肖利民介绍,这些算力中心正在构建起一张“算力网”,目前已完成接入和近期正在接入的节点有智算中心20个、超算中心4个、“东数西算”工程数据中心集群3个。“算力网”预期可实现接入城市之间算力的互联互通,弹性满足全网范围内各城市的算力需求。


中国科学院院士、北京航空航天大学教授钱德沛对新京智库表示,算力资源主要还是分布在经济发达地区,超算中心的布局尤其明显。GDP前三的广东、江苏、山东也是超算中心建设最为密集的地方。因为这些地方有经济实力,也有应用需求。此外,算力资源的分布也与人才分布有关。我们国家计算人才的培养和人数,粤苏鲁也是名列前茅。


北京大学智能学院教授谭营告诉新京智库,东部沿海城市也是希望通过建设算力中心,搭建起一个完整的人工智能生态。因为人工智能算力中心需要聚集大量的顶尖科技人才,如果一个城市不提供良好的研究环境,很难吸引高水平人才。


“算力中心也有利于在国际上塑造良好形象。”谭营说,比如北京、上海的算力资源丰富,这实际上也是吸引一些国际企业入驻的原因。这样有利于一座城市融入国际大循环中,吸引更多的全球资源,从而推动城市稳步向前发展。


以苏州为例,此前并未有算力中心布局。但公开报道显示,苏州市2022年人工智能相关产业规模达1250亿元,近三年产值规模平均增速达22.7%,仅苏州工业园区即集聚了人工智能相关企业1500家。


因此,苏州积极投身于算力中心建设。2023年6月30日,“今日相城”官微发布消息,苏州市人工智能算力中心项目于当日正式启动。该项目旨在发挥苏州乃至长三角地区在市场、技术、人才、资金等方面的优势,构建多层次算力设施体系,打造“东数西算”工程在长三角地区的战略支点。不仅如此,国内首个能源算力中心也于5月18日官宣落地苏州。


谭营介绍,随着数字经济时代算力需求的不断增长,算力资源与市场应用存在不平衡,城市的需求也多样化,算力资源分布将不断在扩展中调整。


“尤其是东部与西部在能源电力、气候环境、经济发展水平及相应算力需求等方面存在较大差异。”肖利民说。通过国家推出“东数西算”工程来统筹规划,从而推动实现全国一体化的算力网络,将我国东部沿海区域的数据计算需求,交由西部内陆区域的算力中心去处理,解决我国算力资源供给区域与需求区域不平衡的问题。


算力正处于蓬勃发展中


多位受访者认为,我国算力经历了三、四个阶段后才逐渐形成今天的格局和形态。


史料记载,1986年3月3日,王大珩、王淦昌、杨嘉墀、陈芳允四位科学家向国家提出要跟踪世界先进水平,发展中国高技术的建议。经过邓小平批示,国务院批准了《高技术研究发展计划(“863”计划)纲要》。


钱德沛介绍,在“863”计划实施的初期,以突破高性能计算机技术为目标,这一时期主要是技术推动。后来,逐渐发展成以解决重大的挑战性应用问题为导向,同时通过高端技术的辐射来牵引计算机产业发展。“这种模式一直持续到今天。”


谭营认为,我国算力发展经历了四个阶段,即初期的认识阶段,2000年至2010年的追赶阶段,领先阶段和现在的综合创新阶段。领先阶段的两个标志性事件是“天河二号”、神威·太湖之光两个计算机的诞生。“这引起了国际上尤其美国的一些关注。”


而肖利民则认为,我国算力发展经历了三个阶段,即初始起步阶段、快速增长阶段。“当下正是我国算力的蓬勃发展阶段。”


肖利民介绍,在超算方面,我国科技计划持续投入超算研发,研制出了银河、神威、曙光、深腾多个系列的超级计算机,并建成一批超算中心,有力支撑了科技创新、经济发展和国防建设,成为世界超算领域的重要力量。


在智算方面,以大模型为代表的人工智能技术的兴起,成为推动算力发展的新动力。我国高度重视人工智能的发展,建设了一批以“鹏城云脑”为代表的智算中心,支撑了我国在人工智能领域的技术创新和产业发展。


钱德沛认为,如果从计算机的性能来划分,我国算力发展可以说迈了四个台阶,即从G级(每秒10亿次)到T级(每秒万亿次),再到P级(每秒1000万亿次),最后到现在的E级(每秒百亿亿次)。


相对应的典型计算机系统是,早期的曙光1000(G级),上世纪末的曙光3000(百G级)。从本世纪开始,我国陆续发展了几代超级计算机,比如联想深腾6800和曙光4000A(T级),天河一号、曙光6000和神威·蓝光(P级),神威·太湖之光和天河二号(百P级)等,接着是E级计算机。


谭营表示,当下我国算力虽然进入综合创新阶段,但面临不小阻力,尤其是计算所需要使用到的芯片。这个阶段的标志是,2017年7月,国务院印发的《新一代人工智能发展规划》。


工信部部长金壮龙在8月19日举行的2023中国算力大会开幕式上表示,近年来,围绕加快算力基础设施建设应用,从中央到地方出台了一系列重要政策举措,实施一大批重大工程项目,推动我国算力产业实现快速发展,为经济高质量发展注入了强大动力。


金壮龙介绍,围绕算力枢纽节点建设130条干线光缆,数据传输性能大幅改善,我国算力产业已初具规模,服务器、计算机、智能手机等计算类产品产量全球第一。


“算力”无处不在


现如今,算力已经无处不在。


浙江大学计算机科学与技术学院副院长尹建伟表示,算力,是数字化改革的基石,也是数字经济的重要业态和组成。算力速度和容量的大幅提升、供给方式的便利及普适,使得数字技术赋能经济生产、社会生活、政府治理各场景,也推动了数字化改革的深度与广度、规模与质量的大幅提升。


金壮龙介绍,高算力芯片加速迭代升级,一批行业骨干企业茁壮成长,算力应用广泛深入政务、工业、交通、医疗等领域,不断催生新技术、新模式、新业态,助力各行各业加快数字化、智能化转型。


“我们的日常生活都离不了算力。”钱德沛说,比如衣食住行的“行”,高铁、航空等交通运输,如果没有背后的算力支持——调度和管理,那肯定会很混乱;再如公共卫生健康,如果没有算力支持,新药发现很难在短时间内完成,在遭遇新型重大传染病时就可能陷入巨大风险。


作为科研人员,西安电子科技大学人工智能学院副教授朱虎明认为,现如今,大家都在用ChatGPT来写文件初稿、提炼摘要、生成一些插图,甚至还将其当作翻译软件用,“就相当于你的工作助理,而这些功能的实现都有赖于算力的支撑”。


现实世界中,算力的作用远不止于此。


谭营介绍,做科研需要模拟一些复杂现象,这需要分析大规模的数据,比如核爆模拟、气象模拟等。这些科研工作都需要大量的计算资源。可以说,算力是推动科研发展的底座。


钱德沛也认为,最近这些年,特别是随着大批在国外接受教育的学者回国工作,他们习惯于用算力——用仿真来解决科研中的新问题,他们离不了算力。这意味着,算力从某种程度上来说,是反映了他们的科研水平和能力。


“传统产业的转型,特别是竞争力的提升,也非常依赖于算力。”钱德沛说,上海超级计算中心,从20年前开始就支持企业的计算应用,比如汽车、航空、核工业等领域的公司,都通过算力大大缩短了产品研发周期,提高了产品竞争力。


以人工智能为例,谭营解释,智能算力的提升,使得语音识别、图像识别,以及智能决策等领域都有了广泛应用。像ChatGPT就是智能算力应用的一个典型成果——推动了产业化的升级,使得通用人工智能向前迈进了一大步。


肖利民进一步解释,基于算力加持的人工智能技术,不仅深刻影响人们的生活,也为科技发展带来了新的途径。作为将人工智能和科技创新深度融合的新兴科研形态,AI for Science(人工智能驱动的科学研究)被称为继经验范式、理论范式、计算范式、大数据范式之后的“科学研究第五范式”。


可利用人工智能技术学习、模拟、预测、优化自然界和人类社会的各种现象和规律,从而推动科学发现和技术创新。而算力与数据、算法并称为驱动人工智能获得成功的三个关键要素。“算力对于科技创新发展至为重要,算力基础设施已成为推动科技创新发展不可或缺的重要基石。”肖利民说。


尹建伟还表示,以云计算、人工智能算力、算力网络等为代表的算力,本身也是一个产业,是数字经济的一种新型业态和重要组成。总体而言,算力不仅是推动数字经济发展的内驱力,也是衡量数字经济发展的“晴雨表”。


互联网或将不再是最重要应用领域


尽管算力已经无处不在,不过,就目前而言,其主要应用领域还是互联网。


中国信通院发布的《中国算力发展指数白皮书(2022)》显示,互联网行业对数据处理、模型训练的需求不断提升,是算力需求最大的行业,占整体算力50%的份额。


不过,也呈现出了新特征,即“正从互联网、电子政务等传统领域,逐步向电信、金融、制造、教育等传统行业拓展”。


《白皮书》披露,由于政府行业对数字政府、平安城市等领域的投入力度不断加强,算力份额占比列第二;服务、电信、金融、制造、教育、运输等行业分列三到八位。其中,电信、金融行业企业的数字化程度高,是我国算力应用较大的传统行业。


从支撑能力看,算力应用场景从病毒研究、地质勘探、航空航天等科技探索,向环境检测、精准营销、智能调度等领域延伸,激发了数据要素驱动的创新活力。


肖利民表示,由于海量的用户群体和丰富的应用场景,互联网行业在中短期预计仍会是算力需求最大的行业。


“只是随着行业数字化、网络化、智能化程度的持续提升。”肖利民表示,尤其是制造业数智化、自动驾驶、车路协同等场景的迅速发展,智能制造、智慧交通等行业的应用场景将更加丰富,智能化水平将更高。相应地,制造、交通等行业对算力的需求预计会有很大提升潜力。


谭营亦认为,主要是人工智能,尤其是通用人工智能,还有量子计算,以及超大规模的科研实验,这些领域对于算力的需求比重会逐渐增加,尤其是处理至今还无法处理的复杂问题,以及超大型的仿真模拟等,这类问题的算力需求会逐渐超过互联网对算力的需求。


比如模拟器飞行。谭营介绍,飞行员的仿真模拟器训练已经可以做到与在天上飞一样。但现在很难模拟大型机群的仿真飞行。比如,在一个战场上,怎么模拟敌对两方不同飞机处于不同状态下的场景、战场演化等。“现在做不到,但今后会占用大量的算力资源。”


对外经济贸易大学信息学院院长熊璋教授亦告诉新京智库,通用的生成式人工智能(AIGC)的发展和普及应用是客观现实的,其大数据、大训练、大模型的技术特征、叠加对各行各业的渗透和覆盖,呈现出了对算力需求的指数级增长,将会是未来最大算力需求的行业。


挑战也不少


尽管由于算力给科研、经济,以及整个社会发展带来巨大的想象空间,但现实之中,我国的算力发展仍然面临着不少挑战。


肖利民认为,当前算力发展面临算力根基不牢靠、算力供需对接不畅等重要挑战。一方面,当前我国的算力基础设施中,算力芯片普遍依赖于国外处理器产品,算力根基不够牢靠,存在较大的断供风险,算力发展的可持续性不强。因此,“如何突破算力芯片,尤其是高端CPU、GPU的设计和制造瓶颈,是一个严峻的挑战”。


另一方面,我国已迈入数字经济时代,数智化应用场景及负载日益多样化,应用对算力提出了多元化需求,形成了CPU、GPU、NPU(神经网络处理器)、DPU(数据处理器)、FPGA(现场可编程门阵列)等多元异构混合的算力格局。“如何有效适配多元异构算力与多样化应用负载也是一个重要的挑战。”肖利民说。


钱德沛则认为,在“双碳”背景下,更高性能的芯片与更低能耗实际上是我国算力发展面临的同一个挑战,也是最大挑战,因为他们互为因果。“我们这两方面都要突破,才能走出一条中国的高性能、低能耗的计算之路。”


而在谭营看来,我国算力发展最大的挑战是其互联与协同。时至今日,我国建设了很多算力中心,但如何把这些算力中心互联起来,发挥“1+1>2”的协同作用比较困难。


肖利民进一步解释,如果把算力网当作一个网络来看,那么这张“网”里,有算力,也有数据。那要建成算力网络,面临算力共享和数据流通两大挑战。


比如,算力共享的挑战。肖利民解释,从字面上来理解算力网络,可能会觉得无非是建设一批算力中心,并用网络将这些算力中心联通在一起,但这样是否就算建成了一个算力网络?


“其实没那么简单。”肖利民说。算力网络要实现算力互联互通和协同共享,实质上是要围绕算力共享,建设一整套算力生态链,其中包括很多环节,诸如算力的生产、聚合、赋能、调度、供应、消费,而算力生态链中每个环节,都有各自需要解决的问题。


好消息是,这些问题也引起了相关部门的重视,并将着手解决。


在7月17日举行的2023中国算力大会新闻发布会上,工信部信息通信发展司司长谢存表示,近期工信部在行业内开展了深入广泛的调研,并计划结合算力行业最新发展情况,出台推动算力基础设施高质量发展的政策文件,进一步强化顶层设计,提升算力综合供给能力。


围绕加强技术创新,培育良好生态,工信部一方面将围绕算力发展需要,增强自主创新能力,推进计算架构、计算方式和算法创新,加强CPU、GPU和服务器等重点产品研发,加速新技术、新产品落地应用;另一方面将围绕算力相关软硬件生态体系建设,加强硬件、基础软件、应用软件等适配协同,提升产业基础高级化水平。


与此同时,还将建优算力网络,促进应用落地。


谢存表示,将加速推进网络设施与算力设施配套部署,进一步优化升级网络体系架构,加强算力网络监测,打造满足各类算力应用需求的运力体系。强化算力资源统筹调度,不断提高算力利用效能。以工业、交通、医疗等典型行业为主要场景,打造一批成熟解决方案,持续推动算力助力传统行业转型升级。


在8月19日举行的2023中国算力大会开幕式上,工信部部长金壮龙亦表示,将紧紧围绕经济社会发展需求,统筹发展和安全,以智能化、绿色化、融合化为主攻方向,一体推进基础设施、技术创新和深度融合应用,做强做优做大算力产业,为建设制造强国、网络强国、数字中国提供有力支撑。


新京报记者 肖隆平

编辑 查志远

校对 卢茜