新京报讯(记者吴婷婷)3月29日,2024北京AI原生产业创新大会暨北京数据基础制度先行区成果发布会在北京经开区举办,人工智能公共算力平台3000P智能算力投入使用,北京人工智能数据训练基地启用,这也是国内首家投入运营的人工智能数据训练基地。


3月29日,北京亦庄人工智能公共算力平台正式点亮并投入使用。新京报记者 李木易 摄


“5、4、3、2、1,点亮!”随着倒计时,北京亦庄人工智能公共算力平台3000P规模算力设备正式点亮并投入使用。北京亦庄人工智能公共算力平台是北京最大规模的高性能人工智能计算集群,具备3000P高性能智能算力、大容量高速存储以及高带宽、低延迟网络服务的特点,可以帮助企业推动开展大模型训练,推广行业应用。


3000P的算力规模有多快?1P约等于每秒1000万亿次的计算速度,3000P则意味着如果用“秒速”“光速”等文字语言都不能准确概括其计算的速度。


算力是人工智能发展三个重要元素之一,另外两个元素是数据和算法。北京亦庄智能城市研究院集团有限公司党委副书记、总经理颜敏介绍,从外部条件来看,目前制约企业大模型发展比较明显的问题是算力和数据,因此建设公共算力平台将解决企业,尤其是创业型企业、小规模企业在发展中购买算力能力不足的问题。与此前市场上的公共算力平台相比,北京亦庄人工智能公共算力平台为政府牵头、国有企业投资建设,具有普惠的性质,算力规模大,可以很好地支持企业的发展。


同时,北京人工智能数据训练基地也在当天的活动上正式启用。在谈到建设这一基地的目的时,颜敏介绍,我国现有的数据量已经非常庞大,但是用于大模型训练的高质量数据集非常少,“北京人工智能数据训练基地通过一系列机制创新、先行先试,重点解决数据的确权难、流通难、收益分配难三个问题。” 


对企业来说,北京亦庄人工智能公共算力平台和北京人工智能数据训练基地将为企业在发展大模型时带来哪些便利?人民中科CEO侯黎明告诉记者,此前在训练大模型过程中,企业常常需要到市场寻找算力,有时不得不东拼西凑。此外,丰富的语料是训练大模型的重要方面,其中涉及政策和数据隐私等问题。他表示,北京亦庄人工智能公共算力平台和北京人工智能数据训练基地的投用,解决了算力和语料的问题。侯黎明举例解释:“就好比亦庄为企业训练大模型搭建了一个图书馆,里面的资料非常丰富,我就不需要像以前一样到各个书店去找书,在训练基地就能‘一站式’凑齐。”


颜敏介绍,目前已有35家企业参与训练基地的建设,包括数据供给方、数据加工方、数据需求方、平台运营方等7个方面,其中13家企业提供了6.8T的数据。


编辑 樊一婧 

校对 刘军