▲2023年5月24日,中关村论坛,人工智能展区,北京通用人工智能研究院工作人员在介绍他们研发的一个具有人类认知智能能力的模型——“通慧模型”。新京报记者 浦峰 摄

5月30日,在2023中关村论坛闭幕式重大成果发布会上,北京市科委、中关村管委会二级巡视员刘航正式发布两项政策。这两项政策分别是:北京市政府印发《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025年)》(以下简称《方案》);市政府办公厅同步印发《北京市促进通用人工智能创新发展的若干措施》(以下简称《措施》)。

围绕着人工智能如此密集地发布重要文件,实属罕见,北京市建设人工智能高地的决心和力度清晰可见。

两份重磅文件逻辑紧密相连

读了这两份重要文件,可以看出两份文件内在逻辑其实紧密相连。

首先,《方案》围绕着突破关键技术、夯实底层基础、构建产业方阵、推动场景建设、构建创新生态五大方向,提出16项重点任务;《措施》则从提升算力资源统筹供给能力、提升高质量数据要素供给能力、系统构建大模型等通用人工智能技术体系、推动通用人工智能技术创新场景应用、探索营造包容审慎的监管环境五个方面推出的具体措施。

《方案》重点是“要做什么”,《措施》则是“具体怎么做”。《方案》侧重宏观产业发展方向,《措施》侧重具体操作,任务的落地。

“人工智能核心产业规模达到3000亿元,持续保持10%以上增长,辐射产业规模超过1万亿元。”《方案》提出了具体的目标数据。16项重点任务和21条具体措施就是围绕着这个目标展开。从大的方向上看,是在国家发展新一代人工智能的决策框架之下,针对北京市的“两个人工智能区”——北京国家新一代人工智能创新发展试验区和国家人工智能创新应用先导区,“一个地”——全球影响力的人工智能创新策源地,“一个中心”——国际科技创新中心的继续布局、深化加强和全面推动。

几个关键词值得关注

在两个重磅文件中,几个重点和关键词值得关注。

一是突破和原创。《方案》提到了“突破人工智能前沿基础理论创新”,强调“围绕人工智能数学机理、大数据智能、多模态智能、决策智能、类脑智能、科学智能、具身智能等方向开展研究布局,形成具有国际影响力的人工智能原创理论体系。”不仅仅是要有基础理论框架体系,而且强调“原创”。

目前,在AI领域,大部分的基础理论框架都是由国外的科学家和工程师提出,这不是什么秘密,国内的业界也一直期待什么时候有我们的科学家或者工程师提出的原创性的框架和体系,打破国外的垄断局面。如今,北京在此方面敢为人先,提出这样一个任务,有希望早日实现突破。

二是两个重要内容。《方案》提到“支持创新主体重点突破分布式高效深度学习框架、大模型新型基础架构、深度超大规模图计算、超大规模模拟计算等基础平台技术。支持数据与知识深度联合学习、高维空间多模态语义对齐、大规模认知与推理、可控内容生成、高效低成本训练与推理等关键算法研发,着力推动大模型相关技术创新。鼓励相关技术和算法开源开放。”

这里提到了两个重要的内容。一个是框架和算法的研发,一个是鼓励开源。框架和算法,是生态的基础,比如早期谷歌提出的Tensorflow,到当前比较流行的PyTorch,主要是来自于美国,后来百度提出的飞桨,也逐渐形成了自己的技术生态。这个堪比电脑的操作系统,重要性可见一斑。开源则是一种态度、底气和实力,目前绝大部分框架都是开源的,包括百度的飞桨。开源社区的共享程度,一直是业界衡量实力的一个重要指标。

再者,《方案》提到“推动国产人工智能芯片实现突破。面向人工智能云端分布式训练需求,开展通用高算力训练芯片研发;面向边缘端应用场景的低功耗需求,研制多模态智能传感芯片、自主智能决策执行芯片、高能效边缘端异构智能芯片;面向创新型芯片架构,探索可重构、存算一体、类脑计算、Chiplet 等创新架构路线。”

众所周知,芯片是人工智能的王者。自从美国对中国芯片方面接连实施限制,我国在芯片方面逐渐独立自主成为了刚需。前面所说的理论和框架,技术体系都是需要算力做支撑,如果说算力是基础设施,芯片则是基础的基础。《方案》可谓抓住了重点的重点。

措施领先,眼光超前

说了《方案》,再来谈谈《措施》。

首先,《措施》提到“算力资源统筹供给”。众所周知,大模型对算力要求非常高。以ChatGPT为例,ChatGPT3.5光训练就用了万级别的A100的卡,这种算力全世界也没几家公司具有。除此之外,实现大模型商用,随着千万级甚至上亿级的高并发,如果没有足够的算力完全撑不住,非常容易造成服务不可用。

在这种算力资源非常紧缺的情形下,单打独斗不行,资源统筹非常有必要。北京市可以发挥非常好的统筹作用,集中全部的算力,合理地分配与调度,实现需求和供给的高效匹配。

其次,《措施》提到“高质量数据要素供给”。数据、算力和算法是人工智能的“三剑客”,缺一不可,数据堪比工业界的“石油”。就语言大模型来说,国外提出的大模型训练过程中,中文数据是缺乏的,中文的知识也是缺乏的,所以其模型推断出来的结果在中文方面是有限的。中文数据这方面,中文是母语,我国更有优势。所以,只要积累到更多的高质量的中文数据和知识,完全可能训练出比国外大模型更好的中文大模型,这恰好也是我们所需要的。

再者,《措施》提到人工智能的应用落地,主要是政务服务、医疗、科学研究、金融、自动驾驶、城市治理这些领域的示范应用。这些领域都是北京的重点领域和优势领域,将人工智能在这些领域的应用推广可谓“强强联手”,发挥出协同效应。

此外,《措施》提到人工智能的监管创新、网络安全和数据防护、加强科技伦理的治理。北京此次提出的这些措施比较领先,眼光比较超前。人工智能不仅仅起到正面的积极作用,如果不加管制,其负面效应会逐渐爆发出来,对社会乃至人类造成伤害。

对人工智能的监管和治理,就要早早把人工智能之“恶”关在笼子里。

综上所述,《方案》和《措施》两份重磅文件在大模型形成一个新的大爆发,人工智能进入一个新的爆发周期的起点这个重要时刻发布,展示出北京冲刺“AI第一城”的决心和部署,值得期待。

▲5月26日,中关村国家自主创新示范区展示中心的一款全尺寸人形仿生机器人。图/新华社

北京在国际人工智能城市排名提升

北京在人工智能方面具有非常好的基础。

首先是人才,北京聚集了众多以清华大学、北京大学、中国科学院等国际和国内知名的高校和科研院所。人工智能是一个人才密集型产业。人才优势非常关键。

其次是资金,在长期看好的有利条件下,北京吸引了国内外资金。还有就是政府推动。相互之间形成了巨大的合力。在这些基础上,北京在人工智能建设方面取得了重大进展。

2022年10月,北京市经济和信息化局在北京人工智能产业创新发展大会上发布了《2022年北京人工智能产业发展白皮书》。白皮书显示,北京持续保持人工智能领先优势。截至2022年10月,北京拥有人工智能核心企业1048家,占全国人工智能企业总量的29%,位列全国第一。

根据白皮书,北京创新“策源地”建设提速。北京人工智能领域核心技术人才超四万人,占全国的60%。人工智能论文发表量居全国第一。在专利授权数量全球排名前100的机构中,北京总部机构30家。白皮书显示,北京人工智能支撑能力不断增强。人工智能算力发展排名全国第一。

白皮书还显示,北京国家人工智能先导区建设成果显著。数字人、智能机器人等技术在冬奥会成功落地,彰显科技冬奥魅力。海淀、朝阳、西城、昌平、通州等区已开始或完成“智慧城市大脑”相关部署,北京已迈向全域场景开放的智慧城市2.0阶段。无人出行服务从示范运营迈入商业化试点新阶段。2022年度北京市智能工厂和数字化车间名单正式发布,36家智能工厂和47家数字化车间名单出炉,人工智能与智能制造融合创新加速落地。

除此之外,最近,据不完全统计,目前中国10亿参数规模以上的大模型已发布79个,14个省市/地区都在开展大模型研发,主要集中在北京和广东,其中北京38个大模型,广东20个大模型。中国大模型中,已有半数以上大模型开源,高校/科研机构是开源主力。

在国内,北京长期占据人工智能城市排行榜第一的位置。在国际人工智能城市排名榜上,北京的排名也从2020年的第七到2023年的第五,地位逐渐提升。

可以预见,北京未来将有一个越来越清晰的新名片:AI之城。

撰稿 / 刘兴亮(DCCI互联网研究院院长)
编辑 / 柯锐
校对 / 赵琳