北京时间3月19日凌晨,英伟达GTC大会开幕,英伟达CEO黄仁勋发布主题为“见证AI的颠覆时刻”的演讲,宣布推出新一代AI芯片架构Blackwell(布莱克威尔)、超级芯片GB200、AI微服务、人形机器人项目GR00T……可谓亮点颇多。


黄仁勋表示,台积电将在生产中使用英伟达计算光刻平台,而Blackwell将成为亚马逊、微软、谷歌等全球最大数据中心运营商部署新电脑和其他产品的基础。


不过,美国股市对本次英伟达发布的新内容反响并不热烈,截至当日收盘,英伟达微涨0.7%,股价为884.55美元,但其盘后股价下跌1.71%,最终为870.85美元/股。


“英伟达是纵向扩张的好手,拥有超越时代的眼界。现在其触角继续往上游光刻机,下游模型、应用延伸,试图巩固其地位。相比之下,国内7nm的GPU产量还很有限,更别说配套的计算平台和高速网络产品。我国追赶世界AI先进水平还需努力。”3月19日,人工智能算力行业技术顾问李扬威在接受新京报贝壳财经记者采访时表示。


更快!下一代芯片架构Blackwell推理性能超越前代30倍


在当前“百模大战”的背景下,英伟达的GPU芯片作为训练AI大模型的“神兵利器”,一直处于供不应求的状态,拥有多少张英伟达的A100、H100芯片更是被视为AI企业硬实力的标志之一。


值得注意的是,H100 GPU芯片所对应的架构核心是“Hopper”,而在本次大会上,黄仁勋推出了新一代芯片架构“Blackwell”,并展示了基于该架构的GB200芯片的硬实力。


Blackwell拥有2080亿个晶体管,是上一代芯片“Hopper”800亿个晶体管的两倍多,可以支持多达10万亿个参数的AI模型。和此前A100、H100芯片不同的是,GB200芯片由两个Blackwell GPU和一个Grace中央处理器组合配对组成,其命名也由此而来。


李扬威告诉新京报贝壳财经记者,目前芯片行业的生态体系不会改变,改变的是芯片的设计方向,“随着半导体工艺迭代逐渐缓慢,原始版本的摩尔定律逐渐失效。越来越大的模型在极速提高GPU单元间的通信需求,让传统网络间的互联通信越来越难。所以这次英伟达在往超大规模芯片、内部D2D通信(类似晶圆基板上芯片封装)、尽量小范围网络内解决问题的方向上走。”


黄仁勋展示Blackwell GPU和Hopper GPU的区别。图/官网直播截图



英伟达方面表示,Blackwell GPU的训练性能是上一代Hopper GPU的4倍,推理性能是30倍,能源效率约25倍。而在GPT-3(1750亿参数)大模型基准测试中,GB200的性能是H100的7倍,训练速度是H100的4倍。


据介绍,Blackwell这一名字旨在向美国统计学家兼数学家大卫·布莱克威尔(David Blackwell)致敬,其是首位入选美国国家科学院的非裔美国人,对博弈论、概率论、信息论和统计学做出了重大贡献。


黄仁勋表示,如果将时间拉长到8年,可以发现GPU的计算规模“已经增加了1000倍”。他认为,Blackwell将成为亚马逊、微软、谷歌、甲骨文等全球最大数据中心运营商部署的新计算机和其他产品的基石。


由此可见,在当前最为火热的AI算力需求方面,GB200的出现进一步加深了英伟达的“护城河”。


李扬威告诉新京报贝壳财经记者,英伟达早在2019年前就看到了高速网络传输在AI计算中的特殊地位,豪横买下了mellanox(迈络思,高性能计算和云计算厂商),经营CUDA(并行计算架构)生态多年不求回报,才造就了今天的AI霸主。


在李扬威看来,随着量化技术越来越成熟,越来越多的关注点放在了如何通过降低计算精度来提高计算效率和节省资源的问题,从fp32(floating point,指浮点数,后面的数字表示浮点数位数)、fp16、fp8到fp4。英伟达的霸主地位维系于CUDA生态和互联技术,“芯片谁都能设计制造,只要没有开源计算平台占据市场主流,没有替代nvlink(由英伟达开发并推出的一种总线及其通信协议,多针对高性能运算领域)和Infinity band(直译为“无限带宽”技术,是一个用于高性能计算的计算机网络通信标准)的技术方案出来,英伟达的霸主地位就可以一直维持。”


光刻平台投入生产 进入人形机器人领域 英伟达布局上下游


此外,英伟达还在人工智能产业的上下游分别进行了布局,不仅深挖护城河,还“加宽”了护城河的面积。


首先,在上游芯片制造方面,英伟达宣布,为加快下一代先进半导体芯片的制造速度并克服物理限制,全球最大的晶圆厂台积电,以及硅片到系统设计解决方案领域领先企业新思科技,将在生产中使用英伟达计算光刻平台。


具体来看,这两家企业已将英伟达cuLitho平台集成到了其软件、制造工艺和系统中,在加速芯片制造速度的同时,也加快了对未来新一代英伟达Blackwell架构GPU的支持。


而在下游的应用领域,英伟达宣布推出数十项企业级生成式AI微服务,企业可以利用这些微服务,在自己的平台上创建和部署定制应用,同时保留对知识产权的完整所有权和控制权。据了解,这些云原生微服务目录在英伟达的CUDA平台上开发,可适用于英伟达及合作伙伴生态系统中20多个热门的AI模型进行推理优化。


此外,英伟达特别针对医疗企业推出了二十多项全新微服务,其中医疗微服务套件包含经过优化的英伟达AI模型和工作流,并提供行业标准应用编程接口(API),可用于创建和部署云原生应用,与在CPU上运行相比,英伟达的微服务能够将基因组分析工作流程中的变异调用速度提高50倍以上。


英伟达方面称,医疗AI微服务可以提供先进的医学影像、自然语言和语音识别以及数字生物学生成、预测和模拟功能。


值得注意的是,英伟达还进入了最近火热的人形机器人领域,发布人形机器人通用基础模型项目GR00T。据介绍,GR00T驱动的机器人能理解自然语言,并通过观察人类行为,模仿并快速学习协调、灵活性和其他技能,以适应现实世界并与之互动。


黄仁勋与机器人互动。图/官网直播截图



“开发通用人形机器人基础模型是当今AI领域中最令人兴奋的课题之一。”黄仁勋说。


英伟达还发布了一款基于Thor系统级芯片的新型人形机器人计算机Jetson Thor,并对其旗下的Isaac机器人平台进行了重大升级,包括生成式人工智能基础模型和仿真工具,以及人工智能工作流基础设施。该公司希望通过这一举措,让机器人拥有更聪明的大脑,得以通过观察人类的行为,做出自然的模仿动作,在动作的协调性、灵活性等方面大大提升。


黄仁勋还通过视频展示了多台这样的机器人如何完成各种任务,贝壳财经记者注意到,其中被用于展示的包括敏捷机器人、傅利叶智能机器人和宇树科技的机器人产品。可以发现,在人形机器人热度持续升高的当下,英伟达贯彻了自己AI“卖水人”的风格,致力于为这些不同品牌的机器人提供“大脑”。


“英伟达的硬件没有问题,但在软件应用领域还没有完全证明自己。现在人形机器人领域还是起步阶段,目前,英伟达是在布局。”李扬威对贝壳财经记者表示。


记者联系邮箱:luoyidan@xjbnews.com


新京报贝壳财经记者 罗亦丹

编辑 徐超

校对 翟永军