新京报贝壳财经讯(记者张晓慧)近日,面壁智能正式发布并开源新一代端侧文本基座大模型MiniCPM5-1B,INT4(量化技术)量化后权重仅0.5GB,可在手机、浏览器等90%以上终端设备运行。新京报贝壳财经记者获悉,众智FlagOS社区基于统一多芯片软件栈,通过vLLM-plugin-FL推理插件完成MiniCPM5-1B的跨芯片适配与推理部署Day-0发布。
据悉,此次适配覆盖英伟达、华为昇腾、平头哥、摩尔线程、海光、昆仑芯、沐曦、天数智芯等8类数据中心AI加速芯片。
此外,针对MiniCPM5面向端侧部署的特点,此次跨芯片适配首次将Day-0适配延伸至 ARM端侧平台。ARM架构广泛存在于手机、AIPC、机器人、车载终端、边缘网关和各类嵌入式设备中,是端侧AI部署中数量最大、覆盖最广的计算平台之一。随着MiniCPM5-1B这类小尺寸高密度模型的发展,越来越多推理任务有机会从云端GPU下沉到端侧设备。
据了解,FlagOS支持MiniCPM5-1B在ARM上以int8、bf16、fp32三种精度运行,实现从数据中心多款AI芯片到端侧ARM的“一套代码、跨架构运行”。
编辑 杨娟娟
校对 王心
