新京报贝壳财经讯(记者罗亦丹)1月30日,科大讯飞正式发布了星火认知大模型V3.5、星火语音大模型,同时宣布对去年5月6日发布的星火开源13B模型进行了改进,增加了数据、能力、针对应用场景的工具链,值得注意的是,星火开源13B是基于全国产化算力平台的开源大模型,训练策略针对昇腾算力进行了优化,训练效率直追英伟达A100芯片。


而就在一天前,1月29日晚间,科大讯飞发布业绩预告显示,预计去年实现归属于上市公司股东的净利润为6.45亿元至7.3亿元,同比增长15%至30%。报告期内,公司在人工智能通用大模型及行业大模型方面高强度投入并取得显著进展。


科大讯飞董事长刘庆峰介绍,基于测试集COGLLM-EVAL-V3.5、OpenAl构建的代码能力公开测试集HumanEval所得出的测试结果,星火认知大模型V3.5在文本生成、语言理解、知识问答、逻辑推理、数字能力、代码能力、多模态等方面都有提升。其中,星火认知大模型V3.5的语言理解、数学能力超过GPT-4 Turbo,代码能力达到GPT-4 Turbo的96%,多模态理解能力达到GPT-4V的91%。


“听说今年尔滨特别火,作为南方小土豆还挺想去玩一下的。要不你用东北话介绍下有啥好玩的呗?”科大讯飞研究院院长刘聪在发布会上进行了实操演示,讯飞星火V3.5用一口地道的东北话逗乐现场观众,幽默之余,讯飞星火V3.5快速为刘聪定制了旅游攻略,还催促他赶快买票,春运机票紧俏。在与刘聪的对话中,星火大模型通过东北旅游行程,展示了大模型在指令跟随、多轮对话、语义理解、拟人合成等方面的能力。


刘庆峰透露,目前讯飞开放平台之上,大模型总开发者超35万,其中企业开发者超22万,开发者数增长迅猛,大模型应用加速落地,持续夯实第一开发者生态。


此外,在发布会上,首个基于全国产化算力平台“飞星一号”的开源大模型——星火开源13B正式发布。刘庆峰透露,基于“飞星一号”训练,星火开源大模型全栈国产适配优化,训练策略针对昇腾算力进行优化,训练效率达英伟达A100芯片的90%。这不仅是对昇腾AI硬件的进一步深度优化,也展示了国产算力在追赶国际先进水平方面的决心和能力。


目前,华为昇思开源社区已正式上架星火大模型开源13B,面对学术、企业研究完全免费,增进学术合作的同时,增进产业探索。


“通过这场发布会,我们展望一个充满希望、孕育着生长能量的春天。相信2024年一定可以实现星火燎原,通用人工智能不仅能够在中国各大领域深度而广泛应用,而且我们在源头技术创新、在大模型的底层能力上也会站上全新台阶。”刘庆峰说。


编辑 韦英姿

校对 付春愔