麻省理工科技评论大模型评测：讯飞星火排名第一

大众报业·齐鲁壹点 2023-08-18

国内“千模大战”下，谁是最聪明的大模型？《麻省理工科技评论》中国最新发布的大模型评测报告给出了答案。

报告显示，在8个一级大类的600道题目的测试和盲评中，讯飞星火认知大模型V2.0在6个大类中得分率排名第一，在此次评测中表现突出，以 81.5 分（百分制计）的成绩在本次评测中登顶，荣获“最聪明”的国产大模型称号。

图：大模型评测综合得分率

图：4个大模型各项能力雷达图

《麻省理工科技评论》中国从研发和商业化能力、外界态度以及发展趋势等维度全方位检测大模型的能力，力图评出“最聪明”的国产大模型。选取了“讯飞星火”、“百度文心一言”、“商汤商量”、“阿里通义千问”作为中文大模型平台的代表，展开系统、科学的评测。

在刚刚过去的8月15日，讯飞星火认知大模型V2.0如期发布，进一步突破代码能力和多模态能力。技术获得重大突破的同时，搭载讯飞星火V2.0核心能力的应用和产品也越来越丰富：既有辅助程序员高效工作的智能编码助手iFlyCode1.0、能够进行视频创作的讯飞智作2.0、能够便捷搭建轻应用的教育数字基座应用开发助手，还有帮助教师设计教学活动、一键生成课件的星火教师助手、面向英语学习者口语练习的星火语伴2.0，讯飞AI学习机也升级AI 1对1智能编程助手和AI 1对1创意绘画伙伴。

责任编辑：向南