科大讯飞的讯飞星火再次获得冠军，实现了国产大模型的“安全可控”

新华社研究院中国企业发展研究中心最近发布的年度第三份关于大模型的评测报告——人工智能大模型体验报告3.0（下文简称《报告》）评测结果显示，科大讯飞研发的讯飞星火认知大模型获得1775最高分，连续蝉联冠军，并在基础能力指数、智商指数、工具提效指数三项评测指标中排名第一。

本次报告在评估维度、主客观融合、指标与市场异动匹配等方面进行了升级。例如，在1000道题中选择400道题进行实际问答测试，并增加了对厂商技术实力和未来发展潜力的维度评测等。

《报告》选取了讯飞星火在内的10家最新版本国产主流大模型产品进行评测，以“技术实力”和“发展潜力”为坐标系。其中，“技术实力”包括平台性能、安全性能、模型可解释性、实时性能四大二级指标和易用性等七大三级指标，“发展潜力”包括社会认可度、创新能力、市场前景三大二级指标和用户接受度等五大三级指标。综合得出的主流大模型综合指数3.0显示，讯飞星火等3家大模型在“技术实力”和“发展潜力”上都处于第一象限，属于大模型领域的“未来领袖”。

星火认知3.0发布

星火认知3.0发布

《报告》认为，科大讯飞凭借其在语音技术领域的长期积累，为大模型注入了丰富的语音交互能力。综合“技术实力”和“发展潜力”，《报告》实际评测结果认为，科大讯飞再次表现亮眼，这再次证明了科大讯飞在大模型技术领域积淀深厚。

今年下半年以来，“百模大战”已从“拼技术”转向“拼应用”的转折点，应用为王成为行业共识。

《报告》对主流大模型的产品进行了基础能力、智商、情商和工具提效四大维度的测试。结果显示，科大讯飞获得1775分，总分第一且基础能力、智商、工具提效三项指数均获第一。今年8月份，在《人工智能大模型体验报告2.0》中，讯飞星火获得总分第一、智商和工具提效两项指数第一。

在《报告》的四大评测维度中，“工具提效指数”直指落地应用，通过在不同专业技能场景下评测模型提升问题分析和解决水平以及大纲罗列的速度来检验大模型是否真正“好用”。

上个月刚结束的讯飞星火认知大模型V3.0发布会上，讯飞星火的“工具属性”全面落地，人们在不同的场景都能感受到“AI助手”无处不在。在刚刚过去的“双11”，讯飞AI硬件销售额同比增长126%，讯飞AI学习机等多个智能硬件获得天猫和京东7个品类销售冠军。

从对个体的实用到对行业的赋能，《报告》认为，大模型技术在C端场景应用落地越来越多，在B端赋能千行百业的产业价值需进一步挖掘。

为了保证算力安全，讯飞和华为强强联合，将自身拥有的自研大模型训练平台与华为基于昇腾AI基础软硬件的高算力AI芯片、高性能算子库、多卡高速互联、分布式存储等优势结合起来，打造出面向超大规模大模型的训练国产算力集群，保证了人工智能大模型的算力安全和发展自主。同时，讯飞星火形成了立体化的“内容安全”保障机制，解决了内容安全方面的问题。

在实践成效方面，《报告》认为，在讯飞保障内容、华为保障算力的前提下，讯飞联合华为推出了国产软硬件一体化的私有专属大模型解决方案“星火一体机”。这个解决方案就像一个人工智能大模型的服务器，开箱即可提供从底层算力、AI框架、训练算法、推理能力、应用成效等全栈AI能力，让企业可以在这个“一体机”上独家打造属于自己的专属私有化大模型。

讯飞星火认知大模型V3.0功能亮点

科大讯飞刘聪：大模型的“直道冲锋”将是一场持久战

讯飞智作首批通过中国信通院“可信虚拟人”L3级检验

本文由小熊AI网发布，不代表小熊AI网立场，转载联系作者并注明出处：https://www.xiaoxiong360.com/html/info/1611.html

科大讯飞的讯飞星火再次获得冠军，实现了国产大模型的“安全可控”

相关推荐