报告提出:大模型需进一步挖掘产业价值
中国青年报客户端讯(中青报·中青网记者 王海涵 )去年ChatGPT面世以来,大模型技术备受社会关注。近日,新华社研究院中国企业发展研究中心发布的年度第三份关于大模型的评测报告——人工智能大模型体验报告3.0(下文简称《报告》)评测结果显示,由科大讯飞研发的讯飞星火认知大模型获得1775最高分,并获基础能力指数、智商指数、工具提效指数三项评测指标第一。本次测评选取10家最新版本国产主流大模型产品,以“技术实力”和“发展潜力”为坐标系,在1000道题里面选择400道题进行实际问答,测试基础能力、智商、情商和工具提效四个维度。其中,“工具提效指数”直指落地应用,通过“在不同专业技能场景下评测模型均能一定程度上提升问题分析和解决水平,以及大纲罗列的速度”,来检验大模型是否真正“好用”。测评指标方面,“技术实力”包括平台性能、安全性能、模型可解释性、实时性能四大二级指标和易用性等七大三级指标;“发展潜力”包括社会认可度、创新能力、市场前景三大二级指标和用户接受度等五大三级指标。
本次评价在评估维度、主客观融合、指标与市场异动匹配等方面相较以往进行升级,增加了对大模型厂商技术实力和未来发展潜力的维度评测等。《报告》提出,今年下半年以来,“百模大战”已从“拼技术”转向“拼应用”的转折点,各厂商都努力在模型算法、架构、性能等各方面寻求突破。大模型技术在C端场景应用落地越来越多,在B端赋能千行百业的产业价值需进一步挖掘。期待未来大模型能够推动数字经济和产业经济深度融合,牵起新一轮技术革命,为社会经济发展提供源源不断科技动力。综合指数测评图解。受访单位供图来源:中国青年报客户端
相关推荐
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。