国产AI大模型高考成绩单出炉：讯飞星火获得综合第一

首页 > AI资讯 > 最新资讯 > 国产AI大模型高考成绩单出炉：讯飞星火获得综合第一

新火种 2024-06-12

6月11日消息，随着今年高考的结束，一场前所未有的“智能竞赛”也在幕后悄然展开。今年的高考战场上，一支非传统但引人注目的队伍——国产人工智能大模型，吸引了广泛关注。

近日，搜狐科技、量子位等十余家权威媒体对近10款国产人工智能大模型进行了高考作文、数学、物理三个科目的全面评测，并公布了令人瞩目的成绩。

首先进行的是高考作文的评测。在搜狐科技的评测中，三位资深语文教师作为权威专家为各大模型的作文打分。腾讯元宝和百度文心一言以超过50分的成绩位居前列，智谱清言、字节豆包与讯飞星火则并列第三。Kimi、阿里通义、百川、海螺排名相对靠后。

而在潇湘晨报的“AI写作”评测中，讯飞星火不仅平均分位居首位，且获得了全场最高分56分。潇湘晨报邀请湖南知名作家、编辑作为阅卷老师，对国内五大AI大模型产品——百度文心一言、讯飞星火、阿里通义千问、字节豆包、腾讯元宝的高考作文进行评分，经过四位阅卷老师的综合打分，讯飞星火以49分的平均分高居首位。

国产AI大模型高考成绩单出炉：讯飞星火获得综合第一

给讯飞星火打出“全场最高分”56分的阅卷老师表示：“本文观点清晰，论述集中且层层推进，很多句子都简洁有力，颇有思想性。如果是某个学生写的，无疑是难得的佳作。”

接下来是数学科目的较量。在搜狐科技的数学评测中，讯飞星火、文心一言、豆包均以63%的正确率位列第一梯队，智谱清言、阿里通义则以50%的正确率位居第二梯队，其他大模型相对落后。

国产AI大模型高考成绩单出炉：讯飞星火获得综合第一

在量子位的高考数学评测中，虽然没有给出详细成绩单，但展示了各家大模型详细的解题思路，交由网友打分，通过网友的投票打分可以看出，讯飞星火的“识图+解数学题”能力收到了最高认可，位居其后的分别是Kimi、通义千问、文心一言、豆包等。

国产AI大模型高考成绩单出炉：讯飞星火获得综合第一

最后是高考物理的测试。在量子位的评测中，阿里通义千问与讯飞星火以71.4%的准确率高居第一梯队，而Kimi、海螺和腾讯元宝则以42.9%的准确率位于第二梯队。百川百小应和万知答对一题位于第三梯队。

文心一言、豆包、天工、智谱清言、商量因为出现了不同程度读图失败的问题，在成功识别的题目中，商量和文心一言的正确率为2/4，即正确率为28.6%；豆包、天工、智谱清言正确率为1/2，即正确率为14.3%。

国产AI大模型高考成绩单出炉：讯飞星火获得综合第一

综合以上媒体在作文、数学、物理三门科目的成绩，我们得出了2024年人工智能大模型高考“成绩单”。来自科大讯飞的讯飞星火以52.49分高居第一名，通义千问、文心一言分别位列第二、第三名，而Kimi、字节豆包、海螺AI等其他大模型也有不错的表现。

综合成绩：

第一名：52.49 讯飞星火

第二名：46.08 通义千问

第三名：37.67 文心一言

第四名：34.68 Kimi

第五名：33.57 字节豆包

第六名：31.92 海螺AI

第七名：30.61 腾讯元宝

第八名：30.28 智谱清言

第九名：21.56 百川百小应

国产AI大模型高考成绩单出炉：讯飞星火获得综合第一

Tags:

成绩单模型

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。