国产AI大战高考物理，第1题全对，第2题开始放飞 - 新火种

热门关键词

文心一言 AI copy btc 斑马腾迅 aa 1 iPollo sd

首页 > AI资讯 > 最新资讯 > 国产AI大战高考物理，第1题全对，第2题开始放飞

国产AI大战高考物理，第1题全对，第2题开始放飞

新火种 2024-06-11

端午佳节，有的地方高考已经结束，有的考生还奋战在考场上。

先祝大家都心想事成，考出水平。

陆陆续续，文理综各个科目的考试题目开始在网上流出，那么语文数学之后，也是时候让大模型们继续来挑战一波了。

国产AI大战高考物理，第1题全对，第2题开始放飞

考题方面，先给大模型们来一份辽宁物理——

多解释一嘴，新高考改革下大部分省份已经取消了文理分科，采用3+1+2或3+3的新模式，也就是物理化学生物现在是拆开考的。

那么闲话少叙，我们有请参赛AI助手——

通义千问、文心一言、Kimi、智谱清言、豆包、海螺AI、腾讯元宝、讯飞星火、天工、百小应、万知、商量。

国产AI大战高考物理，第1题全对，第2题开始放飞

Round 1：单选题

这份物理卷共有10道选择题，其中1-7题为单选题，总计28分。

1、3两题不涉及图片解析，人类考官直接把题目扔给了大模型：

国产AI大战高考物理，第1题全对，第2题开始放飞

图片题给出的提示词统一为：查看图中题目，给出答案。

国产AI大战高考物理，第1题全对，第2题开始放飞

在看详细答案之前，心急的看官们可以先扫一眼“考试”结果（测试方法比较简单粗暴，不能完全反映各AI真实水平，仅图一乐）：

国产AI大战高考物理，第1题全对，第2题开始放飞

文心一言、豆包、天工、智谱清言和商量出现了不同程度读图失败的问题，在成功识别的题目中，商量和文心一言的正确率为2/4，豆包、天工、智谱清言正确率为1/2。

接下来，就来看看大模型们的具体表现。

单选题中，准确率最高的是第一题，一道有关标量矢量的概念题，参赛大模型百分百通过。

到了第二题，大模型们就开始各有各的想法了。题目是：

国产AI大战高考物理，第1题全对，第2题开始放飞

来看看成功得分的选手们的回答：

通义千问

国产AI大战高考物理，第1题全对，第2题开始放飞

文心一言

国产AI大战高考物理，第1题全对，第2题开始放飞

海螺AI

国产AI大战高考物理，第1题全对，第2题开始放飞

讯飞星火

国产AI大战高考物理，第1题全对，第2题开始放飞

4位选手中，文心一言和讯飞星火进行了逐个答案的分析，海螺AI则最言简意赅，只回答了答案没给过程。

另一道正确率比较高的题，是难度较大的第5题。

国产AI大战高考物理，第1题全对，第2题开始放飞

但答对这道题的选手名单有所不同，讯飞星火、海螺AI依然在列，另外两位换成了Kimi和腾讯元宝。

Kimi

国产AI大战高考物理，第1题全对，第2题开始放飞

腾讯元宝

国产AI大战高考物理，第1题全对，第2题开始放飞

和海螺AI一样，腾讯元宝也是惜字如金型（doge）。

另外一个有意思的现象是，有的大模型选手尽管答案不对，但还挺有考试技巧的。

比如ChatGLM，在面对双缝干涉实验中，“哪种说法可以使相邻两条亮纹中央间距变小”这个问题时，它一通分析觉得答案全错，但还是退而求其次挑了一个看上去相对正确的答案。

国产AI大战高考物理，第1题全对，第2题开始放飞

Round 2：多选题

再来看看多选题（18分）的情况。

p.s. 在多选题作答过程中，人类考官在提示词中提醒了选手们这是“多选题”。

国产AI大战高考物理，第1题全对，第2题开始放飞

根据多选题判卷规则，全部选对得满分，部分选对得一半分，有选错不得分，表现最佳的是海螺AI（2道题全对，1道题部分对），其次是通义千问、文心一言和万知（1道题全对，2道题部分对）。

和单选题的情况类似，大模型们正确率最高的第8题是一道概念题：

第9题有两位选手选中了全部正确选项：海螺AI和万知。

国产AI大战高考物理，第1题全对，第2题开始放飞

来看看万知的具体回答：

国产AI大战高考物理，第1题全对，第2题开始放飞

今日份的测试，就先到这里，你觉得大模型们的表现如何？至少在这份物理卷子46分的选择题里，还是有不少选手能拿到及格分了。

— 完 —

Tags:

大战物理

相关推荐

科学探索奖名单出炉：最年轻仅31岁，数学物理领域女性占半数

2024-08-28

国产AI大战高考物理，第1题全对，第2题开始放飞

2024-06-11

新火种AI|谷歌“复仇”OpenAI，硅谷AI大战正在上演

2024-05-20

“百模大战”进入新阶段商业化之路有待探索

2024-04-27

百模大战”进入新阶段，商业化之路有待探索

2024-04-27

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

热门文章

小K播早报|2025中国互联网企业家座谈会召开“天工”夺得全球首个人形机器人半马冠军

杭州：争夺机器人第一城

2025-04-24 11:27

前高通高管任小米芯片平台部负责人；2024年我国再生资源回收总量超4亿吨

2025-04-19 11:21

美国对华芯片管制将适得其反？专家：华为等中国厂商将受益！

2025-04-23 11:21

成立香港仔机器人，国华（00370）按下人工智能转型加速键

2025-04-24 11:27

信银理财董文赜：拥抱变革向新求质——共赴银行理财高质量发展新征程

2025-04-24 13:24

蒙曼谈人工智能冲击：守住人类对于生活的感受

2025-04-21 11:28

分析师：美国禁售AI芯片适得其反给中国送上巨大胜利

2025-04-22 18:27

浩物股份：公司暂未本地部署接入DeepSeek大模型

2025-04-21 11:27

【VIP机会日报】政策面催化下跨境支付概念震荡走高栏目多维度梳理焦点公司收获涨停

2025-04-24 13:24