Claude3反超GPT-4竞技场登顶！小杯Haiku成开发者新宠：性价比无敌 - 新火种

热门关键词

文心一言 AI copy btc 斑马腾迅 aa 1 iPollo sd

首页 > AI资讯 > 最新资讯 > Claude3反超GPT-4竞技场登顶！小杯Haiku成开发者新宠：性价比无敌

Claude3反超GPT-4竞技场登顶！小杯Haiku成开发者新宠：性价比无敌

新火种 2024-03-29

GPT-4真的被反超了！

大模型竞技场上，Claude 3大杯Opus新王登基，Elo分数来到榜首。

Claude 3反超GPT-4竞技场登顶！小杯Haiku成开发者新宠：性价比无敌

连小杯Haiku也跻身第二梯队，超过了GPT-4-0613这个型号，把GPT-3.5-turbo远远甩在身后。

Claude 3反超GPT-4竞技场登顶！小杯Haiku成开发者新宠：性价比无敌

Haiku的输入token价格，可是比GPT-3.5-turbo还便宜了一半，输出方面，每100万token也比GPT-3.5-turbo便宜近2块钱。

Claude 3反超GPT-4竞技场登顶！小杯Haiku成开发者新宠：性价比无敌

跟GPT-4相比，价格更是只有1/20。并且Haiku同样支持200k上下文。

Claude 3反超GPT-4竞技场登顶！小杯Haiku成开发者新宠：性价比无敌

难怪有开发者直言：

Claude 3反超GPT-4竞技场登顶！小杯Haiku成开发者新宠：性价比无敌

而在Claude 3加入竞技之前，GPT-4家族已经霸榜快一年了。

Claude 3反超GPT-4竞技场登顶！小杯Haiku成开发者新宠：性价比无敌

给新来的朋友补充一下背景知识：大模型竞技场榜单（LMSYS Chatbot Arena Leaderboard）的评分标准是人类打分，同一个问题同时抛给A、B两个模型，人类裁判觉得哪个回答得好就给哪个投票。

小杯Haiku成开发者新宠

值得一提的是，在竞技场官方贺电中，Haiku这个型号也被专门高亮了出来：

Claude 3反超GPT-4竞技场登顶！小杯Haiku成开发者新宠：性价比无敌

具体有多快，已经有网友做了个直观的对比：

博尔特还没跑完100米，Haiku已经读完100k token的文档了……

Claude 3反超GPT-4竞技场登顶！小杯Haiku成开发者新宠：性价比无敌

Claude 3反超GPT-4竞技场登顶！小杯Haiku成开发者新宠：性价比无敌

事实上，凭借其超高的性价比，在开发者社群中，Claude 3小杯Haiku确已成新宠。

已经有人第一时间大开脑洞，搞出了能让Haiku效果“超频”到大杯Opus水准的开源项目，吸引不少关注。

Claude 3反超GPT-4竞技场登顶！小杯Haiku成开发者新宠：性价比无敌

简单来说，就是让Opus给Haiku当老师：

先用Opus生成执行任务的范例，再用这些教学案例来提高Haiku的姿势水平。

划重点：Haiku的价格仅为Opus的1/60，而响应速度则是Opus的10倍。

这个名为gpt-prompt-engineer的项目目前在GitHub上累计揽下7.3k标星。

Claude 3反超GPT-4竞技场登顶！小杯Haiku成开发者新宠：性价比无敌

还是这位马特老哥，还用Opus和Haiku搞了个“AI股票分析师”，直接火上了GitHub热榜。

Claude 3反超GPT-4竞技场登顶！小杯Haiku成开发者新宠：性价比无敌

不少应用产品也在第一时间接入了Haiku。比如能依据Prompt自动生成网站UI的Vercel。

Claude 3反超GPT-4竞技场登顶！小杯Haiku成开发者新宠：性价比无敌

△就说快不快吧

不过，就在一片给Claude 3新王点赞的声音中，也有网友认为：

Claude 3反超GPT-4竞技场登顶！小杯Haiku成开发者新宠：性价比无敌

但最让开发者们期待的当然还是：

Claude 3反超GPT-4竞技场登顶！小杯Haiku成开发者新宠：性价比无敌

OpenAI，快起来卷（doge）。

Claude 3反超GPT-4竞技场登顶！小杯Haiku成开发者新宠：性价比无敌

— 完 —

Tags:

竞技场新宠

相关推荐

GPT-4omini排名雪崩，大模型竞技场规则更新，奥特曼刷分小技巧无效了

2024-09-04

国产大模型全阵容，中文大模型竞技场推出！

2024-06-01

3D生成竞技场来了！比拼360°环绕视频，最强模型由你pick

2024-05-30

黑马！大模型竞技场榜单更新，国产玩家首次进入全球总榜前10

2024-05-22

开源模型首胜GPT-4！竞技场最新战报引热议，Karpathy：这是我唯二信任的榜单

2024-04-11

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

热门文章

政协委员甄子丹：人工智能对电影行业既是冲击也是鼓励

我国首个林草行业大模型研发成功

2025-04-18 20:23

小K播早报|2025中国互联网企业家座谈会召开“天工”夺得全球首个人形机器人半马冠军

2025-04-21 13:22

前高通高管任小米芯片平台部负责人；2024年我国再生资源回收总量超4亿吨

2025-04-19 11:21

美国对华芯片管制将适得其反？专家：华为等中国厂商将受益！

2025-04-23 11:21

蒙曼谈人工智能冲击：守住人类对于生活的感受

2025-04-21 11:28

分析师：美国禁售AI芯片适得其反给中国送上巨大胜利

2025-04-22 18:27

浩物股份：公司暂未本地部署接入DeepSeek大模型

2025-04-21 11:27

大消费高低切换加速涨价概念正逐步化身市场暗线

2025-04-17 13:23

两会新华解码丨“强化宏观政策民生导向”透出什么深意？

2025-04-17 11:28