“AI版拼多多”又出手了！DeepSeek放出超重磅全新模型R1：对标o1,实测超出想象的好，今天可用 - 新火种

热门关键词

文心一言 AI copy btc 斑马腾迅 aa 1 iPollo sd

首页 > AI资讯 > 最新资讯 > “AI版拼多多”又出手了！DeepSeek放出超重磅全新模型R1：对标o1,实测超出想象的好，今天可用

“AI版拼多多”又出手了！DeepSeek放出超重磅全新模型R1：对标o1,实测超出想象的好，今天可用

蒋紫涵 2024-11-22

DeepSeek放大招！DeepSeek-R1-Lite-Preview 震撼登场！推理能力超强，没有黑盒，实时展示推理思考过程，直接叫板OpenAI的o1-preview！

直接看性能

DeepSeek-R1-Lite 预览版模型在美国数学竞赛（AMC）中难度等级最高的 AIME 以及全球顶级编程竞赛（codeforces）等权威评测中，大幅超越了 GPT4o，甚至o1-preview 等知名模型

在六个不同基准测试（AIME 2024、MATH、GPQA Diamond、Codeforces、LiveCodeBench、ZebraLogic）中的表现

AIME 2024：pass@1，模型第一次尝试就给出正确答案的百分比

deepseeker-r1-lite-preview 的表现最佳，达到 52.5%。o1-preview 紧随其后，为 44.6%

MATH：accuracy，模型在数学推理题上的正确率

deepseeker-r1-lite-preview 依然领先，正确率为 91.6%。o1-preview 紧随其后（85.5%），与其他模型拉开较大差距

GPQA Diamond：pass@1，模型在高难度问题上的首答正确率

o1-preview 领先，达到 73.3%，deepseeker-r1-lite-preview 紧随其后，为 58.5%

Codeforces：rating，模型在编程挑战赛中的分数

deepseeker-r1-lite-preview 领先，分数为1450 , o1得分1428

LiveCodeBench：accuracy，编程任务的正确率（2024年8月至11月）

o1-preview 小幅领先，正确率为 53.6%。deepseeker-r1-lite-preview 紧随其后，为 51.6%

ZebraLogic：accuracy，评估逻辑推理任务的正确率

o1-preview 占据第一，为 71.4%，deepseeker-r1-lite-preview 紧随其后，为 56.6%

DeepSeek-R1-Lite-Preview推理缩放

更长的推理，更好的性能。随着思维长度的增加，DeepSeek-R1-Lite-Preview 在 AIME 上的得分稳步提高，这与OpenAI o1 提出推理缩放规律是一致的，由此也可以说明推理缩放具有巨大的潜力

DeepSeek-R1-Lite-Preview实测

实时透明的思维过程！让你清清楚楚地看到AI的思考过程，不再是黑盒！

我测试了几个经典问题:

9.11和9.8哪个大？

9.12和9.9哪个大？

单词 “strawberry”（草莓）有几个r?

单词'blueberrycherryberrycarbonpherry'?有几个r?

回答全都是一次性正确，并且实时的展示出了思考的过程

令我印象非常深刻，如果我没记错，这是我第一次在大模型上测试这些经典问题全部一次性答对，大家可以自己去试试

开源模型和API即将推出！DeepSeek-R1-Lite 目前仍处于迭代开发阶段，仅支持网页使用，暂不支持 API 调用。DeepSeek-R1-Lite 所使用的也是一个较小的基座模型，无法完全释放长思维链的潜力。正式版 DeepSeek-R1 模型将完全开源，公开技术报告，部署API

各路网友都在向OpenAI喊话，赶紧放出o1完整版，deepseek太强了，超出了想象

DeepSeek-R1-Lite-Preview现在就可以使用

现在就可以用，每天50个额度！ http://chat.deepseek.com

最后说一句：真心觉得deepseek太牛皮了，这是在别人限制我们情况下做出来的，国产之光！

Tags:

重磅出手

相关推荐

“AI版拼多多”又出手了！DeepSeek放出超重磅全新模型R1：对标o1,实测超出想象的好，今天可用

2024-11-22

中银证券：重磅玩家入局AI眼镜行业产业热度提升

2024-11-22

单月大涨2773%！AI，突传重磅

2024-11-21

独家|哪吒汽车“自救”进行时：将获供应链金融支持地方国资股东或陆续出手

2024-11-20

哪吒汽车“自救”进行时：将获供应链金融支持地方国资股东或陆续出手

2024-11-20

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

热门文章

政协委员甄子丹：人工智能对电影行业既是冲击也是鼓励

我国首个林草行业大模型研发成功

2025-04-18 20:23

小K播早报|2025中国互联网企业家座谈会召开“天工”夺得全球首个人形机器人半马冠军

2025-04-21 13:22

前高通高管任小米芯片平台部负责人；2024年我国再生资源回收总量超4亿吨

2025-04-19 11:21

美国对华芯片管制将适得其反？专家：华为等中国厂商将受益！

2025-04-23 11:21

蒙曼谈人工智能冲击：守住人类对于生活的感受

2025-04-21 11:28

分析师：美国禁售AI芯片适得其反给中国送上巨大胜利

2025-04-22 18:27

浩物股份：公司暂未本地部署接入DeepSeek大模型

2025-04-21 11:27

大消费高低切换加速涨价概念正逐步化身市场暗线

2025-04-17 13:23

两会新华解码丨“强化宏观政策民生导向”透出什么深意？

2025-04-17 11:28