国泰君安：计算机国产大模型性能领先场景应用加速落地

首页 > AI资讯 > 最新资讯 > 国泰君安：计算机国产大模型性能领先场景应用加速落地

国泰君安：计算机国产大模型性能领先场景应用加速落地

新火种 2025-01-15

智通财经APP获悉，国泰君安发布研报称，DeepSeek-V3的发布标志着国产AI在规模、效率和成本方面实现重大突破。DeepSeek-V3在多项评测中超越多款顶尖模型，且成本极具竞争力，其强大性能与开源策略显著提升了其市场竞争力，具备高投资价值。因此AI大模型在各行业落地的技术路径有望逐步明确，MoE架构的低成本、高性能的大模型在垂类领域中的运用潜力巨大。

国泰君安主要观点如下：

DeepSeek-V3的强大性能与开源策略显著提升了其市场竞争力，具备高投资价值。

DeepSeek正式发布了其全新系列模型DeepSeek-V3，并同步开源。该模型为自主研发的MoE架构，拥有6710亿参数和37亿激活参数，在14.8万亿token上进行了预训练。DeepSeek-V3在多个评测中超越了Qwen2.5-72B和Llama-3.1-405B等开源模型，其性能与顶尖闭源模型GPT-4o和Claude-3.5-Sonnet相媲美。尤其在知识类任务、长文本处理、代码编写和数学竞赛等方面表现出色。

DeepSeek-V3的生成速度提升和灵活的API定价策略为用户带来更高的使用价值。

通过算法和工程上的创新，DeepSeek-V3的生成吐字速度从每秒20次提升至60次，实现了3倍的性能提升，用户体验更加流畅。DeepSeek调整了API服务的价格，新的定价为每百万输入tokens0.5元(缓存命中)/2元(缓存未命中)，每百万输出tokens8元。高性价比有望为DeepSeek带来了更大市场份额和收入增长。

DeepSeek-V3的开源权重和本地部署能力增强其社区支持和应用扩展性，推动了技术生态发展。

DeepSeek-V3采用FP8训练，并开源原生FP8权重，得到开源社区的广泛支持。DeepSeek提供从FP8到BF16的转换脚本，方便社区进行适配和拓展应用场景。模型权重可通过HuggingFace平台下载，进一步促进了本地部署和多样化应用。这种开放的生态系统为其在AGI普惠化方面奠定了坚实基础。

风险提示：较低定价压缩盈利空间，技术竞争加剧的风险。

Tags:

深度学习模型场景

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

国泰君安：计算机国产大模型性能领先场景应用加速落地

NVIDIA深度适配通义千问大模型，推出舱驾融合大模型解决方案

NVIDIA深度适配通义千问大模型推出舱驾融合大模型解决方案

哈啰亮相2024云栖大会：展示AI整体布局及大模型案例

在线可玩！智谱开源图生视频模型，网友直呼Amazing！

奥特曼：o1仅仅是“推理模型的GPT-2”；黄仁勋：我给你加速50倍

热门文章

联想AIPC全家桶接入DeepSeek，本地跑70B大模型，离线也能写总结

【VIP机会日报】机器人概念再度走强栏目追踪行业动态提及产业相关公司强势涨停

马克龙敦促欧盟企业暂停在美投资，称不排除使用反胁迫工具应对关税

AI图像生成平台「LiblibAI」获数亿元融资

AI剧本风控项目启动天使轮融资

紫光国微：在特种集成电路业务方面强化业务能力、提升发展质量

联芸科技：我司已量产的商用产品暂未应用于无人驾驶

GPT-4.5发布了，最突出的是“情商”

资讯出海，扬帆起航正当时！