首页 > AI资讯 > 最新资讯 > 国泰君安:计算机国产大模型性能领先场景应用加速落地

国泰君安:计算机国产大模型性能领先场景应用加速落地

新火种    2025-01-15

智通财经APP获悉,国泰君安发布研报称,DeepSeek-V3的发布标志着国产AI在规模、效率和成本方面实现重大突破。DeepSeek-V3在多项评测中超越多款顶尖模型,且成本极具竞争力,其强大性能与开源策略显著提升了其市场竞争力,具备高投资价值。因此AI大模型在各行业落地的技术路径有望逐步明确,MoE架构的低成本、高性能的大模型在垂类领域中的运用潜力巨大。

国泰君安主要观点如下:

DeepSeek-V3的强大性能与开源策略显著提升了其市场竞争力,具备高投资价值。

DeepSeek正式发布了其全新系列模型DeepSeek-V3,并同步开源。该模型为自主研发的MoE架构,拥有6710亿参数和37亿激活参数,在14.8万亿token上进行了预训练。DeepSeek-V3在多个评测中超越了Qwen2.5-72B和Llama-3.1-405B等开源模型,其性能与顶尖闭源模型GPT-4o和Claude-3.5-Sonnet相媲美。尤其在知识类任务、长文本处理、代码编写和数学竞赛等方面表现出色。

DeepSeek-V3的生成速度提升和灵活的API定价策略为用户带来更高的使用价值。

通过算法和工程上的创新,DeepSeek-V3的生成吐字速度从每秒20次提升至60次,实现了3倍的性能提升,用户体验更加流畅。DeepSeek调整了API服务的价格,新的定价为每百万输入tokens0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens8元。高性价比有望为DeepSeek带来了更大市场份额和收入增长。

DeepSeek-V3的开源权重和本地部署能力增强其社区支持和应用扩展性,推动了技术生态发展。

DeepSeek-V3采用FP8训练,并开源原生FP8权重,得到开源社区的广泛支持。DeepSeek提供从FP8到BF16的转换脚本,方便社区进行适配和拓展应用场景。模型权重可通过HuggingFace平台下载,进一步促进了本地部署和多样化应用。这种开放的生态系统为其在AGI普惠化方面奠定了坚实基础。

风险提示:较低定价压缩盈利空间,技术竞争加剧的风险。

相关推荐
免责声明
本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。