首页 > AI资讯 > 最新资讯 > 阶跃星辰联合吉利开源两款多模态大模型打造开源大模型的中国新势力

阶跃星辰联合吉利开源两款多模态大模型打造开源大模型的中国新势力

新火种    2025-03-19

2月18日,阶跃星辰和吉利汽车集团联合宣布,将双方合作的阶跃两款Step系列多模态大模型向全球开发者开源。该两款大模型分别为Step-Video-T2V视频生成模型和Step-Audio语音模型。

其中,阶跃Step-Video-T2V模型的参数量达到300亿,可以直接生成204帧、540P分辨率的高质量视频。从生成效果来看,阶跃Step-Video-T2V在复杂运动、美感人物、视觉想象力、基础文字生成、原生中英双语输入和镜头语言等方面具备强大的生成能力,且语义理解和指令遵循能力突出,能够高效助力视频创作者实现精准创意呈现。

阶跃Step-Audio是行业内首个产品级的开源语音交互模型,能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地高质量对话。模型生成的语音具有超自然、高情商等特征,同时也能实现高质量的音色复刻并进行角色扮演,满足影视娱乐、社交、游戏等行业场景下应用需求。

阶跃星辰是吉利汽车集团的科技生态战略合作伙伴。双方在算力算法、场景训练等领域优势互补,显著增强了多模态大模型的性能表现。此次联合开源的行动,旨在促进大模型技术的共享与创新,推动人工智能的普惠发展。

吉利汽车集团CEO淦家阅表示:“目前,吉利全栈自研的星睿AI大模型已经与阶跃Step-Video-T2V、Step-Audio等大模型完成了深度融合,将为用户带来更智能、更高阶的座舱交互与智驾出行体验,推动AI科技在智能汽车领域的普及。”

据了解,这也是阶跃星辰首次开源其Step系列基座模型。阶跃星辰创始人、CEO姜大昕表示:“阶跃星辰一直以实现AGI为目标坚持研发基座大模型。我们相信多模态模型是实现AGI的必经之路,但目前尚处于早期阶段,期待与社区开发者集思广益,共同拓展模型技术边界,并推动产业落地。”

相关推荐
免责声明
本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。