首页 > AI资讯 > 最新资讯 > 大模型迈向“多模态”时代,“情绪化”成关键趋势|直击2025GDC

大模型迈向“多模态”时代,“情绪化”成关键趋势|直击2025GDC

科创板日报记者陈美    2025-02-22

《科创板日报》2月21日讯(记者 陈美)开年,随着上海首个科技盛会 ——“2025 全球开发者先锋大会(GDC)” 的举办,一场关于技术是创新基石、应用是实现落地的关键、发展需具备可持续性的思维碰撞在大会中激烈展开。

会上,AI产业链语料企业库帕思CEO黄海清在接受《科创板日报》记者采访时表示,“随着DeepSeek的崛起,基础大模型公司们将重新资源分配,语料行业也需要在这场变革中自我更新,把成本降下来。”

作为专注于人工智能语料数据服务的公司,黄海清向《科创板日报》记者介绍,库帕思已经为阶跃星辰、商汤、MiniMax,以及上海人工智能实验室等提供高质量的语料数据。

黄海清认为,随着行业的发展,现在是Data for AI,但未来则是AI for Data。“在 AI 产业链中,算力、算法、算料是关键的三要素。在算力方面,需朝着具备 10 万卡集群规模的方向演进;在算法方面,以 DeepSeek 为代表的基础大模型公司已实现弯道超车,未来是否会再次被超越,值得期待;在算料方面,国内人工智能应用场景丰富,能够带动高质量算料的进步与发展。”

对于语料产业发展的趋势,黄海清认为,未来行业语料的标注和清洗,应该有AI的身影。“即通过AI技术实现语料标注的自动化与知识化,让行业从劳动力密集型变为知识和技术型,最终减轻数据获取成本高昂的问题。”

“同时,高质量的语料数据也应该具有鲜活度、真实性、大样本、完整性、多样性、高知识密度的特点。目前,大模型在情绪理解和知识深度上的语料能力仍有不足,需通过高质量语料和算法优化改进。” 黄海清说道,鉴于当前大模型发展现状,未来多模态大模型(如结合视觉、语音)必将成为行业趋势,进一步推动 AI 贴近人类的需求。

在此背景下,《科创板日报》记者注意到,上海本地的头部大模型公司——阶跃星辰开源了两款阶跃 Step 系列多模态大模型——Step-Video-T2V 视频生成模型和 Step-Audio 语音模型。

阶跃星辰副总裁李璟表示,“多模态一直阶跃星辰最重要的标签。而之所以拥抱开源,是因为相信技术社区的力量,希望吸引更多‘智慧’,优化、改进大模型。同时,构建强大的生态。”

根据企业官方技术报告中的评测结果,阶跃 Step-Video-T2V 的参数量和模型性能目前在全球开源视频生成领域都处于领先水平。而阶跃 Step-Audio方面,据介绍,这是业内首款产品级的开源语音交互模型,目前已在跃问 App 内开放用户体验。

李璟表示,阶跃 Step-Audio最大的特点,是能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地进行高质量对话。“比如,当用户面临各种人生问题,它都可以像好朋友一样提供贴心陪伴并出主意,体现出‘熟知人情世故’等、情商高特点。”李璟谈到。

库帕思CEO黄海清也认为,语料数据的情绪化,是大模型发展的重要一步。“没有‘情绪’就意味着没有人类共性和人情味,大模型仍是冷冰冰的机器;有‘情绪’的大模型,则代表了‘有趣’的灵魂,可以让AI成为人类更好的Agent。”

相关推荐
免责声明
本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。