首页 > AI资讯 > 最新资讯 > 千亿开胃菜中国电信开源12B星辰大模型:性能提升30%

千亿开胃菜中国电信开源12B星辰大模型:性能提升30%

新火种    2024-04-18

4月17日消息,中国电信近期宣布开源其12B参数规模的巨型AI模型——TeleChat-12B,此举标志着国内大模型技术发展的又一重要进展。

与1月份发布的7B参数版本相比,TeleChat-12B在内容理解、性能表现和应用场景等方面实现了约30%的整体提升,特别是在多轮对话推理和安全相关领域的能力上,提高超过了40%。

此外,有消息称,中国电信计划在今年内推出参数规模达到千亿级的超大型AI模型。

为了确保模型的高效能,TeleChat-12B将训练数据量从7B版本的1.5TB增加至3TB,显著提高了数据的质量和模型的性能。

TeleChat-12B还利用了电信用户的实际交互数据,对奖励模型和强化学习模型进行了优化,有效提升了模型在问答场景中的表现。

目前,星辰大模型已经被应用于多种实际场景,包括文本创作、编程、网络故障分析和业务经营分析等。以文本创作为例,该模型平均生成的文本长度超过1500字,且有效采纳率高达85.7%。

在对外服务的企事业单位客户中,星辰大模型支持企业经营分析、政务咨询、民生诉求响应等多样化场景,能够涵盖95%的实际业务需求,并且在多轮对话理解中的准确率达到了90%。

除了在传统行业中的应用,星辰大模型也在积极探索更多前沿领域的应用,例如在无人机智能编排和轻量化建设方面取得了新的进展。

千亿开胃菜 中国电信开源12B星辰大模型:性能提升30%

相关推荐
免责声明
本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。