腾讯混元大模型应用落地加速超300个腾讯产品及场景接入内测

首页 > AI资讯 > 最新资讯 > 腾讯混元大模型应用落地加速超300个腾讯产品及场景接入内测

腾讯混元大模型应用落地加速超300个腾讯产品及场景接入内测

证券日报 2023-11-24

　　11月23日，腾讯披露，腾讯混元大模型背后的自研机器学习框架Angel再次升级，大模型训练效率提升至主流开源框架的2.6倍，千亿级大模型训练可节省50%算力成本。升级后的Angel支持单任务万卡级别超大规模训练，进一步提升腾讯云HCC大模型专属算力集群的性能和效率。

　　同时，Angel还提供了从模型研发到应用落地的一站式平台，支持用户通过API接口或精调等方式快速调用腾讯混元大模型能力，加速大模型应用构建，腾讯会议、腾讯新闻、腾讯视频等超过300个腾讯产品及场景均已接入腾讯混元内测。

　　目前，相关能力已通过腾讯云对外开放。基于升级后的Angel机器学习框架，腾讯云TI平台可提供更优的训练和推理加速能力，并支持客户用自己的数据一站式训练精调，基于腾讯混元大模型打造专属智能应用。

　　自研机器学习框架升级，大模型训练推理效率再提升

　　面向大模型训练，腾讯自研了机器学习训练框架AngelPTM，针对预训练、模型精调和强化学习等全流程进行加速和优化。AngelPTM采用最新的FP8混合精度训练技术，结合深度优化后的4D并行和ZeROCache机制优化存储，可兼容适配多款国产化硬件，能够以更少的资源和更快的速度训练更大的模型。

　　2023年4月份，腾讯云面向大模型而生的新一代HCC高性能计算集群正式发布，性能较前代提升3倍。除了硬件的升级外，针对大模型训练场景，HCC对网络协议、通信策略、AI框架、模型编译等也进行了系统级优化，大幅节约训练调优和算力成本。此前AngelPTM就已经通过HCC对外提供服务，本次Angel机器学习框架升级，也将进一步提升HCC大模型专属算力集群的性能，助力企业加速大模型落地。

　　腾讯自研的大模型推理框架AngelHCF通过扩展并行能力、采用多种Attention优化策略等方式对性能进行了提升。同时，框架还适配了多种压缩算法，以提高吞吐能力，从而实现更快的推理性能和更低的成本，支持大型模型推理服务。相较于业界主流框架，AngelHCF的推理速度提高了1.3倍。

　　一站式应用构建，让大模型“开箱即用”

　　作为实用级大模型，腾讯混元大模型从研发之初就面向应用场景而生，在实践中解决大模型落地难点。腾讯产品及应用种类多、流量大，让模型真正“用起来”挑战很大。基于Angel，腾讯构建了大模型接入和应用开发的一站式平台，包含数据处理、精调、模型评估、一键部署以及提示词调优等服务，让大模型的“开箱即用”成为可能。

　　模型接入层面，腾讯混元大模型提供千亿、百亿、十亿多个尺寸的模型，充分适配各类应用场景的需求，只需要经过简单微调就能达到满足业务需求的效果，同时降低模型训练和推理服务的资源成本，在问答、内容分类等常见应用场景中具有更高的性价比。

　　应用开发层面，腾讯内部已有超过300项业务和应用场景接入腾讯混元大模型内测，相比上个月数量翻了一倍，覆盖文本总结、摘要、创作、翻译、代码等多个领域。

（文章来源：证券日报）

Tags:

深度学习模型场景

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

腾讯混元大模型应用落地加速超300个腾讯产品及场景接入内测

NVIDIA深度适配通义千问大模型，推出舱驾融合大模型解决方案

NVIDIA深度适配通义千问大模型推出舱驾融合大模型解决方案

哈啰亮相2024云栖大会：展示AI整体布局及大模型案例

在线可玩！智谱开源图生视频模型，网友直呼Amazing！

奥特曼：o1仅仅是“推理模型的GPT-2”；黄仁勋：我给你加速50倍

热门文章

未来的大模型，或许都是A卡来算的？

零一万物新模型盲测国产首超GPT-4o！李开复透露：一次训练成本超2000万

瞄准垂直领域，浩鲸科技“鲸智大模型”重磅发布

ColorOS15支持AI超清像素：50KB超糊图片秒变4K超清

量子计算新融资！玻色量子官宣数亿元A轮融资

6.98万！爆火的国产人形双足机器人今起开卖

联想发布首款信创AIPC！基于兆芯开先KX-7000系列：支持异构GPU加速

颜水成袁粒提出新一代MoE架构：专家吞吐速度最高提升2.1倍！

马斯克X平台寻求新的赚钱法子：将数据授权给第三方AI公司