蚂蚁集团CodeFuse代码大模型开源ModelCache大模型语义缓存

首页 > AI资讯 > 最新资讯 > 蚂蚁集团CodeFuse代码大模型开源ModelCache大模型语义缓存

蚂蚁集团CodeFuse代码大模型开源ModelCache大模型语义缓存

新火种 2023-11-11

站长之家11月6日消息:蚂蚁集团旗下CodeFuse 代码大模型宣布开源了 ModelCache 大模型语义缓存，可以降低大型模型应用的推理成本，提升用户体验。

ModelCache 的架构包括 adapter、embedding、similarity 和 data_manager 模块。adapter 模块处理业务逻辑，embedding 模块将文本转换为语义向量表示，similarity 模块对向量进行相似度排序和评估，data_manager 模块负责数据的存储和查询。ModelCache 还支持一键清空和缓存淘汰策略等缓存数据管理功能，数据隔离功能以确保不同环境、产品和模型之间的数据独立性，以及数据回流功能来保存重要数据。

微信截图_20231106161315.png

ModelCache 的线上效果统计表明，命中缓存可以将平均耗时降低10倍，提速率可达14.5%。此外，ModelCache 还对 embedding 模型进行了持续优化，以提高语义相似度的准确性。

未来，ModelCache 将继续优化性能和精度，通过算法优化、数据存取和计算资源调配等手段提升召回时间和准确率。同时，将进一步改进语义表示技术和相似度评估模块，以提高模型对复杂语义的理解能力和召回率。

Tags:

人工智能模型语义

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

蚂蚁集团CodeFuse代码大模型开源ModelCache大模型语义缓存

美光科技：人工智能（AI）需求稳健，驱动数据中心DRAM产品增产

Meta发布多模态LLAMA3.2人工智能模型，能够同时理解图像和文本

百度千帆大模型平台日均调用量超7亿次

百度智能云：千帆大模型平台日均调用量超7亿次

科大讯飞与中国绿发携手发布泰山大模型

热门文章

香港生成式人工智能研发中心获2亿港元捐赠

杭州：争夺机器人第一城

美国对华芯片管制将适得其反？专家：华为等中国厂商将受益！

成立香港仔机器人，国华（00370）按下人工智能转型加速键

蒙曼谈人工智能冲击：守住人类对于生活的感受

信银理财董文赜：拥抱变革向新求质——共赴银行理财高质量发展新征程

重庆首例！机器人辅助通过3里米小孔切除巨大肿瘤

分析师：美国禁售AI芯片适得其反给中国送上巨大胜利

浩物股份：公司暂未本地部署接入DeepSeek大模型