科大讯飞取得模型训练方法专利，提升模型的泛化能力

首页 > AI资讯 > 行业动态 > 科大讯飞取得模型训练方法专利，提升模型的泛化能力

科大讯飞取得模型训练方法专利，提升模型的泛化能力

新火种 2023-12-11

金融界2023年12月2日消息，据国家知识产权局公告，科大讯飞股份有限公司取得一项名为“模型训练方法、装置、设备及存储介质“，授权公告号CN116628509B，申请日期为2023年7月。

专利摘要显示，本申请公开了一种模型训练方法、装置、设备及存储介质，方法包括：当确定需要添加新增训练数据时，基于预先构建的batch列表，过滤掉已经训练使用过的batch，得到剩余各batch，避免重复读取已使用的batch迭代训练模型，其中batch列表中按照训练时的读取顺序记录各batch的标识。对于新增训练数据构建成若干batch，将对新增训练数据所构建的各batch与剩余各batch进行随机顺序打乱，并将打乱后的各batch的标识顺序的记录在batch列表中，以便后续按照batch列表顺序读取各标识对应的batch数据，进行在线模型训练，可以最大程度地保持训练数据的分布一致性，提升模型的泛化能力。

Tags:

大模型模型专利

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

科大讯飞取得模型训练方法专利，提升模型的泛化能力

NVIDIA深度适配通义千问大模型，推出舱驾融合大模型解决方案

NVIDIA深度适配通义千问大模型推出舱驾融合大模型解决方案

哈啰亮相2024云栖大会：展示AI整体布局及大模型案例

在线可玩！智谱开源图生视频模型，网友直呼Amazing！

奥特曼：o1仅仅是“推理模型的GPT-2”；黄仁勋：我给你加速50倍

热门文章

英伟达接到大单：曝苹果斥资10亿购买AI服务器

营收上涨、净亏损扩大，小马智行发布上市后首份财报

腾讯混元训练营开营，共创50多个大模型应用场景

性能不等于销量NVIDIA最新AI芯片市场遇冷！客户偏爱成熟老产品

朱啸虎看不上的赛道，腾讯投了150亿独角兽

腾讯构建AI新矩阵：四大产品线合龙

腾讯发布2024全年财报，一边靠游戏赚钱，一边给AI充值

小米真AI智能眼镜下月发布：双芯架构、自带镜头

DeepSeekV3模型重磅升级！腾讯/微美全息加速AI大模型“上车”多场景落地