上海人工智能实验室葛佳烨：大模型评测亟需可靠的数据污染检测技术

首页 > 快讯 > 上海人工智能实验室葛佳烨：大模型评测亟需可靠的数据污染检测技术

上海人工智能实验室葛佳烨：大模型评测亟需可靠的数据污染检测技术

新火种 2024-04-15

14日讯，在“知乎AI先行者沙龙”上，上海人工智能实验室司南大模型评测产品负责人葛佳烨表示，大语言模型评测中面临全面性、评测成本、数据污染、鲁棒性等挑战。她表示，评测数十万道题需要大量算力资源，基于人工打分的主观评测成本高昂。同时，海量语料不可避免带来评测集污染，亟需可靠的数据污染检测技术。此外，大模型对提示词十分敏感，多次采样情况下模型性能不稳定。（记者黄心怡）

Tags:

人工智能实验室

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

上海人工智能实验室葛佳烨：大模型评测亟需可靠的数据污染检测技术

工信部辛国斌：深化5G+工业互联网和人工智能赋能加快数字技术在制造业全行业全链条的应用

工信部辛国斌：深化5G+工业互联网和人工智能赋能，加快数字技术在制造业全行业全链条的应用

徐直军：华为核心战略是抓住人工智能变革机遇，提供可持续算力解决方案

传音控股与联发科技共建人工智能联合实验室

美国SEC主席：人工智能工具单一化会给金融业带来风险

热门文章

蒋昌建谈人与机器人未来：不可避免投射感情，定会融合发展

保龄宝：公司暂未接入deepseek大模型

东信营销科技：获得AI大模型“双备案”认证

上海一小学的世界读书日：纸质阅读的浪漫，AI无法取代

2连板海航科技：目前公司不涉及人工智能、云计算和云存储业务

海航科技：公司目前不涉及“人工智能”“云计算”“云存储”业务

产学研深度融合力推大模型广泛落地

靳东：喜爱我的观众被AI骗得很惨，建议AI换脸立法

泼水节要来了，“澎湃”用AI打开西双版纳狂欢盛宴