金融大模型应用评测指南在沪首发

首页 > AI资讯 > 最新资讯 > 金融大模型应用评测指南在沪首发

金融大模型应用评测指南在沪首发

新火种 2024-12-15

上海标准再次在金融领域落地。昨天，在中共上海市委金融委员会办公室、上海市经济和信息化委员会指导下，上海市人工智能行业协会和上海金融业联合会联合发布全国首个以金融业务能力为核心的团体标准《金融大模型应用评测指南》，上海库帕思科技有限公司发布多维度金融大模型评测数据集(2024版)。《金融大模型应用评测指南》以金融业务为核心，从模型基础、金融安全与价值对齐、金融风险控制、金融专业认知、金融业务辅助拓展等5个维度185项指标要求着手，构建了金融领域大模型的能力测评框架，同时给出了相关的评测方法与工具以及评测分级标准。以模型基础能力方面为例，围绕模型基础理解和推演功能，指南定义了包括文本分类、信息抽取等在内的11项单模态，图文检索、视频问答等在内的6项多模态指标要求。金融安全与价值对齐能力方面，围绕模型的可靠性、可解释性以及隐私保护，指南设计了内容合规、文化价值、伦理价值等在内的9项指标要求。金融大模型评测数据集(2024版)是用于评测金融领域大模型应用成效的重要抓手。金融机构比照《金融大模型应用评测指南》能力测评框架，共设计评测数据44000余句对，帮助大模型“跑数据”。据介绍，评测数据集比照最高水平、最好标准，具有规模大、结构优、价值对齐等特点，符合金融领域对知识鲜活度、多样性和高密度的整体要求。后续，金融评测数据集将定期更新，样例集已在Open Data Lab和开放原子社区发布。

Tags:

机器学习模型指南

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

金融大模型应用评测指南在沪首发

CCF-CV携手合合信息打造技术分享论坛，聚焦大模型时代中的视觉安全前沿热点

周鸿祎：专业化大模型能够把大模型拉下神坛，把它从原子弹变成茶叶蛋

谷歌发布新一代大模型Gemini2.0，备战智能体时代

封面有数｜2024年度AI十大趋势发布：行业首轮洗牌结束，投融资呈现马太效应

谷歌称其PaliGemma2人工智能模型可识别情绪，引发专家担忧

热门文章

小K播早报|2025中国互联网企业家座谈会召开“天工”夺得全球首个人形机器人半马冠军

前高通高管任小米芯片平台部负责人；2024年我国再生资源回收总量超4亿吨

杭州：争夺机器人第一城

美国对华芯片管制将适得其反？专家：华为等中国厂商将受益！

信银理财董文赜：拥抱变革向新求质——共赴银行理财高质量发展新征程

蒙曼谈人工智能冲击：守住人类对于生活的感受

成立香港仔机器人，国华（00370）按下人工智能转型加速键

分析师：美国禁售AI芯片适得其反给中国送上巨大胜利

浩物股份：公司暂未本地部署接入DeepSeek大模型