三大能力、十大维度！元保聚焦保险领域评估大模型价值

首页 > AI资讯 > 最新资讯 > 三大能力、十大维度！元保聚焦保险领域评估大模型价值

三大能力、十大维度！元保聚焦保险领域评估大模型价值

新火种 2023-10-27

2023年，ChatGPT横空出世，让世界认识了AIGC的魔力，也在国内掀起了一场关于大模型的竞争，国内主要科技公司基本开始下场制作自己的大模型。如今，大半年已经过去，已经有许多人工智能大模型开始陆续面世。为了探究这些大模型在实际场景的应用潜力，国内领先的保险科技平台——元保，联合国内保险科技研究机构——分子实验室，共同发布了《人工智能大模型保险行业应用评测报告》（以下简称《报告》），评测其在保险领域的应用价值。

根据《报告》显示，元保联合分子实验室对包括ChatGPT3.5、ChatGPT4、Claude-1、Claude-2、清华智谱ChatGLM130B、百度文心一言、阿里通义千问、科大讯飞星火、360智脑、昆仑万维天工等市场上十大主流的大模型进行了测评。同时，《报告》还特邀国内知名高校专家学者、中国大地财产保险股份有限公司、众惠财产相互保险社等保险公司的专业人员共同调研并撰写完成。

对于《报告》的价值和借鉴意义，清华大学金融科技研究院副院长、中国保险与养老金研究中心主任魏晨阳给出了高度的评价，他表示：“对大模型的评测工作，在全球范围都是一个意义重大的事情。结合金融领域一个重要板块（保险）的大模型评测，其实更具有特殊的意义。包括AI在内的科技赋能，核心在于结合具体应用场景时，模型是否在实操层面、核心业务的前沿，真正有实用价值。”

在测评维度层面，《报告》从常用的保险业务场景中抽离出三大能力，即专业知识问答能力、营销服务应用能力、合规风控应用能力，基本上涵盖大模型在保险领域的主要应用方向。综合各问题回答表现的平均分，10个主流大模型在医疗知识、保险常识、保险法律知识领域表现普遍较好，在智能核保、智能理赔、话术优化上表现不尽如人意，在营销服务应用能力上表现参差不齐，而国内大模型的表现要强于国外大模型。

总结来说，当下头部大模型在专业知识问答上已有较强应用能力，可直接使用程度很高，但是仍需要在营销话术、理赔建议、场景识别等方面进行提升，而元保联合分子实验室发布的这份保险行业首份大模型评测报告《报告》，则是一定程度上消除了保险大模型市场的信息不对称，对于保险机构选择大模型厂商、深度应用大模型具有非常大的指导意义。

Tags:

自然语言处理维度模型

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

三大能力、十大维度！元保聚焦保险领域评估大模型价值

百度千帆大模型平台日均调用量超7亿次

百度智能云：千帆大模型平台日均调用量超7亿次

科大讯飞与中国绿发携手发布泰山大模型

华知大模型5.0发布

三个大模型组队挑战o1，实测360多模型协作干掉提示词工程

热门文章

全球首次！人形机器人将与人类一起跑“半马”

政协委员甄子丹：人工智能对电影行业既是冲击也是鼓励

全国人大代表刘庆峰：发展AI新岗位，试点“AI失业保障专项保险”

我国首个林草行业大模型研发成功

工学博士娄勤俭：我对人工智能有偏爱

平稳开局！今年一季度我国货物贸易进出口10.3万亿元，增长1.3%

前高通高管任小米芯片平台部负责人；2024年我国再生资源回收总量超4亿吨

小K播早报|2025中国互联网企业家座谈会召开“天工”夺得全球首个人形机器人半马冠军

人工智能概念股午后拉升，科创人工智能相关ETF涨近4%