从“卷”参数到“卷”应用大模型直击金融业务“最后一公里”
金融行业数据资源丰富,实践场景广泛,拥有与大模型深度结合的前景。而作为与数字技术最紧密的试验田,金融机构对于大模型的态度是高度关切但投入审慎。
一位国有大型银行人士认为,关键还是要看通过大模型能否突破此前业务中无法解决的效率或准确性问题。腾讯云计算(北京)有限责任公司(以下简称“腾讯云”)总裁邱跃鹏则指出,大模型并非越大越好,金融机构需要在场景中去“裁减”到最适合自己参数的模型,追求效率和成本的最优解。
《中国经营报》记者注意到,在近期披露的一系列大模型进展中,科技公司更多开始瞄准金融业务的“最后一公里”。11月23日,腾讯云发布金融行业大模型解决方案。同日,北京中关村科金技术有限公司(以下简称“中关村科金”)发布企业知识大模型、开发平台,以及AIGC应用等多项产品。更早前,蚂蚁科技集团股份有限公司(以下简称“蚂蚁集团”)披露百灵大模型已完成备案,基于该大模型的多款产品已陆续完成内测,将向公众开放。
对大模型的“理解误区”
波士顿咨询(BCG)在2023年8月发布的《银行业生成式AI应用报告(2023)》(以下简称“《报告》”)中指出,银行业应用生成式AI主要遵循两大类价值创造逻辑:一是替代人工,即接受大量重复性、简单基础的任务,以释放运营类人力资源;二是赋能人工,利用生成式AI的“对话”和“创造”能力,以AI为助手放大关键节点“人”的产能,赋能专业内容形成和基础管理环节。生成式AI的应用场景可以贯穿于银行全产业链的各个环节中,包括营销、获客、投研、风控等。
《报告》认为,未来生成式AI在银行业的落地进展,一方面取决于中文通用大语言模型的发展,另一方面基于通用大模型针对银行业的适配与优化。
自今年以来,国内大模型市场已经经历了从基础大模型、行业大模型到大模型应用的“三连跳”。腾讯研究院今年7月末的一项调研数据显示,国内参数在10亿规模以上的大模型数量已达到116个,其中金融行业大模型约18个。
中国信息通信研究院云计算与大数据研究所人工智能部主任曹峰表示,过去一年大模型发展极速,从聚焦基础能力,到聚焦大模型的开发平台,再到基于大模型应用生态的构建。目前,行业最需要解决的是大模型如何落地、运营以及如何在产业环境中进一步发挥作用。
对金融机构而言,“在产业环境中发挥效果”无疑是要走向业务“最后一公里”。但事实上,由于算力、数据、技术的一系列高门槛,不少中小金融机构对此仍是“望洋兴叹”。
一家中部省份城商行人士向记者表示,银行对大模型很关注,但感觉和小机构实际需求比较远,成本也太高,行内态度主要是先看头部大行怎么实践,再选择如何跟随。
在邱跃鹏看来,目前行业的一个误区在于:当大家想到大模型时都想去追求大参数、大size,觉得越大越好。但他的团队在实践中发现,很多场景中动辄一两千万元的成本不是每家企业都能承受的,必须考虑ROI(投资回报率)。
以金融业务中重要的智能识别技术(OCR)为例,金融行业的票据、单据处理需要大量非结构化的信息进行专业的处理,传统OCR深度学习模型需要有大量的定制,要做票据的检测、识别、程序化,错误率非常高。
邱跃鹏透露,OCR的一站式学习平台和大模型可以解决上述问题,但在参数选择和精调程度上要求很高。“如果把识别出来的文字灌到大模型中去做更好的图像理解、文字内容理解,不一定是最高效的解决办法。当我们在实践中把参数适当降下来后发现它对算力要求降低了却能很好解决场景问题。”他表示。
记者调研采访了解到,当前金融机构部署大模型主要有三种方式,除了极少机构有能力进行独立自研,更多采用的是与第三方合作形式,其中包括与通用或行业大模型合作再进行微调,也包括从云端调用接入大模型API(应用程序编程接口),完成私有化部署。而科技背景的平台型公司作为输出技术的主力军,通常在母公司的通用大模型基础上开发新的行业大模型,金融机构在实践中通常可以根据不同细分场景的业务需求,灵活选择各类大模型,降低大模型使用成本。目前,基于百度的文心一言、阿里的通义千问、腾讯的混元大模型,都有面向金融行业构建生态合作伙伴的部署。
以腾讯云为例,其推出的金融行业大模型解决方案包含四层架构——算力层、平台层、大模型层以及应用层。在大模型层,通过模型商店MaaS,支持接入腾讯混元大模型、金融行业大模型及20多个主流开源模型。在应用层,基于金融行业大模型的能力,结合金融行业前中后台业务场景,打造一系列智能应用。
腾讯云副总裁、腾讯云智能解决方案负责人王麒在接受媒体采访时表示,不同的金融企业可以根据自身的投入成本以及场景复杂度,选择在不同的点切入自己的金融行业大模型,在能效比方面寻求一个最优的选择。
他还透露,在上述OCR技术使用场景中,通过领域精调和训练,实现了参数和场景适配的较好效果——将交易的票据提升到了95%,同时降低了人力的成本,单张单据的处理时间从以前的五分钟降到了五秒。
一位国有大型银行研发中心负责人在近期谈及大模型发展原则时也表示,数据是核心,但数据不是越多越好,高质量训练数据才是关键;算力是基础,算力瓶颈是挑战也是机会,开源节流才是关键;场景是关键,但场景建设也需要合理布局。
机构路径选择分化
大型企业倾向从上到下提供一揽子解决方案,行业中小机构则倾向通过生态合作来实现自己的大模型解决方案输出。
具有清华技术背景的北京智谱华章科技有限公司(以下简称“智谱AI”),过去一年推出了多种量级的ChatGLM大模型,以适配不同市场需求。在智谱AI总裁王绍兰看来,大模型不是天生就可以拿来赋能行业,需要大量的行业生态合作伙伴一起做工程开发。
以中关村科金为例,其选择通过与优秀的底层通用大模型企业合作,通过领域知识库注入领域知识,在开源的通用大模型基础上微调出适合金融等行业的领域大模型。在具体的业务产品构建上,通过企业知识大模型,支撑平台领域大模型工厂、领域知识库工厂完成“行业化”过程,继而输出智能营销、智能服务、智能运营、超级员工四类产品。
中关村科金技术副总裁张杰向记者透露,大模型价值的根本在于多样化业务场景的实际应用,且成本可负担、安全性可控、业务深耦合。他倾向认为,企业应用大模型不一定用千亿级别规模参数非常大的模型,关键是依据每个企业的高频需求让企业可以用上,并且成本可负担。
财富管理被普遍认为是生成式AI有望最先得到广泛应用的场景。在国际市场上,摩根士丹利已经开始采用GPT 4.0来优化财富管理咨询流程,帮助约1.6万名财富管理顾问。
诺亚控股有限公司数据管理部总经理孙甜指出,高净值客户开户涉及资料整理和流程审批复杂,需要高水平的24小时客服支持,通过中关村科金ChatPilot知识助手赋能智能客服,客服系统问答意图识别和回复的准确率大幅提升,文本客服运营工作量减少70%以上,回答效果可以提升50%以上。
融360(北京融世纪信息技术有限公司)则基于腾讯云的底座,开发出全链或者一站式的解决方案。融360创始人、CEO叶大清认为,大模型在实际应用中不能为了做而做,需要考虑业务简单方便和底层大模型的兼容能力。
在王麒看来,做底层通用大模型是一个“深水区”,需要多年的技术积累。最终,行业应该是少数几家头部厂商能做底层大模型,更多合作伙伴加入进来做精调,即做好“最后一公里”,来实现应用落地。
腾讯云副总裁胡利明在接受采访时则建议,行业的机构以及合作伙伴可根据自身需求甄选场景和试点——从场景价值、需求频次、技术三个维度进行整体的选择,如营销、客服、风控等需求频次多、价值大、技术成熟度高的场景可先进行试点,而舆情监控、智能投顾、投研以及代码助手则可作为第二优先级。
至于此前被认为大语言模型较难被突破的风控环节,胡利明也透露,腾讯云基于行业大模型以及金融风控的经验,通过大量的预训练和知识蒸馏形成Level 2的风控模型。“我们和某头部股份制银行合作的信用卡风控场景,在它的活动周期内贷款环节查询量有500万次,最终查到5万次的诈骗行为,帮助客户避免了超过亿元的损失。”
(文章来源:中国经营网)
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。