百亿AI大模型不香了?多家大行、中小银行“剑指”千亿参数大模型
大模型作为新一代人工智能技术的代表,其热度从2022年末以来一直维持在高位。从应用侧来说,多家银行已在进行相关探索。
大模型参数规模的选择,对于银行来说或是一个问题。《银行科技研究社》发现,包括中小银行在内,多家银行似乎不满足于百亿参数大模型,而是在引进、布局更大规模的千亿大模型。
大型银行、中小银行均向千亿大模型“进发”
10月14日,浙江农商联合银行发布关于企业级基础大模型采购公开招标公告,采购内容主要包含千亿级参数基础大模型及模型升级、定制化人天服务。
该项目的投标人资格要求之一为,投标单位自2021年1月1日以来,具有至少1家2023年度我国系统重要性银行的大模型相关项目案例。
这表明,部分中小银行正向大中型银行看齐,意在应用大模型实现降本增效、提升竞争力等。
不过,从目前的公开信息来看,布局千亿大模型的中小银行还不多。而在全国性商业银行方面,多家银行早已开始行动,包括打造千亿大模型技术体系、围绕千亿大模型进行算力布局等。
工商银行早在2023上半年,就实现百亿大模型应用,同时着手准备千亿大模型探索。之后,其建成千亿级大模型技术体系,并不断深化技术建设与赋能。具体进展为:
2023半年报显示,工商银行完成人工智能AI大模型能力建设应用规划,在国内同业率先实现百亿级基础大模型在多个场景应用;与头部科技公司合作探索千亿级人工智能大模型在金融行业的创新应用实践,以此提升数字金融服务的精准度和效率。
2023年报显示,其建成同业首个全栈自主可控的千亿级AI大模型技术体系,实现在多个金融业务领域创新应用。
2024半年报显示,该行深化千亿级大模型技术建设与赋能,打造金融市场、信贷风控、网络金融等50余个应用场景。
近期,工商银行方面还表示,其全面建成同业最大千卡云算力集群、千亿级金融大模型、高质多维的金融数据集,发展出一条可持续、可拓展的金融大模型技术路线。
邮储银行2024半年报透露,大模型异构算力集群初步具备支持千亿级规模大模型训练能力。
招商银行2023年报显示,其加强大模型建设,引入千亿参数大模型,用自有语料调优、训练、适配行内场景,跟进开源大模型技术的发展,并在专业场景自研百亿参数大模型。另外,2024年1月29日,该行以单一来源方式采购预训练基础大语言GLM模型的结果公告显示,中选供应商为智谱华章,后者将提供GLM千亿参数量级基础大模型。
中信银行2023年报则透露,其打造软硬件一体化的中信大模型平台,完成千亿级开源大模型部署,探索落地代码生成、智能操作等场景。据悉,该行在2024年7月发布大模型平台信创算力服务器采购需求调研征集公告,拟采购硬件产品为支撑该行大模型平台信创算力集群建设,具备千亿级大模型的微调训练和推理能力,不过该公告强调,此次仅为前期项目需求调研。
兴业银行于2024年8月8日发布2个大模型项目招标公告,其中一个是采购通用大模型软件产品一套。技术要求包括供应商需提供具备自有知识产权的千亿大模型及相关系列百亿大模型;模型需支持私有化部署,具备语言理解、知识问答、多轮对话、文本创作、长文本生成、逻辑推理、文生图、函数调用等大模型关键能力等。
目前看来,多家银行既在探索百亿大模型应用,也在为千亿大模型做准备。
对于银行而言,千亿大模型是否必要?
以招行透露的信息可知,其2023年在专业场景自研百亿大模型,同时从外部引入千亿大模型。
对于银行来说,目前自研百亿大模型是头部银行能做的,而自研千亿大模型成本高,产出或难以跟上投入。那么,采购或引入模型,是更合适的。
不过,千亿大模型对于银行尤其是中小银行来说,是必要的吗?
据《银行科技研究社》了解,参数量是影响模型基础能力的重要因素之一,模型参数量越大,模型的泛化能力越强。
也有人指出,应用侧机构在选择大模型时,应对大模型规模与专业场景结合等进行更多思考。虽然千亿大模型在通用性上表现出色,能应对各种任务,但其全面性并不总是适用于机构的特定需求,尤其是在垂直领域和专业场景。
而有些百亿大模型或能够发挥专业场景的优势,机构通过对模型进行微调和打磨,结合内部的私有数据,可在特定领域取得更好的效果。
所以银行也好,其他机构也罢,应根据自身的需求和场景,灵活选择适用的大模型,避免陷入盲目追求参数规模的误区。
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。