2024年大模型行业研究报告
第一章 行业概况
1.1 简介
大模型是指具有大规模参数和复杂计算结构的机器学习模型。这些模型通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数。大模型的设计目的是为了提高模型的表达能力和预测性能,能够处理更加复杂的任务和数据。大模型在各种领域都有广泛的应用,包括自然语言处理、计算机视觉、语音识别和推荐系统等。大模型通过训练海量数据来学习复杂的模式和特征,具有更强大的泛化能力,可以对未见过的数据做出准确的预测。
图 大模型产业图谱
来源:资产信息网 千际投行 iFinD
1.2 分类
按输入数据类型的不同:语言大模型(NLP),视觉大模型(CV)和多模态大模型。NLP通常用来处理文本数据和理解自然语言,例如GPT系列,文心一言等。CV通常用于图像处理和分析,例如VIT系列,文心UFO等。多模态大模型能够处理多种不同类型数据,例如DingoDB多模向量数据库等。
按应用领域的不同:三个层次,通用大模型L0,行业大模型L1和垂直大模型L2。通用大模型L0是指可以在多个领域和任务上通用的大模型。行业大模型L1是指针对特定行业或领域的大模型。垂直大模型L2是指针对特定任务或场景的大模型。
大模型市场容量及规模巨大,预计2028年将达到1179亿元。
图 我国大模型产业市场规模
来源:资产信息网 千际投行 iFinD
第二章 产业链、商业模式及政策监管2.1 产业链
大模型指参数规模较大的预训练模型。这些模型通常具有数十亿甚至数千亿个参数,需要在大量硬件资源上进行训练。大模型通过对数据进行分布式表示,能够捕捉到数据中的复杂关系,提高模型在各类任务中的泛化能力。
从大模型行业产业链来看,上游主要包括硬件和软件,硬件又包括芯片、服务器、通信网络等;软件又包括云计算、数据库、中间件等。中游是指大模型行业;下游是指大模型的应用领域,包括游戏、办公、传媒影视、医疗、金融、电商、工业等,这些领域的多样化需求将推动大模型不断进行技术创新和优化,提升模型的准确性和效率。
图 大模型产业链
来源:资产信息网 千际投行 iFinD
通用大模型
如GPT、BERT等,能够处理多种类型的任务,如文本生成、文本分类、机器翻译等。
图 国内通用大模型布局
来源:资产信息网 千际投行 iFinD
多模态大模型
能够处理多种模态的数据,如图像、文本、语音等,如CLIP、DALL-E等。
图 2022-2023年主流多模态大模型
来源:资产信息网 千际投行 iFinD
AI大模型
指具有巨大参数规模的人工智能模型。这些模型通过机器学习和深度学习的技术来学习和理解庞大的数据量。AI大模型的发展推动了人工智能领域的快速发展,并在各个领域中展现出惊人的应用潜力。
图 AI大模型谱系图
来源:资产信息网 千际投行 iFinD
金融和投资大模型
2024年4月10日,在2024数字产业链金融行业峰会上,网商银行宣布旗下的供应链金融解决方案大雁系统升级,AI大模型首次应用于产业链金融场景,提升小微企业金融服务的覆盖率和便捷性。
在该领域上,大模型系统帮助金融和投资机构构建更全面的企业图谱。同时,大模型有语义理解、生成能力,与大模型驱动的Agent实时反馈能力叠加,能够更好地刻画小微企业的经营状况和信用情况。
图 金融大模型的价值与作用
来源:资产信息网 千际投行 iFinD
2.2 商业模式
目前大模型商业应用尚处早期,以 API、PaaS、MaaS 三种模式为主。当前全球大模型产业落地仍处于早期探索阶段,需要与下游场景企业合作建立大模型商业模式,但下游企业目前对于大模型的理解相对有限,所需要的资源支撑比较薄弱。总的来说,大模型落地可以通过 API 接口调用付费、或者大厂提供落地所需的开发工具、云平台、服务等的 PaaS 模式,更进一步是直接提供相关定制好的模型调用的 MaaS 模式。
应用程序编程接口(Application Programming Interface,简称:API),是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又无需访问源码,或理解内部工作机制的细节。
近年来软件的规模日益庞大,常常需要把复杂的系统划分成小的组成部分,编程接口的设计十分重要。程序设计的实践中,编程接口的设计首先要使软件系统的职责得到合理划分。良好的接口设计可以降低系统各部分的相互依赖,提高组成单元的内聚性,降低组成单元间的耦合程度,从而提高系统的维护性和扩展性。
图 通用大模型的主要商业模式
来源:资产信息网 千际投行 iFinD
PaaS模式(Platform as a Service)是指平台即服务。把服务器平台作为一种服务提供的商业模式,通过网络进行程序提供的服务称之为SaaS(Software as a Service),是云计算三种服务模式之一,而云计算时代相应的服务器平台或者开发环境作为服务进行提供就成为了PaaS。
所谓PaaS实际上是指将软件研发的平台作为一种服务,以SaaS的模式提交给用户。因此,PaaS也是SaaS模式的一种应用。但是,PaaS的出现可以加快SaaS的发展,尤其是加快SaaS应用的开发速度。在2007年国内外SaaS厂商先后推出自己的PAAS平台。
图 未来PaaS市场增长驱动力强劲
来源:资产信息网 千际投行 iFinD
SaaS软件运营服务是(Software as a Service,简称SaaS)让用户能够通过互联网连接来使用基于云的应用程序。常见示例有电子邮件、日历和办公工具。它不需要用户将软件产品安装在自己的电脑或服务器上。
SaaS提供完整的软件解决方案,用户可以从云服务提供商处以即用即付方式进行购买。为组织租用应用,组织用户即可通过互联网连接到该应用(通常使用 Web浏览器)。所有基础结构、中间件、应用软件和应用数据都位于服务提供商的数据中心内。服务提供商负责管理硬件和软件,并根据适当的服务协议确保应用和数据的可用性和安全性。SaaS让组织能够通过最低前期成本的应用快速建成投产。
图 2021 年全球公有云 SaaS 市场份额
来源:资产信息网 千际投行 iFinD
大模型产业市场规模持续增长,市场前景广阔。预计2028年市场规模将达到1179亿元。2022~2028年复合增长率约为60.11%,市场规模快速成长。
图 我国大模型产业市场规模
来源:资产信息网 千际投行 iFinD
2.3 技术发展
大模型的起源可以追溯到20世纪90年代,当时人工智能领域还处于初创期,研究人员主要关注的是基于规则的专家和知识表示系统。数据资源的不断增加和计算机性能的不断提升,人们开始意识到基于数据驱动的机器学习方法在人工智能领域具有更大的潜力。大模型的概念逐渐浮出水面。
近十余年间,人工智能技术泛化能力、创新能力及应用效能不断提升,成为了推动经济及社会发展的重要引擎。
2015年前后,人脸识别算法达到接近人眼的识别能力,被视为人工智能技术工业级应用水平的代表性事件。
2022年,以ChatGPT为代表的大模型为用户带来了全新交互体验。通过其在内容生成、文本转化和逻辑推理等任务下的高效、易操作表现,大模型正逐步成为当前主流应用程序的重要组成部分。
图 大模型技术发展各时期
来源:资产信息网 千际投行 iFinD
2023年7月,OpenAI向用户正式开放了代码解析插件Code Interpreter,使得ChatGPT和GPT-4可以根据用户问题来编写和执行代码,从而拓展了模型在数据分析、复杂计算与功能调用方面的能力。
图 全球大模型技术发展脉络
来源:资产信息网 千际投行 iFinD
2023年,大语言模型及其在人工智能领域的应用已成为全球科技研究的热点,其在规模上的增长尤为引人注目,参数量已从最初的十几亿跃升到如今的一万亿。参数量的提升使得模型能够更加精细地捕捉人类语言微妙之处,更加深入地理解人类语言的复杂性。在过去的一年里,大语言模型在吸纳新知识、分解复杂任务以及图文对齐等多方面都有显著提升。随着技术的不断成熟,它将不断拓展其应用范围,为人类提供更加智能化和个性化的服务,进一步改善人们的生活和生产方式。
图 大模型带来语音技术发展的全新机会
来源:资产信息网 千际投行 iFinD
2023年被视为中国大模型的发展元年。3月16日,百度正式推出了基于百度新一代大语言模型的生成式AI产品“文心一言”,成为了率先“跑出来”的国内大模型厂商。文心一言的问世,也拉开了国内“百模大战”的帷幕。此后,阿里、华为、腾讯、京东、科大讯飞、360、字节跳动等科技公司纷纷发布了自家的大模型。文心一言发布8个月后的11月15日,李彦宏在深圳西丽湖论坛上表示,国内目前已经发布了238个大模型。这意味着,在这两百多天里,平均每天都有一个大模型问世。
图 国内大模型技术路线图
来源:资产信息网 千际投行 iFinD
2.4 政策监管
大模型在快速发展的同时也带来了一系列潜在的风险和挑战。
一方面,大模型所需的海量数据、复杂参数以及工程难度放大了人工智能固有的技术风险,如数据窃取、泄露等安全问题,模型黑盒导致决策结果难预测和难解释问题,以及模型面对随机扰动和恶意攻击的鲁棒性问题。
另一方面,大模型的多场景通用性也放大了隐私风险、歧视风险和滥用风险等应用风险。这些问题引发了全球范围的关注,对人工智能治理能力与治理水平提出了新的挑战。
目前,全球大模型治理正处于探索阶段,从人工智能伦理准则等基本共识出发,逐步深入推动大模型监管政策法规和企业治理落地实践。国际组织积极制定人工智能治理原则及倡议,重点关注大模型的治理和监管问题。
图 2023年以来国内大模型相关政策梳理
来源:资产信息网 千际投行 iFinD
在政策方面,2021年11月,联合国教科文组织通过了《人工智能伦理问题建议书》,旨在促使人工智能系统造福人类、社会、环境和生态系统、防止危害,同时促进和平利用人工智能系统。
2023年11月,在英国人工智能安全峰会期间,包括中国、美国、英国等 28 个国家和欧盟共同签署了《布莱切利宣言》,确保人工智能以人为本、值得信赖并负责任,通过国际伦理和其他相关倡议促进合作,应用人工智能带来的广泛风险。
同年11月,世界互联网大会发布了《发展负责任的生成式人工智能研究报告及共识文件》,就发展负责任的生成式人工智能提出十条共识。
在标准方面,ISO/IEC JTC1 /SC42人工智能分委会正在开展人工智能可信赖国际标准研制工作,为指导利益相关方研发、使用可信赖人工智能相关技术和系统提供参考,主要标准包括 ISO/IEC TR 24028:2020《人工智能的可信赖概述》、ISO/IEC 38507:2022《组织使用人工智能的治理影响》等。
全球主要经济体加快推进大模型治理和监管相关政策制定步伐。中国在人工智能监管方面主张“包容审慎的分类分级监管”原则,国家网信办已于2023年7月10日颁布了首部面向大模型监管的《生成式人工智能服务管理暂行办法》,后续将进一步针对生成式人工智能技术特点及其在有关行业和领域的服务应用,制定相应的分类分级监管规则或指引。
2023年10月8日,中国科技部发布《科技伦理审查办法(试行)》,提出从事人工智能科技活动的单位,研究内容涉及科技伦理敏感领域的,应设立科技伦理(审查)委员会,并建立伦理高风险科技活动的清单制度,对可能产生较大伦理风险挑战的新兴科技活动实施清单管理。
2023年10月18日,国家网信办发布《全球人工智能治理倡议》,提出发展人工智能应坚持相互尊重、平等互利的原则,各国无论大小、强弱,无论社会制度如何,都有平等发展和利用人工智能的权利。
在标准方面,中国信息通信研究院已经启动《大规模预训练模型技术和应用评估方法》系列标准研制的工作,全面覆盖大模型的开发、部署和应用环节,其中第四部分可信要求是目前国内首项针对大模型领域的可信赖标准。
与此同时,全国信息安全标准化技术委员会已经启动包括《信息安全技术 生成式人工智能服务安全基本要求》在内的三项生成式人工智能安全国家标准编制工作,以支撑大模型的监管落地。
欧盟现行人工智能立法仍主要集中在传统人工智能,但已经开始关注通用人工智能以及生成式人工智能的问题,主张尊重人格尊严、个人自由和保护数据及隐私安全。
2023年6月14日,欧洲议会投票通过《人工智能法案》,该法案基于风险等级将人工智能系统分成四类,并制定了不同程度的监管要求。
2023年5月13日,美国白宫总统科技顾问委员会(PCAST)成立生成式人工智能工作组,以帮助评估关键机遇和风险,并就如何更好地确保这些技术的开发和部署尽可能公平、负责任和安全提供意见。
2023年10月30日,美国总统拜登签署人工智能行政令,旨在加强对人工智能潜在风险的监管,发展安全、可靠和值得信赖的人工智能,促进人工智能创新,确保美国在人工智能领域继续领跑全球。
同时行政令在标准方面,提出美国国家标准与技术研究所(NIST)将制定严格的人工智能安全测试标准,人工智能系统在公开发布前需根据这些标准进行广泛的测试以确保安全。
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。