中金公司:AI手机或将重塑手机行业生态
摘要:
AI手机:把大模型装进手机,智能终端演进的新方向。AI手机指的是通过端侧部署AI大模型,实现多模态人机交互,展现为非单一应用智能化的手机终端。我们认为AI手机当前的发展需要关注两个关键点,一是通过AI切实解决用户痛点;二是用户的数据安全及隐私问题。Counterpoint预测, 2027年全球AI手机渗透率约40%,出货量有望达5.22亿部。
在模型侧,模型轻量化初显成效,手机厂商陆续发布端侧模型。一方面科技巨头如谷歌、Meta等纷纷推出轻量化模型,另一方面手机厂商亦通过自研或在现有大模型基础上优化的方式,研发适配在手机端运行的模型。
在硬件侧,NPU算力升级,异构计算及内存升级,同时关注电池及散热。IDC与OPPO白皮书指出AI手机NPU算力需大于30TOPS;IDC指出AI手机至少需要16G内存。遵循算力及内存提升同时控制功耗的逻辑,我们看到芯片端三大升级趋势:1)AI工作负载增加,NPU算力提升成为重点;2)AI应用多样化,异构计算日益重要;3)AI推理需求增加,内存容量及带宽需求提升。此外,我们判断散热、电池及整机设计等亦或将带来升级。
在操作系统及应用侧:操作系统优化升级,移动端应用日新月异,商业模式有望跑通。端侧AI的运行需要大模型与操作系统、硬件及手机本地模型协同,AI agent与手机的结合也成为重要方向。从应用落地进展看,移动端的AI应用落地目前主要包括独立APP、应用程序集成进手机、集成进语音助手,我们认为未来移动端AI应用商业模式有望逐渐成熟。长期来看,我们认为手机端或有望形成新的流量入口,深刻影响手机厂商商业模式。
正文:
AI手机:把大模型装进手机,智能终端演进的新方向
个性化定制的人工智能设备
AI手机指的是通过端侧部署AI大模型,实现多模态人机交互,展现为非单一应用智能化的手机终端。目前AI手机应用功能仍处于早期,终端定义标准及技术升级趋势主要集中在大模型及软硬件配置。根据Canalys,满足以下三大标准即可被确认为AI手机:1)大模型方面,智能手机能够在端侧运行LLM(如谷歌的Gemini、三星的Gauss等)和其他生成式AI模型(如Stable Diffusion等);2)硬件方面,智能手机的SoC芯片中包含能够加速AI运行的专用单元(如高通的Hexagon、联发科的APU和谷歌的TPU等);3)运行效果方面,端侧LLM的推理能力高于成人的阅读速度即10 token/s(基于LLaMA-2 7B, 或同等水平),同时端侧AI生成图像的时间要小于2秒(基于Stable Diffusion v1.5,20步,512*512分辨率,或同等水平)。
图表1:手机AI发展阶段资料来源:艾瑞咨询,中金公司研究部我们认为AI手机当前的发展需要关注两个关键点。
一是通过AI切实解决用户痛点,如OPPO Find X7一键消除、三星Galaxy S24即圈即搜等的热门AIGC应用,促进用户从“尝新”到“常用”转变。OPPO首席产品官刘作虎表示,用户对OPPO Find X7 AI消除功能的热情较高,后台数据显示该功能的用户人均使用次数达15次,实现了从尝鲜到常用,根据OPPO官方微博,OPPO Find X7预售5分钟销量已达上一代的402%,首销当天全渠道销量是上一代的317%。同时OPPO销售端反馈,用户对于AI手机的概念并没有感知,但是当AI消除功能拿出来做展示后,产品的销售成功率或将变高,我们认为这进一步论证了端侧AI应用解决用户痛点,进而促进新形态终端落地的产业发展逻辑。
二是用户的数据安全及隐私问题。根据谷歌官网,谷歌会搜集用户的Gemini应用对话内容、相关产品使用信息、用户位置相关信息以及用户反馈,并根据隐私权政策使用这些数据来提供、改进和开发谷歌产品、服务及机器学习技术。以Gemini为例,用户的Gemini应用活动记录会默认存储到谷歌账号并保留最多18个月。在此过程中,对于厂商而言,如何为用户设置安全数据保护墙以及合理运用数据进行训练或将成为AI手机能够持续发展的关键。
图表2:手机厂商数据安全解决方案资料来源:各公司官网,中金公司研究部手机厂商加速,抢滩AI手机市场
Counterpoint预测,2024年全球AI手机渗透率约4%,出货量有望超1亿部;2027年全球AI手机渗透率约40%,出货量有望达5.22亿部。
图表3:各品牌最新发布的AI手机注:统计时间截至2023年3月13日,为不完全统计资料来源:谷歌官网,小米官网,vivo官网,中金公司研究部图表4:全球AI手机出货量及渗透率预测图表5:中国AI手机出货量及渗透率预测行业升级:关注端侧芯片及手机应用落地进展
模型侧:模型轻量化初显成效,手机厂商陆续发布端侧模型
谷歌及Meta开源模型奠定手机端轻量化模型基础
与AIPC类似,基于安全隐私、降低云端使用成本等因素考量,AI手机也将采用端云结合的方式。因此一方面科技巨头如谷歌、Meta等纷纷推出轻量化模型,另一方面手机厂商亦通过自研或在现有大模型基础上优化的方式,研发适配在手机端运行的模型。
图表6:AI手机行业主要进展注:图表中预计均为对应厂商各自的产品计划资料来源:各公司官网,中金公司研究部手机厂商陆续发布手机轻量化模型
当前各厂商发布的轻量大模型参数量在10亿~130亿之间,涌现能力相差不大,而在模型数量、自研深度、开源程度等方面存在着一些初期的差异化发展。
► 模型数量方面,华为、荣耀 、小米、谷歌、传音推出1-2个轻量化模型;vivo推出自研通用大模型矩阵,具体包括1B端侧、7B端云两用、70B云端主力、130B云端、175B云端5款自研通用大模型以实现不同的功能需求;根据OPPO官网,OPPO发布安第斯大模型AndesGPT,覆盖了从十亿至千亿以上的多种不同参数规模,在手机端实现三级大模型部署策略。
► 自研深度方面:手机厂商中华为、小米、vivo、荣耀均为自研,谷歌推出的gecko(壁虎)模型为自研PaLM 2的轻量版,Gemini Nano和Gemma也为自研。OPPO发布会表示AndesGPT是自主训练;传音是基于业界模型,通过自建的语音数据库进行训练。
► 开源程度方面:vivo 7B蓝心大模型是手机厂商中第一个开源的大模型,同时vivo也发布了对应的开发套件BlueKit,使得中小开发者可以直接调用大模型的端侧推理能力。
图表7:手机轻量化模型推出情况资料来源:华为官网,小米官网,OPPO官网,vivo官网,荣耀官网,联想官网,宏碁官网,谷歌官网,Meta官网,中金公司研究部硬件侧:NPU算力升级,异构计算及内存升级,同时关注电池及散热等变化
考虑手机SoC市场中,高通、联发科及苹果为主要参与厂商,因此我们在下述分析中,也会以这几家头部厂商为重点。由于目前苹果并未明确提出AI手机芯片的方案,在上一篇AIPC报告中,我们也重点介绍了苹果M3芯片情况,因此在下文中不赘述。近期高通、联发科陆续发布了面向手机市场的新一代SoC,重点强调了算力的提升及内存的升级。
图表8:高通及联发科新一代手机SoC情况资料来源:高通官网,联发科官网,中金公司研究部变化一:AI工作负载增加,NPU算力提升成为重点
当前手机中基本不存在独立的AI芯片,而是将CPU、GPU、DSP、NPU等集成在一颗SoC芯片中。由于CPU、GPU是通用处理器,因此其本职工作是进行操作系统、软件等应用的处理;而NPU(Neural Network Processing Unit)则是专门用于处理深度学习等运算的专用处理器,擅长标量、向量和张量数学运算,专门用于运行AI工作负载。
由于其专用的设计目的,NPU在AI计算的时延、功耗、性能、能效比等各方面均高于CPU、GPU,因此各厂商纷纷在手机SoC芯片中集成NPU并提升其性能:1)高通骁龙8 Gen 3芯片集成的Hexagen NPU通过提高矢量加速器的时钟速度等实现比上一代推理速度提升98%,能效提升40%;2)联发科天玑9300芯片搭载的APU 790深度适配Transformer模型,速度提升为上一代芯片的8倍。
图表9:高通NPU演进过程资料来源:《通过NPU和异构计算开启端侧AI》(高通,2024年),中金公司研究部图表10:芯片厂商NPU布局情况变化二:AI应用呈现多样化,异构计算发挥重要作用
高通指出,生成式AI用例需求存在多种类型,具有复杂性、并发性和多样性,对应对芯片的性能及资源调用提出不同要求。在此背景下,异构计算架构能够支持处理多样性的特点就具有较大吸引力,从而充分发挥每个处理器的优势:CPU擅长顺序控制和即时性;GPU适合并行数据流处理;NPU擅长标量、向量和张量数学运算。
从更加远期的角度看,未来个人助手或在AI手机上成为标配,因此语音识别、大语言模型、语音模型等多种模型可能会并行运行,因此高通提出需要在NPU、GPU、CPU和传感器之间分布处理模型,进行整体的方案设计。
图表11:AI需求(AI个人助手)工作负载分配过程资料来源:《通过NPU和异构计算开启端侧AI》(高通,2024年),中金公司研究部SoC多核架构持续升级,AI功能受到重视。SoC设计的另一个延伸方向是如何从芯片架构上进行优化。主流手机SoC(主要是CPU)设计主要使用Arm核,ARM架构在手机市场市占率超过99%。从SoC的设计架构发展历程看,CPU等处理器经历了从单核高频率、多核、大小核、“大核+中核+小核”“超大核”的变化,频率和核心数也相应不断增加,意在提升SoC性能。但另一方面,由于移动端性能和功耗平衡的限制,SoC的核数不能无限制增加。
图表12:高通及联发科新一代手机SoC情况资料来源:高通官网,联发科官网,中金公司研究部Arm架构升级助力芯片性能提升,持续增强AI能力。根据Arm官网,2021年发布的Arm V9架构是当前旗舰手机采用的最新一代架构,其中2023年发布的Armv9.2指令集包括新的QARMA3 PAC算法、浮点能力增加和PMU增强等,意在强化手机芯片的AI计算能力。根据Arm在MWC2024大会上的介绍,随着 Arm CPU 提供的AI能力每两年实现翻番,通过搭载Arm 2023 全面计算解决方案 (TCS23) 的智能手机,Arm在该手机的Arm Cortex CPU上借由LLaMa2-7B参数演示AI推理。演示性能接近每秒生成10个Token,这大约是普通成年人读取速度的两倍。
此外,在GPU方面,不同于此前手机厂商均采用ARM公版GPU方案,各厂商开始自研GPU以形成差异化竞争优势。
图表13:各厂商自研GPU情况注:统计时间截至2024年3月14日资料来源:各公司官网,量子位,中金公司研究部变化三:AI推理需求增加,内存容量及带宽需求提升
除了计算,AI手机同样会对存储提出更高要求。根据联发科无线事业部AI技术高级经理庄世荣,130亿参数量大模型运行需要有13GB的内存容量(INT8),同时智能手机运行安卓操作系统需要4GB的内存,同步相对流畅的运行其他手机APP需要6GB的内存,AI模型端侧推理部署的手机存储量应该达到23GB才能够实现较好的用户软件使用体验。OPPO刘作虎也提到,70亿参数大模型正常的模型大小是28GB,为了真正在端侧部署,OPPO对模型进行压缩和轻量化,最后压缩到最小的3.9GB左右,无论是存储还是内存占用都是这个量级。vivo副总裁黄韬表示大模型对手机运行内存性能的要求,起码是8G起步。IDC指出,16GB RAM将成为新一代AI手机的基础配置。
图表14:AIPC内存容量需求资料来源:Omdia,中金公司研究部图表15:手机内存升级趋势资料来源:IDC,中金公司研究部变化四:关注散热、电池及整机设计等变化
在其他硬件变化方面,为了适配大模型及其计算需求,同AIPC,我们判断AI手机在散热、电池及整机设计等环节亦或将带来升级变化。
电池:硅碳负极提升电池能量密度。传统PC或手机电池采用石墨作为负极,石墨负极理论克容量为372mAh/g,但硅基负极理论克容量可高达4200mAh/g,因此便出现了通过给负极掺硅碳复合材料的方式来提升电池能量密度的技术尝试。目前在小米、荣耀的新一代旗舰手机上,均出现了高密度硅碳负极电池的身影。其中小米“金沙江电池”容量达到5300mAh,最高硅含量6%,电池体积降低8%,续航提升高达17%。而在AI时代,随着算力提升带来的功耗提升,对电池续航能力的要求也更高。
图表16:小米新一代小米14 Ultra采用硅碳负极电池资料来源:小米官网,石墨资讯,中金公司研究部散热:随着AI计算带来的功耗增大,如何提升散热亦成为重点。当前手机散热技术路径主要有石墨片、均热板、热管。从新材料和技术上,当前石墨烯等新材料的采用成为了可能。由于芯片算力提升,对应对散热的要求也会提升,但同时还要满足手机在重量、厚度等方面的整体设计要求,因此目前各家厂商的散热方案并不完全一致,但通过提升散热能力降低发热的整体思路一致。
操作系统&应用侧:操作系统优化升级,移动端应用日新月异,商业模式有望跑通
操作系统:差异化OS系统成为竞争焦点,AI Agent加快手机端落地
操作系统提供了软件运行的环境,成为AI端侧落地的重要一环。在日常运行交互过程中,手机端侧大模型不断学习用户的价值观、需求、行为偏好、顾虑等数据形成用户画像并持续更新,从而使得用户在操作系统交互中能得到更加智能的个性化体验。我们认为,经历了功能创新匮乏、硬件堆叠定义手机的长周期,大模型能力的加持使得手机来到软件体验定义产品的新时点。
长期来看,端侧AI的运行需要大模型与手机OS操作系统、手机硬件及手机本地模型协同。OPPO提出来智慧OS的概念,与智能手机相比,在AI手机时代,应用的生态从原本的独立APP演变为多个场景,同时智慧OS也要能够实现多模态融合的交互。
此外,AI agent与手机的结合也成为另一个重要方向。目前OpenAI正开发两款革命性的Agent软件,其中一款能够有效接管客户的设备来自动执行复杂的任务,从移动端AI的发展趋势看,我们认为未来AI Agent与手机的结合或具有较大可能。手机端AI Agent的发展方向是Agent自主调用手机端应用,让用户享受到专属手机智能助理的服务,从而打破APP的隔阂,通过自主的规划决策实现跨应用的操作。
应用:移动端应用百花齐放,商业模式跑通成为关键
移动端的AI应用落地目前主要以三种形式完成:独立APP、应用程序集成进手机、集成进语音助手。
图表17:移动端应用布局情况资料来源:中金公司研究部从应用类型上,图像/视频侧热门移动端AI迅速吸引用户眼球,目前已实现付费使用。1)2023年7月17日妙鸭相机微信小程序上线,以微调后的Stable Diffusion为模型基础,实现了对人像照片制作数字分身并生成各类个人写真、证件照片的功能。“9.9元限时优惠”大大压缩了一张精修写真所需的成本,根据新榜报道,妙鸭小程序上线第二天的晚上11点,页面仍限时有2000多人在排队等待生成写真,应用热度较高。2)根据美团官网,美图基于自己发布的AI视觉大模型MiracleVision,发布了6款AI影像生产力工具(WHEE、开拍、WinkStudio、美图设计室2.0、DreamAvatar数字人、美图AI助手RoboNeo)。
当然从目前的现状看,我们预计与移动APP早期发展的趋势类似,移动端AI应用的商业变现亦需要较大规模的用户基础,因此商业化仍处在发展早期。
Llama 2开源模型的商用化或将推动移动端AI应用商业模式进一步成熟。2023年7月19日,Meta发布了免费可商用版本Llama 2,包含了7B、13B、70B三种参数版本,相比于Llama 1,Llama 2的训练数据多了40%,上下文长度翻倍,并采用了分组查询注意力机制,在包括推理、编码、精通性和知识测试等外部基准测试中均由于其他开源语言模型。这意味着开源社区开始拥有一个规模适宜、性能较好、可商用的底座模型,在此基础上开发者们可对模型进行二次开发,加速推动相关应用的商业化落地。
图表18:Llama 2开源模型商业化推动移动AI应用商业模式落地资料来源:Meta官网,中金公司研究部手机生态:AI手机或将形成新的交互方式,影响手机厂商生态
从交互的形态上看,文本不再是唯一的方式。我们认为未来人机交互的模式有望从文本进化到语音等方式,同时人机交互也将呈现多模态结合的特点。
手机端或有望形成新的流量入口,深刻影响手机厂商商业模式。我们认为,类比在移动互联网时代,垂类APP取代了搜索引擎作为流量入口的角色;在AI时代,搜索引擎或智能机器人助理,有望再次成为用户获取信息及进行交互的重要入口,甚至直接帮助用户进行内容筛选和内容生成。从远期角度看,当APP的功能被部分集成至搜索引擎或智能机器人助理后,若APP以及应用商店的入口功能被削弱,当前手机厂商软件生态的商业模式或许将出现变化。
风险提示:
AI算法技术及应用落地进展不及预期:ChatGPT\GPT-4等模型不开源,同时存在着隐私数据泄露、模型窃取、数据重构、PromptInjection攻击等数据安全性问题、回答准确性问题、道德问题,威胁着模型应用的落地。
AI变现模式不确定:虽然AI的出现或将改变数字内容生产关系,但是:1)ToC端,除了GPT-4,其他部分AI模型的用户还处于免费体验的模式,同时Newbing等应用也仍处于免费体验的模式,收费模式尚不确定;2)ToB端,目前大量初创企业接入的ChatGPT、GPT-4API接口收费较低,未来的收费标准和模式也不确定。
消费电子智能终端需求低迷:受整体宏观经济、国际地缘政治冲突及半导体周期下行等因素叠加影响,消费电子市场受到较大冲击,国内外市场需求均呈现不同程度的疲软。根据IDC,2023年全球智能手机出货量同比下降3.4%至11.65亿台,创2013年以来新低。根据IDC,2023年中国智能手机出货量同比下降5.1%至2.71亿台。若2024年消费电子需求回暖不及预期,我们认为硬件端受益AI的进展或将不及预期。
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。