华金证券:端侧AI推动智能眼镜成为新兴社交工具
财中社12月12日电华金证券发布消费电子行业报告,完美的AI助手,终极的数字社交。“端侧AI”是指AI可以直接在移动设备上处理数据,无需连接到服务器或云端,能够在用户设备本地完成复杂的推理和决策。端侧AI在对硬件提出更高要求的同时,也对其算力、能效以及软硬件协同等方面提出新的挑战。眼镜系端侧AI最佳落地场景之一,相比手机、电脑等传统设备,以下原因使其成为AI的最佳载体:便携性,眼镜轻便易携,可随时随地与AI交互,不受时间和空间的限制。人体贴合性,眼镜与人体高度贴合,可提供更自然、更舒适的交互体验。可扩展性,眼镜可集成摄像头、麦克风、扬声器等传感器,满足视、听、说、感知等多维度需求。通过深度整合多模态大模型,AI眼镜不仅能实现自然流畅的AI语音交互,还能利用眼镜上的摄像头,让AI通过视觉感知周围环境,基于真实世界进行AI聊天问答、物体识别以及拍照答题等体验。眼镜可以看用户所看,听用户所听,因此可以成为完美的AI助手,因为其知道用户正在做什么事情。
眼镜终端作为数字社交工具的前景:无缝社交体验:智能眼镜可以让用户在不中断当前活动的情况下进行社交互动,如视频通话、发送消息等。这种无缝的社交体验可以让人与人之间的联系更加紧密。共享视角与体验:通过智能眼镜的摄像头和AR技术,用户可以与他人分享自己的视角和经历,增加社交互动的真实感和趣味性。例如,在旅游时,用户可以与远方的朋友实时分享所见所闻。虚拟聚会与活动:未来,智能眼镜可能会成为参加虚拟聚会、演唱会等活动的必备工具,用户可以在家中就能身临其境地参与各种社交活动。
音频/摄像头/AR显示三大要素组合,构建国内眼镜终端三大类别。从用户角度看,国内AI眼镜的基本功能大致包括语音识别、音视频播放录制以及AI调用(如语音交互、翻译、查询天气交通信息等),而厂商在功能设计上主要围绕"音频"、"摄像头"以及"AR显示"三大要素进行组合,这些功能决定了产品的价格区间,通常在500元至5,000元之间,功能越丰富,售价越高。音频眼镜(听歌+通话):以音频功能为核心,省略摄像头等视觉交互功能。这类眼镜支持语音通话、听音乐等基础音频功能,代表性产品包括小米生态链企业蜂巢科技推出的界环AI音频眼镜以及华为的智能眼镜。此类眼镜,厂商仅需在镜框内增加麦克风阵列、耳机、电池和处理器等组件即可打造成型,这类眼镜的功能主要依赖语音识别和TTS(文本转语音)技术,无需图像处理模块,价格便宜。视频眼镜(拍照+录像):在音频功能基础上增加摄像头模块和部分AI功能,在具备拍照和录像功能的基础上,再给用户带来基础性AI体验,如Ray-Ban Meta。此类眼镜相较于音频眼镜增加摄像头模块,技术难度提升不算巨大,但目前已属于最主流、销量最大品类。AR+AI眼镜(音频+视频+AR+AI):在音频和摄像头的基础上,加入AR体验,例如Rokid发布的Rokid Glasses,不仅支持音/视频功能,还可以通过摄像头和AR技术实现实时翻译和导航等相对复杂功能。另外还有百度推出的小度AI眼镜,以及星纪魅族的StarVAir2 AR智能眼镜等产品。
(文章来源:财中社)
- 免责声明
- 本文所包含的观点仅代表作者个人看法,不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。 交易和投资涉及高风险,读者在采取与本文内容相关的任何行动之前,请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。