AI 眼镜或是下一代交互革命的黄金交汇点。
AI 眼镜是结合人工智能技术和智能眼镜硬件的可穿戴设备。AI 眼镜是在传统眼镜基 础上做加法,通过集成摄像头、传感器、麦克风、显示屏以及内置大模型等,从而满 足用户音频、拍摄、AI 交互等需求的一种智能穿戴设备。AI 眼镜通过大模为眼镜提 供强大的智能属性,搭配摄像头,可支持语音助手交互、图像识别、文字提取等功能。 当前的 AI 眼镜产品主要有三种形态: 1)音频 AI 智能眼镜。传统蓝牙音频眼镜接入 AI 大模型,是 AI 智能眼镜的基础形 态,基本只支持音频播放和语音交互,AI 大模型通过语音的方式提供基础的智能 服务,例如李未可 Meta Lens Chat、界环 AI 眼镜都是典型的音频 AI 智能眼镜。 2)拍照 AI 智能眼镜。该类眼镜是在音频 AI 智能眼镜的基础上增添高清摄像头,其 AI 大模型可通过摄像头感知周边环境,提供与当下环境具备交互能力的智能服 务,实现第一视角拍摄,同时具备人脸识别、场景识别等智能化功能,为用户带 来智能化拍摄及交互体验。当前代表性产品有 Meta 和 Ray-Ban 联合推出的 RayBan Meta、闪极 Al 智能拍摄眼镜 A1、雷鸟 V3 Al 拍摄眼镜及小度 Al 眼镜等。
3)AR+AI 智能眼镜。该类智能眼镜指具备 AR 显示功能、并接入大模型的眼镜,部 分眼镜具备拍照、空间定位等多模态感知能力。AR+AI 智能眼镜通过采用 Locos、 Micro OLED、Micro LED 等显示屏技术叠加光波导技术实现 AR 显示效果,AI 大模型可通过其实现实时信息显示及视觉呈现,可与眼镜用户进行更简单便捷的 智能交互。当前典型产品有星纪魅族 StarV Air2、影目 Go 2、Rokid Glasses 等。
AI 眼镜能依托大模型实现多种 AI 功能。以 Rokid Glasses 为例,它深度整合阿里巴 巴旗下通义千问大模型,具备强大的智能交互能力,不仅能支持实施导航及实时翻译 功能,还能充当用户的“百科全书”。在教育领域,学生可以用 Rokid Glasses 的 AI 问 答功能拍照解题;在日常生活中,用户可以用 Rokid Glasses 的 AI 识物功能快速计 算食物卡路里含量;在工作中,用户可以用 Rokid Glasses 的 AI 闪记快速进行会议 纪要的整理。预计随着多模态大模型技术的发展,AI 智能眼镜的功能还将更多元化。
AI 智能眼镜经历了多年的演进,逐步实现了从“技术初始探索”到“AI 交互落地” 的跨越。特别是在 AIGC 技术的推动下,AI 智能眼镜的发展逐渐进入了新的阶段, 成为智能硬件行业中的一项关键创新。 1)技术初始探索期(2010-2013 年)。2012 年谷歌重磅推出 Google Glass,其配 备微型显示屏、摄像头、麦克风等组件,能通过语音指令实现拍照、导航、信息 查询等基础功能。尽管受限于当时的技术水平,产品存在续航短、佩戴舒适度欠 佳等问题而未能在市场上广泛普及,但它开创性地将 AI 技术融入眼镜形态,搭 建起硬件与软件交互的雏形,奠定技术根基,引发行业对智能眼镜潜力的关注。 2)市场应用拓展期(2014-2016 年)。2014 年,爱普生推出 Moverio BT-200,它聚 焦企业和医疗应用领域,具备高清显示功能,可为工业维修人员提供实时操作指 南,辅助医疗人员在手术中查看患者影像资料等,开启 AI 智能眼镜在特定行业 的应用篇章。2015 年微软推出 HoloLens,运用 AR 技术能在现实场景叠加高清 3D 虚拟图像,实现虚实融合交互。例如帮助建筑设计师直观看到设计方案的立 体呈现,提前感受空间布局效果,成为智能眼镜从技术走向实际应用的重要标杆。 3)行业成熟细分期(2017-2022 年)。2017 年,联想推出 New Glass C200,通过AR 辅助系统和工业级防护设计,推动其在设备检修等工业场景的规模化落地。 2019 年华为推出主要功能为音乐播放和录音的智能眼镜,并开始将其推向消费 市场。2020年微软推出升级版HoloLens,在显示效果和交互精度上实现新突破, 深化 AI 集成。2021 年小米推出其首款智能眼镜,主打轻便设计和健康监测功能, 通过亲民价格将智能眼镜推向大众市场,推动产品市场从企业级跨越到消费级。 4)AI 智能交互阶段(2023 年以来)。2023 年起 AI 智能眼镜迎来新变革,Meta 发 布的 Ray-Ban Meta 智能眼镜融合 AI 技术,支持语音识别,用户能通过语音快 速拨打电话、播放音乐;且其不仅具备实时翻译功能,还能提供智能导航。同时 随着AIGC技术兴起,使智能眼镜可依据用户习惯生成个性化内容推荐,在办公、 社交、出行等多场景下,实现与人、设备、环境的无缝连接与交互。示范效应下, 诸多手机、生态等行业厂商纷纷入局,AI 智能眼镜市场进入“百花齐放”阶段。

3.1 产品端: AI 拍摄/音频眼镜主导市场,AI+AR 是未来趋势
以拍摄和音频交互为核心功能的 AI 眼镜当前主导智能眼镜市场。AI 拍摄/音频眼镜 通过集成高灵敏度麦克风、多镜头模组及专用 AI 芯片,实现了实时语音翻译、动态 视频录制、环境降噪等实用功能,在旅行记录、会议辅助等场景中展现出显著优势,例如海外的 Ray-Ban Meta 智能眼镜就是“AI 拍摄/音频眼镜”的优等生,销量已超 百万。国内厂商也在积极追赶,但仍受制于早期技术成熟度、应用开发完成度,2024 年,国内厂商多以 AI 眼镜技术发布会,预告、预售和众筹为主,少数厂商顺利发售。
随着 MEMS 微型投影技术和光波导显示方案的突破,未来 AI 眼镜将向"AI+AR"深 度融合方向演进。AI+AR 眼镜通过低功耗芯片驱动的全息图像投射,用户可在透明 镜片上叠加实时导航、视频通话等信息,配合空间音频算法形成沉浸式交互体验。这 种技术迭代不仅需要光学引擎的小型化突破,更依赖多模态传感器的协同优化。依赖 于原有的 AR 技术储备,当前国内星际魅族、影目科技、灵伴科技、雷鸟创新等 AR 厂商均已推出相关产品,而 Meta 也已发布 AI+AR 眼镜“Meta Orion”原型机。
3.2 发展难题:续航/舒适/多元化功能的不可能三角
当前产业发展面临着由物理定律与技术瓶颈共同构成的“不可能三角”:设备重量、 续航能力与功能多样性之间存在着天然的制约关系。这一矛盾本质上是能量密度、计 算能力与工业设计三者的动态平衡问题,给 AI 的眼镜的推广带来了一定阻碍。
重量普遍偏高,佩戴舒适感有待提升。 当前 AI 眼镜的重量大都超过普通眼镜的重量标准,一定程度上影响佩戴体验。 为实现实时翻译、AR 导航、健康监测等多元化功能,AI 眼镜设备往往需集成更 强大的芯片组与传感器,而延长续航时间则依赖更大容量的电池或无线充电模 块。然而,每一项硬件升级都在推高产品重量——当前主流产品普遍超过 40g, 少数产品甚至突破 80g,远超美国国家眼镜商协会普通眼镜标准(30g)。
续航普遍偏短,影响用户体验 。用户对 AI 眼镜的复杂需求容易产生多重矛盾制约产品续航优化。一是微型化硬件与 高能耗的矛盾,高性能处理器、传感器和显示模块在小体积下被迫共享有限电池容量; 二是实时 AI 运算与功耗控制的矛盾,语音交互、图像识别等任务需持续调用算力资 源;三是散热限制与性能释放的矛盾,紧凑结构导致热量堆积,系统被迫降频运行。 当前 AI 眼镜产品的续航时间普遍较短,制约移动场景深度应用,一定程度上影响用 户体验。梳理近两年的 AI+AR 眼镜续航能力,可以发现当前的 AI 眼镜产品续航时间 多集中在 4 小时以内,高性能场景下续航时间甚至更短。以 Ray-Ban Meta 为例,根 据中国信通院泰尔终端实验室测试数据显示,正常负载情况如 80%音量听音乐,续 航达 2.5 小时;重负载情况如录制 3 分钟视频 10 次,续航仅为 30 分钟。虽然 Rayban Meta 配备的充电盒在一定程度上缓解续航焦虑,但仍还是影响到用户的体验。