
智能穿戴赛道从来不缺玩家,但缺有核心技术壁垒的玩家。
科大讯飞在语音识别领域深耕二十余年,如今这家语音识别"老兵"正在用一种新产品形态——AI眼镜——重新切入消费电子战场。2026年3月,讯飞AI眼镜在MWC展会全球首秀亮相,同步在国内电商平台开启预约。
这一次,它靠的不是概念,而是技术复利。
从语音识别到AI眼镜的跃迁
理解讯飞AI眼镜的能力,需要先理解它的技术起点。
讯飞在语音领域的技术积累是系统性的。从最早的语音输入法到后来的翻译机,讯飞几乎参与了国内语音技术应用的所有关键节点。这套技术体系包括:麦克风阵列设计与降噪算法、多语种语音识别与翻译引擎、以及基于大模型的语义理解能力。
讯飞AI眼镜的硬件架构印证了这一点。它采用5颗气导麦克风加1颗骨传导麦克风组成的"5+1阵列",在硬件层面为远近声源识别与环境降噪提供了基础。更关键的是算法层面的创新——根据不同翻译场景动态调整麦克风工作模式,这是讯飞多年场景化落地经验的体现。
而唇动识别降噪技术的率先落地,则代表了其在多模态融合方向的深度探索。通过摄像头捕捉目标说话人的唇动信息,与语音信号融合分析,在眼镜形态上实现了技术突破。
这意味着,讯飞做AI眼镜并非跨界,而是将多年积累的语音技术进行了一次产品化封装。

场景落地:AI助理重构工作流
技术储备需要找到真实的痛点场景。
讯飞AI眼镜将核心发力点放在了"AI助理"功能上。基于星火大模型驱动,它构建了一条完整的能力闭环:功能调用、生态服务调用、多模态理解,再到GlassClaw,让AI从单一功能集合进化为能主动帮用户做事的超级助理。
一个具体场景是跨国技术会议。当工程师佩戴眼镜与海外客户对接时,眼镜通过唇动识别精准锁定发言者,实时同传翻译专业术语,视野中同步呈现译文。会议全程,AI助理自动记录关键参数与争议点。会后只需一句话——"小飞小飞,生成会议纪要"——便可生成包含技术指标对比与待办事项的结构化纪要,直接推送至邮箱。
这不是语音转文字的简单堆叠,而是从"听懂"到"落地"的全流程闭环。超级AI助理的价值,在于把碎片化的信息转化为可执行的结构化输出。

全场景翻译:四种模式覆盖核心沟通形态
除AI助理外,全场景翻译能力是另一核心支柱。
讯飞AI眼镜支持四种语音翻译模式:同声传译适用于论坛会议,支持8米收音;面对面翻译专为商务谈判设计,双方无需中断眼神交流;通话翻译支持悬浮窗后台运行;线上同传则覆盖飞书、钉钉、腾讯会议、ZOOM等主流会议软件。四个模式均支持122个语种(包含口音)选择。
更值得关注的是垂直领域的专业翻译能力。讯飞AI眼镜支持17个行业翻译官,涵盖信息技术、医疗、金融、法律、外贸等领域。在专业场景中,这解决了"翻译准"的问题——通用翻译官难以处理垂直领域的术语偏差,而行业翻译官能识别并精准翻译专业表达。用户也可以通过自定义词库添加个性化的专业术语与专属表达,确保跨语言沟通中的专业精准度。
从语音识别专家到AI眼镜新玩家,讯飞靠的不是概念包装,而是二十余年技术积累的一次集中释放。
当AI能力与眼镜形态深度融合,智能穿戴的价值天花板,或许正在被重新定义。