有形象、能专注、会观察！声网对话式AI引擎升级

7月26日，声网亮相2025世界人工智能大会（waic），正式发布新版对话式ai引擎，该版本新增声纹识别、数字人与视觉理解三项功能，实现对话式ai音视频交互体验的全新升级。同时，口袋ai毛绒宠物——芙崽 fuzozo、家庭陪伴机器人——赋之 ebo air 2 plus等一系列搭载对话式ai引擎的人气ai硬件也亮相声网展台。

全新对话式ai引擎

三大功能实现多模态融合交互

声纹识别

选择性注意力锁定新增声纹识别功能，该功能赋予ai精准识别用户声纹特征的能力，有效区分不同说话者。用户只需在对话初期大声、清晰地说话，即可提升ai对声音的锁定效果。声纹识别不仅可以智能屏蔽95%的环境人声、噪声，让ai对话更准确、高效，同时也适用于多人与ai对话的场景，实现更加多元化的对话式ai响应与服务。

数字人交互

支持商汤等市场主流的数字人方案，通过集成高度拟真、表情动作自然的数字人，用户可与屏幕中的高度拟人化的数字形象进行实时、生动的对话互动，增强交互的临场感与情感连接，且有多个数字人形象供选择，适用于虚拟客服、教育陪伴、娱乐社交等多种场景。

视觉理解

新增的视觉理解能力为ai加上“眼睛”，一方面支持实时视频，能够解析摄像头捕捉的画面信息，结合语音指令，ai能“看懂”用户手势、环境物体或特定视觉线索，实现“所见即所言”的智能反馈；

另一方面，支持拍照与图片上传识别，ai会解答图片中的关键信息，可适用于教育场景的拍照识题与作业批改，智能助手场景的识物、翻译、分析等。在对话式ai中加入视觉理解，将为人机对话协作开辟更广阔的空间。

对话式ai正从基础的互动问答向深度理解、情感共鸣和情境感知演进。声网对话式ai引擎集成的声纹识别、数字人和视觉理解等能力，是构建下一代自然、沉浸式人机交互基础设施的重要一步。

从会说话到会共情

多元ai硬件亮相展台

此次声网展台设置了多个对话式ai的体验展区，其中人气最高的当属ai硬件展区，多款搭载对话式ai功能的ai硬件集中亮相。对话式ai开发套件以及搭载了开发套件的卡皮巴拉ai玩偶与数字人全息仓，具备ai陪伴功能的ai毛绒宠物——芙崽、家庭陪伴机器人——赋之 ebo air 2 plus，将ai玩具与角色手办结合的赛博大舞台、具备翻译与识图功能的ai眼镜等，让现场的观众体验到既会说话，又能共情的各类ai硬件。

对话式ai开发套件让智能硬件设备实现自然流畅的实时语音对话、智能停顿及打断处理、超低延时响应，为开发者提供“对话式ai+智能硬件开发”一站式解决方案。此次waic展出的双屏与单屏两类开发套件，可适用于ai玩具、ai教育硬件、ai陪伴设备、智能家居等各类智能硬件场景。

在本次展会上，声网也作为人工智能重点企业代表，亮相杨浦区展位，集中展示了声网对话式ai引擎等创新成果，吸引了众多观众驻足体验与互动。

未来，声网将持续完善对话式ai引擎与开发套件，通过多元化的功能、极致的对话体验，加速智能对话在各类终端和场景中的普及与深化，推动更加自然、智能、安全的人机共生时代到来。

文字丨成佳佳

编辑丨文茜婷陆顺吉（实习）

*转载请注明来自上海杨浦官方微信

（点击图片查看）

上观号作者：上海杨浦

特别声明：本文经上观新闻客户端的“上观号”入驻单位授权发布，仅代表该入驻单位观点，“上观新闻”仅为信息发布平台，如您认为发布内容侵犯您的相关权益，请联系删除!