有形象、能专注、会观察!声网对话式AI引擎升级

7月26日,声网亮相2025世界人工智能大会(waic),正式发布新版对话式ai引擎,该版本新增声纹识别、数字人与视觉理解三项功能,实现对话式ai音视频交互体验的全新升级。同时,口袋ai毛绒宠物——芙崽 fuzozo、家庭陪伴机器人——赋之 ebo air 2 plus等一系列搭载对话式ai引擎的人气ai硬件也亮相声网展台。

全新对话式ai引擎

三大功能实现多模态融合交互

声纹识别

选择性注意力锁定新增声纹识别功能,该功能赋予ai精准识别用户声纹特征的能力,有效区分不同说话者。用户只需在对话初期大声、清晰地说话,即可提升ai对声音的锁定效果。声纹识别不仅可以智能屏蔽95%的环境人声、噪声,让ai对话更准确、高效,同时也适用于多人与ai对话的场景,实现更加多元化的对话式ai响应与服务。

数字人交互

支持商汤等市场主流的数字人方案,通过集成高度拟真、表情动作自然的数字人,用户可与屏幕中的高度拟人化的数字形象进行实时、生动的对话互动,增强交互的临场感与情感连接,且有多个数字人形象供选择,适用于虚拟客服、教育陪伴、娱乐社交等多种场景。

视觉理解

新增的视觉理解能力为ai加上“眼睛”,一方面支持实时视频,能够解析摄像头捕捉的画面信息,结合语音指令,ai能“看懂”用户手势、环境物体或特定视觉线索,实现“所见即所言”的智能反馈;

另一方面,支持拍照与图片上传识别,ai会解答图片中的关键信息,可适用于教育场景的拍照识题与作业批改,智能助手场景的识物、翻译、分析等。在对话式ai中加入视觉理解,将为人机对话协作开辟更广阔的空间。

对话式ai正从基础的互动问答向深度理解、情感共鸣和情境感知演进。声网对话式ai引擎集成的声纹识别、数字人和视觉理解等能力,是构建下一代自然、沉浸式人机交互基础设施的重要一步。

从会说话到会共情

多元ai硬件亮相展台

此次声网展台设置了多个对话式ai的体验展区,其中人气最高的当属ai硬件展区,多款搭载对话式ai功能的ai硬件集中亮相。对话式ai开发套件以及搭载了开发套件的卡皮巴拉ai玩偶与数字人全息仓,具备ai陪伴功能的ai毛绒宠物——芙崽、家庭陪伴机器人——赋之 ebo air 2 plus,将ai玩具与角色手办结合的赛博大舞台、具备翻译与识图功能的ai眼镜等,让现场的观众体验到既会说话,又能共情的各类ai硬件。

对话式ai开发套件让智能硬件设备实现自然流畅的实时语音对话、智能停顿及打断处理、超低延时响应,为开发者提供“对话式ai+智能硬件开发”一站式解决方案。此次waic展出的双屏与单屏两类开发套件,可适用于ai玩具、ai教育硬件、ai陪伴设备、智能家居等各类智能硬件场景。

在本次展会上,声网也作为人工智能重点企业代表,亮相杨浦区展位,集中展示了声网对话式ai引擎等创新成果,吸引了众多观众驻足体验与互动。

未来,声网将持续完善对话式ai引擎与开发套件,通过多元化的功能、极致的对话体验,加速智能对话在各类终端和场景中的普及与深化,推动更加自然、智能、安全的人机共生时代到来。

文字丨成佳佳

编辑丨文茜婷 陆顺吉(实习)

*转载请注明来自上海杨浦官方微信

(点击图片查看)

上观号作者:上海杨浦

特别声明:本文经上观新闻客户端的“上观号”入驻单位授权发布,仅代表该入驻单位观点,“上观新闻”仅为信息发布平台,如您认为发布内容侵犯您的相关权益,请联系删除!