智能语音背包

搜索文档
智能交互终于步入真·人机交互时代了,这很讯飞
量子位· 2025-06-13 13:07
白交 衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 苹果放鸽子的更新,国产AI率先实现了。 背上一个看起来平平无奇、体积也没什么存在感的包,宇树机器人就声情并茂地开口说话。 你甚至可以让巴斯光年、变形金刚在你面前唱歌跳舞。 手里的一支签字笔、一块贴牌,也可以化身会议神器。 在 科大讯飞最新发布会上,我看到了智能硬件的新范式: 社交i人戴上AI眼镜,就可以轻松跟外国人social,看似不经意就加上微信好友;戴着它看展的话,看到不懂的展品还可以不懂装懂一下 (bushi。 你对智能硬件的想象,是不是还停留在"能听懂你说话"的阶段?这种"你说一句、它答一句"的交互,本质上还是命令式的、静态的。场景一变 化,语气一模糊,体验就崩了。 但现在,这些都开始变了。 万物皆可交互,万物皆可互联开始具象化。 设备不再是限制,产品与服务正在被AI革新 ,交互重构整个硬件产业生态。 AIUI,一站式搞定人机交互开发 正如此次发布会所展现, 一个最大的感知就是 现在智能硬件从基础交互迈向深度智能协作,从而在应用场景里深度赋能。 从技术角度来说,人机交互正在变成一个复杂的系统性工程,而不再是语音识别、模型系统和语音合成的简单组 ...
智能交互终于步入真·人机交互时代了,这很讯飞
量子位· 2025-06-13 13:07
核心观点 - 智能硬件交互正从基础指令式升级为深度智能协作,实现"万物皆可交互"的愿景 [5][9][12] - 科大讯飞通过AIUI平台和机器人超脑平台技术突破,推动人机交互向拟人化、多模态、场景化方向发展 [10][34][36] - 儿童场景成为大模型时代交互需求增长最快的领域,交互频次飙升733% [26][66] 技术突破 AIUI交互平台升级 - 全双工交互模式实现"有所闻有所不闻",能识别用户迟疑、附和等非结构化语音输入 [17][19] - 情绪识别技术通过语调分析判断用户情绪状态,基于千万级高情商对话数据训练共情模型 [20][21] - 类人记忆系统采用长短时记忆融合架构,构建用户专属知识库和聊天方式 [23] - 音频端到端响应时间缩短至1.6秒,量产语音交互系统中处于领先水平 [25] 机器人超脑平台 - 整合视听融合感知(语音+唇形+人脸追踪)、多模态降噪技术,嘈杂环境下语音识别率从83%提升至96% [39][40][41] - 模块化设计解决行业碎片化需求,已应用于500+机器人客户,覆盖人形/四足/轮式机器人 [46][47][57] - 智能语音背包实现即插即用,为存量机器人赋予对话能力,现场演示中实现拟人化幽默互动 [49][51][55] 场景应用 儿童交互方案 - 专设童言识别模型和童语理解模型,应对儿童天马行空的非结构化表达 [26] - 结合AI早教实现场景化学习,如引导儿童用英语描述恐龙特征等趣味互动 [28] - 儿童场景交互速度增长7倍,成为大模型时代最高频交互场景 [66] 多硬件赋能 - 智能眼镜采用三麦阵列降噪技术,嘈杂环境中实现一对一私密对话 [30] - 数字人平台构建超10万分身,2024年制作量提升16%,日交互次数增长6.5倍 [61][62] - 轻量化方案支持一句话+照片快速生成数字人分身,覆盖教育/金融/媒体等领域 [63] 生态布局 - AIUI联合30万+开发者共建解决方案,推动软硬件交互效果优化 [31] - 开发者大赛设36道应用赛+72道算法赛,涵盖智能座舱/多模态虚拟人等前沿赛道 [69] - 技术-场景-生态闭环已赋能广电/家庭/医疗/办公等场景,实现产业级落地 [75][76]