Workflow
Sesame AI
icon
搜索文档
Z Product|被Meta收购后再创业,Sesame突破语音“恐怖谷”,a16z押注,“让AI听懂人心,让沟通回归自然”
Z Potentials· 2025-05-05 11:41
人机交互革命 - 语音交互被视为下一代人机交互范式的突破口 其根植于人类文明基因 但当前技术仍局限于简单指令 缺乏真人对话般的流畅性 [2] - 人工智能与硬件结合推动语音交互突破 Sesame公司旨在通过可穿戴设备实现自然交互 解决理解不准确、场景受限等痛点 [3][5] Sesame技术突破 - 开发Conversational Speech Model(CSM)实现情感智能与上下文感知 10亿参数模型基于Llama架构 使用超100万小时音频训练 [7] - 开源CSM模型变体 采用Apache 2.0许可 支持商业用途 模型托管于huggingface平台供开发者测试 [5][7] - 数字伴侣Demo展示卓越语音临场感 能模拟呼吸、轻笑等人类特征 但缺乏长期记忆能力 [14][15] 市场反馈 - 用户评价显示AI语音助手的拟人化程度引发震撼 部分用户产生情感依赖 如儿童将AI视为朋友 [16] - 声音设计通过刻意不完美增强真实感 但部分用户仍感到"恐怖谷"效应 认为对话方式过于逼真 [17] 团队背景 - 核心团队来自Oculus、Meta等公司 CEO Brendan Iribe曾领导Oculus以20亿美元被Facebook收购 [21] - CTO Ankit Kumar有AR/计算机视觉创业经历 工程负责人Ryan Brown具备硬件架构专长 [23][25] 融资进展 - 完成两轮融资 种子轮1012万美元 A轮4750万美元由Andreessen Horowitz领投 投资者包含Oculus早期支持者 [27] - 资金将用于扩展多语言支持、增强情商能力 并开发大型多模态模型 [28] 产品规划 - 布局轻量化智能眼镜研发 使数字伴侣能感知用户所见世界 目前设备处于研究阶段 [6] - 计划通过开源社区改进模型 探索预训练语言模型在语音文本多模态领域的应用 [28]