Workflow
语音Agent
icon
搜索文档
OpenAI连丢4位大将!Ilya合作者/o1核心贡献者加入Meta,苏黎世三人组回应跳槽:集体做出的选择
量子位· 2025-06-27 16:09
核心观点 - Meta近期从OpenAI挖走多名核心AI研究员,包括Trapit Bansal和苏黎世三人组(Lucas Beyer、Alexander Kolesnikov、翟晓华),加强其在推理大模型和多模态领域的布局 [1][10][11] - 公司同时推进语音AI初创公司PlayAI的收购谈判,并已招募语音AI专家Johan Schalkwyk,强化AR眼镜的语音交互能力 [23][24][26] - OpenAI创始人奥特曼公开回应称不担心人才流失,并暗示被挖人员并非其最优秀人才 [12] 人才流动 Trapit Bansal - 2022年加入OpenAI,与Ilya Sutskever合作推动大模型强化学习研究,是o1系统的核心贡献者 [1][6] - 谷歌学术引用量2883次,h指数16,多篇高引论文涉及多智能体强化学习和非平稳环境适应 [7][8] - 加入Meta新成立的超级智能部门,专注推理大模型研发 [2] 苏黎世三人组 - 原谷歌研究员,共同开发ViT架构(论文引用超6.5万次),开创Transformer视觉应用先河 [14][15] - 2023年被OpenAI集体挖走并成立苏黎世工作室,2024年6月又集体跳槽至Meta [10][20][21] - 成员背景:翟晓华(南京大学本科/北大博士)、Lucas Beyer(德国亚琛工业大学博士)、Alexander Kolesnikov(ISTA博士) [16][17][18] 战略布局 语音AI - 拟收购初创公司PlayAI(2024年获2100万美元融资),其技术目标是实现类人类的流畅语音对话 [24][25] - 此前已招募Seasame AI的Johan Schalkwyk,强化端侧语音模型能力 [26] - 行业推测Meta计划将语音AI整合至AR硬件生态 [27] 研究领域 - 推理大模型:通过Trapit Bansal加盟强化前沿技术探索 [2] - 多模态:苏黎世三人组持续深耕视觉-语言交叉领域 [14][20]
泡泡玛特疑进军家电行业;马云现身淘宝闪购周会丨新鲜早科技
21世纪经济报道· 2025-06-25 10:00
泡泡玛特进军家电行业 - 泡泡玛特正在招聘家电领域人才 包括小家电采购主管 家电品质专家 研发工程师等岗位 薪资范围12000-45000元 [2] - 部分岗位明确要求冰箱 咖啡机 早餐机 电水壶等相关经验 该项目被标注为A+及以上大投入项目 [2] 阿里巴巴动态 - 马云和吴泳铭现身饿了么工区 据传参与淘宝闪购周会 行业分析认为淘宝闪购业务潜力促使阿里加大投入 [3] 英伟达高管减持 - 英伟达CEO黄仁勋两天内出售10万股公司股票 套现近1440万美元 此次减持属于预先制定的10b5-1规则交易计划 [4] OpenAI硬件布局 - OpenAI收购公司io计划开发硬件交互的语音AI Agent 进军AI硬件领域 最初曾考虑与AI耳机公司iyO合作 [5] xAI开发生产力工具 - xAI为Grok开发支持AI处理电子表格的高级文件编辑器 此举被视为与OpenAI 谷歌 微软在生产力工具领域的竞争 [6] 新财富创富榜 - 2025年张一鸣以4815 7亿元持股估值首登榜首 雷军家族持股市值2010亿元 同比暴涨96% 梁文锋因DeepSeek月活破1 8亿以1846亿元估值进入前十 [7] 腾讯QQ故障 - 腾讯QQ因报错闪退问题向用户致歉 故障持续约1小时后修复 [8] 短剧App违规通报 - 45款App被通报违法收集个人信息 包括12款短剧应用如《鲸娱短剧》《短剧大全》等 存在广告误导欺骗行为 [9] 融资动态 - 易控智驾完成超4亿元D轮融资 由宁德时代旗下溥泉资本领投 方广资本等跟投 [10] - 理万电子获数千万元A+轮融资 投资方为江阴霞客新兴产业发展基金 [11]
喝点VC|a16z剖析2024年AI语音发展:产品数量激增、B2B垂直应用为重点
Z Potentials· 2025-03-13 12:02
AI语音Agent的技术进步 - 模型开发进步简化基础设施栈,降低延迟并提升性能,这一改进主要在过去六个月内实现[3][4] - OpenAI在2024年12月将GPT-4o实时API输入价格降低60%至$40/百万tokens,输出价格降低87.5%至$2.50/百万tokens[3] - GPT-4o mini现已通过实时API提供使用[3] 市场增长与投资趋势 - 语音Agent市场在2024年下半年爆发式增长,最新一届YC中22%公司构建语音相关产品[4][6] - 对话式语音技术栈多个层面吸引资金关注,包括模型公司(ElevenLabs、Cartesia)、横向平台(Vapi、Bland)和垂直化平台(HappyRobot、Wayfaster)[7] - 2024年公开融资案例显示,模型公司如ElevenLabs获8000万美元B轮融资,Hume获5000万美元B轮融资[10] 重点应用领域 - 早期应用集中在呼叫中心/BPO支出高的行业,如金融服务、保险、政府和支持服务[11] - AI语音Agent在教练培训场景有较强付费意愿,尤其针对高薪岗位如销售教练[11] - YC数据显示语音Agent公司主要布局B2B(69%)、医疗(18%)和消费级应用(13%)[14] 企业采用策略 - 大型企业通常采用渐进式策略,先捕捉较小比例通话再逐步扩展覆盖更多类型通话和工作流程[9] - 自2020年以来已有90家语音Agent公司成立,其中10家属于W25批次,许多公司在过去一年转型进入该领域[14] 行业细分数据 - B2B领域最常见细分行业为金融科技(16.9%)和运营支持(12.4%,主要是客户服务)[14] - 医疗领域语音Agent覆盖人类医学(11.2%)、牙科(3.4%)、兽医(2.2%)和物理治疗(1.1%)[14]