SuperAgent
搜索文档
当AI公司都在产品层内卷,这家公司却在思考Frontier Research
36氪· 2026-02-09 18:45
行业背景与核心问题 - 行业当前面临的核心现实问题是:当AI Agent走向长期运行的真实工作流时,挑战远超提示词或工具调用,而是部署成本、交互效率以及底层模型是否适合“常驻运行” [3] - 行业形成了一种隐含共识,即通过更快的产品迭代(如更复杂的Prompt、更精细的流程编排和更丰富的工具调用)来解决Agent问题,但这回避了根本问题:如果底层模型本身不适合长期运行与实时协作,产品设计只是在放大系统的结构性上限 [4][5] FlashLabs的战略定位与核心理念 - 公司选择了一条反共识的路径:回到前沿研究和模型层本身,重新审视Agent的基础假设,而非在既有模型能力上加速产品化 [5][6] - 公司的核心判断是:AI Agent不应只是被动执行指令的工具,而应更接近一个被赋予目标、能够自主拆解并持续推进工作的“数字员工” [7][8] - 公司认为,对Agent能力的过度保守是对技术潜力的低估,如果技术已具备逼近“数字员工”的可能性,延迟实现只会让效率损失长期固化 [9] 核心产品SuperAgent的设计与功能 - SuperAgent是一款以持续完成复杂任务为目标的企业级AI Agent,其设计假设为一个可以长期运行的系统,而非一次性任务执行器 [10][11] - 其核心机制包括:对用户输入进行意图理解并判断为复合目标、自动进行多步骤任务规划、在执行中持续维护上下文状态以避免任务半途而废 [11] - 产品具有主动性特征:在目标歧义或条件不明确时会主动向用户发起确认,在任务完成后会主动提出下一步建议 [11] - 整个任务拆解、规划、搜索与执行过程对用户保持可见,使其从“指令执行器”升级为组织协作者角色 [12] - 在部署上选择云端化、开箱即用的路径,以降低使用与部署成本,便于在真实业务场景中持续验证价值 [12] - 已在销售与增长、内容与展示、GTM与运营等多个岗位场景中完成能力验证,具体承担线索发现、数据补全、PPT生成、数据清洗、客户画像构建等任务 [13][14] 语音交互的革新:端到端模型Chroma - 公司认为,如果Agent要嵌入真实工作流(尤其是客服、销售等岗位),语音是不可回避的交互形态 [16] - 行业主流采用“级联式架构”(ASR+LLM+TTS),但该架构在实时、长期协作场景中存在副语言信息丢失和累积延迟的问题 [16][17] - 公司反共识地选择回到模型层,自研了端到端语音模型Chroma,旨在重新定义语音交互的基础架构 [17][18] - Chroma在同一模型体系内完成语音理解、语义推理与语音生成,避免了信息损失与多段延迟,并采用交错调度策略实现亚秒级的端到端响应 [19] - 实际测试显示的优势包括:能直接感知并表达语音中的情绪、语调等副语言信息;仅需几秒钟参考音频即可实现高保真个性化语音克隆;端到端延迟显著低于传统级联系统,使交互更接近自然交流节奏 [20][21] - 在Speaker Similarity指标上,Chroma 1.0得分为0.817,优于Human baseline的0.73及多个对比模型如Seed-TTS的0.76 [23] - 在性能指标上,Time-to-First-Token为146.9毫秒,平均每帧延迟为52.3毫秒 [25] 开源战略与研究哲学 - 公司将Chroma视为“可被检验的研究假设”而非封闭产品模块,并选择开源模型权重与推理代码 [26][27] - 公司认为,对于Agent与端到端语音模型这样的前沿方向,真正需要验证的是整个架构的可扩展性与长期成立的可能,封闭会过早固化假设 [28][29] - 模型开源后,在社区的下载量迅速超过一万次,开发者讨论焦点集中在架构是否适合实时交互、长期运行的稳定性以及能否成为Agent的通用语音基础设施 [29] - 公司将开源视为一项长期工程,计划持续开放模型能力、训练思路与部分数据构建方法,并向开源社区发起语音数据集共建计划 [30][31][32] 公司整体战略与长期愿景 - 从SuperAgent到Chroma,体现了公司的共同战略取向:相比短期变现,更优先押注决定长期上限的基础能力 [33] - 创始人将自己定位为“原生有效加速主义者”,相信技术进步本身具备长期价值,应在前沿能力上持续推进 [34] - 在Agent范式未定的阶段,公司选择承担更高不确定性,去验证下一代基础假设是否成立,旨在把决定未来上限的能力先做出来 [34][35] - 这意味着更慢的回报周期,但也意味着在范式真正成形时拥有更大的主动权,在一场可能持续十年以上的技术演进中,站在定义能力边界的一侧比顺应当下趋势更重要 [36][37]
当AI公司都在产品层内卷,这家公司却在思考Frontier Research
36氪· 2026-02-09 17:33
行业现状与核心挑战 - AI Agent因Open Claw的爆火首次被推向真实工程环境,开始尝试进入企业内部承担持续、复杂、可被验证的工作任务 [1] - 当Agent走向长期运行的真实工作流,挑战暴露,远不止提示词或工具调用,而是部署成本、交互效率以及底层模型是否适合“常驻运行” [1] - 行业形成隐含共识,试图通过更快的产品迭代解决Agent问题,方向包括更复杂的Prompt、更精细的流程编排和更丰富的工具调用 [1] - 有观点认为,若底层模型本身不适合长期运行与实时协作,再精巧的产品设计也只是放大系统的结构性上限 [1] FlashLabs的战略定位与核心理念 - 公司选择了一条更慢、风险更高的路径,回到前沿研究和模型层本身,重新审视Agent的基础假设 [2] - 公司认为AI Agent不应只是被动执行指令的工具,而应更接近被赋予目标、能够自主拆解并持续推进工作的“数字员工” [3] - 创始人认为,当下中小企业核心挑战是在组织规模受限前提下持续放大关键岗位产出能力,因此Agent需能理解OKR与KPI并主动工作 [3] - 公司战略是押注决定长期上限的基础能力,优先于短期变现,在Agent尚未定型前把决定未来上限的能力先做出来 [19][20] 核心产品SuperAgent的设计与功能 - SuperAgent是一款以持续完成复杂任务为目标的企业级AI Agent,面向销售、市场与运营等真实岗位场景 [5] - 产品设计假设为一个可以长期运行的系统,而非一次性任务执行器,首先进行意图理解,将其判断为可能包含多个阶段的复合目标 [5] - 系统会自动进入任务规划流程,对整体目标进行多步骤拆解,并在执行过程中持续维护上下文状态,避免“任务半途而废” [5] - 产品具有主动性,在目标歧义或条件不明确时会向用户发起确认,任务完成后会主动提出下一步建议 [5] - 整个任务拆解、规划、搜索与执行过程对用户保持可见,使其从“指令执行器”升级为更接近组织协作者的角色 [5] - 在部署方式上选择了云端化、开箱即用的路径,以应对使用与部署成本过高的问题 [6] - 已在销售与增长、内容与展示、GTM与运营等多个岗位场景中完成能力验证 [6] 自研端到端语音模型Chroma - 公司认为如果Agent要嵌入真实工作流,语音是不可回避的交互形态,尤其在客服、销售、支持等以实时沟通为核心的岗位中 [7] - 行业主流选择“快路径”,即通过ASR、LLM与TTS的级联式架构,但此架构在实时、长期人机协作场景中存在信息丢失和累积延迟问题 [7][8] - 公司反共识地回到模型层,尝试重新定义语音交互基础架构,花费约一年时间自研打造了端到端语音模型Chroma [8] - Chroma在同一模型体系内完成语音理解、语义推理与语音生成,避免了传统级联式方案的信息损失与多段延迟 [8] - 模型采用交错调度策略,能在实时流式对话中同时处理语音与文本标记,实现亚秒级的端到端响应 [8] - 实际测试中,模型能直接感知并表达语音中的副语言信息,如情绪、语调与停顿 [9] - 只需几秒钟参考音频即可实现高保真的个性化语音克隆,并在多轮对话中保持一致 [9] - 在真实对话场景中,Chroma的端到端延迟显著低于传统级联系统 [9] - 在Speaker Similarity (SIM)指标上,Chroma 1.0得分为0.817,优于Human baseline的0.73及多个竞品 [11] - 模型的时间性能指标包括:Time-to-First-Token (TTFT) 146.9 ms,平均每帧延迟52.3 ms,生成RTF 0.43x,总生成时长16.6s [13] 开源战略与研究理念 - 公司认为如果Agent被视为前沿研究问题,其核心能力不应只存在于公司内部 [15] - Chroma被当作一种“可被检验的研究假设”而非产品模块,其成立取决于在更复杂、更开放环境中的适应能力 [15] - 公司在发布Chroma时,与Huggingface及Github平台同步开放了模型权重与推理代码 [15] - 创始人认为,对于前沿方向,真正需要验证的是整个架构是否具备可扩展性与长期成立的可能,开源是为了更快发现尚未想清楚的部分 [16] - 模型开源后,在社区的下载量迅速超过一万次,开发者讨论焦点集中在端到端语音路径的适用性上 [16] - 开源被规划为一项长期工程,随着Chroma向2.0版本迭代,公司计划持续开放模型能力、训练思路与部分数据构建方法,并准备发起语音数据集共建计划 [17]
Property Finder raises $170m from Mubadala, UAE funds
Gulf Business· 2026-01-29 11:57
融资概况 - 中东房地产门户网站Property Finder获得由穆巴达拉投资公司领投的1.7亿美元投资 其他投资方包括另一家阿联酋主权财富基金和BECO资本 [2] - 此次融资是继2025年由Permira旗下基金领投、黑石成长型基金大力参与的5.25亿美元投资之后的最新一轮 彰显了国际和地区投资者对公司长期战略和财务前景的持续信心 [3] - 连同Ares Management和汇丰银行提供的2.5亿美元债务融资 公司已筹集近7亿美元的股权资本 此交易是该地区规模最大的融资轮次之一 [3] - 根据交易条款 穆巴达拉和另一家主权财富基金将各投资7500万美元 BECO资本将从其新成立的2.5亿美元成长基金I中投入2000万美元 这是该基金的首笔投资 [4] - 早期投资者General Atlantic自2018年首次投资以来 继续持有公司大量股份 [3] 投资者与战略意义 - 穆巴达拉的投资体现了其支持国家冠军企业和高增长技术平台(包括为阿联酋长期经济发展做贡献的下一代独角兽)的持续承诺 [6] - 引入两家领先的阿联酋主权财富基金进一步强化了公司的机构股东基础 并使公司与阿联酋建设世界领先数字经济的国家议程更加紧密地结合在一起 [6] - BECO资本是公司最早的风险投资支持者 此次投资深化了双方始于十多年前的合作关系 [4] - 获得全球和地区投资者的支持后 公司将继续专注于简化找房流程、提高经纪人效率 并增强房地产生态系统的信任和透明度 [7] 公司业务与市场地位 - 此次融资巩固了公司作为该地区主导性数字房地产平台以及MENA快速增长房地产分类信息市场技术领导者的地位 [2] - 公司报告了强劲的财务表现 旗舰产品采用加速 在阿联酋及更广泛的MENA地区市场渗透加深 [5] - 包括信用优化工具、房屋估值和超级经纪人在内的人工智能驱动解决方案持续扩展 与Stake和Keyper的合作关系正在将平台服务范围扩大至房地产全生命周期 [5] - 公司创始人兼首席执行官表示 该地区持续经历非凡的经济增长势头 公司致力于帮助建设一个更透明、可信赖且由技术驱动的房地产市场 [6] - 公司首席财务官表示 此轮融资将加速其打造由数据、信任和创新驱动的地区领先房地产操作系统的雄心 [6] - 穆巴达拉高管认为 公司已在科技与房地产的交汇处建立了一个具有韧性和可扩展性的业务 而房地产仍是穆巴达拉的核心战略优先领域 [6][7] - BECO资本认为 公司正在为房地产生态系统的所有利益相关者创造真实价值 并持续树立行业标准 [7] 交易相关方 - 摩根大通在此次交易中担任独家配售代理 [8] - Moelis & Company担任公司的独立财务顾问 [8] - Freshfields担任公司的法律顾问 Cooley担任公司创始人Michael Lahyani的法律顾问 [8]