通用智能体
搜索文档
买下Manus,Meta的焦虑解药来了
第一财经· 2025-12-30 11:37
收购事件概览 - Meta宣布收购通用AI Agent初创公司Manus,交易金额达数十亿美元,为Meta历史上第三大规模收购案,仅次于190亿美元收购WhatsApp和140亿美元收购Scale.ai [3] - 收购完成后,Manus将保持独立运作,继续通过APP和网站提供服务,并在新加坡继续运营,其首席执行官肖弘将出任Meta副总裁 [3][4] - 此次收购进程迅速,耗时仅十余天,在Meta提出收购意向前,Manus正以超过1亿美元的年度经常性收入尝试进行新一轮融资 [5] 被收购方Manus的业务与价值 - Manus在通用AI Agent领域已取得显著成绩,上线至今已处理超过147万亿个token,并创建了超过8000万台虚拟计算机 [3] - 公司定位为“最佳体验整合者”,其生存战略是与巨头合作共生,作为应用层灵活集成各家最优模型,旨在为用户提供极致体验 [7] - 此次收购将进一步巩固Manus在AI应用层的战略位置,致力于将人工智能能力转化为可规模化、可靠的系统,以端到端执行用户任务 [3] 收购方Meta的战略动机与行业背景 - 收购旨在快速补齐Meta在通用智能体领域的产品化与商业化短板,加速其内部生态闭环建设 [6] - 此次收购反映了行业竞争焦点正从基座模型逐渐向应用端侧重 [6] - 2025年Meta在模型迭代、算力基建、组织重组、资本并购等多方面采取激进策略,以追赶OpenAI与Google,但成效并不明显,摩根士丹利已于12月上旬将其目标价从820美元下调至750美元 [5] - 当前大模型赛道迈入基础模型增长瓶颈,从“无限数据”进入“数据有限”阶段,架构与数据创新变得更为关键,拥有规模用户和工程化能力的Manus因此进入Meta视野 [6] 交易影响与行业观点 - 此次收购对Meta的重要意义在于极大补足了其通用Agent平台的能力,并有望在Facebook等平台上产生带动效应 [7] - 有观点认为,数十亿美元的收购是Meta焦虑情绪下的又一次落子,无法根治其在顶尖模型性能、算力基础设施及企业问题等方面存在的持续问题 [6] - Manus的估值在近两年内从字节跳动2024年开出的约3000万美元收购价,飙升至此次的数十亿美元,反映了中国AI创业者的成长与美国科技巨头的焦虑 [5] - 此次收购可能改变Manus此前与多家巨头基座模型之间建立的良性合作关系 [7]
扎克伯格豪掷数十亿美元收购Manus
21世纪经济报道· 2025-12-30 11:27
公司核心发展历程与关键事件 - 公司Manus的母公司蝴蝶效应于2022年在中国成立,后迁至新加坡 [1] - 公司核心团队包括创始人肖弘、季逸超和张涛,三人均有成功的创业或大公司高管背景 [1] - 公司在2025年3月推出“全球首款通用智能体产品”Manus并迅速走红 [1] - 2025年4月下旬,公司获Benchmark领投7500万美元(约合5.5亿元人民币)融资,投后估值近5亿美元 [1] - 2025年5月13日,Manus正式开放注册 [1] - 2025年6月,Manus公司总部从中国搬至新加坡 [1] - 2025年12月,Meta以数十亿美元金额收购Manus,创始人肖弘将出任Meta副总裁 [1] 公司经营与财务表现 - 在发布八个月后,公司年度经常性收入已突破1亿美元 [2] - 公司总营收运行率已超过1.25亿美元,其中包括基于使用量的收入及其他收入 [2] - 自Manus1.5发布以来,其每月增长率持续超过20% [2] 公司团队与全球布局 - 公司目前在新加坡、东京和旧金山共有105名员工 [2] - 公司很快将在巴黎开设新办公室 [2] 行业动态与巨头投入 - 腾讯、阿里、字节、百度等中国科技巨头正以千亿规模重注AI领域 [3] - 美国股市市值正逼近70万亿美元 [3]
买下Manus,Meta的焦虑解药来了
第一财经· 2025-12-30 11:25
收购事件概览 - Meta宣布收购通用AI Agent初创公司Manus,交易金额达数十亿美元,为Meta历史上第三大规模收购案,仅次于190亿美元收购WhatsApp和140亿美元收购Scale.ai [1][2] - Manus在通用AI Agent领域已处理超过147万亿个token,并创建了超过8000万台虚拟计算机,收购前正以超1亿美元年度经常性收入尝试进行新一轮融资 [2][3] - 收购完成后,Manus将保持独立运作,继续通过APP和网站提供服务,并在新加坡运营,其创始人肖弘将出任Meta副总裁 [2][3] 收购战略动机 - Meta试图通过收购快速补齐在通用智能体领域的产品化与商业化短板,加速内部生态闭环建设,以追赶OpenAI与Google [4] - 行业竞争焦点正从基座模型逐渐向应用端侧重,收购Manus能为Meta的Facebook等平台带来带动效应,补足其通用Agent平台能力 [4][5] - 大模型赛道进入基础模型增长瓶颈期,架构与数据创新变得更为关键,拥有规模订阅用户和工程化能力的Manus因此进入Meta视野 [4] 行业与公司背景 - Manus的估值从2024年字节跳动约3000万美元的收购报价,跃升至此次数十亿美元,反映了中国AI创业者的成长 [3][4] - Manus的生存战略是与巨头合作共生,作为应用层灵活集成各家最优模型,扮演“最佳体验整合者”,但被收购后与其它基座模型的合作关系可能改变 [5] - 2025年Meta在模型迭代、算力基建等多方面高举高打但成效不明显,摩根士丹利在12月上旬已将其目标价从820美元下调至750美元 [4] 交易影响与评价 - 此次收购被视为Meta焦虑情绪下的又一次战略落子,而非解决其顶尖模型性能、算力基础设施等根本问题的“特效药” [1][4] - 真格基金合伙人认为,此次耗时仅十余天的收购对AI时代的年轻创业者是莫大激励 [3] - 创新奇智CTO认为Meta的选择很明智,因为基模和Agent可以分开训练,且当前开源模型性能强劲,Manus带来的通用Agent能力想象空间很大 [5]
游戏AI来了,英伟达新模型看直播学会所有游戏,GPT-5.2秒杀塞尔达
36氪· 2025-12-25 15:06
英伟达NitroGen模型的技术突破 - 公司发布名为NitroGen的新模型,其核心逻辑类似于特斯拉FSD的“端到端”模式,通过视觉输入直接产生操作输出,而非依赖游戏后台数据[1] - 模型通过观看YouTube和Twitch上总计4万小时带有手柄画面叠加的游戏实况视频进行学习,将游戏画面与手柄按键动作进行对应[3][7][10] - 该模型学习了超过1000款不同的游戏,旨在成为一个“通才”,而非针对单一游戏的“专才”[11] 模型性能与通用性 - 当被置于一款从未见过的新游戏中时,NitroGen的表现比从零训练的模型强了52%[14] - 模型能够处理多种游戏类型,包括动作RPG、平台跳跃和Roguelike等,并展现出快速上手的“游戏直觉”[11][14] 在游戏领域的应用与影响 - 结合类似GPT-5.2-Thinking等大模型的强大推理能力,NitroGen等技术预示着AI可能终结人类撰写游戏攻略和软件文档的时代[18] - 未来AI不仅能玩游戏,还能自动记录、复盘并生成“白金攻略”,甚至自动修复游戏Bug[18] - 视频游戏已从AI测试基准演变为物理智能的训练场,是机器人技术跨越“莫拉维克悖论”的关键转折点[25][26] 向机器人技术与具身智能的延伸 - NitroGen是基于英伟达的GR00T机器人基础模型构建的,标志着公司将其在虚拟世界的技术积累向物理机器人领域延伸的野心[20] - 该研究为解决具身智能的数据匮乏瓶颈提供了新路径:利用互联网规模的游戏视频数据(4万小时,覆盖1000多种游戏)来训练通用的运动控制策略,这被类比为机器人学习的“ImageNet时刻”[27][36][39][40] - 游戏世界中的“感知-决策-行动”闭环与物理机器人完全同构,是高效的“练兵场”,能为机器人打造应对混乱现实的“通用大脑”[22][29] 通用智能体的分层架构愿景 - 未来的通用智能体可能采用分层架构:顶层(大脑)由类似GPT-5.2的推理模型负责长程规划和逻辑理解;中层(小脑)由类似NitroGen的通用策略模型负责将指令翻译为具体运动轨迹;底层(脊髓)由基于GR00T的控制器负责高频的全身控制和平衡维持[43][44][45] - 通过“在游戏中学会控制,在仿真中学会物理,在现实中学会适应”的路径,实现通用智能体的发展[43]
张涛首次回应争议,Manus 为什么没有被替代?
AI前线· 2025-12-13 13:33
文章核心观点 - 文章记录了真格基金在清华大学举办的AI创业分享活动,核心围绕AI智能体公司Manus的创业历程、产品理念、技术架构、市场策略以及对AI Agent行业未来的展望[4] - Manus作为一款通用AI智能体,其成功被归结为在正确的时间交付了正确的产品,并通过“Less structure, more intelligence”的理念,构建了一个不依赖预设工作流、由模型自主决策的智能系统[7][17] - 面对外界关于“技术套壳”和“营销驱动”的质疑,公司通过持续领先的Benchmark成绩和产品实际体验进行了回应,并分享了其极简、高效的创业方法论[13][20][23] - 公司认为AI Agent的未来在于更强的通用性、24小时持续服务能力以及主动性,并建议个人应尽早开始学习使用Agent,以适应技术变革[40][50][60] Manus的创业历程与关键转折 - **从AI浏览器到通用智能体**:团队最初耗时7个月开发了一款AI浏览器,但在上线前一周意识到AI与用户“争抢电脑”的体验问题,遂决定放弃该项目[10][11] - **灵感来源**:Cursor产品的现象级流行,让团队看到非工程师用户也能受益于AI编程的潜力,这启发了Manus的创作方向[11][12] - **核心洞察**:基于两个关键认知——AI擅长使用电脑但不该用用户的电脑、AI编程能力可以民主化,团队形成了Manus的产品雏形[13] 产品理念与技术架构 - **核心理念**:坚持“Less structure, more intelligence”和“Zero Predefined Workflow”,将任务拆解、工具调用的决策权完全交给模型,以实现处理长尾任务和更优的性能[7][17][19] - **技术实力证明**:在发布15天后,即在硅谷某知名ToB Agent公司的Benchmark展示中位列第二,被行业顶尖团队视为对标对象[13] - **Benchmark表现**:在包括Scale AI的Remote Labor Index (RLI)在内的多项基准测试中长期保持第一,例如在RLI上取得2.50的自动化率分数,领先于Claude、GPT-5和ChatGPT Agent等[14][15][44] - **架构开放性**:公司认为技术本身无秘密,其技术架构(Less structure, more intelligence)在发布第三周就已向全球公开[17] 应对市场质疑与“爆火”真相 - **回应“技术套壳”质疑**:强调任何Benchmark首次发布时的排名最具参考价值,而Manus常在未事先通知的突袭式榜单中位居第一,证明了其技术实力[16] - **回应“营销驱动”质疑**:澄清3月份的发布视频制作成本极低,仅使用了借来的镜头、14.9美元的剪映会员和9.9美元的BGM版权,爆火核心在于产品本身而非营销[20][21] - **发布时的真实状况**:发布时公司账上约有800-900万美元,但因流量巨大,高峰期日成本达50万美元,迫使公司采用邀请码机制控制成本,否则可能20天内破产[23][24] - **产品本质**:成功的关键是在行业对AI产品形态感到迷茫的2025年初,交付了一个全新的、正确的产品形态,满足了市场期待[23] 关键产品决策与增长策略 - **坚持“通用”定位**:认为面向消费者(ToC)的Agent若过于垂直(如旅行规划),将面临极高的获客成本,因此必须通用,让用户每天都有使用理由[30][31] - **早期增长利器:Session Replay**:上线前两周加入任务回放功能,让无法立即体验产品的用户能直观感受Agent的工作过程,对早期病毒式传播帮助巨大[31] - **自然流量的反思**:早期高度依赖自然流量,七个月内市场营销总花费仅约5-6万美元,但认识到这主要触达“创新者”和“早期采用者”[54][55] - **走向大众市场的策略转变**:计划在2026年进入大众市场时,将采用更传统、更系统的营销手段,高效传递产品价值,而非仅依赖自然流量[56][57][58] 团队管理与基础设施选择 - **核心体验亲自抓**:在开发革命性新产品时,核心团队(最初仅5人)亲自把控最核心的产品体验、技术框架与交互细节,以确保高度对齐与执行效率[33] - **基础设施合作策略**:创业初期选择与E2B公司合作,使用其开源版并进行深度定制,以节省时间成本和工程资源,这是基于创业公司资源有限的理性决策[34][35][36][37] - **时间成本优先**:对于创业公司而言,时间成本是第一成本,因此利用成熟、已验证的技术框架是更合理的选择[37] 行业竞争与未来展望 - **应对模型公司的竞争**:OpenAI发布ChatGPT Agent时,团队感到高兴,因为这提供了直接对比的机会。通过对比测试,Manus在100%的任务产出质量上胜出[42][43] - **应用公司的优势**: - **模型选择灵活性**:可根据不同任务步骤选择最合适的模型(如用Gemini搜索、GPT-5推理、Claude写代码),而非绑定单一模型[46] - **系统级竞争**:Agent的竞争是包含环境、工具在内的整个系统的竞争,工程工作构成重要壁垒[48] - **Agent未来发展方向**: - **操纵更多工具与平台**:正整合进Windows、未来将操控Android,以扩展通用能力边界[49] - **24小时持续服务**:正在构建底层基础设施,以支持复杂、长时间的可靠任务执行,为全天候服务做准备[50] - **增强主动性**:开发原型使Agent能主动连接用户个人应用(如Gmail、Calendar),在后台自主找事做,实现“眼里有活”[50] 给创业者与学生的建议 - **给创业者的建议**:学习事物背后的本质和原因,而非表面形式(如拍特定风格的视频或做邀请码)[22][25] - **给学生的建议**:强调在2025年(被视为Agent元年)的最后时间里,务必开始使用一线Agent产品并学会与之共处,这如同几十年前学习开车或使用电脑一样,是适应未来的关键技能[8][60]
Skild AI、Humanoid AI等机器人独角兽,竟然都选了这只中国“手”
机器人大讲堂· 2025-12-11 12:01
文章核心观点 全球顶尖人形机器人公司与研究机构正逐步采用全直驱五指灵巧手作为行业共识的技术路线,而这一关键部件并非来自传统灵巧手公司,而是出自中国全栈派具身智能公司星动纪元,其产品星动XHAND1凭借全直驱架构带来的性能优势,正在定义行业交互标准并占据生态枢纽地位 [1][5][25][33] 全球行业趋势与选择 - 多家全球顶尖人形机器人企业,包括即将完成超10亿美元融资的Skild AI、韩国Rainbow Robotics、英国Extend Robotics以及发布HMND 01的英国Humanoid AI,均不约而同地采用了全直驱五指灵巧手 [1] - 斯坦福大学、卡耐基梅隆大学、UC Berkeley、哥伦比亚大学、清华大学、北京大学、字节Seed等全球顶级科研机构是其长期客户 [5] - 这些厂商选择的灵巧手并非来自传统灵巧手公司,而是指向中国的星动纪元公司 [5] 星动纪元公司定位与战略 - 公司通常被外界视为人形机器人整机厂商,但其宏观战略是实现通用智能体,被视为“中国的Figure” [7] - 公司坚持人形机器人从脑到形态、尺寸、末端执行器都应1:1向人学习,认为手部能力是通用机器人的“能力边界” [7] - 公司通过“模型+本体+场景数据”构建软硬一体自研能力,成长为一家具身大脑与人形本体都做的全栈派公司 [9] - 公司在打造通用智能体的同时,反向输出关键模块,形成“技术定义—标准渗透—生态卡位”的三级跳战略 [9] - 公司对灵巧手的重度投入源于对通用机器人终局的判断:手是智能体能力的物理边界和无法绕行的终极接口 [18] 全直驱技术路径的优势 - **性能强悍**:XHAND1实现了单手25Kg负载与80N握力的强悍输出,维护成本降低60%以上 [12] - **响应迅速**:12个主动自由度在1000Hz的控制频率下,响应速度可媲美电竞选手手速,指令与动作间几乎零延迟 [14] - **数据高保真**:全直驱架构下电流与力矩存在极高线性对应关系,能提供纯净、高保真的力控数据流,适合强化学习训练 [15][16] - **算法友好**:架构从诞生之初就被赋予算法友好基因,支持强化学习触觉仿真,是业内为数不多对强化学习开发者友好的灵巧手 [23] - **耐用可靠**:空载抓握寿命达100万次 [24] 星动纪元的技术护城河 - 公司采用深度垂直整合模式,核心部件自研率超过95%,从高功率密度空心杯电机、驱动器到高精度编码器全部自研打通 [22] - 全栈自研使其牢牢掌握了对全直驱的技术定义权,并能从底层元件开始为灵巧手量身定制,掌握创新节奏 [22] - 硬件与算法协同设计的深度,使得XHAND1能将精妙算法快速、无损地“编译”成现实动作 [24] 产品矩阵与生态构建 - **核心部件**:星动XHAND1灵巧手 [26] - **整机产品**: - 全尺寸双足人形机器人星动L7:拥有55个高自由度,400N·m峰值扭矩关节模组,曾获首届世界机器人运动会跳高冠军,支持全尺寸与半身形态灵活切换 [29][30] - 人形服务机器人星动Q5:拥有44个自由度,已应用于海尔智慧家庭、世纪金源购物中心、联想展厅等真实场景 [30] - 通过“本体+灵巧手+大脑+场景数据”构建具身智能软硬件闭环,旨在重建覆盖全场景的生态网络 [26] 行业拐点与意义 - 行业对灵巧手的评价标准正从追求形态仿生,转向追求交互效能、数据质量与系统可靠 [33] - 头部厂商的集体选择标志着具身智能趋势下一个拐点的到来,一种关于灵巧手的事实标准正在行业的集体选择中悄然成型 [25][33] - 这场关于手的竞争本质是定义未来人机共融环境中物理交互的基础语法 [33]
别再肝了!Google 发布 SIMA 2,你的下一个游戏搭子可能是个 AI
深思SenseAI· 2025-11-21 12:14
SIMA 2核心能力突破 - 新一代通用智能体SIMA 2与Gemini深度集成,能够在虚拟世界理解并执行自然语言指令,执行连续多步操作[1] - SIMA 2超越简单指令执行,通过Gemini作为推理中枢具备思考和推理能力,能够解释意图并描述下一步行动[2] - 智能体可以理解复杂细致指令,执行冗长任务并给予反馈,互动体验接近真实玩家[5] 技术实现与训练方法 - 训练使用大量带语言标注的人类演示视频,结合Gemini自动生成标注进行强化学习[2] - 具备初步对话式协作能力,能用自然语言向用户解释意图并描述行动计划[2] - 通过反复试验加Gemini反馈评估的闭环实现自我改进,不断学会完成更复杂新任务[11] 多模态与环境适应能力 - 借助Gemini出色多模态能力,可以理解图像、表情符号和简洁语言进行互动[6][7] - 在《我的世界》学会挖矿后,能将采集能力迁移到其他未训练过的游戏中[7] - 在Genie 3新生成的3D模拟世界中,即使未受专门训练也能正确辨别方向并执行指令[9][10] 行业意义与发展路径 - SIMA 2是迈向通用交互式具身智能的重要一步,为机器人领域智能具身化提供核心能力模块[15][16] - 通过大规模多世界数据训练叠加Gemini推理能力,将分散的专用系统能力整合进统一通用智能体框架[15] - 虚拟3D世界为具身智能提供可控低成本训练环境,Gemini加SIMA 2组合让会思考的LLM迈向会动手做事的Agent[14]
智能体崛起,AI+软件研发到新拐点了?
AI前线· 2025-11-18 13:34
LLM原生开发时代的现状评估 - 行业对大模型在软件开发中的作用存在分歧,部分观点认为其仅是高级自动补全而非范式变革[5] - 大模型在实际开发中呈现"一半是火焰,一半是海水"的两面性:在独立、结构清晰的小任务或0到1创新场景表现突出,但在复杂庞大的现实任务中挑战巨大[5] - 对非研发群体而言已实现范式变革,使其从"不会"到"能"完成软件开发;对专业程序员群体则处于变革拐点阶段,尚未完全实现范式变革[5][6] - 越来越多公司开始披露AI生成代码比例,该比例正在快速上升,部分团队甚至超过50%[6] AI在具体开发环节的应用成效 - 在UI设计稿转代码方面,通过多模态模型结合设计稿解析,代码生成可用度达到80%至90%[13][14] - 在多端代码转换任务中,AI生成代码质量可达70%以上,整体提效约达原来的1.5倍[14] - 在代码审查环节,通过AI结合规范进行自动检测,测试阶段bug数量下降幅度达30%-40%[15] - 在测试用例生成方面,平安集团内部用例数据生成覆盖率已达60%左右,脚本生成时间从数小时缩短至几分钟[18][19] - AI特别擅长替代重复性、机械性任务,如中英文前端代码互转等传统自动化难以覆盖的场景[15] 智能体与AI助手的能力演进 - Coding Agent代表通用智能体的发展路径,能独立完成软件研发任务,潜力远超特定工具层面的自动化[3][31] - 智能体与助手的核心区别在于闭环能力:助手是单点辅助,而智能体可串联完整开发-测试-审查流程[28] - 智能体具备"动脑、动手、动嘴"的自主执行能力,能在DevOps平台上自动执行代码生成、测试、验证、提交PR等任务[31] - 实现从开发意图输入到代码生成与自测的完整AI流程闭环,预计至少还需要一年以上时间[30] AI落地研发面临的主要挑战 - 当前最大问题在于AI效果缺乏稳定性,收益不足以抵消改变工作习惯的成本时落地困难[20] - 算力问题影响使用体验,响应速度从2分钟降至10秒可显著提高用户容错意愿[22] - 用户提示词能力差异导致使用效果悬殊,有的用户AI参与率能达到50%,有的不足10%[22] - 在大型存量代码库中,AI难以处理庞大上下文,常出现不符合逻辑的修改[20] AI时代对人员能力模型的新要求 - 提示词工程成为关键能力,需要让模型进行"角色扮演",通过严谨结构和细颗粒度输入确保理解准确[23] - 知识工程能力日益重要,需要将团队流程规范、协作规范等整理成明确文档供模型学习引用[24] - 未来工程师价值将体现在架构视角和整体技术思维,AI加速了各角色从"执行者"向"评估者"或"决策者"的转变[37][38] - 全栈工程师价值可能更高,AI使精通多种语言成为可能,能显著提升个人能力边界[39] 行业发展趋势与生态建设 - 更倾向于发展轻量化、插件化生态而非统一大平台,先观察AI在各环节改进效果再谈平台化整合[32] - DevOps层面可能出现更高抽象层次的AI工作台,整合数据检索、任务调度、执行分析等能力[32] - 目前几乎没有公司把"AI生成代码比例"写入绩效考核体系,更倾向于通过文化与引导而非考核推动普及[33][34][35] - AI带来的不是岗位消亡而是岗位价值重塑,开发和测试岗位将转向更具策略性和创造性的工作[35]
奢侈科技品牌BUTTONS与特斯联合作,发布首款搭载HALI智能体的影音机器人|最前线
36氪· 2025-10-20 18:29
产品发布 - 全球奢侈科技品牌BUTTONS推出首款搭载特斯联通用智能体HALI的硬件设备BUTTONS SOLEMATE智能体超级影音机器人 [1] - 通用智能体HALI于2024年11月14日发布 经迭代已从高度拟人化智能体演进为具备空间认知与物理交互能力的生活协同者 [1] 通用智能体HALI技术特性 - HALI构建了与物理环境深度绑定的三维语义记忆模型 将信息记忆关联于空间坐标与环境上下文 提高信息调用直观性与准确性并使AI能运用世界模型进行推理 [3] - HALI作为用户交互智能中枢 能实时感知并处理用户请求 以用户位置行为意图及环境状态作为交互第一语境 实现服务找人的主动转变 [3] - HALI运作流程为先通过端侧模型解析用户意图拆解任务 在时空连续体中对资源设备及行为进行最优编排 再借助端侧芯片完成数据预处理与加密 最终联动云端调度多个垂域智能体实现复杂功能 [3] 云端算力与平台支持 - 特斯联徐州AIoT智算中心的GPU服务器集群负责执行大规模协同计算 AIoT智算云平台上的混合智算引擎支撑任务动态调度 [4] - 特斯联云端大模型承担路径规划确保设备避开障碍 视觉语言模型负责识别目标 大语言模型生成执行策略并回传 最终由智能体落地决策与响应 [4] - 基于特斯联徐州智算中心庞大异构算力储备 可将复杂流程在数秒间完成 AIoT智算云平台构建了统一抽象层和端到端工具链 使模型无缝运行在异构算力上并大幅提升推理及训练效率 [6] 行业趋势与战略方向 - 公司指出专用AI Agents能力局限于专业领域 缺乏跨领域迁移学习能力 主要在数字世界中运行而没有空间感知或与物理世界的直接交互 [6] - AI向通用性演进的关键在于突破数字世界壁垒 获得在物理环境中感知-推理-行动的完整能力闭环 真正的通用智能体必须能感知三维环境 推理空间关系及物理定律 并安全有效地执行任务影响现实世界 [6]
BUTTONS SOLEMATE发布 特斯联构建新“智能体生态”
中证网· 2025-10-19 15:03
公司产品发布与升级 - 公司发布首款搭载特斯联通用智能体HALI的“BUTTONS SOLEMATE 智能体超级影音机器人” [1] - 此举推动公司自研智能体HALI全面进化,构建新的“智能体生态”,完成从智能产品到沉浸式智能体验的升级 [1] - HALI自2024年11月14日首次亮相后持续迭代,已从高度拟人化的智能体演进为具备空间认知与物理交互能力的“生活协同者”和应用于物理世界的通用Agent产品 [1] 产品技术能力与特性 - HALI能实时感知和处理用户请求,通过端侧模型解析意图、拆解任务,并利用端侧芯片预处理与加密数据,云端调度多个垂域智能体共同完成复杂功能 [1] - 借助公司云端大模型,BUTTONS SOLEMATE可实现空间避障导航、视觉目标识别、智能策略生成与执行响应的一体化功能 [1] - 得益于公司徐州智算中心庞大的异构算力储备,看似复杂的流程可以在数秒间完成 [1] 行业技术趋势与平台能力 - 为应对异构芯片融合计算挑战,公司AIoT智算云平台在模型与硬件间构建了基于多架构芯片算子库的统一抽象层,并提供兼容多种推理及训练框架的端到端工具链 [2] - 该平台使模型得以无缝运行在异构算力之上,并实现推理及训练效率的大幅提升 [2] - 行业观点认为,AI向通用性演进的关键一步在于突破数字世界壁垒,获得在物理环境中“感知-推理-行动”的完整能力闭环 [2] - 真正的通用智能体必须能够感知三维环境的几何结构与动态变化,推理物体之间的空间关系、物理定律及动作的因果链条,并最终安全有效地执行任务以影响现实世界 [2]