Workflow
通用智能
icon
搜索文档
重磅!PI 获42亿融资!估值飙升至392亿
机器人大讲堂· 2025-11-21 12:00
融资与估值 - 公司完成新一轮6亿美元融资,估值飙升至56亿美元 [1] - 本轮融资由Alphabet旗下CapitalG领投,现有投资者Lux Capital、Thrive Capital及杰夫·贝索斯持续加码,新晋投资方Index Ventures与T Rowe Price也参与此轮融资 [1] - 公司自2024年3月成立以来融资进程加速,种子轮融资7000万美元估值4亿美元,A轮融资4亿美元估值跃升至24亿美元,三轮融资累计吸金超10亿美元 [9] 团队构成 - 公司团队堪称全明星阵容,首席执行官兼联合创始人Karol Hausman曾是Google DeepMind资深研究科学家,联合创始人Sergey Levine是强化学习领域领军人物,另一位联合创始人Groom是投资人兼支付巨头Stripe前高管 [1] - 团队还包括来自特斯拉、谷歌DeepMind、X等顶尖科技公司的专家,以及斯坦福大学教授等 [3] 技术方向与模型进展 - 公司聚焦通用家用机器人领域,致力于研发可作为各类机器人大脑的人工智能算法,长期愿景是构建一套通用智能系统以赋能多样化机器人应用场景 [3] - 公司提出以研发通用人工智能模型为解决方案,采用覆盖广、数据小的数据集构建策略,首款模型π-0于2024年10月发布,可实现叠衣服、组装纸盒、操作微波炉等多种复杂任务 [5] - 2025年4月发布π-0.5模型,增强了对全新环境的适应能力,通过异构数据协同训练能理解技能语义上下文并实现跨机器人物理行为迁移 [7] - 2025年11月发布最新机器人基础模型π*0.6,引入RECAP通用训练方法,在制作意式浓缩咖啡、折叠衣物、组装工厂包装纸箱等任务中成功率均超过90% [7] 行业背景与挑战 - 家用机器人面临复杂多变的空间环境,多样化任务对精细化动作控制要求高,现有专用机器人往往难以胜任 [3] - 实现不同功能通常需基于新模型与数据重新训练,增加了开发成本,且训练数据需严格适配机器人物理形态与应用场景,加大了数据准备难度 [3]
除了走猫步,人形机器人还能有啥用
中国青年报· 2025-11-12 09:45
行业前景与市场预期 - 特斯拉首席执行官埃隆·马斯克预计公司未来约80%的价值将来自人形机器人,计划在未来10年交付100万台[1] - 摩根士丹利预估到2050年全球或有10亿台人形机器人投入使用[1] - 全球人形机器人销量预计从去年数百台跃升至今年2万台,机器人工程师职位数量同比增长近90%[1] - 贝恩公司报告指出2022年至2024年间人形机器人单位成本至少下降40%,而欧盟劳动力成本同期上涨5%[4] - 售价1.6万美元的宇树机器人成本与美国最低工资年薪相当,远低于熟练工人工资[4] 技术挑战与现状 - 当前人形机器人实际应用有限,宣传视频中的熟练操作常有人后台遥控,更多流向晚会和展览扮演吉祥物[2] - 机器人实现"像人一样走路"是巨大挑战,因缺乏人类前庭系统,需人工关节和肌腱完美运作才能确保平衡[2] - 人体结构精妙复杂,如5根手指的不同长度和特定自由度均有深刻进化逻辑,难以在硅基生命上解码[2] - 机器人专家质疑仿人形态效率,认为关节承受压力大且平衡任务艰巨,轮子效率更高[3] 发展逻辑与驱动因素 - 技术研究者认为人形是通往通用智能的最佳载体,因世界设施结构均依据人类身形设置,人形机器人可无缝融入现有环境而无需大规模改造[3] - 全球老龄化趋势是重要驱动因素,到2050年全球60岁以上人口将翻一番达20亿,2030年全球制造业劳动力可能短缺近800万[4] - 人形机器人有望短期内取代工厂固定机械臂,补足非标准化环节或承担高危作业[3] - 在老龄化严重的日本,类人机器人已加入医疗护理工作[4] 长期愿景与哲学意义 - 马斯克描绘"可持续富足"图景:7×24小时工作的人形机器人将使全球经济规模扩大10倍甚至100倍,工作成为人类可选项,实现全民高收入[1] - 在更遥远设想中,人形机器人终将能做人类能做的所有事,或作为人工智能拥有实体的过渡形态[4] - 人形机器人被视为人类理解机器的语言接口,其拟人化形态可能改变人与工具的关系[5] - 该领域被视为人类追求造物、实现古老梦想的延续,从古希腊塔洛斯到现代机器人均体现这一浪漫主义梦想[5][6]
AI 赋能资产配置(二十二):大模型如何征服 K 线图?
国信证券· 2025-11-10 17:44
核心观点 - Kronos模型是首个专为金融K线数据设计的基础模型,成功将金融时序分析从传统的数值回归范式转向语言建模范式,解决了通用时间序列模型在金融市场中的适应性难题[1] - 该模型通过在大规模金融语料基础上预训练,实现了对市场动态的精准解读,在价格预测任务中的RankIC较领先的通用时序模型提升了93%,波动率预测的平均绝对误差降低了9%[2] - 在策略回测中,由Kronos信号驱动的投资组合实现了21.9%的年化超额收益和1.42的信息比率,证明了其预测信号能够有效转化为优秀的投资绩效[2] - 该模型确立了“领域专用”路径,为金融大模型的发展指明了方向,标志着从“通用智能”到“领域智能”转型的必要性[2] 通用时间序列模型在金融市场的困境 - 通用时间序列基础模型(TSFM)试图通过“一个模型解决所有时序问题”的思路,在涵盖多领域的庞大数据集上训练,但在应用于金融市场时面临显著挑战,表现甚至不及针对单一金融任务设计的传统模型[9] - 金融时间序列数据具有极低的信噪比与尖锐的非平稳性,其数据生成机制不断漂移甚至突变,通用TSFM从平稳数据中学到的“归纳偏置”难以适应金融市场动态本质[10] - 主流时间序列模型的训练语料中,金融序列数据的占比普遍低于1%,导致模型参数体系中仅有微不足道的部分用于理解金融市场特征,分析能力与模型设计难以应对K线数据的典型特征[10][11] Kronos模型的技术架构与创新 - 模型的核心创新在于其专有的“金融分词器”与“分层自回归建模”机制,分词器利用BSQ算法将连续的K线数据离散化为离散的Token,如同将市场波动转化为可被模型理解的“金融单词”[1][18][22] - 模型采用分层预测机制,首先预测代表市场大势的“粗粒度”标记,再在此框架下预测捕捉细节波动的“细粒度”标记,模仿了“先战略、后战术”的专业投资决策流程,显著提升了计算效率与模型鲁棒性[1][24][29] - BSQ算法通过判断特征向量相对于一组最优超平面的方位来生成二进制编码,对异常值具有更强鲁棒性,能更稳健地处理闪崩、流动性瞬间枯竭等极端行情,提升模型在真实交易环境中的可靠性[23] - 分层标记化机制将一个完整的20位代码拆解为10位的“粗粒度”代码和10位的“细粒度”代码,使模型先后进行两次“1024选1”的预测,大幅降低了自回归模型的计算复杂度,使构建超大词汇表以精确捕捉市场细微模式成为可能[24] 训练数据体系与模型配置 - Kronos模型构建了横跨45家全球主流交易所的庞大数据体系,覆盖股票、加密货币、外汇及期货等多类资产,包含超过120亿条K线记录,时间粒度从1分钟到周线共7个频点[30] - 模型提供了多种规模的配置以满足不同应用场景需求,参数规模从24.7M的Kronos-small到499.2M的Kronos-large,用户可根据实际需求在预测精度和计算成本之间取得平衡[31][32] - 在实战推理环节,模型引入了“多情景推演”机制,通过温度调节与核采样技术生成多样化的未来路径,对关键决策点可通过蒙特卡洛模拟产生大量情景并进行集成平均,显著提升预测稳定性[32] 实战应用性能与表现 - 在资产配置与组合优化方面,Kronos模型在所有基准模型中表现最为突出,实现了最高的年化超额回报率和最优的信息比率,其分层预测机制使配置策略兼具稳健性和灵活性[36] - 在风险管理与波动率控制方面,模型通过自回归预测未来已实现波动率,其波动率预测的MAE较最佳基线降低9%,R²指标提升至0.262,能帮助投资者识别市场风险突变点[37][40] - 在交易策略与信号生成方面,模型的多频率预测能力支持各类交易策略,在价格预测任务中RankIC平均提升93%,且在不同资产类别中保持稳定,通过温度缩放和蒙特卡洛滚动,信号稳定性可进一步提升5-10%[41] - 模型在A股实战回测中实现21.9%的年化超额收益和1.42的信息比率,验证了从预测信号到投资绩效的有效转化,标志着专用化基础模型在复杂金融场景中的显著优势[42] 未来发展方向 - 下一代模型有望突破单一价格序列的分析局限,构建融合K线数据、文本舆情、基本面指标和宏观因子的统一认知框架,实现价格走势、文本情绪、基本面的联合推理[43] - 模型未来可能与强化学习、自动决策技术深度结合,构建“感知-决策-执行-优化”的完整智能链路,形成具备持续进化能力的投资智能体,不仅能准确预测市场状态,还能自主制定配置方案、动态调整头寸、实时监控风险[43]
流形空间CEO武伟:当AI开始“理解世界”,世界模型崛起并重塑智能边界|「锦秋会」分享
锦秋集· 2025-11-05 22:01
世界模型的核心概念与定义 - 世界模型是AI智能的下一个基础范式,其目标不是生成内容,而是在智能体内部模拟世界的运行规律[9] - 世界模型是一种可以模拟所有场景的生成式模型,被理解为"the online simulator in our brain",即能够在线进行模拟的智能体模型[15] - 技术上,世界模型通过隐式建模学习并近似环境的状态转移概率分布,从而在仿真空间中进行预测与推演[16] - 与传统AIGC不同,世界模型的目标不是"还原现实",而是通过预测环境变化来做出更优决策[9] 世界模型的技术价值与应用方向 - 世界模型让AI第一次具备"心智推演"能力,能在脑中模拟因果、预判后果、优化行动[9] - 主要应用方向包括构建Agent Model和环境模型两大范式[18][22] - 作为Agent Model时,通过在线模拟和推演获得更好决策,替代依赖经验回放的模仿学习方式[18] - 作为环境模型时,通过离线强化学习获得更好泛化能力,成为通用的Omni Simulator[22] - 为自动驾驶、无人机、具身智能等领域奠定通用智能底座,实现从"经验学习"到"因果理解"的跨越[9] 行业技术路线与发展历程 - 世界模型方向最早可追溯到2018年论文《World Models》,提出Mental Model概念并通过RNN对世界状态进行建模[24] - 2024年OpenAI的Sora出现后形成首个具备文生视频能力的结构化模型,AIGC技术与视觉世界模型开始深度融合[24] - Google的Genie系列基于海量视频数据进行scaling up,训练具有三维空间一致性的视频生成模型,以自回归技术路线为主干[27][28] - Google的Dreamer系列核心思想与AlphaGo一脉相承,在模型构造的虚拟环境中让智能体进行强化学习,经过三代迭代实现跨游戏环境泛化[43][44][52] - Meta的V-JEPA技术路线引入新思路,通过sampling与能量函数评估方式搜索最优执行状态,提供更可解释、更物理一致的智能体建模方式[55][56][57] 流形空间的技术布局与成果 - 公司提出"全域世界模型"体系,已在自动驾驶、机器人、无人机等方向实现突破[9] - 2025年CVPR上发表DriveScape自动驾驶世界模型,比特斯拉Autopilot自动驾驶世界模型发布更早[75] - 2025年NeurIPS上发布RoboScape,是首个针对具身智能的物理可控世界模型,能通过单帧图像+语言指令执行物理动作,支持刚体与柔性物体交互[78] - 2025年ACM MM上推出全球首个无人机世界模型AirScape,通过显式世界建模实现空间与视角统一控制[81] - 所有模型基于自研LongScape基础架构,结合Auto-regressive + DiT混合建模方式,整体研发进度超前于特斯拉世界模型团队[83] - 已将模型量化蒸馏部署到边缘端推理系统,驱动机器人实现自主移动以及无人机实现自主导航[84] 当前挑战与未来发展方向 - 现有模型如Cosmos、Genie、WorldLabs在多模态感知、指令遵循、物理世界建模等方面仍有不足,任务适应性不够强[66] - 具身智能体面临跨尺度空间挑战,自动驾驶汽车、室内操作机器人、低空无人机等不同尺度下的泛化能力仍然较弱[67] - 未来提升主要集中在五个方面:需要更丰富的多模态数据、更强的表征学习能力、新的原生世界模型基模架构、转向任务执行能力的训练目标、以及任务泛化与跨环境自适应能力[69][70][71][72][73]
DeepMind一篇论文终结十年之争,GPT-5推理靠世界模型
36氪· 2025-10-31 16:22
GPT-5的推理能力突破 - GPT-5展现出惊艳的推理能力,逻辑水平堪比专家,网友评价如同与博士讨论问题[1] - 其核心突破不在于参数规模扩大,而在于智能体内部形成了“世界模型”[1] - 这种推理能力表现为多步逻辑处理能力,如解数学习题和规划流程[5] 世界模型的理论基础 - 世界模型是AI脑中的预测地图,能够对事件发展进行预测(如球桌边缘滚动→掉落预测)[3][4] - 学术框架中存在目标、策略、世界模型的三角推导关系:已知世界模型和目标可推导最优策略,已知策略和世界模型可反推目标[7] - 最新研究补齐三角关系最后一角:通过智能体策略和目标可恢复其世界模型,证明世界模型是通用智能的必要条件[9] 世界模型的实验验证 - 研究人员搭建虚拟迷你世界(含X/Y状态概率跳转)验证世界模型存在性[10][11] - 实验数据显示任务复杂度与模型精度正相关:任务越复杂,世界模型误差迅速下降[12][14] - 在复合目标实验(需状态间来回跳转)中,世界模型仍能被稳定恢复[15] 世界模型的技术意义 - 世界模型解释了“涌现能力”现象:非魔法而是模型清晰化的自然结果[17] - 模型为破解AI黑箱提供新途径,未来可能通过抽取世界模型解释AI行为[17] - 智能体强度与模型精度正相关,GPT-5的推理能力提升直接源于世界模型优化[16] 行业影响与未来展望 - 世界模型既是通向通用智能的通行证,也可能因模型与人类认知差异成为不确定性源头[17] - 该突破改变对AI能力的理解范式,从数据模仿转向内在认知构建[4][9] - 研究成果为AI安全性研究提供理论支撑,使模型可解释性具备实现基础[17]
零一万物官宣三位高管新任命;前天猫精灵总裁彭超创业,想从运动AI硬件实现通用智能丨AIGC日报
创业邦· 2025-10-28 08:10
零一万物高管任命 - 公司宣布联合创始人沈鹏飞统筹国内ToB及ToG业务拓展与销售体系 [2] - 赵斌强晋升副总裁并聚焦模型平台技术与专业产品体系建设 [2] - 宁宁晋升副总裁并负责国际业务拓展与AI咨询落地 [2] 云玦科技创业动态 - 前天猫精灵总裁彭超创立云玦科技 首款产品为运动可穿戴硬件设备结合Agent智能体 [2] - 公司项目于10月中旬启动 核心思路是让AI在5000立方米运动空间内实现跟踪、规划、分析、执行及自进化能力 [2] - 硬件形态不限于单一产品 而是一套产品组合 目标是从运动场景迁移至更多物理空间实现通用智能 [2] 苹果地图业务拓展 - 苹果计划在Apple地图中整合广告功能 允许企业付费置顶搜索查询结果 [3] - 该功能最早可能在明年上线 广告界面设计将优于谷歌等竞争对手 [3] - 公司将利用AI技术保持搜索结果的实用性与相关性 [3] 火山引擎视频生成模型升级 - 火山引擎正式上线豆包视频生成模型1.0 pro fast 生成速度最高提升约3倍 [4] - 新模型价格直降72% 在继承Seedance 1.0 pro核心优势基础上实现效率突破 [4]
前天猫精灵总裁彭超创业,想从运动AI硬件实现通用智能丨36氪独家
36氪· 2025-10-27 18:17
公司核心信息 - 前阿里巴巴集团副总裁、天猫精灵总裁彭超近期创立云玦科技,首款产品为运动可穿戴硬件设备结合Agent智能体 [5] - 公司项目于10月中旬启动,核心思路是让AI扮演跟踪、规划、分析、执行的角色,配合硬件使智能体具备自进化能力,初期专注于高速高频运动的5000立方米空间,后续将迁移至更多物理空间 [6] - 具体硬件形态仍在设计中,但将不只是一款产品,而是一套产品组合 [7] 创始人背景与创业思路 - 联合创始人齐炜祯为Multi-token Prediction架构的开创学者,其研究成果已被Deepseek V3、Qwen-3-Next等模型引入核心预训练方法,能力点集中于提升模型预测速度、降低消耗并保证质量 [11] - 彭超在阿里任职期间即关注Agent智能体,曾提出下一代智能体交互将从挖掘用户情感与个性化需求出发,推动人机交互向人机伙伴关系迁移 [10] - 彭超拥有多年大厂经验,曾操盘10亿美金以上量级的智能硬件业务,包括在华为印度建立全链条国家地区部公司,以及在阿里主导将达摩院大模型引入天猫精灵 [12][13] 行业趋势与产品定位 - AI大模型出现Agentic use趋势,从被动响应指令进化为能主动规划、执行复杂任务,小参数量推理模型成熟推动AI从工具向助理进化 [7] - 细分行业的Agent智能体是当前AI创业者青睐的赛道 [7] - 公司产品定位为消费级智能体与通用智能采用同一套训练架构,通过硬件配合实现智能体自进化 [6]
天猫精灵前总裁彭超再创业,瞄准运动可穿戴与智能体融合|融资首发
钛媒体APP· 2025-10-27 17:00
公司核心动态 - 天猫精灵前总裁彭超与前阿里巴巴集团副总裁彭超联合创立新公司云玦科技 [2] - 公司首款产品将聚焦于"运动可穿戴硬件设备 + Agent智能体"的融合形态 [2] - 产品目前仍在设计阶段 但内部共识是打造"不只是一款产品 而是一整套产品组合" [3] 创始团队背景 - 创始人彭超拥有超过14年智能硬件产品经验 曾主导将达摩院大模型引入天猫精灵并组建阿里巴巴智能互联事业群 [2] - 彭超在华为荣耀期间带领团队实现全球线上份额第一 在印度组建了华为海外唯一集产品定义至销售于一体的国家级区域公司 [2] - 联合创始人齐炜祯为人工智能学术界代表 曾任中关村人工智能研究院大模型博士培养方向导师 研究方向聚焦自然语言生成与预训练模型 [2] - 齐炜祯在NLP顶会发表论文十余篇 总引用次数超过2300次 其主导研发的ProphetNet及BANG模型已部署于必应广告推荐系统多个国家市场 [2] - 齐炜祯在2020年ProphetNet项目中首次提出MTP架构 该架构后来成为DeepSeek V3、Qwen-3-Next等大模型的核心预训练方法之一 [3] 产品与技术愿景 - 公司认为未来消费级智能体与通用智能可能采用同一套训练架构 核心是让AI承担"跟踪—规划—分析—执行"的角色 [4] - 目标是通过硬件实现AI的具身化自进化 使其能在陪伴用户高速高频运动的5000立方米物理空间中持续学习与提升 [4] - 最终愿景是将学习成果迁移至更广泛的现实场景中 [4]
LeCun怒揭机器人最大骗局,坦白Llama与我无瓜
36氪· 2025-10-26 17:22
人形机器人行业现状与挑战 - 行业面临从特定任务训练到通用智能的鸿沟,家用机器人实现叠衣服、倒水等任务仍需AI领域取得一系列突破[1] - 行业秘密在于公司尚不知晓如何让机器人变得足够聪明以达到实用级别[21] - 人形机器人拥有40个自由度,可能产生的位姿组合数量超过宇宙原子总数,该问题无法通过编程解决,唯一途径是神经网络[25] 技术路径分歧:世界模型与LLM - Meta首席AI科学家Yann LeCun认为突破核心在于打造可规划的世界模型架构,以学习理解和预测物理世界系统[1] - LeCun指出大语言模型是一条死胡同,仅靠文本训练无法实现人类水平智能,智能源于视觉、听觉、触觉等多模态经验[15] - 四岁儿童通过视觉接收的数据量已相当于所有公开文本训练的最大规模LLM的数据量[15] - LeCun预测未来3-5年内,世界模型会成为AI架构的主流模型,届时头脑清醒的人都不会再用生成式LLM的路子[20] 主要公司动态与战略 - **特斯拉**:公司内部对于如何快速实现通用人形机器人已有非常明确的思路[1];正建设年产百万台Optimus机器人的生产线,目标2026年初推出具备量产意向的V3原型机[26];其神经世界模拟器能够基于当前状态与后续动作直接合成未来状态,该架构将无缝迁移至Optimus机器人[28][31] - **Figure AI**:公司CEO宣称明年就能实现通过语音指令让人形机器人在陌生环境完成各类通用工作[23];强调其机器人所有操作都由神经网络驱动,否认某些公开演示仅为戏剧表演或预设程序[25] - **1X Technologies**:公司发布自研世界模型,该模型允许从相同初始条件出发并行部署不同策略进行直接对比[35][37];公司CEO坦言让机器人进入家庭存在理想与现实的落差,现实环境复杂得离谱[37] 世界模型技术架构 - 世界模型定义为给到时刻t的世界状态及智能体可能动作,以预测动作执行后的环境[16] - 系统配备世界模型后可进行规划,设想连续动作并预测结果,结合代价函数评估任务完成情况,运用优化方法搜索最优动作序列[18] - 环境动力学模型完全通过自监督学习,机器人无需针对特定任务反复训练,能从模拟数据或真实操作中学习动作-结果关系,零样本完成新任务[18][19] - 1X世界模型包含视觉编码器、动作编码器、核心网络及视频与状态价值解码器,通过对成功标签进行监督学习生成的状态价值预测可量化评估输入动作质量[35]
从被吹捧到沦为鸡肋,“AI”这个词用了还不到一年
36氪· 2025-10-17 19:56
文章核心观点 - 当前AI行业的发展状况与历史上两次AI寒冬前的情景高度相似,存在技术泡沫、市场脱节及商业模型不可持续等问题,第三次AI寒冬可能正在来临 [1][4][6][7] 历史上的AI寒冬 - 第一次AI寒冬发生在1974-1980年,因计算机内存和处理能力有限,难以处理复杂实际问题,且早期AI系统无法有效利用人类常识和领域知识,导致政府大幅削减资金支持,AI研究陷入低谷 [2] - 第二次AI寒冬发生在1987-1993年,以专家系统为代表的AI因知识库有限、维护成本高且无法自动学习而失去商业价值,同时昂贵的专用AI硬件市场被性价比更高的台式计算机取代,导致AI硬件市场崩溃和投资撤离 [3] 当前AI行业面临的挑战 - 大模型训练成本高昂,存在严重幻觉问题,难以在企业垂直场景中落地应用,投入产出比极低 [5] - 许多AI产品开发脱离用户真实需求,功能与实际需求脱节,导致产品无人使用或被迅速淘汰 [5] - 企业数字化基础薄弱、业务流程不规范、数据孤岛严重等问题,阻碍了AI技术的有效落地 [6] - 资本市场缺乏耐心,一旦AI项目回报周期拉长便迅速撤资,转向其他风口 [6] 潜在第三次AI寒冬的成因 - 技术能力与社会预期之间存在巨大鸿沟,对通用智能概念盲目乐观 [4] - AI产品与现实市场需求脱节,缺乏可持续的商业发展模式和核心技术壁垒 [6] - AI公司普遍无法提供端到端的一体化解决方案,仅能提供单一功能模块 [6] - 企业和资本急于看到立竿见影的回报,不愿为AI技术的长期演进买单 [7]