通用智能
搜索文档
GPT-5.2来了,首个“专家级”AI复仇成功,牛马打工人终于得救了
36氪· 2025-12-12 07:58
产品发布与定位 - OpenAI发布GPT-5.2系列模型,包括即时版、思考版和专业版三款,今日全部上线 [1][2] - 该系列模型定位为“地表最强通用模型”,专为解决高难度知识型工作而生 [4] - 此次更新正值公司内部进入“红色代码”紧急状态,旨在集中资源优先开发,但公司高管表示不应将其视为对竞争对手的直接回应 [21] 核心性能提升 - 相比上一代,GPT-5.2在通用智能、超长文本理解、Agent工具调用及视觉能力上实现全面进化 [6] - 在SWE-Bench Pro基准测试中取得55.6%的高分,在LMArena代码竞技场中位列全球第二,在ARC-AGI-2基准测试中以52.9%的绝对优势登顶全球第一 [6] - 在GDPval基准测试中,覆盖44种职业知识,表现超越人类行业专家,成为首个在该测试中表现超过人类专家水平的模型 [6][25] - 在长上下文推理方面树立新标准,在OpenAI MRCRv2基准测试的多种变体(高达256k Token)上达到接近100%的准确率 [53] - 视觉能力显著增强,在图表推理和软件界面理解方面的错误率大约减少了一半 [60] 具体任务表现 - 在GDPval知识工作任务中,GPT-5.2 Thinking在70.9%的情况下击败或打平顶尖行业专业人士,完成任务的速度比专家快11倍,成本低于1% [27] - 在针对初级投资银行分析师电子表格建模的内部测试中,GPT-5.2 Thinking的平均每任务得分比GPT-5.1高出9.3个百分点(从59.1%升至68.4%) [33] - 在编程能力上,GPT-5.2 Thinking在SWE-bench Verified上取得80%的高分,能更可靠地调试生产环境代码、实现功能请求和重构大型代码库 [44] - 幻觉显著减少,在一组去标识化的ChatGPT查询中,包含错误的回答相对减少了30% [49] - 在工具调用和端到端工作流方面表现卓越,在Tau2-bench Telecom上创造了98.7%的新纪录 [64] 模型规格与定价 - 模型知识库更新至2025年8月31日,拥有40万Token的上下文窗口和12.8万Token的最大输出长度 [19] - 相比GPT-5/5.1,GPT-5.2的输入输出价格贵了40% [19] - 具体定价为:GPT-5.2 / gpt-5.2-chat-latest的输入价格为每百万Token 1.75美元,输出价格为14美元;GPT-5.2 Pro的输入价格为21美元,输出价格为168美元 [20] - 尽管每Token成本更高,但由于更高的Token效率,GPT-5.2的性价比反而更高 [88] 行业影响与生态 - 该模型被定位为“打工人的最佳工作模型”,能有效辅助完成创建电子表格、制作演示文稿、编写代码、感知图像等专业任务 [21][22][29] - 公司报告称,ChatGPT每天能为企业用户平均节省40–60分钟,重度用户每周能节省超过10小时 [25] - 在科学研究辅助方面,GPT-5.2 Pro和Thinking是辅助科学家工作的最佳模型,在研究生水平基准GPQA Diamond上分别达到93.2%和92.4%,并已实际参与完成学术论文证明 [70][72][73] - 新模型已向付费ChatGPT用户(Plus、Pro、Go、Business、Enterprise)优先开放,GPT-5.1将继续供付费用户使用三个月后停用 [87] - 开发者可通过Responses API和Chat Completions API使用对应模型,并支持新的第五种推理强度“xhigh” [88]
没有身体就没有AGI!Hillbot苏昊对谈千寻高阳:具身智能泡沫很大但进展真实
量子位· 2025-11-27 11:00
文章核心观点 - 具身智能是通往通用人工智能的必经之路,其本质与大语言模型无异,核心在于数据规模的扩展[2][3][4] - 行业正处于“全民做科研”的泡沫与真实进展并存阶段,技术突破是连续过程,机器人具身模型的GPT-3.5时刻预计在2-3年内到来[31][33][38][41] - 中国在具身智能领域具备硬件与软件协同设计、供应链效率和现实世界数据采集的显著结构性优势[25][26][27][30] 具身智能的战略重要性 - 具身智能是实现通用物理智能和通用智能的关键出口,缺乏身体则无法验证认知和改变世界[2][16][19] - 无论是虚拟智能体还是物理机器人,与环境的交互和经验学习是获得通用能力的必不可少环节[21][23] - 科学发现和拓展人类生存空间等宏大目标,均需具身智能实现感知与交互的配合[19] 技术路径与突破预期 - 技术路径借鉴大语言模型的成功经验,核心是解决预训练问题,让模型具备先验知识[39][40] - 世界模型是技术框架的重要组成部分,旨在建立对物理世界常识的表征,视觉-语言-动作架构需要其支撑[34][36] - 下一个突破是模型听话程度和完成多样化物理行为能力的连续提升,最终能串联复杂任务[40][41] - 机器人具身模型的GPT-3.5时刻预计还需2-3年,GPT-4时刻则需更长时间[41] 中美竞争与中国优势 - 中美在顶尖技术层面差距不大,美国在人才绝对数量和资本对“世界第一”量级的投入上具有优势[24][25] - 中国的核心优势在于硬件和软件的协同设计能力、供应链效率以及现实世界数据采集的迭代速度[25][26][27] - 硬件迭代周期在中国可比美国快3-10倍,配件获取速度以天为单位,而美国需周以上[25][26] - 中国全社会对具身智能的投入度和决心更强,且在该领域“没有退路”,必须持续支持[30] 行业现状与挑战 - 当前AI行业处于“全民做科研”状态,因问题宏大,资本和研究力量过早介入导致泡沫与真实进展并存[31][33] - 具身智能发展的最短板是数据,其瓶颈与大语言模型的电力瓶颈不同[27] - 芯片供应,特别是端上芯片,是中国面临的一个明确挑战[30]
重磅!PI 获42亿融资!估值飙升至392亿
机器人大讲堂· 2025-11-21 12:00
融资与估值 - 公司完成新一轮6亿美元融资,估值飙升至56亿美元 [1] - 本轮融资由Alphabet旗下CapitalG领投,现有投资者Lux Capital、Thrive Capital及杰夫·贝索斯持续加码,新晋投资方Index Ventures与T Rowe Price也参与此轮融资 [1] - 公司自2024年3月成立以来融资进程加速,种子轮融资7000万美元估值4亿美元,A轮融资4亿美元估值跃升至24亿美元,三轮融资累计吸金超10亿美元 [9] 团队构成 - 公司团队堪称全明星阵容,首席执行官兼联合创始人Karol Hausman曾是Google DeepMind资深研究科学家,联合创始人Sergey Levine是强化学习领域领军人物,另一位联合创始人Groom是投资人兼支付巨头Stripe前高管 [1] - 团队还包括来自特斯拉、谷歌DeepMind、X等顶尖科技公司的专家,以及斯坦福大学教授等 [3] 技术方向与模型进展 - 公司聚焦通用家用机器人领域,致力于研发可作为各类机器人大脑的人工智能算法,长期愿景是构建一套通用智能系统以赋能多样化机器人应用场景 [3] - 公司提出以研发通用人工智能模型为解决方案,采用覆盖广、数据小的数据集构建策略,首款模型π-0于2024年10月发布,可实现叠衣服、组装纸盒、操作微波炉等多种复杂任务 [5] - 2025年4月发布π-0.5模型,增强了对全新环境的适应能力,通过异构数据协同训练能理解技能语义上下文并实现跨机器人物理行为迁移 [7] - 2025年11月发布最新机器人基础模型π*0.6,引入RECAP通用训练方法,在制作意式浓缩咖啡、折叠衣物、组装工厂包装纸箱等任务中成功率均超过90% [7] 行业背景与挑战 - 家用机器人面临复杂多变的空间环境,多样化任务对精细化动作控制要求高,现有专用机器人往往难以胜任 [3] - 实现不同功能通常需基于新模型与数据重新训练,增加了开发成本,且训练数据需严格适配机器人物理形态与应用场景,加大了数据准备难度 [3]
除了走猫步,人形机器人还能有啥用
中国青年报· 2025-11-12 09:45
行业前景与市场预期 - 特斯拉首席执行官埃隆·马斯克预计公司未来约80%的价值将来自人形机器人,计划在未来10年交付100万台[1] - 摩根士丹利预估到2050年全球或有10亿台人形机器人投入使用[1] - 全球人形机器人销量预计从去年数百台跃升至今年2万台,机器人工程师职位数量同比增长近90%[1] - 贝恩公司报告指出2022年至2024年间人形机器人单位成本至少下降40%,而欧盟劳动力成本同期上涨5%[4] - 售价1.6万美元的宇树机器人成本与美国最低工资年薪相当,远低于熟练工人工资[4] 技术挑战与现状 - 当前人形机器人实际应用有限,宣传视频中的熟练操作常有人后台遥控,更多流向晚会和展览扮演吉祥物[2] - 机器人实现"像人一样走路"是巨大挑战,因缺乏人类前庭系统,需人工关节和肌腱完美运作才能确保平衡[2] - 人体结构精妙复杂,如5根手指的不同长度和特定自由度均有深刻进化逻辑,难以在硅基生命上解码[2] - 机器人专家质疑仿人形态效率,认为关节承受压力大且平衡任务艰巨,轮子效率更高[3] 发展逻辑与驱动因素 - 技术研究者认为人形是通往通用智能的最佳载体,因世界设施结构均依据人类身形设置,人形机器人可无缝融入现有环境而无需大规模改造[3] - 全球老龄化趋势是重要驱动因素,到2050年全球60岁以上人口将翻一番达20亿,2030年全球制造业劳动力可能短缺近800万[4] - 人形机器人有望短期内取代工厂固定机械臂,补足非标准化环节或承担高危作业[3] - 在老龄化严重的日本,类人机器人已加入医疗护理工作[4] 长期愿景与哲学意义 - 马斯克描绘"可持续富足"图景:7×24小时工作的人形机器人将使全球经济规模扩大10倍甚至100倍,工作成为人类可选项,实现全民高收入[1] - 在更遥远设想中,人形机器人终将能做人类能做的所有事,或作为人工智能拥有实体的过渡形态[4] - 人形机器人被视为人类理解机器的语言接口,其拟人化形态可能改变人与工具的关系[5] - 该领域被视为人类追求造物、实现古老梦想的延续,从古希腊塔洛斯到现代机器人均体现这一浪漫主义梦想[5][6]
AI 赋能资产配置(二十二):大模型如何征服 K 线图?
国信证券· 2025-11-10 17:44
核心观点 - Kronos模型是首个专为金融K线数据设计的基础模型,成功将金融时序分析从传统的数值回归范式转向语言建模范式,解决了通用时间序列模型在金融市场中的适应性难题[1] - 该模型通过在大规模金融语料基础上预训练,实现了对市场动态的精准解读,在价格预测任务中的RankIC较领先的通用时序模型提升了93%,波动率预测的平均绝对误差降低了9%[2] - 在策略回测中,由Kronos信号驱动的投资组合实现了21.9%的年化超额收益和1.42的信息比率,证明了其预测信号能够有效转化为优秀的投资绩效[2] - 该模型确立了“领域专用”路径,为金融大模型的发展指明了方向,标志着从“通用智能”到“领域智能”转型的必要性[2] 通用时间序列模型在金融市场的困境 - 通用时间序列基础模型(TSFM)试图通过“一个模型解决所有时序问题”的思路,在涵盖多领域的庞大数据集上训练,但在应用于金融市场时面临显著挑战,表现甚至不及针对单一金融任务设计的传统模型[9] - 金融时间序列数据具有极低的信噪比与尖锐的非平稳性,其数据生成机制不断漂移甚至突变,通用TSFM从平稳数据中学到的“归纳偏置”难以适应金融市场动态本质[10] - 主流时间序列模型的训练语料中,金融序列数据的占比普遍低于1%,导致模型参数体系中仅有微不足道的部分用于理解金融市场特征,分析能力与模型设计难以应对K线数据的典型特征[10][11] Kronos模型的技术架构与创新 - 模型的核心创新在于其专有的“金融分词器”与“分层自回归建模”机制,分词器利用BSQ算法将连续的K线数据离散化为离散的Token,如同将市场波动转化为可被模型理解的“金融单词”[1][18][22] - 模型采用分层预测机制,首先预测代表市场大势的“粗粒度”标记,再在此框架下预测捕捉细节波动的“细粒度”标记,模仿了“先战略、后战术”的专业投资决策流程,显著提升了计算效率与模型鲁棒性[1][24][29] - BSQ算法通过判断特征向量相对于一组最优超平面的方位来生成二进制编码,对异常值具有更强鲁棒性,能更稳健地处理闪崩、流动性瞬间枯竭等极端行情,提升模型在真实交易环境中的可靠性[23] - 分层标记化机制将一个完整的20位代码拆解为10位的“粗粒度”代码和10位的“细粒度”代码,使模型先后进行两次“1024选1”的预测,大幅降低了自回归模型的计算复杂度,使构建超大词汇表以精确捕捉市场细微模式成为可能[24] 训练数据体系与模型配置 - Kronos模型构建了横跨45家全球主流交易所的庞大数据体系,覆盖股票、加密货币、外汇及期货等多类资产,包含超过120亿条K线记录,时间粒度从1分钟到周线共7个频点[30] - 模型提供了多种规模的配置以满足不同应用场景需求,参数规模从24.7M的Kronos-small到499.2M的Kronos-large,用户可根据实际需求在预测精度和计算成本之间取得平衡[31][32] - 在实战推理环节,模型引入了“多情景推演”机制,通过温度调节与核采样技术生成多样化的未来路径,对关键决策点可通过蒙特卡洛模拟产生大量情景并进行集成平均,显著提升预测稳定性[32] 实战应用性能与表现 - 在资产配置与组合优化方面,Kronos模型在所有基准模型中表现最为突出,实现了最高的年化超额回报率和最优的信息比率,其分层预测机制使配置策略兼具稳健性和灵活性[36] - 在风险管理与波动率控制方面,模型通过自回归预测未来已实现波动率,其波动率预测的MAE较最佳基线降低9%,R²指标提升至0.262,能帮助投资者识别市场风险突变点[37][40] - 在交易策略与信号生成方面,模型的多频率预测能力支持各类交易策略,在价格预测任务中RankIC平均提升93%,且在不同资产类别中保持稳定,通过温度缩放和蒙特卡洛滚动,信号稳定性可进一步提升5-10%[41] - 模型在A股实战回测中实现21.9%的年化超额收益和1.42的信息比率,验证了从预测信号到投资绩效的有效转化,标志着专用化基础模型在复杂金融场景中的显著优势[42] 未来发展方向 - 下一代模型有望突破单一价格序列的分析局限,构建融合K线数据、文本舆情、基本面指标和宏观因子的统一认知框架,实现价格走势、文本情绪、基本面的联合推理[43] - 模型未来可能与强化学习、自动决策技术深度结合,构建“感知-决策-执行-优化”的完整智能链路,形成具备持续进化能力的投资智能体,不仅能准确预测市场状态,还能自主制定配置方案、动态调整头寸、实时监控风险[43]
流形空间CEO武伟:当AI开始“理解世界”,世界模型崛起并重塑智能边界|「锦秋会」分享
锦秋集· 2025-11-05 22:01
世界模型的核心概念与定义 - 世界模型是AI智能的下一个基础范式,其目标不是生成内容,而是在智能体内部模拟世界的运行规律[9] - 世界模型是一种可以模拟所有场景的生成式模型,被理解为"the online simulator in our brain",即能够在线进行模拟的智能体模型[15] - 技术上,世界模型通过隐式建模学习并近似环境的状态转移概率分布,从而在仿真空间中进行预测与推演[16] - 与传统AIGC不同,世界模型的目标不是"还原现实",而是通过预测环境变化来做出更优决策[9] 世界模型的技术价值与应用方向 - 世界模型让AI第一次具备"心智推演"能力,能在脑中模拟因果、预判后果、优化行动[9] - 主要应用方向包括构建Agent Model和环境模型两大范式[18][22] - 作为Agent Model时,通过在线模拟和推演获得更好决策,替代依赖经验回放的模仿学习方式[18] - 作为环境模型时,通过离线强化学习获得更好泛化能力,成为通用的Omni Simulator[22] - 为自动驾驶、无人机、具身智能等领域奠定通用智能底座,实现从"经验学习"到"因果理解"的跨越[9] 行业技术路线与发展历程 - 世界模型方向最早可追溯到2018年论文《World Models》,提出Mental Model概念并通过RNN对世界状态进行建模[24] - 2024年OpenAI的Sora出现后形成首个具备文生视频能力的结构化模型,AIGC技术与视觉世界模型开始深度融合[24] - Google的Genie系列基于海量视频数据进行scaling up,训练具有三维空间一致性的视频生成模型,以自回归技术路线为主干[27][28] - Google的Dreamer系列核心思想与AlphaGo一脉相承,在模型构造的虚拟环境中让智能体进行强化学习,经过三代迭代实现跨游戏环境泛化[43][44][52] - Meta的V-JEPA技术路线引入新思路,通过sampling与能量函数评估方式搜索最优执行状态,提供更可解释、更物理一致的智能体建模方式[55][56][57] 流形空间的技术布局与成果 - 公司提出"全域世界模型"体系,已在自动驾驶、机器人、无人机等方向实现突破[9] - 2025年CVPR上发表DriveScape自动驾驶世界模型,比特斯拉Autopilot自动驾驶世界模型发布更早[75] - 2025年NeurIPS上发布RoboScape,是首个针对具身智能的物理可控世界模型,能通过单帧图像+语言指令执行物理动作,支持刚体与柔性物体交互[78] - 2025年ACM MM上推出全球首个无人机世界模型AirScape,通过显式世界建模实现空间与视角统一控制[81] - 所有模型基于自研LongScape基础架构,结合Auto-regressive + DiT混合建模方式,整体研发进度超前于特斯拉世界模型团队[83] - 已将模型量化蒸馏部署到边缘端推理系统,驱动机器人实现自主移动以及无人机实现自主导航[84] 当前挑战与未来发展方向 - 现有模型如Cosmos、Genie、WorldLabs在多模态感知、指令遵循、物理世界建模等方面仍有不足,任务适应性不够强[66] - 具身智能体面临跨尺度空间挑战,自动驾驶汽车、室内操作机器人、低空无人机等不同尺度下的泛化能力仍然较弱[67] - 未来提升主要集中在五个方面:需要更丰富的多模态数据、更强的表征学习能力、新的原生世界模型基模架构、转向任务执行能力的训练目标、以及任务泛化与跨环境自适应能力[69][70][71][72][73]
DeepMind一篇论文终结十年之争,GPT-5推理靠世界模型
36氪· 2025-10-31 16:22
GPT-5的推理能力突破 - GPT-5展现出惊艳的推理能力,逻辑水平堪比专家,网友评价如同与博士讨论问题[1] - 其核心突破不在于参数规模扩大,而在于智能体内部形成了“世界模型”[1] - 这种推理能力表现为多步逻辑处理能力,如解数学习题和规划流程[5] 世界模型的理论基础 - 世界模型是AI脑中的预测地图,能够对事件发展进行预测(如球桌边缘滚动→掉落预测)[3][4] - 学术框架中存在目标、策略、世界模型的三角推导关系:已知世界模型和目标可推导最优策略,已知策略和世界模型可反推目标[7] - 最新研究补齐三角关系最后一角:通过智能体策略和目标可恢复其世界模型,证明世界模型是通用智能的必要条件[9] 世界模型的实验验证 - 研究人员搭建虚拟迷你世界(含X/Y状态概率跳转)验证世界模型存在性[10][11] - 实验数据显示任务复杂度与模型精度正相关:任务越复杂,世界模型误差迅速下降[12][14] - 在复合目标实验(需状态间来回跳转)中,世界模型仍能被稳定恢复[15] 世界模型的技术意义 - 世界模型解释了“涌现能力”现象:非魔法而是模型清晰化的自然结果[17] - 模型为破解AI黑箱提供新途径,未来可能通过抽取世界模型解释AI行为[17] - 智能体强度与模型精度正相关,GPT-5的推理能力提升直接源于世界模型优化[16] 行业影响与未来展望 - 世界模型既是通向通用智能的通行证,也可能因模型与人类认知差异成为不确定性源头[17] - 该突破改变对AI能力的理解范式,从数据模仿转向内在认知构建[4][9] - 研究成果为AI安全性研究提供理论支撑,使模型可解释性具备实现基础[17]
零一万物官宣三位高管新任命;前天猫精灵总裁彭超创业,想从运动AI硬件实现通用智能丨AIGC日报
创业邦· 2025-10-28 08:10
零一万物高管任命 - 公司宣布联合创始人沈鹏飞统筹国内ToB及ToG业务拓展与销售体系 [2] - 赵斌强晋升副总裁并聚焦模型平台技术与专业产品体系建设 [2] - 宁宁晋升副总裁并负责国际业务拓展与AI咨询落地 [2] 云玦科技创业动态 - 前天猫精灵总裁彭超创立云玦科技 首款产品为运动可穿戴硬件设备结合Agent智能体 [2] - 公司项目于10月中旬启动 核心思路是让AI在5000立方米运动空间内实现跟踪、规划、分析、执行及自进化能力 [2] - 硬件形态不限于单一产品 而是一套产品组合 目标是从运动场景迁移至更多物理空间实现通用智能 [2] 苹果地图业务拓展 - 苹果计划在Apple地图中整合广告功能 允许企业付费置顶搜索查询结果 [3] - 该功能最早可能在明年上线 广告界面设计将优于谷歌等竞争对手 [3] - 公司将利用AI技术保持搜索结果的实用性与相关性 [3] 火山引擎视频生成模型升级 - 火山引擎正式上线豆包视频生成模型1.0 pro fast 生成速度最高提升约3倍 [4] - 新模型价格直降72% 在继承Seedance 1.0 pro核心优势基础上实现效率突破 [4]
前天猫精灵总裁彭超创业,想从运动AI硬件实现通用智能丨36氪独家
36氪· 2025-10-27 18:17
公司核心信息 - 前阿里巴巴集团副总裁、天猫精灵总裁彭超近期创立云玦科技,首款产品为运动可穿戴硬件设备结合Agent智能体 [5] - 公司项目于10月中旬启动,核心思路是让AI扮演跟踪、规划、分析、执行的角色,配合硬件使智能体具备自进化能力,初期专注于高速高频运动的5000立方米空间,后续将迁移至更多物理空间 [6] - 具体硬件形态仍在设计中,但将不只是一款产品,而是一套产品组合 [7] 创始人背景与创业思路 - 联合创始人齐炜祯为Multi-token Prediction架构的开创学者,其研究成果已被Deepseek V3、Qwen-3-Next等模型引入核心预训练方法,能力点集中于提升模型预测速度、降低消耗并保证质量 [11] - 彭超在阿里任职期间即关注Agent智能体,曾提出下一代智能体交互将从挖掘用户情感与个性化需求出发,推动人机交互向人机伙伴关系迁移 [10] - 彭超拥有多年大厂经验,曾操盘10亿美金以上量级的智能硬件业务,包括在华为印度建立全链条国家地区部公司,以及在阿里主导将达摩院大模型引入天猫精灵 [12][13] 行业趋势与产品定位 - AI大模型出现Agentic use趋势,从被动响应指令进化为能主动规划、执行复杂任务,小参数量推理模型成熟推动AI从工具向助理进化 [7] - 细分行业的Agent智能体是当前AI创业者青睐的赛道 [7] - 公司产品定位为消费级智能体与通用智能采用同一套训练架构,通过硬件配合实现智能体自进化 [6]
天猫精灵前总裁彭超再创业,瞄准运动可穿戴与智能体融合|融资首发
钛媒体APP· 2025-10-27 17:00
公司核心动态 - 天猫精灵前总裁彭超与前阿里巴巴集团副总裁彭超联合创立新公司云玦科技 [2] - 公司首款产品将聚焦于"运动可穿戴硬件设备 + Agent智能体"的融合形态 [2] - 产品目前仍在设计阶段 但内部共识是打造"不只是一款产品 而是一整套产品组合" [3] 创始团队背景 - 创始人彭超拥有超过14年智能硬件产品经验 曾主导将达摩院大模型引入天猫精灵并组建阿里巴巴智能互联事业群 [2] - 彭超在华为荣耀期间带领团队实现全球线上份额第一 在印度组建了华为海外唯一集产品定义至销售于一体的国家级区域公司 [2] - 联合创始人齐炜祯为人工智能学术界代表 曾任中关村人工智能研究院大模型博士培养方向导师 研究方向聚焦自然语言生成与预训练模型 [2] - 齐炜祯在NLP顶会发表论文十余篇 总引用次数超过2300次 其主导研发的ProphetNet及BANG模型已部署于必应广告推荐系统多个国家市场 [2] - 齐炜祯在2020年ProphetNet项目中首次提出MTP架构 该架构后来成为DeepSeek V3、Qwen-3-Next等大模型的核心预训练方法之一 [3] 产品与技术愿景 - 公司认为未来消费级智能体与通用智能可能采用同一套训练架构 核心是让AI承担"跟踪—规划—分析—执行"的角色 [4] - 目标是通过硬件实现AI的具身化自进化 使其能在陪伴用户高速高频运动的5000立方米物理空间中持续学习与提升 [4] - 最终愿景是将学习成果迁移至更广泛的现实场景中 [4]