AReaL v1.0
搜索文档
DeepSeek V4多模态大模型将发布,深度适配华为寒武纪国产芯片;马斯克确认SpaceX的IPO目标估值超1.75万亿美元丨AI周报
创业邦· 2026-03-08 12:20
文章核心观点 文章是一份全球AI产业周报,总结了2026年3月1日至3月7日期间全球人工智能领域的重要新闻与投融资动态。核心观点是:全球AI产业持续高速发展,技术迭代与商业应用齐头并进,特别是在大模型、具身智能(机器人)、AI硬件等领域进展显著,同时资本市场对AI产业,尤其是头部公司和具身智能赛道给予了巨额资金支持[5][6][33][34]。 根据相关目录分别进行总结 大模型技术迭代与发布 - **OpenAI发布GPT-5.4系列**:正式推出GPT-5.4及GPT-5.4 Pro模型,新增“Thinking(思维)”模式,可提前展示思考路径并允许用户实时调整,同时优化了在办公软件等专业任务中的协同表现[11][12] - **DeepSeek将发布多模态大模型V4**:计划推出具备文本、图像及视频生成全功能的多模态大模型V4,并已完成对华为、寒武纪等国产芯片的深度优化[10] - **阶跃星辰全面开源Step3.5 Flash模型**:开源了该模型的预训练、中训练权重及配套训练框架,该模型采用稀疏MoE架构,总参数1960亿,激活参数约110亿,专为智能体场景设计,在OpenClaw项目排名升至前二[18] - **Anthropic开放Claude记忆功能**:此前仅供付费用户使用的记忆功能已向所有免费用户开放[22] - **阿里开源桌面Agent工具CoPaw**:正式开源CoPaw,用户可基于此进行二次开发,自由接入本地模型和编写Skills,是业界部署门槛最低的Agent工具之一[26] 具身智能与机器人领域进展 - **国家大基金首次投资具身智能**:银河通用机器人完成25亿元人民币新一轮融资,其中国家人工智能产业基金(国家大基金三期)系首次出手投资具身智能企业[26] - **荣耀发布人形机器人Robot**:在MWC 2026上亮相,现场表演了舞蹈和后空翻等动作[16] - **理想汽车秘密研发机器人**:内部代号为“Nexus”的机器人团队已秘密研发近一年,规划了双轮和双足两款机器人,其中双轮机器人计划于2026年年中发布,主要用于工厂制造场景[27][28] - **三星计划部署人形机器人**:宣布计划在2030年前,在其全球制造业务中全面整合人工智能并部署人形机器人,应用于物流、生产、质检等领域[26] - **大界机器人完成数亿元D轮融资**:融资将主要用于工业具身智能技术迭代,并拓展船舶海工、能源电力、航空航天等市场[20] - **娃哈哈精机公司解散**:娃哈哈集团旗下承担机器人研发与智能装备制造业务的杭州娃哈哈精密机械有限公司决议解散并进入清算程序,此举被解读为宗馥莉剥离非核心业务、聚焦主业的举措[16] AI硬件与消费级产品 - **多家公司推出AI眼镜**:千问AI眼镜正式上线,G1系列叠加国补后到手价1997元[22];乐奇Rokid海外版AI眼镜宣布升级,成为行业首款支持谷歌Gemini的AI眼镜[20];模块化AI眼镜品牌玄景MLVision或接手魅族AI眼镜业务[31] - **联想发布系列AI概念硬件**:在MWC 2026期间展出了包括AI Workmate、模块化PC、裸眼3D笔记本、可折叠掌机在内的多款AI概念产品,试图打破传统PC边界[24] - **高通推出新可穿戴平台**:推出骁龙可穿戴平台至尊版,集成多项连接技术,其NPU可在终端侧支持高达十亿参数级的模型[31] - **光年之外发布AI原生浏览器**:美团旗下光年之外团队宣布其AI原生浏览器Tabbit进入公测,将网页浏览、搜索、AI对话与任务执行融为一体[24] 行业巨头动态与战略 - **OpenAI获得巨额融资并筹备上市**:以7300亿美元估值获得1100亿美元新投资,投资方包括软银(300亿美元)、英伟达(300亿美元)和亚马逊(500亿美元)[14]。英伟达CEO黄仁勋称,其对OpenAI的300亿美元投资“可能是最后一次”,因后者正准备上市[29]。截至2026年2月末,OpenAI年化收入突破250亿美元,较此前214亿美元增长17%[29] - **SpaceX被确认高估值IPO计划**:马斯克在社交平台确认,SpaceX计划以1.75万亿美元估值进行IPO[7][8] - **阿里巴巴管理层聚谈AI与人事变动**:马云与阿里、蚂蚁核心管理层罕见聚齐,探讨AI带来的挑战和机会[29]。公司批准通义实验室负责人林俊旸辞职,并宣布成立基础模型支持小组,由CEO吴泳铭等协调资源支持基础模型建设[28] - **AI编程助手Cursor收入快速增长**:消息称Cursor年化收入已突破20亿美元,过去三个月收入运行率实现翻倍,其中企业客户贡献约60%的收入[29] 投融资市场概况 - **全球融资规模巨大**:本周全球披露人工智能融资事件55起,已披露金额的32起事件总融资规模达7840.9亿元人民币,平均融资金额达245.03亿元人民币[34] - **融资阶段以早期为主**:在已披露阶段的事件中,早期(种子/天使/A轮)融资事件达42个,成长期(B/C轮)11个,后期(D轮及以后)2个[37] - **国内外融资额差异显著**:本周国内人工智能领域已披露融资总额为90.68亿元人民币,最高单笔融资为银河通用的25亿元人民币B+轮融资[43]。海外领域已披露融资总额高达7745.72亿元人民币,最高单笔融资为OpenAI的1100亿美元(约合人民币7745.72亿元)E轮融资[44] - **国内融资地域集中**:国内融资事件主要集中在北京(13起)、浙江(8起)、上海(7起)、广东(6起)和江苏(6起)[40] 其他重要行业新闻 - **全球首个气溶胶预报AI模型发布**:由中国科学家牵头在《自然》期刊发布全球首个气溶胶预报人工智能模型AI—GAMFS,可在1分钟内实现全球未来5天的高精度环境气象预报[18] - **蚂蚁集团发布强化学习训练框架**:联合清华大学发布开源强化学习训练框架AReaL v1.0稳定版,主打“Agent一键接入RL训练”,兼容各类Agent框架[10] - **AI芯片公司业绩**:沐曦股份发布2025年业绩快报,实现营业总收入16.44亿元,同比增长121.26%[31] - **市场预测**:IDC预测2026年全球智能机器人硬件市场规模将接近300亿美元,其中中国市场规模将突破110亿美元,并引领全球增长[33]
补齐OpenClaw进化拼图!AReaL v1.0开源,智能体强化学习「一键接入」
机器之心· 2026-03-04 11:58
Agent赛道现状与趋势 - 2026年开年,Agent依然是全球最引人注目的AI赛道之一,OpenClaw(原Clawbot)掀起的Agent热潮仍在发酵,让“一人公司”概念首次真正有了落地的可能性[1] - 近日,OpenClaw超越了React、Linux,成为GitHub上Star量最多的非资源/教程类开源软件项目[2] - Agent的能力边界正在拓宽,从Browser Agent到Coding Agent,从个人到企业级工作流Agent,能做的事越来越多[4] - 各类运行时框架(如LangChain、Claude Code、OpenClaw)不断拓宽智能体的能力边界,使其能胜任更复杂的任务[4] - 行业下一阶段的重点将从“教Agent怎么做事”转向“如何让Agent自我进化”,以强化学习(RL)为代表的系统化训练正成为决定Agent能力上限的关键变量[43][44] AReaL v1.0框架的核心突破 - 由蚂蚁和清华大学联合打造的开源强化学习框架AReaL发布了里程碑式的稳定版本v1.0[8] - AReaL v1.0是一套面向Agent的开源全异步强化学习训练框架,其核心进展是让“Agent一键接入RL训练”成为现实,重新定义了智能体强化学习的范式[8] - 该框架可以兼容任意Agent框架,仅需修改一个接口地址即可无缝接入RL训练,包括最近火热的OpenClaw,极大降低了强化学习的训练门槛[9] - 框架引入了系统化的AI辅助开发体系,并基于深度定制开发的PyTorch原生训练引擎Archon,实现了千亿MoE模型的端到端训练[9] 技术架构与性能优势 - AReaL的核心架构创新在于将强化学习中的训练与推理完全解耦,推理引擎流式生成轨迹,训练引擎持续消费样本,两者在独立GPU上同时运行[21] - 通过精心设计的PPO算法修正和陈旧度控制机制,AReaL在保证训练稳定性的同时,实现了2倍以上的吞吐提升[22] - 该设计让Agent可以一边学习一边全力工作,训练引擎异步更新参数,不会阻塞智能体的推理[23] - 为了解决大量共享前缀造成的冗余计算,AReaL引入了基于Trie(前缀树)的序列打包方案,实现了树状注意力计算[29][33] - 树状注意力带来了显著的性能提升:单Worker训练吞吐最高提升8.31倍,集群整体吞吐最高提升6.20倍,相比于基线方案减少超过50%的GPU显存占用[30] 创新的训练引擎Archon - AReaL v1.0带来了训练引擎Archon的重磅更新,这是一个支持完整5D并行(数据并行DP、张量并行TP、流水线并行PP、上下文并行CP、专家并行EP)的PyTorch原生训练引擎[34][39] - Archon引擎从零开始实现到验证正确性,仅用了1人·月的工作量,在32天内通过累计72万行代码修改完成,并验证了能训练千亿参数MoE模型[34] - 创造这一效率奇迹的秘诀在于AReaL集成的一整套AI辅助开发体系,实现了复杂工程开发的高度自动化[35] AI辅助开发体系 - AReaL的AI辅助开发体系包括:为各核心模块配置领域专家Agents;引入以命令驱动的引导式工作流;在真实开发场景中,由特定Agent全程自动化完成任务规划、代码生成、自动校验到PR创建[37][38] - 这套体系释放出清晰信号:AI辅助编程不仅仅是效率工具,同样具备了深度参与复杂系统开发的真实生产力,重新定义了效率边界[41] - 软件工程的角色分工出现深刻重构,人类开发者可更多地转向“明确需求、设计系统”等决策工作,而AI更多地承担流程固定、规则明确的工程落地任务[41] 行业影响与未来展望 - AReaL v1.0为行业贡献了一个兼具易用性、可靠性和强扩展性的开源Agentic RL范本,应用层保持开放和兼容,引擎层深度优化[44] - 随着这类高性能底座的日益成熟,Agent有望加速跨越跑通Demo的初级阶段,真正开启持续、自主、规模化进化的新阶段[45] - 当训练框架变得足够简单,Agent的接入方式足够统一,AI能够深度辅助底层系统开发时,Agentic RL的大规模落地将跨越少数顶尖团队的门槛,成为更普及的大众开发者利器[44] - 未来,AReaL团队将继续在系统组件可用性、Archon引擎生产效率、AI辅助开发能力和VLM/Omni模型Agent训练等四个方向发力,旨在打造成为Agentic AI时代的高性能RL运行时底座[44]