通用人工智能(AGI)
搜索文档
华人学者:中国造船、无人机,美国再不改,公厕都建不成
观察者网· 2025-09-16 12:11
中美治理模式差异 - 中国以工程思维主导治理 领导层多拥有工程学背景 擅长统筹建设和务实高效解决问题 [3][5][6] - 美国演变为律师主导型社会 程序优先于结果 制度设计系统偏向富裕群体 联邦政府由律师掌控 [3][5] - 治理差异导致美国基建成效低下 如高铁建设进度远落后于中国 [7][10] 中国工业与技术成就 - 到2030年中国将占全球工业产能45% 高收入经济体总和仅38% [11] - 京沪高铁3年建成通车 加州高铁延迟至2030年且造价飙升至1280亿美元 [10] - 在电动汽车 半导体制造 新型服务业等高科技制造业领域表现突出 占经济总量5% [15] 产业政策对比 - 中国长期为制造业和高科技产业提供资金支持 坚持至目标达成 如"中国制造2025"计划 [18] - 美国曾因Solyndra破产事件保守15年 近期才推出半导体行业扶持政策 [17] - 中国明确技术自主可控目标 在汽车 航空 半导体等高端产业追求技术主导地位 [19] 技术竞争与制裁影响 - 美国制裁倒逼中国自主创新 企业加速替换美国设备 如半导体领域 [19][20] - 中国通过工程创造应对法律手段 聚焦建造更好汽车 城市和发电厂 [19] - 贸易战促使中国企业支持技术自主 此前因商业利益依赖美国技术 [20] 全球格局展望 - 中美民众在追求目标和欣赏技术成就方面高度相似 均具快速行动特质 [21] - 欧洲和日本节奏缓慢追求完美 未来全球格局将由中美主导 [22][23] - 英国 加拿大 日本和欧盟等经济体可能被中美超级大国甩在身后 [23]
报道:OpenAI正在组建人形机器人算法团队
华尔街见闻· 2025-09-16 11:40
公司战略转向 - OpenAI正加速机器人技术领域投入 通过组建专注于人形机器人的新团队 押注物理世界交互是实现通用人工智能的关键一步 [1] - 公司近期已聘请多位人形机器人控制算法专家 招聘目标明确指向人形机器人项目 [1] - 所有机器人相关职位均强调"专注于解锁通用机器人技术并在真实世界环境中推动AGI级别智能" 表明公司将机器人技术与AGI终极目标直接挂钩 [2] 人才招聘进展 - 斯坦福大学研究人员Chengshu Li已于2025年6月加入 其研究涉及为处理家务的人形机器人设计能力基准 [2] - 另有两名来自其他机器人实验室的研究人员也已入职 招聘行动正在提速 [2] - 公司寻找具备遥操作和模拟(如Nvidia Isaac平台)经验的专家 这些是训练人形机器人的关键技术 [1] 硬件发展路径 - 机械工程师职位要求具备原型设计和制造带触觉及运动传感器的机器人系统专业知识 [3] - 职位要求拥有"为大批量(100万台以上)生产设计的机械系统经验" 暗示未来可能进行大规模生产甚至制造业部署 [3] - 公司可能自研机器人硬件 或为机器人训练开发遥操作系统 具体路径尚未明确 [3] 行业竞争格局 - 人形机器人赛道竞争激烈 包括特斯拉、谷歌以及Figure、Agility、Apptronik等明星初创公司 [4] - 自2024年初以来 风险投资已向人形机器人初创公司投入超过50亿美元 [4] - 摩根士丹利预测到2050年该产业市场价值可能达到5万亿美元 [4] 技术发展背景 - 公司战略转向正值业界反思大型语言模型发展路径之际 在GPT-5研发达到平台期后 AI需要"走向物理世界"寻求突破 [1][4] - 虽然目前人形机器人仍难以应对复杂不可预测的环境 但资本和顶尖人才涌入有望加快技术突破步伐 [4]
OpenAI与微软分成曝新料!这家印度老厂哭晕:10年前白捐了10亿美元
AI前线· 2025-09-15 16:08
OpenAI与微软合作关系调整 - OpenAI预计向微软分享的收入占比将从当前20%降至约8% 为自身多留存逾500亿美元收入 [2] - 微软仍能从OpenAI投资中获得约333.3亿美元收益 但未明确是累计或年度金额 [2] - 双方正就服务器租赁费用进行谈判 微软因早期押注已获得显著收益 [2] OpenAI资本运作与估值 - 微软自2019年累计向OpenAI投资130亿美元 参与ChatGPT及API收入分成 [3] - 公司二次股票出售规模扩大逾40亿美元至103亿美元 以5000亿美元估值进行 [3] - 非营利性部门将获得超1000亿美元资金 占私人市场估值20% [4] - 非营利性母公司继续控制营利性业务 持有股权价值超1000亿美元 [5] 微软战略调整与竞争态势 - 微软将OpenAI视为竞争对手 允许其使用其他云服务提供商资源 [3] - 微软承诺对自有AI模型进行重大投资 同时保持采用第三方模型的灵活性 [3] - 微软人工智能业务年化收入约130亿美元 持有OpenAI约30%股份价值约1500亿美元 [8] Infosys早期投资与决策失误 - Infosys十年前以捐赠名义投资OpenAI 10亿美元 未转化为股权投资 [6] - 公司前CEO曾预测AI将重塑15万名工程师工作 但领导层变更后放弃战略合作机会 [6] - 若2019年加大投入 10亿美元投资现值可能超450亿美元 当前OpenAI估值是其市值4.3倍 [8] 公司治理与监管动态 - OpenAI重组为营利性公司面临慈善机构反对 遭加州与特拉华州总检察长调查 [5] - 公司承诺与监管机构合作 确保工具安全且有益 将安全作为行业优先事项 [5] - 与微软签署不具约束力谅解备忘录 积极推进最终协议条款敲定 [3]
DeepMind哈萨比斯最新认知都在这里了
量子位· 2025-09-15 13:57
文章核心观点 - 谷歌DeepMind CEO哈萨比斯认为AGI将在未来十年内实现 并开启科学的黄金时代和新文艺复兴 在能源 健康等领域带来巨大益处 [2][7][51] - 当前AI系统仍存在关键瓶颈 包括缺乏真正的创造力 无法提出新假设 以及在某些领域表现优异但其他方面犯简单错误 [4][5][33] - 实现AGI需突破多模态理解 世界模型构建和持续学习能力等核心技术障碍 [6][21][36] DeepMind战略定位与团队规模 - DeepMind与谷歌完成合并 整合Alphabet所有AI团队 成为谷歌和Alphabet的"发动机舱" 负责构建核心Gemini模型及视频模型 交互式世界模型等多种AI模型 [15] - 团队规模约5000人 其中80%以上为工程师和博士研究员 约有三四千名顶尖技术人才 [16] - 模型已全面接入谷歌生态 包括Workspace和Gmail等全线产品 每日服务数十亿用户通过AI概览 AI模式或Gemini应用进行交互 [15] 世界模型技术突破 - Genie 3世界模型通过分析数百万段YouTube等平台视频 自主推导现实世界运行逻辑 能即时生成可交互的沉浸式环境 [17][19] - 模型无需预编程物理规则 仅通过观察学习即掌握光影反射 物体运动等复杂原理 生成持续一两分钟的高度一致性交互场景 [19][20] - 技术突破点在于实现逆向工程学习物理规律 生成范围远超人类活动 包括操控沙滩小狗或与水母互动等多元世界模拟 [19] 机器人技术发展路径 - 采用"安卓模式"战略 打造跨机器人的通用操作系统层 同时探索垂直整合 将最新模型与特定机器人类型深度结合 [25] - 人形机器人对日常任务极具价值 因人类环境基于人体工学设计 但专用机器人形态在工业等领域仍有不可替代性 [26][27] - 当前处于类似70年代PC初期阶段 未来两三年将实现算法突破 关键挑战在于硬件规模化时机选择 需平衡成熟度与量产需求 [28][29] AGI核心能力缺失与衡量标准 - 当前AI缺乏真正创造力 无法像爱因斯坦提出狭义相对论那样实现直觉飞跃或类比推理 [33][34] - 真正AGI需在所有领域保持博士级表现 而非仅在某些领域优异 同时需具备持续学习能力以实时吸收新知识 [35][36] - 关键测试包括给AI设置1901年知识截止点 检验其能否提出类似1905年爱因斯坦的创新理论 [34] 创意工具变革与行业影响 - Nano Banana等工具的核心优势在于惊人一致性 能理解指令并保持其他元素不变 实现高效迭代 [14][38] - 工具双轨赋能:降低大众创作门槛 同时为顶级创作者提供十倍百倍效率提升 但输出质量仍依赖使用技巧和审美素养等专业因素 [38][39] - 未来娱乐将出现融合共创的新艺术形式 顶级创意先锋主导高质量动态叙事 数百万人可参与部分内容共创 [39][40] 药物研发加速前景 - Isomorphic Labs依托AlphaFold技术 旨在将药物研发周期从数年或十年缩短至几周或几天 [41] - 目前与礼来 诺华等重要合作 推进癌症 免疫学和肿瘤学研究 预计明年进入临床前阶段 [43][44] - 采用混合模型架构 结合学习组件与化学物理规则约束 以解决生物学数据不足问题 [45] 能源效率与AGI贡献 - 通过模型蒸馏等技术 相同性能下模型能效过去两年提升10倍甚至100倍 [49] - AI系统在电网效率 材料设计和新能源等领域的贡献将远超其自身能源消耗 [50] - 当前总需求未降低因前沿模型仍需扩大规模实验 但服务端能效持续优化 [49]
正式开课!具身大脑和小脑算法与实战教程来啦
具身智能之心· 2025-09-15 08:04
具身智能行业概述 - 具身智能强调智能体与物理环境的交互与适应 聚焦智能体在物理世界中感知环境、理解任务、执行动作并反馈学习的能力[1] - 大脑和小脑构成具身机器人核心模块 大脑负责思考感知(语义理解和任务规划) 小脑负责执行(高精度的运动执行)[1] 产业发展动态 - 近2年具身明星团队陆续创业 成立星海图、银河通用、逐际动力等公司 推动具身本体和大小脑技术进步[3] - 华为2024年底启动"全球具身智能产业创新中心" 与乐聚机器人、大族机器人等合作建设具身智能大脑、小脑关键技术[5] - 京东自2025年5月以来连续投资智元机器人、千寻智能、逐际动力等公司 强化物流科技与家庭服务场景效率[5] - 腾讯、蚂蚁集团、小米等科技巨头通过战略投资与合作加快构建具身智能产业生态[5] - 国外Tesla/Figure AI推进工业与物流机器人应用 美国投资机构支持Wayve、Apptronik等公司落地自动驾驶与仓储机器人[5] - 国内企业以产业链投资与综合平台驱动具身智能落地 国外科技巨头侧重基础模型、模拟环境与类人机器人原型研发[5] 技术演进路径 - 第一阶段聚焦抓取位姿检测 通过点云或图像预测末端执行器姿态实现静态物体抓取 但缺乏任务上下文和动作序列建模[6] - 第二阶段进入行为克隆阶段 借助专家演示数据学习从感知到控制的端到端映射 具备模仿人类完成复杂任务能力[6] - 第三阶段2023年兴起Diffusion Policy方法 通过扩散模型生成整个动作轨迹 提升策略稳定性与泛化能力[6] - 2024年进入Vision-Language-Action模型阶段 代表工作包括OpenVLA、RT-2、PI0等 融合视觉感知、语言理解与动作生成模块[7] - VLA模型支持零样本或小样本快速泛化 实现从"感知+控制"向"感知+推理+行动"的范式跃迁[7] - 2025年探索VLA模型与强化学习、世界模型、触觉感知等模块融合 弥补"只能理解不能反馈"等局限[9] - VLA+强化学习提升机器人在长时任务中的试错能力与自我改进能力[11] - VLA+世界模型引入环境动态预测 使机器人具备"想象未来"能力 助力高效规划与决策[11] - VLA+触觉信息拓展从"看"到"看+触多模态融合"的感知边界 实现更精细安全的操作[12] 应用与人才发展 - 技术演进推动人形机器人、机械臂、四足机器人等产品落地 服务于工业、家居、餐饮、医疗康复等领域[14] - 相关产品和融资络绎不绝 岗位呈现爆发式增长 导致许多学生转入具身智能领域研究[14] - 产业界重视推动具身智能从"论文"走向"部署" 对工程能力提出更高要求[17] - 需掌握Mujoco/IsaacGym/Pybullet等平台的策略训练与仿真测试能力[17] - 需具备训练部署Diffusion Policy/VLA/力触融合VLA模型的实践能力[17] - 需实现强化学习在VLA后训练上的应用 支持机器人反馈微调[17] - 需掌握从世界建模预测→策略学习→物理执行的一体化具身智能架构[17]
500亿美元!OpenAI拟削减微软分成
北京商报· 2025-09-15 01:04
收入分成调整 - OpenAI向微软支付收入分成比例将从2024年近20%大幅下降 预计2030年降至约8% [1] - 到2030年公司将额外保留超过500亿美元收入 此前预测分成支出为740亿美元 新协议下降至560亿美元 [1] - 分成比例调整可能涉及未来产品排除条款 例如月费2万美元博士级AI代理未被纳入现有收入分享协议 [1] 合作协议谈判 - 双方正围绕通用人工智能实现后合作关系演变进行谈判 现有合同规定微软将失去对OpenAI技术独家访问权 [2] - 微软争取修改或删除AGI条款 同时协商服务器租用成本等关键问题 [2] - 部分安排已敲定 非营利组织和微软将各获约三分之一股份 员工股份出售按5000亿美元估值进行 [2] 公司架构重组 - OpenAI设立利润上限营利性子公司的架构限制投资者回报为投资额100倍 导致持续融资受阻 [3] - 重组计划将非营利机构子公司转换为公益公司 非营利母公司控制超1000亿美元股权 占5000亿美元估值20% [3] - 重组需获得微软支持 需修改商业合同条款以符合大股东利益 [3] 上市筹备进展 - 公司首席财务官表示重组为首次公开募股铺平道路 上市取决于准备程度和资本市场氛围 [4] - OpenAI将考虑未来时间点上市 资本市场对AI企业关注度达前所未有高度 [5] - 成功上市可获得更充裕资金 加大技术研发投入并加速拓展业务版图 [5]
英伟达财报披露,DeepMind发布Genie 3
中国能源网· 2025-09-14 11:56
全球科技股指表现 - 2025年8月美股指数小幅上涨 标普500指数累计上涨1.91% 纳斯达克综合指数上涨1.58% 费城半导体指数上涨1.09% [1] - 港股及中概股显著上涨 纳斯达克中国金龙指数上涨6.03% 恒生科技指数上涨4.06% [1] - A股计算机板块表现突出 单月大涨17.49% [1] 重点科技公司股价变动 - 苹果公司月涨幅达14.71% 英特尔表现最为强劲 月涨幅达26.10% [2] - 部分科技股出现下跌 META下跌1.51% 微软下跌3.32% AMD下跌5.28% [2] - 英伟达微涨0.26% 特斯拉上涨10.32% 谷歌上涨12.57% 亚马逊上涨6.64% 高通上涨8.46% [2] 利率与汇率市场 - 美国10年期国债利率保持稳定 8月29日报4.23% 较8月1日无变动 [2] - 中国10年期国债收益率上升13.2个基点 8月29日报1.84% [2] - 美元兑人民币中间价累计调升466个基点 8月29日报7.10 [2] 英伟达财务业绩 - 2026财年第二财季总营收467.43亿美元 同比增长55.60% 净利润264.22亿美元 同比增长59.18% [3] - 数据中心业务营收410.96亿美元 同比增长56.43% 其中计算板块营收338.44亿美元(增长49.73%) 网络板块营收72.52亿美元(增长97.71%) [3] - 游戏业务营收42.87亿美元 同比增长48.85% 主要受益于Blackwell产品供应增加 [3] 人工智能技术突破 - 谷歌DeepMind发布通用世界模型Genie 3 能够根据文本提示生成动态世界 以每秒24帧速度实时导航 分辨率达720p并保持数分钟一致性 [4] - Genie 3具备视觉记忆能力 可回溯1分钟前内容 相比Genie 2的10-20秒交互时间实现质的飞跃 [4] - 该技术为AI Agent提供无限丰富的模拟训练环境 被视为迈向通用人工智能(AGI)的重要里程碑 [4]
加码AGI等青年人才培育,蚂蚁InTech奖在外滩大会揭晓
贝壳财经· 2025-09-12 15:37
活动概览 - 2025年“Inclusion·外滩大会”上揭晓“2025蚂蚁InTech奖”,10位青年科学家获“蚂蚁InTech科技奖”,每人奖金20万元,同时10位中国籍在读博士生获“蚂蚁InTech奖学金”,每人奖金5万元 [1] - 颁奖典礼有中国工程院院士陈纯、郑纬民及美国国家工程院外籍院士张宏江等学界权威亲临,Michael I Jordan和Jack Dongarra等国际知名学者通过视频寄语青年学者 [3] 获奖者研究成果 - 获奖者在通用人工智能、具身智能、数字医学、数据安全等前沿方向展现卓越创新能力,其成果被业界广泛采用 [8] - 金鑫(北京大学)提出软件定义的人工智能系统方法,优化大模型训练与推理性能 [8] - 李永露(上海交通大学)研究具身数据的挖掘与利用,以及面向物理理解与推理的具身模型基建 [8] - 汪定(南开大学)发现人类口令分布函数并建立定向口令猜测模型,引起美国身份认证标准修订 [8] - 王利民(南京大学)开发领先通用视频理解大模型InternVideo,下载量超500万,并提出“渐进式训练”方法赋能自动驾驶等场景 [8] - 王翔(中国科学技术大学)首创“零空间约束”知识编辑技术,实现对大模型中陈旧或敏感信息的精准“遗忘” [8] - 张帆(电子科技大学)将AI引入弥散磁共振成像,将术前影像神经纤维提取缩短至几分钟内,被多国临床机构采用 [9] - 张峰(中国人民大学)提出压缩数据直接计算理论与技术,为大数据高效处理提供新方案,成果曾获日内瓦国际发明展特别嘉许金奖 [9] - 张扶桑(北京航空航天大学)在泛在智能感知领域提出基于菲涅尔区衍射的无线感知理论,推动无线感知应用落地 [10] - 赵恒爽(香港大学)在计算机视觉领域开发多个性能领先的场景理解视觉基础模型,如PSPNet、Point Transformer和Depth Anything,推动自动驾驶和具身智能等下游应用 [10] - 张宇(华中科技大学)提出高性能图计算理论与方法,其图计算系统多项性能指标领跑Graph500 [10] 公司战略与行业影响 - 蚂蚁集团首席技术官表示科技驱动是公司立身之本,青年科研人才是创新的关键引擎,InTech奖旨在发掘并支持计算机与交叉学科领域的中国青年科研力量 [15] - 本届整体参评规模达去年3倍,海外申报者占比超20%,候选人来自牛津、耶鲁、斯坦福及清华、北大、港大等顶尖高校,显示海内外关注度显著提升 [15] - 近十年中国AI科研人员从2015年不足万人增长至2024年的52万人,显示中国科研人才生态蓬勃发展 [15] - 蚂蚁集团持续加大对AGI等前沿技术与青年人才的投入,包括推出“Plan A”全球招募AI顶尖人才,组建AGI攻坚团队,开源大模型与强化学习框架,并通过与高校共建联合实验室等举措构建青年人才生态 [15]
宇树科技王兴兴:现在是“AI干活”大规模爆发前夜
国际金融报· 2025-09-11 15:50
公司动态与创始人观点 - 宇树科技创始人兼CEO王兴兴在公司宣布IPO计划后首次公开亮相,于2025年9月11日的Inclusion·外滩大会上发言 [1] - 创始人王兴兴表示,AI在内容生成(如写文作画)方面已超越99.99%的人,但让AI实际执行物理任务(“干活”)仍处于早期阶段,是一片“荒漠” [1] - 创始人透露,其在2011年曾对AI感兴趣,但因当时领域冷门、学习资料有限而未能深入,并称这是其最后悔的一件事 [3][4] - 随着大模型快速发展,创始人认为现在终于有机会将AI与机器人结合,实现真正落地 [4] - 创始人认为当前是让AI落地干活“大规模爆发性增长的前夜”,并对时代感到激动人心 [5] - 创始人建议年轻创新者忘记过去经验,学习最新知识,全力拥抱新时代 [5] 行业机遇与趋势 - AI与机器人的融合发展正在催生全新的“具身智能”产业,旨在让机器人拥有通用人工智能能力,能像人一样自主感知、规划和行动 [4] - 当前创新创业的门槛已大幅降低,年轻创新者迎来好时代,可以用AI工具实现新创意 [5] - 在AI时代,小组织的爆发力会越来越强 [5] - AI时代非常公平,只要聪明并愿意做事,就有机会成功 [5] 行业发展面临的挑战 - 具身智能发展在高质量数据层面存在挑战,包括数据采集、质量问题以及数据利用率需提升 [4] - 在模型算法层面,当前多模态数据的融合并不理想 [4] - 在机器人领域,模型与机器人的控制模态对齐是难点,例如根据生成视频让机器人学做家务时,视频生成与控制模态的对齐极具挑战 [4][5] 公司运营与管理 - 宇树科技是一家以硬件为主要产品的公司 [5] - 随着业务快速发展、人员规模扩大,公司可能面临协作效率降低的问题,需要探索更高效的组织管理方式 [5]
当我们再说具身大小脑的时候究竟在说什么?
具身智能之心· 2025-09-11 13:53
具身智能行业概述 - 具身智能成为通用人工智能(AGI)探索的关键方向 强调智能体与物理环境的交互与适应 聚焦感知环境、理解任务、执行动作和反馈学习的能力 [1] - 大脑和小脑构成具身机器人核心模块 大脑负责思考感知和语义理解 小脑负责高精度运动执行 [1] 国内外产业布局 - 近2年具身明星团队创业活跃 星海图、银河通用、逐际动力等从实验室走向商业和工业界 [3] - 华为2024年底启动"全球具身智能产业创新中心" 与乐聚机器人、大族机器人合作建设大脑和小脑关键技术 [5] - 京东自2025年5月连续投资智元机器人、千寻智能、逐际动力 强化物流科技与家庭服务场景能力 [5] - 腾讯、蚂蚁集团、小米等科技巨头通过战略投资与合作布局 加快构建产业生态 [5] - 国外Tesla/Figure AI推进工业与物流机器人应用 Wayve和Apptronik获投资机构支持落地自动驾驶与仓储机器人 [5] - 国内企业以产业链投资与综合平台驱动落地 国外科技巨头侧重基础模型、模拟环境与类人机器人原型研发 [5] 技术演进阶段 - 第一阶段聚焦抓取位姿检测 通过点云或图像预测末端执行器姿态 但缺乏任务上下文和动作序列建模 [6] - 第二阶段进入行为克隆阶段 通过专家演示数据学习端到端映射 但存在泛化能力弱和误差累积问题 [6] - 第三阶段兴起Diffusion Policy方法 通过扩散模型生成动作轨迹提升策略稳定性与泛化能力 [6] - 2024年进入Vision-Language-Action模型阶段 融合视觉感知、语言理解与动作生成模块 支持零样本或小样本快速泛化 [7] - VLA模型实现从"感知+控制"向"感知+推理+行动"的范式跃迁 代表工作包括OpenVLA、RT-2、PI0等 [7] - 2025年探索VLA与强化学习、世界模型、触觉感知等模块融合 弥补"只能理解不能反馈"等局限 [9] 技术融合方向 - VLA+强化学习提升长时任务试错能力与自我改进能力 [11] - VLA+世界模型引入环境动态预测 使机器人具备"想象未来"能力 [11] - VLA+触觉信息拓展多模态融合感知边界 实现更精细安全的操作 [12] - 技术演进从低层感知向高层理解发展 逐步迈向通用任务和开放环境智能体时代 [14] 应用与人才需求 - 技术发展推动人形机器人、机械臂、四足机器人等产品落地 [14] - 应用覆盖工业、家居、餐饮、医疗康复等领域 相关产品和融资活跃 [14] - 岗位呈现爆发式增长 大量人员转入具身智能领域研究 [14] - 工程与系统能力需求激增 需掌握Mujoco/IsaacGym/Pybullet等平台策略训练与仿真测试 [17] - 需具备训练部署Diffusion Policy/VLA/力触融合模型的能力 [17] - 需实现强化学习在VLA后训练的应用 支持机器人反馈微调 [17] - 需掌握从世界建模预测到策略学习再到物理执行的一体化架构 [17]