通用人工智能
搜索文档
突发!日本重启人形机器人计划!
机器人大讲堂· 2025-11-30 14:25
日本政府人形机器人战略规划 - 日本政府计划继承或重启Asimo事业,联合企业、大学等机构共同开发AI驱动的人形机器人[1] - 目标是在2030年推出用于工作场所和家庭环境的自主人形机器人原型[1] - 长期目标是到2050年制造出能够“做人类能做的一切”的多功能人形机器人,使其能理解环境并独立决策[1] 日本在全球人形机器人领域的地位与动向 - 尽管有“日本告别机器人强国行列”的声音,但日本并未退出人形机器人领域竞争[4] - 日本的技术实力与研发热度从未减退,丰田研究所、川崎重工等机构仍手握专利并持续推进研发[6] - “安卓之父”安迪・鲁宾在东京设立人形机器人公司,业内认为日本正依托技术优势准备重返国际一线阵营[6] 丰田研究所 (TRI) 的合作与进展 - 丰田研究所自2015年成立以来,将机器人技术列为核心研究方向之一[7] - 2024年10月,TRI与波士顿动力达成合作,推动Atlas机器人实现全身协调的自主任务处理能力[7] - 合作以Atlas为载体,融入TRI的大型行为模型,构建端到端语言条件策略,基于4.5亿参数的扩散Transformer架构[10] - 2025年8月发布的成果显示,Atlas可完成零件分拣、汽车部件搬运等任务,面对干扰可实时调整,任务完成率达98.7%[12] - 采用VR遥操作采集数据训练通用策略,新技能可通过人类演示快速添加,较传统编程成本降低60%以上,部分场景效率超人类操作[12] TMSUK公司的产品与计划 - TMSUK是服务型机器人领域的代表性企业,业务覆盖科研、医疗、建筑等多领域[13] - 2005年与高西淳夫实验室合作推出的Shinpo机器人是早期能够实现双膝行走的人形机器人里程碑产品[13] - 医疗领域重点产品是与昭和大学齿科部合作的牙科教学机器人Pedia_Roid,高110厘米、重23公斤,模拟5至6岁儿童,搭载24个气压缸等,单台成本约2500万日元[15] - 与早稻田大学合作研发的Kobian机器人可通过驱动面部关节表达七种人类情绪[17] - 2025年联合村田制作所、早稻田大学等机构成立“京都人形机器人协会”,计划2026年底完成灾害现场用人形机器人原型机开发[19] ZMP公司的早期产品与转型 - 公司命名源自人形机器人动力学核心的零力矩点概念[20] - 2001年推出首款人形机器人Pino,身高70厘米,面向研究与教育领域,采用基于Linux的开放平台[20] - 2005年推出小型家用人形机器人Nuvo,身高39公分,具备播放音乐、跳舞、报时、婴儿监视、安防等功能,以58.8万日元价格上市[22] - 升级款E-nuvo humanoid自由度提升至21个,搭载投影仪辅助演示[24] - 公司在商业化早期阶段后将业务重心转向无人机、自动驾驶车辆及物流、安防类机器人等领域[26] 村田制作所的机器人技术与计划 - 人形机器人技术主要集中在公司早期阶段,2005年公开亮相双足骑行机器人“村田男孩”,高50厘米、重5公斤,搭载多种传感器实现平衡控制[27] - 2008年推出“村田女孩”,以独轮骑行设计实现S型平衡木穿行等复杂动作,进一步完善传感与通信协同系统[29] - 2014年与京都大学合作开发“机器人啦啦队”,通过传感器及无线群控技术实现10台机器人同步舞蹈且无碰撞[31] - 2025年10月宣布加入“京都人形机器人协会”,计划于2026年3月启动纯国产人形机器人试制,2026年年底完成侧重功率与高灵敏度的两款试制机[33] 川崎重工的Kaleido系列机器人 - Kaleido系列始于2015年研发,以“坚韧耐造”的鲁棒性人形平台为核心定位,截至2025年已迭代至第九代[34] - 2022年推出的第七代凭借“动态行为支持”技术实现类人行走,能完成上下台阶、走独木桥等动作[36] - 2023年亮相的第八代身高180厘米、重86公斤,全身32个自由度,肘和足踝搭载力觉传感器可实时调整姿态保持平衡,能完成灾后清理、协作搬桌、倒走下台阶等任务[36] - 除Kaleido外,还衍生出双腕协作机器人duAro、医护辅助机器人Nura bot等,形成覆盖工业、救援、医疗等多领域的产品矩阵[38] 韩国及其他地区人形机器人发展 - 韩国于今年4月成立K-Humanoid联盟,三星、LG等大型科技公司参与,准备打造自上而下的人形机器人产业链[39] - 该联盟计划在2028年前开发出商用人形机器人,目标规格包括能够举起20公斤以上重物,总重量低于60公斤,拥有50个以上关节,以及每秒2.5米或更快的移动速度[41] - 韩国还在开发一种通用人工智能模型,预计在2028年前将其集成到人形机器人中[41] - 欧洲作为研发前沿阵地,已有多家公司推出人形机器人并开始进入市场化验证,但未出现亚洲这种抱团取暖的情况[41] 全球人形机器人行业现状 - 目前全球范围内仍未出现现象级的人形机器人企业,即便是特斯拉Optimus也没走到量产爬坡期,规模化落地还有很长一段时间[41] - 强化学习路线与世界模型的迭代加速,让整个人形机器人技术路线存在一定的变数[41] - 在通用人工智能到来之前,每个国家、地区甚至每个公司都认为一切才刚刚开始[42]
双区引领 多极支撑 北京未来产业布局全景
新京报· 2025-11-28 18:14
北京未来产业战略规划 - 北京将前瞻布局6G、具身智能等未来产业赛道,力争在“十五五”末建成全球数字经济标杆城市、新兴产业高地和未来产业引领地 [1] - 北京在人工智能、人形机器人、自动驾驶、商业航天等领域成果突出,2024年被《未来产业之城发展指数报告》评为全国综合排名首位城市 [1] - “十四五”期间北京已将未来产业纳入“2441”高精尖产业体系,2023年发布《促进未来产业创新发展实施方案》,锚定未来信息、健康、制造、能源、材料与空间六大方向,系统构建“1+20+N”政策框架 [1] 未来产业空间布局 - 北京已形成“2+N”空间布局格局,海淀区聚焦通用人工智能、量子信息等核心赛道,经开区打造高级别自动驾驶示范区和“火箭大街”商业航天科研基地 [2] - 石景山落地全国首个元宇宙综合体,大兴、房山、昌平等区则围绕氢能、新型储能和合成生物等领域加快集聚 [2] - 2024年4月北京提出率先在海淀区、昌平区启动创建市级未来产业先导区,全力构建创新链、产业链、资金链与人才链深度融合的未来产业创新生态 [2] 各区产业细分赛道 - 海淀区以未来信息为主赛道,未来制造和未来空间为副赛道,重点发展通用人工智能、第六代移动通信(6G)、元宇宙、量子信息 [4] - 昌平区以未来健康为主赛道,未来制造和未来能源为副赛道,重点发展基因技术、细胞治疗与再生医学、脑科学与脑机接口、合成生物、氢能、新型储能 [4] - 经开区聚焦未来制造,发展类人机器人、智慧出行;大兴区发展未来能源如碳捕集封存利用,以及未来材料如石墨烯材料 [4][5] - 房山区发展未来材料如超宽禁带半导体材料、新一代生物医用材料;顺义区、怀柔区、延庆区、丰台区等聚焦未来空间,发展商业航天、卫星网络等产业 [4][5]
为什么我国的人工智能人才,都喜欢往美国跑?
搜狐财经· 2025-11-28 17:59
美国人工智能行业对华人人才的依赖现状 - Meta公司超级智能实验室11位核心研究员全部为移民,其中7人来自中国,占比超过一半 [1] - 美国顶尖人工智能实验室中,中国出生并接受教育的研究人员长期扮演重要角色 [3] - 2023年数据显示,全球顶尖AI人才中华人占比47%,而美国顶级AI人才中华人占比高达75% [4] - ChatGPT-4o核心团队17人中,华人占比35%;马斯克xAI初始团队12人中,华人占比42% [6] - Meta人工智能部门新员工被戏称需掌握普通话,反映其对中国人才的依赖 [3] 华人人工智能人才流向美国的原因 - **学术资源与聚集效应**:美国拥有麻省理工、斯坦福等世界顶尖AI研究机构,提供前沿研究设备和跨学科合作网络 [4] - **科研投入与产出**:2023年美国在人工智能领域的私人投资总额达672亿美元,占全球53% [6] - 2023年美国机构贡献了61个著名AI模型,远超其他国家 [6] - **薪酬吸引力**:2023年美国AI岗位平均薪资达14.6万美元,高薪职位年薪可达六位数 [6] - 中国国内大厂AI研究员年薪约50-80万人民币,仍不及美国同级别岗位 [6] - **工作环境与价值观**:美国职场更强调工作与生活的平衡,对追求生活质量的人才形成吸引力 [7] 人才流动的趋势与影响 - 部分人才采取“候鸟式研究”模式,在中美之间往返,兼顾双方资源与市场 [9] - 中国在AI专利申请量和企业数量上已超越美国 [9] - 人才外流推动了AI技术的反向输入和国际合作 [9] - 人才流动是全球化背景下人才竞争的正常现象,折射出两国在科研环境和产业上的差异 [9]
Gemini如何逆风翻盘?谷歌首席AI架构师:从承认落后开始,找回自己的节奏
美股IPO· 2025-11-28 09:09
公司战略转折 - 公司公开承认在生成式AI领域初期落后于竞争对手,并将此作为重启创新的起点 [3][4][6] - 公司意识到仅靠长期研究传统无法跟上行业速度,需将研究能力转化为产品能力 [5] - 通过组织架构重构和技术路径重塑,公司在两年内扭转落后局面并实现系统性领先 [4] 核心技术优势 - 将多模态视为底层架构核心而非附加功能,从模型结构、token化方式到训练损失进行统一重构 [7] - 多模态理解的目标是增强模型对世界的认知,而非仅生成美观图像,使其在图表解析、文档理解等任务上拉开差距 [7] - 模型体验的跃迁主因是可用性提升,包括指令理解、国际化适配及工具链与代码执行能力 [11][12][13] - 基础设施优势(TPU、全球数据中心、跨产品分发能力)被重新激活,形成难以复制的网络效应 [15][16] 组织架构变革 - 将串行流水线式组织结构(研究-工程-产品-安全)重写为并行系统,各团队从训练第一天起同步参与 [8] - 产品经理、工程团队、安全策略嵌入训练全过程,实现迭代节奏提速和模型产品化 [8][9] - 组织重构涉及20万员工,难度远高于单次模型迭代,但最终让公司找回统一节奏 [10] 产品部署与用户体验 - Gemini 3实现与搜索、YouTube、地图、Android等核心产品“同日上车”部署 [4] - 用户体验改善体现在模型能理解用户意图、执行真实任务,从“能回答”转向“能完成任务” [11][13] - 国际化适配进入核心能力集,训练过程系统性加入多文化、跨场景语料 [12] 行业竞争方向 - 下一阶段AI竞争焦点从语言智能转向行动智能,即多步骤任务完成能力 [17] - 竞争将发生在工作流自动化、开发者工具链、企业任务智能化及系统级AI领域 [18] - 行动模型被视为平台,其商业价值远高于作为产品的对话模型 [19] 创新与未来展望 - 衡量进步的核心标准是模型在真实世界中的应用广度和场景覆盖度 [20][33] - 公司保持广泛技术布局和探索,认为创新枯竭是最大风险而非技术执行 [94][95][96] - 技术路线自然融合,不同模态的架构理念正相互渗透并趋于兼容 [23][64]
AI洗牌,机会均等
北京商报· 2025-11-28 00:13
AI行业竞争格局动态 - 谷歌近期推出大模型Gemini 3 pro和自研芯片TPU,推动母公司市值逼近4万亿美元 [1] - 阿里巴巴全面进入AI to C市场,同时推出千问、灵光、夸克等多款产品 [1] - 百度新设立两个大模型研发部门,并直接向CEO汇报 [1] - DeepSeek实现全球性爆红,挑战了大型科技公司对大模型的垄断格局 [1] AI技术发展特性 - 技术迭代速度极快,用户和竞争对手均难以完全应对 [1] - 技术路线呈现多元化,没有公司能够封锁所有创新路径 [2] - 从弱人工智能(如AlphaGo)向通用人工智能(大模型)演进 [1] - 算法创新可消解硬件算力优势,如DeepSeek对英伟达市值的冲击 [2] 行业需求与研发模式变化 - 行业需求高度差异化,银行需要风控模型,医院需要诊断系统,工厂需要质检方案 [2] - 垂直领域专业团队相比大厂通用模型更具优势 [2] - 研发模式从封闭开发转向开源协作,从单点突破转向生态共建 [2] - 技术共享显著缩短后来者的追赶时间 [2] 市场环境与投资趋势 - 算力价格逐年下降,开源代码广泛可用 [2] - 投资者态度转变,不再轻易为概念买单,更注重场景突破和商业应用 [2] - 估值体系趋于理性,有潜力的项目仍能获得必要支持 [2] 未来竞争关键因素 - 技术迭代速度超过企业经验积累速度,传统优势如用户数量、资金实力不再稳固 [3] - 竞争将更取决于技术优势和执行效率 [3] - 能准确把握技术方向、有效整合资源、持续优化产品的团队有机会胜出 [3] - AI领域没有永远的领先者,新生力量不断涌现 [3]
谷歌阿里百度加码AI竞争,技术迭代加速行业洗牌
北京商报· 2025-11-27 22:34
行业竞争格局 - AI行业竞争激烈且快速变化 谷歌发布Gemini 3 pro大模型和自研芯片TPU 母公司市值逼近4万亿美元 阿里巴巴全面进军AI to C市场 推出千问、灵光、夸克等多款产品 百度新设两个大模型研发部并直接向CEO汇报[1] - 竞争格局存在不确定性 当市场认为大厂垄断时 DeepSeek实现全球爆红 当认为英伟达和ChatGPT地位稳固时 谷歌不断证明其竞争力[1] - 技术领先地位并非永久 大模型不一定需要雄厚背景 老牌公司依然具备竞争力[1] 技术发展特性 - AI技术迭代速度极快 导致用户难以适应 竞争对手难以防范[1] - 技术发展存在大量逆袭机会 全球参与者处于同一起跑线 算力价格逐年下降 开源代码广泛可用[2] - 技术路线多样化 没有公司能封锁所有路径 行业需求千差万别 银行需要风控模型 医院需要诊断系统 工厂需要质检方案[2] 市场竞争动态 - 竞争存在错位现象 英伟达需应对谷歌新款芯片冲击 DeepSeek曾因算法创新导致英伟达市值下跌[2] - 垂直领域存在机会 大厂专注于通用模型 但懂行的团队在垂直领域更具优势[2] - 研发模式从封闭开发转向开源协作 从单点突破转向生态共建 技术共享缩短了后来者的追赶时间[2] 行业演变趋势 - 领先企业更替成为常态 技术迭代速度超过企业经验积累速度 用户数量和资金实力等传统优势不再稳固[3] - 未来竞争取决于技术优势和执行效率 能准确把握技术方向 有效整合资源 持续优化产品的团队有机会胜出[3] - AI领域没有永远的领先者 只有不断涌现的新生力量[3]
【西街观察】AI洗牌,机会均等
北京商报· 2025-11-27 22:25
行业竞争格局动态 - 谷歌近期推出大模型Gemini 3 pro和自研芯片TPU,推动母公司市值逼近4万亿美元 [1] - 阿里巴巴全面进军AI to C市场,旗下千问、灵光、夸克等多款产品同时发力 [1] - 百度新设立两个大模型研发部门,并直接向CEO汇报 [1] - DeepSeek在全球范围内迅速走红,打破大厂垄断大模型的预期 [1] - 英伟达面临谷歌新款芯片的冲击,此前其市值曾因DeepSeek在算法上的创新而下跌 [2] 技术发展特征 - AI技术迭代速度极快,用户和竞争对手均难以应对 [1] - 大模型的出现使通用人工智能的实现可能性显著增加 [1] - 算力价格持续下降,开源代码广泛可用,全球参与者处于同一起跑线 [2] - AI技术路线众多,没有任何公司能覆盖所有方向 [2] - 行业需求高度差异化,银行、医院、工厂等垂直领域存在专业团队的机会 [2] 研发与创新模式演变 - 研发模式从封闭开发转向开源协作,从单点突破转向生态共建 [2] - 企业的技术突破迅速成为行业共同基础,技术共享缩短了后来者的追赶时间 [2] - 自身的研究论文可能成为他人创新的基础 [2] 市场与投资环境变化 - 投资者态度转变,市场不再轻易为概念买单,更关注场景突破和商业应用 [2] - 估值体系趋于理性,有潜力的项目仍能获得必要的支持 [2] 企业竞争核心要素 - 技术迭代速度超过企业经验积累速度,用户数量、资金实力等传统优势不再稳固 [3] - 竞争结果更取决于技术优势和执行效率 [3] - 能够准确把握技术方向、有效整合资源、持续优化产品的团队有机会胜出 [3] - AI领域没有永远的领先者,新生力量不断涌现 [3]
【西街观察】AI洗牌 机会均等
北京商报· 2025-11-27 22:21
AI行业竞争格局动态 - 谷歌近期推出大模型Gemini 3 pro和自研芯片TPU 推动母公司市值逼近4万亿美元门槛 [1] - 阿里巴巴全面进入AI to C市场 旗下千问、灵光、夸克等多款产品同时发力 [1] - 百度新设立两个大模型研发部门 部门负责人直接向CEO汇报 [1] AI技术颠覆性与市场机会 - 技术迭代速度极快 导致行业领先地位频繁更替 例如DeepSeek的全球性爆红和谷歌对英伟达、ChatGPT地位的挑战 [1] - AI技术路线多样化 没有公司能够封锁所有创新路径 例如DeepSeek通过算法创新消解了英伟达硬件算力优势 [2] - 行业需求高度差异化 银行、医院、工厂等垂直领域为专业团队提供机会 大厂的通用模型无法覆盖所有场景 [2] 行业生态与研发模式演变 - 研发模式从封闭开发转向开源协作 从单点突破转向生态共建 技术突破快速成为行业共同基础 [2] - 算力价格逐年下降 开源代码广泛可用 全球参与者处于同一起跑线 [2] - 投资者态度趋于理性 更关注场景突破和商业应用 推动估值体系合理化 使有潜力项目仍能获得支持 [2] 未来竞争关键因素 - 技术迭代速度超过企业经验积累速度 用户数量和资金实力等传统优势不再稳固 [3] - 竞争胜负取决于技术优势和执行效率 而非公司背景 [3] - 能够准确把握技术方向、有效整合资源、持续优化产品的团队有机会胜出 [3]
Gemini如何逆风翻盘?谷歌首席AI架构师:从承认落后开始,找回自己的节奏
华尔街见闻· 2025-11-27 21:16
谷歌AI战略转型 - 谷歌从承认在AI领域落后于竞争对手到通过Gemini 3实现系统性领先,完成技术复兴 [1][2] - 公司首席AI架构师指出,承认落后是内部共识转折和创新的真正起点 [2] - 通过组织重构和基础设施激活,公司在短短两年内扭转局面,重塑行业领先地位 [2][9] 技术架构与多模态战略 - 多模态被视为底层架构必然选择,而非锦上添花,因为世界理解需要融合文本、图像、音频和视频等多维信息 [4] - 谷歌选择从架构级别统一多模态,进行模型结构、token化方式、训练损失和推理路径的底层重构,使模型在图表解析和跨模态任务上拉开差距 [4] - 多模态意义在于增强模型对世界的理解,而非仅生成美观图片 [4] 组织与运营模式变革 - 公司从串行流水线模式转变为并行系统,产品、工程、安全团队从训练第一天就深度协同,打破迭代缓慢和链路割裂问题 [5] - 组织重构让Gemini迭代节奏首次追上竞争对手,模型更稳定、更懂用户意图,能执行真实任务 [5][6] - 对于拥有20万员工的大公司,组织重构难度远高于单次模型迭代 [6] 产品体验与能力提升 - 用户体验改善主因是可用性成为核心目标,包括指令理解能力大幅提升、国际化适配进入核心能力集、工具链与代码执行能力跃升 [7][8] - 模型变好是系统工程成熟后的必然效果,而非单点智力提升 [8] - 公司强调模型在真实世界中的落地应用广度是衡量进步最重要标准,覆盖科研、教育、法律、工程等多元场景 [12] 基础设施与竞争优势 - 基础设施是公司核心优势,包括TPU、全球数据中心、跨产品分发能力、成熟安全体系及Search与Android庞大入口,形成难以复制的网络效应 [9] - Gemini提升本质是基础设施重新被激活,支撑公司快速重返行业中心 [9] - 全栈能力和各层专家协同使模型设计能与硬件、网络和大规模运行环境深度结合 [72] 未来竞争方向与商业价值 - 下一阶段AI竞争从语言智能转向行动智能,重点是多步骤任务完成能力,涉及工作流自动化、开发者工具链、企业任务智能化等领域 [10][11] - 行动模型是平台,商业价值远高于作为产品的对话模型 [11] - AI正从语言模型转向任务操作系统,Gemini目标成为此类系统底层能力 [11] 创新机制与长期发展 - 公司认为创新枯竭是最大风险,而非技术本身,强调不存在终极配方或标准化解决方案 [13][74] - 通过Gemini项目内部探索新架构、新想法,并与谷歌Research、学术界广泛合作,保持多维创新能力 [74][75] - 工程思维成为核心,安全、信任等要素从基础开始嵌入开发过程,而非最后补丁 [35] 全球化协同与规模效应 - Gemini开发凝聚全球团队心血,涵盖欧洲、亚洲等多地研发网络,实现全谷歌协同 [39][40] - 产品团队从研发初期深度参与,确保模型就绪时所有产品同步升级,形成标准流程 [40] - 公司庞大资源从阻力转化为优势,通过独特能力和协同机制支撑大规模创新 [83]
爆料!谷歌DeepMind挖角波士顿动力前CTO Aaron Saunders!
机器人大讲堂· 2025-11-27 17:06
核心观点 - 谷歌DeepMind任命波士顿动力前首席技术官Aaron Saunders为硬件工程副总裁,此举是公司打造机器人领域“安卓系统”战略的关键一环 [1][2][20] - DeepMind旨在基于Gemini大模型构建通用人工智能平台,适配各类机器人硬件,Saunders在机器人硬件研发及商业化方面的经验将助力攻克算法与硬件适配难题 [18][20][22] - 行业竞争激烈,特斯拉计划十年内量产100万台Optimus人形机器人,若DeepMind成功打造通用控制平台,将可能重塑行业生态,降低硬件厂商研发成本 [25][27] Aaron Saunders的专业背景 - Saunders拥有22年机器人工程经验,毕业于美国顶尖工程院校,主修机械工程,辅修计算机科学 [3] - 2003年以核心工程师身份加入波士顿动力,参与BigDog四足机器人研发,负责优化液压驱动系统,解决复杂地形动力输出稳定性问题 [5] - 参与Cheetah高速四足机器人、Petman人形机器人等项目,2018年升任工程团队副总裁,主导人形机器人Atlas和四足机器狗Spot的研发 [7][9] - 作为Atlas项目核心负责人,将机器人关节自由度提升至28个,研发动态平衡算法,使其具备后空翻、360度转体等能力,数据处理延迟缩短至毫秒级 [11][12] - 2021年晋升为首席技术官,提出“硬件模块化、控制智能化”理念,主导Spot模块化硬件架构设计,使其可搭载多种设备,截至2023年已在全球超过50个国家和地区实现商用 [12][14] - 2024年8月离职,诉求为在更广阔平台推动AI与机器人硬件深度融合 [15] DeepMind的战略布局 - 公司战略是打造机器人领域的“安卓系统”,基于Gemini大模型构建通用人工智能平台,具备“开箱即用”能力,适配从人形到非人形的各类机器人硬件 [20] - 重点布局“具身智能”,需解决算法与硬件适配难题,包括统一多类型传感器接口、适配不同运动学结构、保障嵌入式设备低延迟运行等 [22] - 战略思路从直接掌控硬件公司转向构建底层技术生态,通过吸纳核心技术负责人重启机器人领域布局 [25] - 行业分析师判断,成功将Gemini打造成通用控制平台可帮助硬件厂商降低智能系统研发成本,专注于机械设计与量产环节 [27]