通用人工智能(AGI)
搜索文档
具身智能:一场需要谦逊与耐心的科学远征
Robot猎场备忘录· 2025-05-20 13:01
具身智能的核心观点 - 具身智能为机器人领域注入新活力,有望突破性能上限,需保持开放态度避免派别之争 [1] - 具身智能是跨学科产物,依赖材料科学、生物力学等多领域协同突破,而非单一技术路径 [2][6] - 当前具身智能处于早期阶段,人形机器人能力仅相当于自动驾驶"L0"水平,硬件和算法均未成熟 [7] 学科与技术发展 - 传统机器人学的"特殊任务研究"对具身智能有间接贡献,如波士顿动力动态平衡算法、蛇形机器人柔性驱动技术 [2] - 技术迭代呈现沉积效应,如GAN框架仍影响当前AI领域,VLA模型可能被更高效方案取代但会留下技术遗产 [5] - 纯软件算法难以构建长期壁垒,需结合工程实践、材料工艺等"脏活累活"形成护城河 [12] 通用性与具体性 - 通用智能需建立在具体问题钻研基础上,如达芬奇手术机器人亚毫米级操作依赖生物组织参数积累 [3] - 产业需求如汽车线束整理、半导体封装高精度要求等"不性感"的工程细节是锤炼智能的关键场景 [3] - 人形机器人形态优势仅限于人类环境适配,物流/农业等领域专用非人形机器人更具成本效率 [11] 技术路径与产业实践 - VLA技术路径存在争议,儿童和乌鸦案例显示操作能力可独立于语言系统,当前大模型性价比低 [8][9] - 短期优先采用learning与model结合方法,长期纯learning或成主流但需脑科学等学科突破支持 [10] - 工业界更认可model-based解决方案因其稳定可控,端到端大模型并非客户关注重点 [10] 行业动态与案例 - 人形机器人马拉松比赛暴露当前技术局限,多数需人工干预且电机发热问题突出 [7] - 行业存在同质化重复项目风险,需警惕过度追求"酷炫"而忽视经济性 [11] - 华为、智元机器人等公司加码人形机器人赛道,全栈自研和跨领域协作成为焦点 [15][16][18]
谷歌前CEO埃里克·施密特:“非人类智能”崛起将重塑全球格局
36氪· 2025-05-19 19:31
非人类智能的觉醒时刻 - 2016年AlphaGo在围棋比赛中下出人类2500年历史从未出现过的"神之一手",标志着AI革命起点 [4] - AI技术已从语言生成快速演进至战略决策阶段,强化学习突破使AI具备规划能力 [5][6] - 当前AI系统能在15分钟内生成深度技术论文,调用庞大计算资源完成复杂任务 [6] AI三大核心挑战 - 能源瓶颈:美国需新增90吉瓦电力(相当于90座核电站),中东和印度正建设5-10吉瓦数据中心 [7] - 数据枯竭:公开数据几乎耗尽,下一阶段需AI生成数据 [8] - 知识边界突破:现有AI基于人类既有知识,需实现跨领域迁移创造"新知" [8][9] AI安全与治理 - 行业共识需建立"断电"机制应对三种风险场景:递归自我改进/武器控制权/自我复制 [10][11] - 中美AI竞争呈现"核威慑"态势,开源技术扩散可能引发安全风险 [12][13] - 超级智能竞赛中6个月领先可能形成不可逆优势,引发先发制人风险 [14] 中美AI竞争格局 - 美国限制中国获取高端芯片,中国通过算法优化在有限算力下开发出DeepSeek等优秀模型 [13] - 美国主导封闭系统,中国可能成为开源AI领导者,技术扩散带来安全挑战 [13] - 中美是唯二能投入数百亿美元进行AI竞赛的国家,将决定未来全球格局 [16] AI应用前景 - AI可降低药物研发成本,识别所有人类药物靶点并开放数据 [20] - 教育领域可实现个性化AI导师,医疗领域可普及基层AI医生助手 [21] - AI驱动生产力年均增长或达30%,重塑劳动力结构和经济模型 [22] 行业转型趋势 - AI将彻底改变商业流程,智能体通过自然语言协作完成任务 [6] - 中间件行业面临消亡,AI系统可直接接入数据库完成复杂操作 [25] - 所有职业都将被AI重塑,拒绝采用AI工具者将失去竞争力 [24]
机器人第一城,不是杭州
盐财经· 2025-05-19 17:44
机器人产业概述 - 机器人产业有两条发展脉络:文艺作品中的感官形象和现实世界的经济应用 [2] - 工业机器人长期以机械臂形式存在 对生产力产生革命性推动作用 [2] - 人形机器人开始吸引眼球 但要大规模应用仍需突破诸多障碍 [2] 中国机器人产业现状 - 中国机器人产业市场规模和出货量稳居世界第一 工业机器人装机量占全球50%以上 [3] - 全国智能机器人企业数量达45.17万家 较2020年底增长206.73% [3] - 深圳是"机器人第一城" 相关企业近6万家 人形机器人上市公司7家全国最多 [3] - 深圳2023年机器人产值达1797亿元 产业链从上游到下游完整 [3] 机器人分类与发展 - 机器人按使用场景分为工业机器人、服务机器人和特种机器人三大类 [8][9] - 工业机器人专指制造业机器人 特种机器人包括农业、电力、国防等多个行业 [9] - 人形机器人按形态划分 可以是工业、服务或特种机器人 [11] - 中国机器人产业使用场景全、数量大、国产化率高 但在极端参数运动控制和计算系统方面仍需积累 [11] 工业机器人发展 - 工业机器人经过40年发展 机械臂领域已相当成熟 未来比拼极端参数作业 [16] - AGV(自动导向车)因智能制造需求迎来发展机遇 载重从几斤到几十吨都有 [17][18] - 机械手在精细装配领域有发展机会 如手机零部件和电动车线路装配 [19] 医疗机器人前景 - 手术机器人从微创手术向微纳米介入式发展 可进入更细管道治疗肿瘤 [22] - 纳米机器人可能改变肿瘤治疗模式 实现早期干预 [23] - 机器人技术可能改变药物研发模式 减少临床实验环节 [25][26] 人形机器人挑战 - 人形机器人实用价值取决于具身智能(Embodied Intelligence)的突破 [28] - 需要解决运动、智能、能源和安全四大问题 目前都处于起步阶段 [31] - 中国在数据获取方面有优势 工业门类齐全可提供丰富训练数据 [32]
蚂蚁集团CTO何征宇揭秘AI四大挑战:未来所有数据公司都将成为AI公司
新浪科技· 2025-05-18 07:48
公司动态 - OceanBase发布面向AI的应用产品PowerRAG,提供开箱即用的RAG应用开发能力,是公司面向AI时代的探索之一 [1] - CEO杨冰宣布公司全面进入AI时代,致力于构建Data×AI能力,推动一体化数据库向一体化数据底座的战略演进 [1] - 蚂蚁集团CTO何征宇表示将支持OceanBase在金融、医疗、生活等AI核心场景的突破,实践Data×AI理念和架构创新 [2][10] - 蚂蚁集团将继续支持OceanBase开源开放,逐步将Data×AI能力开放给行业 [2][10] 行业趋势 - AGI时代意味着单个模型或解决方案能够完成多个细分AI任务,预计将涌现指数级增长的长尾应用需求 [5] - 海量数据成就了大模型,但大模型幻觉问题的源头也是数据问题,数据决定大模型能力上限 [1][6] - AI发展遵循"长尾理论",海量长尾需求聚合时总和将超越任何单一主流市场规模 [4] - 未来所有数据公司都将成为AI公司 [9] 技术挑战 - 数据获取成本显著增加,互联网公开数据资源已接近枯竭,未来企业成功标准是能否高效率产生高质量数据 [7] - 行业数据流通困难,高严谨性行业存在数字化滞后、数据质量要求严苛等问题,导致高质量数据结构性缺失 [8] - 多模态数据处理难度大,未来数据规模将呈指数级增长,包含文本、视觉、触觉等多种形式 [8] - 大模型质量评估困难,需要大量具备人类思维或知识的数据进行评估 [9] 战略布局 - OceanBase过去在蚂蚁集团内部应用自研海量交易数据技术创新,构建全分布式数据库架构及相关技术体系 [9] - 未来OceanBase将实现从算力、基础设施到平台层、应用层、交付形态的全方位布局 [1] - AI竞争已进入深水区,不仅是模型竞争,更是基础设施竞争,基础设施效果将直接决定模型效果 [10]
蒲慕明院士:未来数十年会用AI的人取代不会用AI的人
第一财经· 2025-05-17 21:14
人工智能对经济社会的影响 - 未来二三十年将是会用AI的人取代不会用AI的人,而非AI直接取代人类 [1] - 未来5年内20%到30%的职业会被AI取代,2030至2060年间50%现有职业将被取代,中点为2045年 [3] - 2050年发达经济体60%的工作岗位可能受AI影响,90%以上职业可能被重构 [3] 教育模式与人才培养变革 - 传统教育需变革,重点包括社会伦理教育、群体生活规范训练及自我学习能力培养 [3] - AI应成为中小学和高校的基础必修课,与语文、数学同等重要 [3] - 教育目标应从知识传授转向培养学习能力、求知能力和问题解决能力 [3] AI时代的科普教育 - 科普需针对两类人群:一般公众和有科学基础的科研人员,后者目前较缺乏 [4] - 科普核心任务是从专家角度帮助公众获取准确信息,而非单纯提供材料 [4] - 科学公民需具备AI能力、辨伪能力,并参与引导AI发展机制 [4] 科学教育与未来社会 - 人工智能时代需培养未来科学家和科学公民,后者需具备科学素养和AI能力 [4] - 科学公民的参与程度反映社会现代化水平,需助力AI发展符合社会需求 [4]
阿里Q4财报:淘天货币化率提速 AI将成第二增长曲线
中国经营报· 2025-05-16 19:14
财务表现 - 2025财年第四季度收入2364.54亿元,同比增长7% [2] - 非GAAP净利润298.47亿元,同比增长22% [2] - 淘天集团营收1013.69亿元,同比增长9% [3] - 阿里国际数字商业集团营收335.79亿元,同比增长22% [3] - 阿里云营收301.27亿元,同比增长18% [3] - 本地生活集团营收161.34亿元,同比增长10% [4] - 菜鸟营收215.73亿元,同比下降12% [4] 战略与业务重点 - 公司战略聚焦"用户为先、AI驱动",成效显著 [2] - 电商货币化率提速,淘天集团客户管理收入710.77亿元,同比增长12% [2][6] - 阿里云外部收入同比增长17%,AI相关产品收入连续七个季度三位数增长 [4] - 未来三年将投入超3800亿元建设云和AI硬件基础设施 [5] - 即时零售被列为战略规划,旨在提升用户活跃度和规模 [8] AI与技术创新 - 阿里云市场份额连续三个季度回升,全财年收入双位数增长 [4] - 开源混合推理模型Qwen3性能超越全球顶尖模型 [4] - 通义开源200余个模型,全球下载量超3亿次,衍生模型数超10万 [4] - AI应用趋势:从大中型企业向中小企业渗透,用户侧场景扩展 [5] 电商业务进展 - 88VIP会员数超5000万,同比保持两位数增长 [6] - 货币化率提升得益于基础软件服务费和"全站推广"渗透率 [6] - 商业化措施包括直播、百亿补贴变现及千分之六基础服务费 [6] - "全站推"工具打通付费与免费流量池,提升商家ROI [6][7] - 白牌卖家商业化率显著提升,支付手续费收取阶段性助力 [7]
阿里AI产品爆发!吴泳铭最新研判
新华网财经· 2025-05-16 10:23
核心业务表现 - 2025财年第四季度营收2364.54亿元人民币,同比增长7%,非公认会计准则净利润298.47亿元人民币,同比增长22% [4] - 2025财年全年收入9963.47亿元人民币,同比增长6%,经调整EBITA同比增长5%至1730.65亿元人民币 [6] - 淘天集团客户管理收入同比增长12%至710.77亿元人民币,88VIP会员超5000万 [17] - 阿里国际数字商业集团收入同比增长22%至335.79亿元人民币,国际零售商业收入同比增长24% [19][20] - 本地生活集团收入同比增长10%至161.34亿元人民币,大文娱集团收入同比增长12%至55.54亿元人民币 [19][20] AI与云计算业务 - 阿里云第四财季收入同比增长18%至301.27亿元人民币,创三年最快增速,AI相关产品收入连续七个季度保持三位数增长 [1][6] - 2025财年阿里云收入达1180亿元人民币,同比增长11%,市场份额连续三个季度回升 [10] - 中国工商银行选择阿里云PolarDB数据库作为全行级交易型分布式数据库 [1] - 公司开源200余个模型,全球下载量超3亿次,千问衍生模型数超10万个 [13] - 未来三年将投入超过3800亿元人民币建设云和AI硬件基础设施 [22] AI应用趋势与案例 - AI应用两大趋势:大中型企业AI应用向用户侧渗透,中小企业开始积极使用AI产品 [2][13] - 中国联通、中国移动、浙江省政府与公司签署战略合作协议 [12] - 中国科学院青藏高原研究所联合公司打造水能粮大模型"洛书",国家天文台发布太阳大模型"金乌" [12] - Vivo发布多模态大模型视觉辅助产品,中国一汽打造汽车行业首个AI Agent [12] - 招商银行落地多个AI应用,小鹏、蔚来等升级智能座舱功能 [12] 业务战略与股东回报 - 公司聚焦电商、"AI+云"核心业务增长,塑造科技驱动的第二增长曲线 [1] - 2025财年以119亿美元回购11.97亿股普通股,派发年度股息和特别股息总计46亿美元 [1][22] - 完成对高鑫零售和银泰百货的出售,形成"AI+云"、电商、其他互联网平台业务的发展阵型 [17] - 淘天AI广告工具"全站推广"渗透率提升,闲鱼AI产品覆盖近2200万用户 [17] - 阿里巴巴国际站AI应用Accio企业用户超百万,高德发布AI导航智能体 [17]
GPT-4V仅达Level-2?全球首个多模态通才段位排行榜发布,General-Level打造多模态通用AI评测新范式
量子位· 2025-05-16 09:24
文章核心观点 - 多模态大模型(MLLM)的评估正从简单的任务分数堆砌,转向科学评估其内部知识迁移与协同泛化能力,这被认为是AI竞赛下半场决定胜负的关键[1] - 一篇被ICML'25录用的论文提出了一套全新的评测框架General-Level和配套数据集General-Bench,旨在为多模态通才模型提供公平、全面、科学的评估基础设施[1][2] - 该框架通过一个五级段位体系(从Level-1到Level-5)量化模型从“专才”到“全才”的通用能力进阶,并已落地为覆盖700多个任务、32.5万+测试样本的超大规模评测基准和公开排行榜[2][3][12] General-Level五级段位评估体系 - **评估核心**:该体系的核心在于衡量模型的**协同泛化效应**,即模型将一种模态或任务中学到的知识迁移提升到另一种模态或任务的能力,追求1+1>2的效果[3] - **段位定义**: - **Level-1 专家型选手**:指在各单项任务上微调到极致的专精模型(SOTA)[6] - **Level-2 入门通才**:模型能支持多种模态和任务,但尚未体现出协同增益效应,属于“一专多能”但未超越专精模型[11] - **Level-3 任务级协同**:模型通过多任务联合学习,在**某些任务上的成绩超越了该任务的专精模型SOTA**,展现出任务层面的协同[11] - **Level-4 范式级协同**:模型在“理解”与“生成”两大任务范式之间形成协同,具备“生成-理解一体化”的推理能力[7][11] - **Level-5 全模态完全协同**:模型在跨模态、跨任务范畴达成全面协同,并且与语言智能相互增强,这是理想的AGI状态,但目前尚无模型达到[7][8][9] - **现状与意义**:该体系将评估视角从堆叠分数提升到考察知识迁移能力,为行业描绘了从专才到通才的清晰进阶路线图[12][13] 目前排行榜中模型主要集中在Level-2和Level-3,达到Level-4的模型凤毛麟角,Level-5仍为空缺[58][69][72] General-Bench评测基准 - **定位与规模**:被誉为当前**规模最大、范畴最广、任务类型最全面**的多模态通才AI评测基准,是一张“超级考卷”[14][15] - **覆盖广度**:覆盖**图像、视频、音频、3D以及语言**五大核心模态,实现了从感知、理解到生成的全链路覆盖[15] - **任务深度与类型**:不仅涵盖大量传统理解类任务(如分类、检测、问答),更纳入了丰富的生成类任务(如图像、视频、音频生成等),且所有任务均支持**自由作答**,依据原生开放指标评估[15] - **数据规模与领域**:汇集了**700余个任务、超过32.5万个测试样本**,并细分为145项具体技能,跨越**29个跨学科知识领域**,包括自然科学、工程、医疗、社会科学等[17] - **动态与开放**:样本总量达325,876并保持开放动态增长,确保了基准的长期生命力[18] 多Scope Leaderboard排行榜设计 - **设计目的**:为了兼顾评测全面性与参与门槛,设计了**多层次的榜单Scope分层解耦机制**,允许能力各异的模型选择合适范围参与比较[20] - **Scope-A 全谱英雄榜**:难度最高,要求模型接受General-Bench全集考验,旨在选拔**全能型的多模态基础模型**[22][23] - **Scope-B 模态统一英雄榜**:包括7个并行子榜单,4个针对单一模态(如纯视觉、纯语音),3个针对模态组合(如图像+文本),模型只需在所选模态范围内评测[24][25][26] - **Scope-C 理解/生成英雄榜**:将评测细分为理解类和生成类两大范式,在图像、视频、音频、文本等模态下分别设榜,共计8个榜单,强调**同一模态内跨任务范式的迁移能力**,对资源要求较低[27][28] - **Scope-D 技能专长榜**:粒度最细,将任务按具体技能聚类(如“视觉问答榜”、“图像字幕生成榜”),参赛模型可只针对某一类技能提交结果,鼓励模型从单点技能极致化开始发展[30][31][33] 排行榜现状与社区反馈 - **模型收录**:排行榜已收录**100多个多模态模型**的成绩,整体表现差异悬殊,颠覆了部分对常见模型能力排位的认知[56][57] - **段位分布**: - **Level-2**:占比最多,包括GPT-4V等闭源模型以及SEED-LLaMA、Unified-IO等开源模型,这些模型支持任务范围广但极少超越单项SOTA,单模态平均得分大致在10-20分左右[61][62] 当前前三名为Unified-io-2-XXL、AnyGPT及NExT-GPT-V1.5[63] - **Level-3**:模型数量较少,包括Sa2VA-26B、LLaVA-One-Vision-72B、Qwen2-VL-72B系列等2024年后的新模型,它们通常具有**数百亿参数**,通过海量多任务训练在部分任务上超越了传统SOTA[65][66] 而GPT-4o、Claude-3.5等闭源模型在此级别表现不够靠前[67] - **Level-4**:目前仅有极个别模型达到,如Mini-Gemini、Vitron-V1、Emu2-37B等原型开源模型,它们在**跨范式推理**上有所突破,但平均分非常低,揭示了构建全面协同AI的巨大挑战[69][70][71] - **Level-5**:至今空缺,尚无模型能达到全模态总协同,团队推测下一个里程碑可能来自“多模态版”的GPT-5[72][73][74] - **社区反响**:该评测平台因**规模空前**(覆盖700+任务)、**体系完整**且**公开透明**而受到社区热烈欢迎,其数据被用于指导研究方向,讨论模型优劣(如开源模型Qwen2.5-VL-72B击败部分闭源巨头),并积累科研洞见[75][76][77]
坚定大投入 阿里、腾讯全力逐浪AI
上海证券报· 2025-05-16 02:25
AI行业趋势 - AI应用从大中型企业内部系统向用户侧场景渗透 [1] - AI产品客户从大中型企业延展到大量中小企业 [1] - 互联网行业正迎来AI技术驱动的增长动力 [1] 阿里巴巴AI战略与业绩 - 2025财年第四季度营收2364.54亿元,同比增长7% [2] - 阿里云第四财季收入增速从3%提高到18%,AI相关产品收入连续七个季度三位数增长 [2] - 2025财年阿里云收入1180亿元,同比增长11% [2] - 未来三年将投入超过3800亿元建设云和AI硬件基础设施 [5] - 淘天AI广告工具"全站推广"提升商家渗透率,夸克推出"AI超级框"等功能 [5] - 阿里云PolarDB数据库获中国工商银行全行级采用 [7] 腾讯AI战略与业绩 - 2025年第一季度营收1800.2亿元,同比增长13% [2] - AI对效果广告与长青游戏业务产生实质性贡献 [3] - 一季度研发投入同比增长21%,实施"AI in All"策略 [6] - 公司不设算力和人力限制支持AI赋能业务 [6] 行业应用与前景 - 养殖业、传统制造业等传统行业AI需求增长显著 [7] - 网易有道聚焦"AI原生"战略,盈利能力提升 [8] - AI加速落地有助于实现通用人工智能(AGI)目标 [8]
郭彦东“详解”具身智能:将AGI的能力真正赋予物理世界的机器人
经济观察报· 2025-05-15 21:57
核心观点 - 智平方创始人郭彦东预测通用机器人的"iPhone时刻"将在5至7年后到来,并设定了2033年百万台产能目标 [1][3] - 公司坚持"软硬一体垂直整合"战略,以自研Alpha Brain为核心驱动AGI终端,从高端工业场景切入商业化 [2][3][6] - 通用智能机器人发展面临三大挑战:技术通用性与鲁棒性、成本与价值平衡、应用场景深度挖掘与标准化 [7][8] 技术战略 - 自研GOVLA大模型是全球首款全域全身VLA模型,具备全局环境理解与全身协同控制能力 [13][14] - 技术架构100%全栈自研,结合空间交互基础模型与双系统协同(System1快速响应、System2复杂推理) [14][17] - 采用"搜索引擎级"多源数据训练(互联网公开数据+仿真数据+真实交互数据),注重训练效率与端侧部署优化 [18][22] 商业化路径 - 首选汽车制造、半导体、生物科技等高端工业场景,因痛点清晰、付费能力强且能验证技术可靠性 [25][26] - 2024年已实现数千万元回款,案例包括晶能微电子晶圆搬运、华熙生物无菌生产等工业场景 [27][29] - 计划2024Q3进入机场服务场景,Q4落地示范小区,构建"技术-场景-数据"闭环 [28] 产能与供应链 - 目标2028年实现万台级应用,2033年达百万台规模,覆盖工业/物流/家庭服务多元场景 [34] - 自建产线控制质量与成本,转化新能源汽车供应链体系,逐步提升核心部件自研比例 [34][35] - 采用"南北协同"人才策略:北京AI算法研发+深圳硬件产业化,强调核心技术自主可控 [36][37] 行业洞察 - 中国具身智能产业优势:完善供应链、丰富应用场景、活跃产业生态,硬件迭代速度全球领先 [36][37] - 成本下降关键:借鉴新能源车供应链,预计5-7年内机器人硬件成本降至经济型汽车价位 [32][35] - "iPhone时刻"前提:技术通用性突破、硬件成本大幅下降、"杀手级应用"出现 [31][32]