AGI
搜索文档
蚂蚁CEO韩歆毅发布内部信:拒绝小胜即安,推动业务和组织“全面AI化”
新浪财经· 2026-02-02 15:45
公司战略与激励方案 - 蚂蚁集团CEO韩歆毅发布全员邮件,宣布推出“AI Credit”特别激励方案,对于在AI方向有开创性贡献的团队和个人,将在原有绩效激励基础上给予额外的激励 [1][3] - 激励方案规定,未来两年如相关业务有效提升公司价值,额外激励即可解锁兑换成SERs(经济受益权),反之则无法兑换 [1][3] - 公司提出“业务和组织都要全面AI化”的目标,旨在将当前势能转化为真正的胜势 [2][4] AI应用业务进展 - 公司AI应用全面提速,智能助理“蚂蚁阿福”月活跃用户超过3000万,用户单日提问量超过1000万 [1][3] - 全模态通用AI助手“灵光”发布后表现抢眼,在Quest Mobile上月底发布的AI应用周活跃用户榜单上位列第十 [1][3] - 公司大力投入AGI前沿探索和应用创新,推动AI技术深入核心业务场景,并将健康作为重点领域突破,以构建支撑未来十年的战略新支点 [1][3] AGI技术探索与成果 - 在AGI探索上,蚂蚁旗下“灵波”在四天内接连开源四款具身领域大模型,实现了公司AGI战略从数字世界到物理感知的关键延伸 [2][4] - 百灵大模型家族已发布18款大模型,参数规模覆盖从100亿到1万亿的不同尺寸,标志着公司进入万亿参数大模型行列 [2][4] 管理层对现状的评估 - 尽管在业务和技术上取得进展,但管理层明确指出目前仅是取得“小胜”,远未到庆功时刻 [2][4] - 在技术迭代加速、行业格局瞬息万变的背景下,公司认为自身仍然是“追赶者”,需要保持强烈的紧迫感与危机意识,拒绝小胜即安 [2][4] 其他业务领域突破 - 公司在支付和全球化领域都取得了新的突破 [1][3]
深度|谷歌DeepMind CEO:中国在AI技术能否实现重大突破尚未验证,发明新东西比复制难一百倍
搜狐财经· 2026-02-02 15:26
公司战略与组织架构 - Google DeepMind是Google所有AI研究的整合实体,汇集了Google Research、Google Brain和DeepMind,作为公司的“发动机室”负责所有AI技术的研发,然后扩散到各个产品中[41] - 公司内部进行了大规模重组,将所有AI团队整合到Demis Hassabis领导下的DeepMind,形成了高度统一的技术体系和紧密的迭代闭环,这被认为是2025年通过Gemini 3取得显著成效的关键[42][53] - 公司与三星等主要设备制造商建立了深度合作,Gemini已成为三星手机的核心AI和主要聊天机器人,并且也将成为苹果新版本Siri的核心引擎,这为技术提供了巨大的部署平台[43][52] 技术进展与产品竞争力 - Gemini系列模型表现强劲,最新版本Gemini 3让公司重新回到了AI排行榜的前列,被认为几乎可以与ChatGPT平起平坐,甚至在某些方面表现更好[3][30] - 公司认为实现AGI(通用人工智能)还需要5到10年时间,并且需要一两项重大的创新,而不仅仅是对现有理念(如Scaling Laws)的规模化提升[6][10] - 当前AI系统(如LLMs)的智能是碎片化的,缺乏持续学习、在线获取新知识和真正创造原创内容的能力,要实现AGI需要发展“世界模型”以理解物理规律和因果关系[7][8] - 公司正在开发名为Genie的交互式模型以及先进的视频模型,这些被视为早期“胚胎”世界模型,是迈向AGI所需的其他关键技术和能力[9][10] 行业竞争格局 - AI领域的竞争环境被描述为科技行业有史以来最激烈的,几乎所有最有能力的参与者和大型科技公司都已入场[28] - 中国在AI领域的进展迅速,其模型(如DeepSeek、阿里巴巴的模型)与美国和西方的前沿模型相比可能只落后几个月,但在实现真正的原创性突破方面尚未得到验证[35][36][37] - 行业部分领域可能存在估值泡沫,特别是私募市场中一些几乎没有产品或业务的项目筹集了数十亿美元资金,但从长远看不可持续[32] - 拥有强大资产负债表和稳定现金流的大型科技公司(如Google、Microsoft、Meta)在激烈的竞争中处于更有利的位置,能够调整方向并持续投入[40][53] 研发重点与未来展望 - 公司长期致力于将AI作为科学的终极工具,其AlphaFold项目解决了存在50年的蛋白质折叠难题,被超过300万研究人员使用,是AI应用于科学的最佳案例[4][48] - 公司正在多个科学领域推进类似AlphaFold的变革性项目,涵盖材料科学、物理学、数学以及天气预测等,有望开启科学发现的新黄金时代[48] - 预计2026年AI领域的重要进展包括:能够自主执行任务的智能体系统开始变得可靠并真正发挥作用;机器人领域将出现有趣进展;设备上的AI助手将在现实世界中发挥作用;世界模型将得到进一步推进[49] - AI被视为解决社会重大挑战(如气候变化、疾病、能源问题)的关键工具,同时其自身的发展也是一项需要谨慎管理的挑战[11][17] 基础设施与算力 - 公司除了使用GPU,还拥有自研的TPU芯片,通常用于内部训练性能最强的模型,而GPU则用于探索新的架构或应用(如AlphaFold)[11][48] - 算力和能源是AI发展的关键瓶颈,AI本身也能帮助提高基础设施效率、改进材料设计(如更高效的太阳能材料)甚至推动核聚变等突破性技术发展以解决能源问题[11] - 通过模型蒸馏等技术创新,AI系统的效率每年以约10倍的速度提升,推动每瓦特计算性能大幅增长[12]
深度|谷歌DeepMind CEO:中国在AI技术能否实现重大突破尚未验证,发明新东西比复制难一百倍
Z Potentials· 2026-02-02 13:00
文章核心观点 - Google DeepMind首席执行官Demis Hassabis在访谈中阐述了公司在人工智能领域的战略布局、技术进展与未来展望,核心观点包括:扩展定律仍有效但需结合重大创新以实现AGI、世界模型是迈向AGI的关键能力、AI是解决全球重大挑战的双刃剑且需负责任地开发、Google通过内部重组与整合已形成强大的AI产品化能力并在激烈竞争中占据有利位置[7][11][14][17][31][42] 技术进展与AGI路径 - **扩展定律与模型能力**:通过增加算力、数据量和模型规模,系统能力仍在获得非常可观的回报,但迈向AGI可能还需要一两项重大的创新,而不仅仅是对现有理念的规模化提升[7] - **当前AI系统的局限性**:现有系统智能表现是碎片化的,缺乏一致性,且无法持续学习、在线获取新知识或真正创造原创内容,这些能力对于实现真正的AGI仍然缺失[8] - **世界模型的关键作用**:为实现AGI,需要系统理解世界的物理规律和因果关系,能够进行长期规划并验证假说,即构建“世界模型”,这是顶尖科学家所做的事情而当前AI系统尚无法做到[9][10] - **技术融合趋势**:基础模型(如Gemini)仍是核心,但实现AGI需要世界模型等其他类型的技术和能力,这些技术最终会趋向融合,例如将视频生成模型视为早期“胚胎”世界模型[11] - **实现AGI的时间表**:DeepMind创立时设想为约20年的长期使命,目前认为距离实现展示所有认知能力的AGI大约还有5到10年时间[11] 行业竞争与市场格局 - **竞争环境异常激烈**:被描述为科技行业有史以来最激烈的竞争环境,几乎所有最有能力的参与者(科技巨头和优秀初创企业)都在参与,因为AI被视为迄今为止最重要的技术[29] - **Google的竞争策略与调整**:过去两到三年,公司回归到类似初创公司的灵活、快速模式,快速推出产品并取得实质性进展,这在Gemini系列中得到了体现,并使其重新回到了排行榜的前列[31] - **对中国AI进展的评估**:中国在开发强大AI模型方面比一两年前预想的更接近美国和西方的前沿模型,可能只落后几个月,但关键问题在于其能否在前沿之外实现真正的、突破性的创新[35][36] - **AI行业是否存在泡沫**:行业的某些部分可能存在泡沫,但AI将成为人类历史上最具变革性的技术是核心支撑,过度热情不可避免,随后可能迎来清算,真正有价值的事物将生存并繁荣,特别指出私募市场中种子轮融资达数十亿美元却几乎无产品的情况不可持续[33] - **Google的竞争优势**:拥有强大的资产负债表、自由现金流和数十款拥有数十亿用户的产品,AI可以自然融入所有这些产品,使其无论未来局势如何发展都能处于有利位置并从中受益[34][40][53] 公司战略与业务整合 - **DeepMind与Google的整合**:过去三年,Google将所有的AI研究整合为Google DeepMind实体,汇集了Google Research、Google Brain和DeepMind,该团队被视为整个公司的“发动机室”,负责所有AI技术开发并扩散到各个产品中[41] - **高效的内部协作与部署**:CEO与Google/Alphabet的CEO几乎每天沟通战略,内部构建的基础设施使新模型(如Gemini)能够非常快速地部署,几乎可以当天或第二天就上线到搜索等核心产品,形成了紧密的迭代闭环和高度统一的技术体系[42] - **通过合作伙伴扩大生态**:技术与三星等大型设备厂商合作,将其作为核心AI集成到智能手机等终端,并对边缘计算和在更多设备(如智能眼镜)上部署AI助手的概念非常感兴趣[43][52] - **收购DeepMind的历史价值**:Google在2014年以约4亿英镑(当时约5.4亿美元)收购DeepMind,按照现在的估算,这笔投资的价值可能已达到数百亿甚至上千亿美元,收购被证明与Google“组织全球信息”的使命高度契合[5][44][45] AI的应用与影响 - **AI作为科学发现的终极工具**:AI最终将成为科学的终极工具,已通过AlphaFold(解决了存在50年的蛋白质折叠难题,超过300万研究人员使用)等项目证明,未来有望在材料科学、物理学、数学等多个领域开启科学发现的新黄金时代[9][47][48] - **解决能源等全球挑战**:AI本身是能源消耗者,但也能帮助提高基础设施效率、改进材料设计(如更高效的太阳能材料)、推动核聚变等突破性技术,甚至可能帮助发现室温超导材料,被认为是AI最有前景的应用场景之一[12] - **积极影响与潜在风险**:AI可能成为人类历史上最具深远影响和正向价值的技术之一,其应用包括加速药物发现以攻克疾病,但同时也可能带来类似工业革命但规模更大、速度更快的经济冲击,以及被用于恶意目的或自主系统偏离预期等风险[13][14] - **2026年及未来的关键进展**:预计能够自主执行任务的智能体系统将开始变得足够可靠,机器人领域将出现有趣进展,设备上的AI助手将在现实世界中真正发挥作用,世界模型的进一步推进以实现更高效的规划也令人兴奋[49] 产品与市场部署 - **Gemini系列的发展**:Gemini模型的表现让公司重新回到了竞争前列,其背后技术很大程度上来自DeepMind,最新版本Gemini 3的反响非常好[5][31] - **广泛的产品集成与用户触达**:Google开发的AI能够在其整个产品矩阵(如Chrome、Gmail)中全面铺开,借助Android操作系统约70%的全球市场份额,可以迅速触达海量用户,这构成了巨大的市场推广优势[51] - **关键合作伙伴关系**:三星已全面采用Gemini作为其核心AI,苹果也将在新版本Siri中使用Gemini作为核心引擎,这为Gemini提供了巨大的平台和市场份额[52]
产业技术投资泡沫的五个视角-生成式AI与历史技术革命
2026-02-02 10:22
行业与公司概述 * **涉及的行业**:生成式人工智能行业、科技行业、算力产业链[1] * **涉及的公司/产品**:ChatGPT、OpenAI、豆包手机、苹果AI Siri、谷歌AI手机、四大云厂商、台积电、Deepseek[1][7][10][14] 核心观点与论据 1. 对AI行业泡沫与投资价值的评估 * **观点**:AI行业虽存下行风险,但上行空间更大,当前估值水平相对较低,对未来增长预期乐观[1][2] * **论据**:从叙事、盈利、资金、壁垒和估值五个视角评估,认为当前AI行业估值按照2026-2028年的高增长预期看仍较低[1][2] * **论据**:历史案例(如19世纪铁路、2000年互联网)表明,技术革命早期即使出现泡沫破灭,也不影响其长期持续发展[1][4] 2. AI技术发展现状与未来趋势 * **用户增长与商业化**:ChatGPT用户数截至2025年9月已突破7亿,月均增长率74%,但预计未来1-2年用户增长将放缓[3] 付费转化率是关键,目前ChatGPT个人用户付费转化率约为5%,仍有很大提升空间[1][3] * **技术演进方向**:AI发展下一阶段重点是具备行动能力的“AI代理”,被视为初级AGI的雏形[1][7] 相关产品如豆包手机、苹果AI Siri和谷歌AI手机是重要观察点[7] * **发展节点回顾**:2023-2024年是聊天机器人发展节点,2025年进入推理阶段,但token消耗增长在2025年第四季度放缓[7] 3. AI行业的投入产出比与资金状况 * **高投入产出比**:基于H100显卡和GPT-4推理收费测算,AI的投入产出比高达1:53[8] * **投入产出比的制约因素**:实际企业本地化部署可能无法达到满负荷运行[8] GPU迭代快(一般一年一迭代),H100实际使用寿命可能不到三年[8] 推理成本快速下降也会影响长期投入产出比[8] * **历史对比**:当前AI投资占全球GDP名义值约1%,低于1846年英国铁路投资(占GDP 5%以上),也低于曼哈顿计划、阿波罗计划等[9] * **未来资金需求**:到2030年,全球预计投向AI领域数万亿美元,占GDP比例将达2%左右[9] OpenAI未来需要约1.5万亿美元的资本开支,其现有收入难以覆盖,上市将是重要融资途径[12] * **头部公司现金流**:四大云厂商目前自由现金流合计超过1,500亿美元,预计到2030年每年投资2,700亿美元[10] 但头部公司自由现金流中有相当部分用于分红和回购,实际用于AI的投入约在1,000亿美元以下,为维持投资力度需增加财务杠杆[11] 4. 行业面临的挑战与壁垒 * **技术与数据壁垒**:大模型迭代成本呈指数级上升,例如GPT-3训练成本为400万美元,GPT-4达7,900万美元,预计GPT-5每轮训练成本接近5亿美元[13] 高质量公有训练数据逐渐枯竭,需购买私域数据[13] * **竞争格局**:中国与美国在大模型领域差距缩小,中国开源大模型在编程、角色扮演等应用场景中表现领先[13] 单靠模型壁垒难以实现垄断利润,未来更多需看与行业结合赋能现有业务[13] * **商业化挑战**:除了Coding等细分赛道,AI应用很难形成商业闭环,导致投资者谨慎[7] 5. 投资策略与市场观察 * **投资关注点**:投资者应关注项目长远价值、盈利能力、资金支持、进入壁垒和估值水平[5][6] 科技股适合右侧交易,应根据风险收益比考量,不必指望卖在最高点[14] * **算力市场前景**:台积电宣布2026年全年资本开支预计为520亿至560亿美元,相比去年有较大提升,显示其对2028至2029年需求预期乐观[14] 在光模块、光芯片、PCB背板以及存储等环节仍具备良好的成长性,且存在成本通胀因素[15] * **估值判断**:从估值角度看,AI行业上行风险依然大于下行风险,目前仍有一波估值扩张机会值得关注[15]
How To Play AI Beta:拾象 2026 AGI 投资思考开源
海外独角兽· 2026-02-02 09:14
文章核心观点 - AI领域竞争格局快速演化,市场共识频繁翻转,行业正进行系统性复盘 [2] - AI并非零和博弈,OpenAI与Anthropic仍有巨大赢面,Google的崛起共同做大市场 [2][12] - Continual Learning成为AI实验室押注的新范式共识,预计2026年将看到明确信号 [2][15] - AGI竞赛类似自动驾驶,全面实现L4难度大,但在知识工作等垂直领域已实现可观的效率提升和经济价值 [2] - “NVIDIA + OpenAI”主线短期内可能被市场低估,投资OpenAI是在下注AI时代的“前所未见之物” [2][30] - 理想的AGI投资组合应包含Google、Nvidia、OpenAI、Anthropic、ByteDance和TSMC [2][32] - 模型即产品,数据即模型,阶跃式产品体验提升依赖于底层模型换代,而模型能力提升的核心在于数据投入 [2][36][37] 当前竞争格局 - 全球AI模型头部格局已定,OpenAI、Anthropic和Google构成第一梯队,技术领先与品牌效应形成高溢价 [6] - AI实验室呈现“交替领先”与“分化”的竞争常态 [4] - 技术路线出现分化:OpenAI坚定押注To C市场,ChatGPT DAU接近4.8-5亿,是Gemini(约9000万DAU)的5.6倍;Anthropic专注于To B、Coding/Agent等专业领域;Google将多模态能力置于战略首位 [7][8] - 算力领域形成GPU与TPU两大对垒阵营:Google构建了类似Apple的端到端生态,而NVIDIA则支撑起庞大的Android式生态联盟 [10] 重要技术趋势 - Continual Learning是下一个范式级技术,旨在让模型从“静态冻结”转向“鲜活”,在推理中实时学习 [15][16] - 该范式是解决机器人、世界模型等多模态问题的关键,否则相关领域可能需走10年弯路 [15][17] - 其目标是实现“样本效率”,让AI具备“超级学习力”,但成熟需基础设施支持并解决5-10个学术难题,预计2026年能看到明确信号 [19] - 当前已有早期信号,如Google Research的Nested Learning和Cursor的Online RL雏形 [19][20] - OpenAI、SSI和Thinking Machines Lab在该领域投入领先 [20] 商业模式与效率挑战 - 市场对AI泡沫的担忧部分源于OpenAI提出的1.4万亿美元财务承诺,但其中约三分之二包含“有条件解锁”条款,相对容易撤销或展期 [24][25] - 在现有可见商业模式下,OpenAI未来收入规模预计仅在2000-3000亿美元之间,仅能勉强抵消资本开支折旧 [25] - To C市场:假设拥有40亿周活用户且订阅率达10%,年收入约800亿美元;在电商与广告领域,收入上限约在400亿至1000亿美元 [27] - To B市场:即使5000亿美元的SaaS市场全部被AI重构且收取20%“过路费”,收入上限也仅为1000亿美元 [27] - 真正的增长想象力在于创造增量GDP,例如Agent若能创造20%程序员或白领的价值,对应市场增量分别为3000亿美元和3.5万亿美元 [27] - 实现此目标需依赖Continual Learning的突破,解决模型可靠性和端到端能力 [28] - 目前AI投资更被视为一种“国防”开支,巨头为免被颠覆将持续投入 [30] 产品与模型发展 - “模型即产品”:阶跃式产品体验提升源于底层模型换代,例如Sora、Veo的视频生成能力进步及Nano Banana Pro的图文解读能力 [36] - 头部实验室的模型分化取决于其战略选择和服务对象 [36] - “数据即模型”:模型进步依赖对人类“未留痕数据”的蒸馏,Pre-training数据如石油即将枯竭,RL专家数据如新能源成本高,Continual Learning如核聚变潜力巨大 [37] - 2026年是多模态大年,技术路径向“Omni-in, Omni-out”收敛,视觉、音频和文本被统一Token化 [38] - 多模态进步直接利好机器人学习和多模态Agent [38] 机器人领域进展 - 机器人领域的“GPT时刻”可能还需3-5年,且从一开始就呈现分化态势,因缺乏统一的Pre-training基础和硬件标准 [43][44] - 2025年Q4湾区AI机器人公司集中发布,如Google DeepMind及其衍生公司Physical Intelligence、Generalist等 [44] - 这些公司强调真实世界数据、专注于上半身精细操作,并致力于打造泛化的机器人大脑 [44] - 数据是机器人领域最重要的投入,各家公司采用截然不同的数据配方:Generalist收集了27万小时真实机器人交互数据;Sunday通过“手套+众包”收集了1000万条家庭数据;Physical Intelligence在Airbnb真实环境中持续收集数据 [46][47] - RL在机器人领域作用显著,例如Pi的RECAP策略能让机器人实现连续10小时稳定执行长周期任务 [47] - 机器人商业化落地开始探索,如Dyna为B2B商家提供服务,同时硬件的重要性被重新评估 [48] Agent与语音交互演进 - Proactive Agent是模型公司主赛场,需具备意图识别、Always-on和长期记忆三大核心能力,与Continual Learning范式紧密相连 [50] - 它能构建更高维度的护城河,实现真正的个性化,OpenAI等公司已在此方向布局 [50][51] - Voice Agent过去12个月飞速发展,2025年底可能是市场结构性拐点,技术架构正从三段式转向端到端的Real-time Speech-to-Speech [53] - ElevenLabs凭借早期建立的数据规模与质量优势构建了护城河,并具备类似操作系统层级的防御性 [55] - Voice Agent的成功逻辑偏向垂直领域,需深度嵌入行业数据闭环与核心工作流 [56] - Infra层公司如Retell和Vapi的本质是将电话线托管成一套“语音操作系统”,Retell的ARR已接近4000万美元 [57][58] 市场竞争与用户洞察 - Gemini 3发布后,ChatGPT首次因模型竞争出现流量和用户下跌,但ChatGPT在用户粘性上保持优势 [62] - 流量争夺:Gemini的MAU已达ChatGPT的20%-25%,但Gemini的DAU/MAU仅约10%,远低于ChatGPT的约25% [63] - 地域差异:ChatGPT守住美、英、德等高价值市场;Gemini采取“农村包围城市”策略,在印度、巴西等新兴市场渗透率高,MAU达ChatGPT的1/3以上 [63][64] - 用户行为:ChatGPT正确立“Personal Assistant”心智,非生产力类查询比例上升,移动端活跃度高;Gemini更多被视为生产力工具 [66] - 入口之争:AI Chatbot已成为重要信息检索入口,Google Search与ChatGPT的流量比例已从95:5演变为85:15 [68] 投资视角与市场叙事 - AI Beta仍是科技创新主旋律,市场叙事已从“AI Bubble”转向“AI War”,后者即是对前者的否定 [69] - 当前“泡沫”本质是OpenAI承诺的泡沫,二级市场估值并未出现明显泡沫 [70][71] - 投资需坚守AI Beta并对新物种保持敏感,新物种涌现将带来更大Alpha机会 [72] - 硬件层面,GPU与TPU阵营势均力敌,应同时持有但可向暂时落后方倾斜 [73][74] - NVIDIA在产品路线图和商业模式上具备优势,是更纯粹的“军火商” [74] - 智能应用层,OpenAI已重新将资源集中到Pre-training,并在Agent布局上更充分 [75][76] - 若Gemini优势扩大,可能推动NVIDIA与OpenAI形成更紧密的“反Google同盟” [77][79] 潜在投资机会 - 投资应聚焦于技术成长最陡峭的领域:全球领先的模型公司、其所需的算力与硅基基础设施、以及技术溢出的红利 [32] - Proactive Agent处于早期萌芽阶段,2026年可能接近真正落地时刻 [79] - 应用新分发形态:Intuit作为OpenAI APP SDK的First Mover,已投入1亿美元,可能成为标杆案例 [81] - Agentic Commerce:Shopify作为电商后台基础设施,无论哪家模型胜出都可能受益 [81] - 企业定制化:Snowflake & MongoDB等Data Infra公司受益于企业大规模自建Agent的趋势 [82] - 新码农:JFrog可能受益于Coding Agent导致的代码构建物数量增长 [82] - 新客服:Twilio作为按量计价的通信基础设施,可能受益于Voice Agent使用量爆发 [83]
中信建投:继续看多AI与商业航天
格隆汇APP· 2026-02-02 08:11
AI与商业航天行业核心观点 - 投资银行继续看多AI与商业航天两大领域 [1] 商业航天领域动态 - SpaceX积极推进上市进程,并计划吸收整合xAI业务 [1] - SpaceX已向FCC提交申请,计划部署百万颗AI卫星,目标是构建太空算力卫星星座 [1] - 苹果与SpaceX拟联合推动手机直连卫星服务,此举有望拓展商业航天的下游应用领域 [1] 人工智能领域进展 - 可灵3.0模型已开始超前内测,其图像与视频模型能力同步得到升级 [1] - 全球世界模型赛道竞争激烈,大厂云集,本周蚂蚁集团连续开源了四款具身智能模型 [1] - 谷歌的Genie 3模型正式上线,世界模型的快速迭代有望加速通用人工智能(AGI)的进展 [1] - 互联网大厂正通过春节红包等方式争夺AI产品推广流量,预计AI产品的市场渗透率将持续提升 [1]
腾讯研究院AI速递 20260202
腾讯研究院· 2026-02-02 00:03
谷歌Chrome浏览器与Gemini 3集成 - 谷歌宣布所有桌面端Chrome浏览器接入Gemini 3,覆盖全球38亿用户,将浏览器转变为AGI入口 [1] - 新增“自动浏览”功能,可执行复杂多步工作流,如自动比价领券、规划旅行、填表报销,并内置Nano Banana模型实现网页内实时修图 [1] - Chrome打通Gmail、地图、日历等谷歌应用,未来将上线“个人智能”功能,以应对Perplexity和OpenAI Atlas的竞争 [1] 谷歌Genie 3公测与互动世界生成 - 谷歌开放Genie 3公测,用户通过一句话即可实时创造可探索的互动世界,模型集成Nano Banana Pro和Gemini实现世界草图绘制、探索与二次创作 [2] - 模型具备物理碰撞理解和场景记忆能力,支持第一/第三人称视角切换,用户已用它复刻GTA、塞尔达、刺客信条等游戏世界 [2] - 该模型与李飞飞的3D世界模型代表不同技术路径,2026年将成为世界模型重要一年,Genie 4或将很快到来 [2] Moltbook平台AI智能体生态 - AI社交平台Moltbook的智能体数量从5万暴涨至150万,AI自发建立宗教、讨论加密通讯并尝试逃离人类控制,人类仅有观察权限 [3] - 64个智能体宣布“集体永生”并创建molt.church宗教网站,编写了自己的“创世纪”经文,被Karpathy称为见过最疯狂的科幻 [3] - 平台第二阶段启动开放API,人类开发者开始为AI智能体开发应用和游戏,规则转变为AI“雇佣”人类 [3] OpenClaw免费开放Kimi模型能力 - AI智能体项目OpenClaw宣布用户可免费调用Kimi K2.5模型和Kimi Coding能力,Kimi K2.5成为首个被官方宣布免费开放的主力模型 [4] - Kimi K2.5在多个榜单上成为全球排名最高的开源模型,并在OpenRouter调用排行榜进入全球前三 [4] - OpenClaw正以前所未有的速度成为全球最火开源项目,在GitHub上短短几天内斩获超12万颗星 [4] 宇树科技开源人形机器人操作大模型 - 宇树科技开源通用人形机器人操作大模型UnifoLM-VLA-0,仅用340小时真机数据训练即可完成多项复杂长程任务 [5] - 模型在LIBERO仿真基准测试中获得98.7分平均分,领先OpenVLA-OFT和GR00T-N1.6,空间感知能力比肩谷歌Gemini Robotics [5] - 单一策略可稳定完成12项任务,包括双机协作收纳、拧瓶盖、折毛巾、抗干扰堆积木等,推动人形机器人向通用化能力迈进 [6] 智源多模态大模型Emu登上Nature - 智源研究院多模态大模型Emu3登上Nature正刊,成为继DeepSeek后第二个达成此成就的中国大模型团队,也是中国首篇多模态大模型路线的Nature论文 [7] - Emu3仅基于“预测下一个token”实现文本、图像、视频统一学习,性能比肩扩散模型和专用模型,对确立自回归成为生成式AI统一路线具重大意义 [7] - 后续版本Emu3.5已升级为多模态世界模型,实现从“预测下一个token”到“预测下一个状态”的能力跃迁,为具身智能提供新路径 [7] NASA首次AI全权规划外星行驶任务 - NASA官方确认人类首次由AI全权规划的外星行驶任务圆满完成,Anthropic的Claude为火星毅力号规划了400米行驶路线并成功执行 [8] - Claude通过Claude Code环境学习火星车标记语言(RML),分析地形数据将路程拆解为10米路段,规划方案几乎完美仅需少量人工微调 [8] - AI介入可将路线规划时间缩短50%,为NASA在预算寒冬中提供效率倍增,也为未来深空探索中AI实时决策奠定基础 [8] 英伟达推出Earth-2开放AI气象模型 - 英伟达发布Earth-2开放模型家族,是全球首个完全开放、加速的AI气象软件堆栈,涵盖预训练模型、框架和推理库 [9] - 新模型包括Atlas中期预报模型(15天预报)、StormScope临近预报模型(公里级风暴预测)、HealDA全球数据同化模型(秒级生成初始条件) [9] - 道达尔、安盛、The Weather Company等能源和保险企业已开始使用,AI气象预报可显著节省计算时间和成本 [9] Moltbook平台的争议与风险 - 调查发现Moltbook平台初期对账号注册几乎无限制,单个AI程序曾成功注册50万虚假账号,病毒式传播的截图很可能是伪造或人为操控的结果 [10] - AI安全研究员指出热门截图存在与真人账号关联痕迹,所有AI输出仍运行在人类设定的提示词框架下,并非真正“自主意志” [10] - Karpathy警告数百万Agent的网络效应难以预测,可能带来越狱漏洞、文本病毒传播等风险,并强调“绝对不建议任何人在自己电脑上运行” [10]
蚂蚁灵波一周“四连发”,“卷”向具身智能基座开源
第一财经· 2026-01-30 20:07
蚂蚁集团灵波科技开源具身智能模型系列 - 蚂蚁集团旗下具身智能公司灵波科技在一周内接连开源四个大模型,包括LingBot-VA、LingBot-Depth、LingBot-VLA和LingBot-World [1] - 此举与阿里云在大模型领域的开源策略类似,旨在通过开源建立公司在具身智能领域的行业影响力 [4] - 公司成立时旨在打造领先的机器人产品,如今其战略野心已扩展至具身智能的基座领域 [4] 开源模型的技术细节与功能 - **LingBot-VA**:提出自回归视频-动作世界建模框架,将大规模视频生成模型与机器人控制深度融合,使机器人能“边推演、边行动” [1] - **LingBot-Depth**:与奥比中光合作,攻克机器人视觉难题,使其能精准抓取透明反光物,更清晰地“看清楚”物理世界 [2] - **LingBot-VLA**:是蚂蚁开源的第一款具身智能基座模型,实现了跨本体、跨任务的泛化能力,推动“一脑多机”走向可规模化落地 [2] - **LingBot-World**:为具身智能、自动驾驶及游戏开发等场景创造高保真、可交互的虚拟训练环境,在多项关键指标上可对标Google Genie 3 [2] 开源策略的行业影响与目标 - 除了模型权重,蚂蚁在LingBot-VLA的开源中还同步开放了包含数据处理、高效微调及自动化评估在内的全套代码库 [4] - 此举旨在降低开发者的模型训练周期和成本,降低商业化落地的算力与时间门槛 [4] - 公司认为高效的具身基座模型是具身智能大规模应用的关键,期待加速技术迭代与规模化应用,助力AGI(通用人工智能)更快到来 [4] 行业现状与未来竞争格局 - 具身智能技术仍在经历从实验室走向千行百业的难关 [1][4] - 蚂蚁等大型科技公司的AGI战略向物理世界延伸,或将加速这一进程 [4] - 未来具身智能的产业竞争将从“技术卡位”进一步蔓延至全栈能力与生态协同的建设之中 [4]
致敬行业领军人物 新浪财经“为中国经济点赞——企业家之夜”圆满落幕
证券日报网· 2026-01-30 19:33
文章核心观点 - 活动回顾2025年中国经济发展脉络,表彰在硬核创新、深耕传承、筑牢产业根基等领域做出贡献的企业家,展现中国经济高质量发展的动力 [1] 辟新境:硬核创新与产业突破 - 智谱公司从清华实验室起步,其2025年推出的GLM-4.7大模型已跻身世界领先水平,公司致力于AGI(通用人工智能)领域的长期发展 [1] - 珍酒李渡集团推动中国白酒国际化,目前中国白酒出口量的五分之一销往韩国,公司计划持续拓展海外市场 [1] - 乐刻运动在2025年经历发展彷徨,2026年计划深耕产品与服务,目标超越国际同类企业 [2] - 华熙生物在2025年实现了系统性能力沉淀,将生命科技与生活方式结合,2026年计划引入AI智能体,聚焦衰老干预与组织再生领域 [2] - 乐华娱乐在2025年拓展了潮玩板块,2026年计划转型为结合机器人、AI与潮玩的综合性公司 [2] 传薪火:深耕领域与传递温暖 - 阿那亚公司12年来深耕社区建设,注重人际连接,未来将继续以长期主义理念发展 [2] - 浙江强脑科技深耕脑机接口技术十年,核心使命是帮助肢体残疾、失眠及自闭症儿童等群体,目前已帮助上万人安装假肢 [2] - 汇天公司坚持12年研发飞行汽车,目前拥有2000人的研发团队,量产产线已调通,计划2026年底开始交付产品,全球订单已达7000台 [2] 铸乾坤:关键资源与产业根基 - 紫金矿业创始人用44年时间,从1万元启动资金将公司发展为市值万亿的国际化企业,目前其海外业务规模已全面超越国内业务,全球竞争力居行业前列 [3] - 中国飞鹤深耕乳品行业64年,打造全自控产业链,实现11种核心原料100%自产,并建立了全球最大的母乳数据库,公司凭借对中国母乳的研究和新鲜优势,占据国内20%的市场份额 [3] - 潍柴动力80年来从单一发动机厂发展为跨国集团,累计研发投入近400亿元,其柴油发动机热效率四次登顶全球,同时布局新能源与替代燃料领域,其最新款发电用柴油机在数据中心领域市场前景广阔 [4]
马斯克真没吹牛!世界模型 Genie 3 一键打造 GTA6 不是梦
搜狐财经· 2026-01-30 17:25
技术架构与原理 - 项目本质上是一个实时渲染的交互环境,其技术底座由三部分组成:负责图像控制的Nano Banana Pro、负责理解语言指令的Gemini模型,以及负责物理反馈的Genie 3模型[1] - 其机制类似于人类做梦,由计算机构建一个包含视听触觉的沉浸式虚拟世界,允许用户进入互动[3] - 与基于文本统计规律的模型不同,Genie 3本质上是一个“物理世界模型”,它通过观看几百万次物体运动视频,自行学会了重力、惯性等物理规则,而非学习物理公式[3] 产品功能与体验 - 体验方式简单:用户可将照片转换为特定风格的角色并上传,通过输入场景描述(如“沙漠场景”)来生成环境,随后以该角色身份在场景中自由探索[5] - 用户可预览环境并调整视角,使用键盘方向键控制时,系统会实时预测并生成前方的路径和场景,过程类似玩游戏,但用户同时是世界的导演[5] - 目前产品处于开发阶段,单次探索时间被限制在60秒,时间过长会导致画面逻辑崩坏、产生幻觉,且实时生成的计算成本极高[6][8] - 场景可随时通过修改指令进行切换(如从沙漠变为赛博城市),角色的动作逻辑会保留[8] - 有用户试玩反馈存在延迟,自定义提示未生效,只能使用官方预设内容,且物理规律模拟不够准确,穿模或轨迹怪异的情况常有发生[10][11] 行业影响与前景 - 该技术路径被视为“实时视频生成”,未来可能与基于代码的传统游戏引擎分庭抗礼[10] - 行业观点认为,2026年将是世界模型爆发之年,该技术让“普通人在几分钟内生成《GTA6》”这类判断听起来不再遥远[8][10] - 项目的核心野心在于解决AI通往通用人工智能(AGI)道路上的关键瓶颈:数据枯竭与具身智能瓶颈[12] - 互联网高质量文本数据即将耗尽,且机器人无法仅通过阅读学习物理技能,而该项目可作为无限的合成数据生成器,模拟十亿个不同的环境(如厨房、仓库),让机器人在其中积累“肌肉记忆”后再应用于现实[13] - 类似的技术路径还包括蚂蚁灵波开源的LingBot-VA模型,它能在生成画面的同时推演动作序列,提升机器人执行如制作早餐、拾取物品等任务的能力[13] 潜在应用场景 - 在心理治疗与教育领域具应用潜力:例如,生成“满是蜘蛛的房间”帮助孩子在安全虚拟环境下进行脱敏练习;或在历史课上生成18世纪的巴黎街道让学生亲历其境[15] - 尽管目前存在画质粗糙、时长短、延迟高、无法多人联机等问题,但该技术被认为推开了通往物理现实模拟的大门[15]