Gemini 3 Pro
搜索文档
Meta还差买个灵魂
新浪财经· 2025-12-30 13:58
来源:胡延平 并购Manus不是胜负手也不是关键手;2026年业界会有多起围绕原力的并购和战事发生;只有模型才有 原力,只有原力才有灵魂,原力之战是竞争主线,需要买个灵魂的不止Meta。Meta万事俱备,只差给 力模型。 Meta收购Manus消息瞬间刷屏,各类溢美之词把正向角度都穷尽了,探讨几个反向观点: 1.买入Manus不是胜负手,此前148亿美元收购Scale AI也不是。 2.Meta的AI拼图,最薄弱的反倒是内围核心——基础模型。 3.Manus对直接面向用户争夺超级入口有利,但没有"原力"驱动。只有模型才有原力,只有原力才有灵 魂,智能体其实并没有。Meta收购Manus,收购的是其调动和使用模型原力的能力的团队,而不是原生 技术能力,更不是原力,智能体只是站在原力肩膀上的应用。订阅方面形成的现金流营收只是个价值背 书,不是价值重点。智能体没有护城河,智能体技术体系与竞争格局也远未定局,还在快速迭代中。 4.Manus、Scale AI只是补齐Meta相对较弱的短板,尤其Scale AI防御有余,进攻不足,用Manus去进攻 也是说笑。 5.头部AI大厂早已进入体系之战,全栈全生态打法,Meta ...
老黄200亿「钞能力」回应谷歌:联手Groq,补上推理短板
量子位· 2025-12-28 14:59
英伟达的战略收购与市场背景 - 英伟达计划以200亿美元收购AI芯片公司Groq,以应对来自谷歌TPU等新芯片范式的竞争威胁,标志着其在AI新时代的重大布局[1][2][3] - 谷歌通过自研TPU成功降低了对英伟达GPU的依赖,削减了训练和推理成本,并在服务大量免费用户时保持了健康的财务状况[28] - 谷歌Gemini 3 Pro的成功证明了GPU并非AI时代的唯一解决方案,芯片需要根据技术发展的不同阶段进行调整[29] Groq LPU的技术优势与市场定位 - Groq的LPU在推理任务,特别是解码阶段,其速度远超GPU、TPU及现有ASIC,比GPU快100倍,单用户处理速度可达每秒300-500个token[6][21] - LPU采用集成在芯片上的SRAM,避免了从片外HBM读取数据的延迟,从而能保持满负荷运转,解决了GPU在解码时因等待数据而导致算力闲置的问题[7][18][19][21] - 市场对低延迟推理存在巨大且高速成长的需求,Groq的业绩证明了“速度”是一个真实存在的付费市场[28] LPU的架构局限与成本挑战 - LPU的片上SRAM容量远小于GPU的HBM,单颗Groq LPU芯片仅有230MB SRAM,而英伟达H200 GPU配备了141GB HBM3e显存[24][25] - 由于单芯片内存容量小,运行大型模型需要大量LPU芯片集群,例如运行Llama-3 70B模型需要数百颗LPU,远多于GPU方案所需的2-4张卡,导致硬件占地面积和总投资巨大[26][27] - 推理芯片被认为是高销量、低利润的业务,与英伟达GPU高达70-80%的毛利率形成鲜明对比[34] AI推理市场的技术需求与竞争格局 - AI推理过程分为预填充和解码两个阶段,对芯片能力有不同要求:预填充阶段需要大上下文容量,适合GPU的并行计算;解码阶段是串行任务,对低延迟要求极高,GPU架构因依赖HBM而存在瓶颈[11][12][14][16][17] - 随着基础模型进展放缓,AI竞争重点从训练转向应用层,应用市场的用户体验对“速度”至关重要[30] - 通过收购Groq,英伟达旨在弥补其在低延迟推理场景的短板,防御潜在颠覆者,并进军竞争对手涌现的推理市场[28][31][32]
图数室丨回看2025,AI那些“封神”瞬间
新浪财经· 2025-12-26 17:28
行业核心观点 - 2025年是人工智能从实验室概念大规模落地到现实应用、走入亿万人生活的“全民AI元年”,AI从“看起来很聪明”转变为“真正开始接管现实世界” [2] 大模型技术突破与迭代 - 深度求索(DeepSeek)于1月20日推出新一代大模型R1,给全球AI界带来“地震” [4] - DeepSeek在5月29日完成R1模型的小版本升级,模型的思维深度与推理能力显著提升 [8] - 深度求索发布新模型DeepSeek-Math-V2,这是全球首个以开源形式达到国际奥林匹克数学竞赛金牌水平的数学推理大模型 [12] - OpenAI于3月25日正式推出基于GPT-4o模型的原生图像生成功能 [6] - OpenAI于8月7日正式发布GPT-5系列模型 [8] - OpenAI于11月13日发布GPT-5.1系列模型,包括即时版和思考版 [12] - 谷歌于3月25日发布号称最强推理模型的Gemini 2.5 Pro [6] - 谷歌于11月18日发布Gemini 3 Pro,可同时处理文本、图像和音频,支持生成杂志风格的可浏览页面或定制化动态布局界面 [12] - Anthropic于5月22日正式推出Claude 4系列大模型 [8] - xAI于2月17日发布最新人工智能模型Grok 3 [6] - 字节跳动旗下火山引擎于10月16日发布新版豆包大模型1.6更新版,成为国内首个支持“分档调节思考长度”的模型 [8] - 截至7月,中国已有433款大模型完成备案并上线 [8] AI智能体与操作系统 - Manus于3月6日正式发布,被广泛认为是首个“真正意义上的通用AI Agent” [6] - OpenAI于7月18日推出全新智能体产品“ChatGPT Agent” [8] - 字节跳动于12月1日发布豆包手机助手技术预览版,开始探路“AI操作手机” [10] 机器人技术发展 - 宇树科技Unitree H1“福兮”机器人于1月28日在春晚舞台上身着喜庆花袄大秀秧歌技艺 [6] - 4月13日,北京举行全球首个人形机器人半程马拉松赛,人形机器人“天工”以2小时40分42秒的成绩夺冠 [6] - 6月7日,2025智源大会召开,人形机器人量产成为现实 [8] AI应用与产品落地 - Perplexity于7月9日推出Comet,一款原生AI网络浏览器,集成搜索与助手功能 [8] - AI音乐生成模型Suno V5发布,将AI音乐生成质量提升至录音室级别 [10] - OpenAI于9月20日正式发布Sora 2 [8] - 特斯拉于6月27日成功完成了Model Y汽车首次“全自动驾驶交付” [8][9] 基础设施与前沿项目 - OpenAI、甲骨文、日本软银于9月23日联合宣布,联手打造的“星际之门”项目将在美国新建5个AI数据中心 [8] - 谷歌公司于11月5日首次公开“太阳捕手”计划,试图打造基于太空的机器学习“数据中心” [12] 行业监管与法律 - 欧盟《人工智能法案》于8月正式生效,成为全球首个系统性的AI监管框架 [8] - 4月17日,全国首例涉及AI模型结构和参数保护的案件正式生效 [6] 跨学科研究 - 美国弧形研究所、英伟达、斯坦福大学等机构的科研人员于2月19日共同开发的AI生物学模型Evo 2正式发布 [6]
游戏AI来了,英伟达新模型看直播学会所有游戏,GPT-5.2秒杀塞尔达
36氪· 2025-12-25 15:06
英伟达NitroGen模型的技术突破 - 公司发布名为NitroGen的新模型,其核心逻辑类似于特斯拉FSD的“端到端”模式,通过视觉输入直接产生操作输出,而非依赖游戏后台数据[1] - 模型通过观看YouTube和Twitch上总计4万小时带有手柄画面叠加的游戏实况视频进行学习,将游戏画面与手柄按键动作进行对应[3][7][10] - 该模型学习了超过1000款不同的游戏,旨在成为一个“通才”,而非针对单一游戏的“专才”[11] 模型性能与通用性 - 当被置于一款从未见过的新游戏中时,NitroGen的表现比从零训练的模型强了52%[14] - 模型能够处理多种游戏类型,包括动作RPG、平台跳跃和Roguelike等,并展现出快速上手的“游戏直觉”[11][14] 在游戏领域的应用与影响 - 结合类似GPT-5.2-Thinking等大模型的强大推理能力,NitroGen等技术预示着AI可能终结人类撰写游戏攻略和软件文档的时代[18] - 未来AI不仅能玩游戏,还能自动记录、复盘并生成“白金攻略”,甚至自动修复游戏Bug[18] - 视频游戏已从AI测试基准演变为物理智能的训练场,是机器人技术跨越“莫拉维克悖论”的关键转折点[25][26] 向机器人技术与具身智能的延伸 - NitroGen是基于英伟达的GR00T机器人基础模型构建的,标志着公司将其在虚拟世界的技术积累向物理机器人领域延伸的野心[20] - 该研究为解决具身智能的数据匮乏瓶颈提供了新路径:利用互联网规模的游戏视频数据(4万小时,覆盖1000多种游戏)来训练通用的运动控制策略,这被类比为机器人学习的“ImageNet时刻”[27][36][39][40] - 游戏世界中的“感知-决策-行动”闭环与物理机器人完全同构,是高效的“练兵场”,能为机器人打造应对混乱现实的“通用大脑”[22][29] 通用智能体的分层架构愿景 - 未来的通用智能体可能采用分层架构:顶层(大脑)由类似GPT-5.2的推理模型负责长程规划和逻辑理解;中层(小脑)由类似NitroGen的通用策略模型负责将指令翻译为具体运动轨迹;底层(脊髓)由基于GR00T的控制器负责高频的全身控制和平衡维持[43][44][45] - 通过“在游戏中学会控制,在仿真中学会物理,在现实中学会适应”的路径,实现通用智能体的发展[43]
GPT-5争议、开源追赶、能力飞跃:Epoch AI年终报告揭示AI能力加速
36氪· 2025-12-25 11:36
12月25日消息,专注于人工智能基准测试的非营利组织Epoch AI发布的年终报告显示,整体来看,AI模型的能力正在快速提升。 顶尖国际模型如GPT、Gemini在专家级数学难题FrontierMath上表现优异,但在真正高难度问题面前仍未满分,显示出推理能力仍有提升 空间。与此同时,AI推理能力和强化学习的进步让增长速度几乎翻倍,成本大幅下降,许多模型已能在消费级硬件上运行。 在此背景下,中国开源大模型也有所进步,但与国际顶尖模型相比仍存在明显差距。在FrontierMath测试中,绝大多数中国模型几乎未能 得分,最高也只有DeepSeek-V3.2取得约2%的成绩。这表明,中国模型虽然在追赶,但在处理真正复杂难题时仍面临挑战。 01 中国模型的"七个月追赶":开源力量正在重塑格局 中国模型的最高分仍落后全球前沿水平约七个月 在Epoch AI的FrontierMath最新评测中,中国开源模型交出了一份令人瞩目的答卷。FrontierMath是一个由专家数学家精心设计的高难度 数学基准测试,涵盖数论、实分析、代数几何、范畴论等现代数学主要分支。完整数据集包含350道问题,其中300道为基础集(第1-3 层) ...
腾讯研究院AI速递 20251225
腾讯研究院· 2025-12-25 00:01
生成式AI开源与能力演进 - Anthropic开源Skills官方知识库,包含16个生产级技能库,涵盖文档处理、创意设计和开发技术类,并包含可创建新技能的skill-creator元技能,极大降低自定义门槛[1] - 字节跳动Seed团队推出Seed Prover 1.5,通过大规模Agentic RL训练,在16.5小时内针对IMO 2025前5题生成完整Lean证明代码,换算成绩35/42达金牌分数线,在Putnam 2025测试中9小时完成12题中的11题,在完整Putnam历史评估集解决88%问题[2] - 通义百聆开源新一代语音交互模型Fun-Audio-Chat-8B,在多项权威基准测评中斩获SOTA,采用创新双分辨率端到端设计,音频帧率降至业界最低5Hz,节省近50%GPU计算[3] AI Agent与交互范式创新 - Second Me发布1.1版本,重塑对话框使AI从“被动回复”转向“主动交付”,可根据上下文和情绪温度主动推送社交玩法,通过独创身份模型建模,可调用真实身份信息和记忆创作内容[4] - Notion已有700多个智能体与千名员工协作处理重复性工作,其联合创始人西蒙已成为效能提升30-40倍的工程师,同时指挥3-4个AI编码智能体[9] - 谷歌将2025定义为AI Agent、推理和科学发现的一年,Gemini 3 Pro在LMArena排行榜榜首,Gemini 3 Flash质量超越上一代Pro规模模型但价格仅为一小部分且延迟显著降低[7] 具身智能与硬件产品突破 - Vbot超能机器狗发布会全网直播热度超千万,上线仅52分钟订单突破1000台,创万元级具身智能产品达成纪录[5] - Vbot超能机器狗搭载128TOPS端侧AI算力(是主流竞品3倍以上)、自研N45高永磁电机(峰值扭矩24.5Nm),续航5小时,支持240W超级快充,可运行13.3km/h马拉松配速,9988元创始权益价打破高性能机器狗高价魔咒[6] - 谷歌在机器人技术方面取得重大进展,包括Gemini Robotics和Genie 3[7] AI技术发展趋势与行业影响 - Epoch AI年终报告显示,自2024年4月起AI能力增长速度明显加快比之前快近一倍,LLM推理价格下降10倍以上,顶级开源模型与顶尖AI差距不到一年,英伟达芯片算力每10个月翻倍[10] - 报告指出AI最大价值可能来自对经济体系工作的广泛自动化而非加速研发,2024-2025年能力爆发式提升可能很快放缓[11] - 图灵奖得主Bengio认为认知型工作更易被AI取代,机器人技术虽暂时落后但只是时间问题,即便“水管工”等体力工作也只是暂时安全[7] - Notion CEO将AI比作无限心智的时代材料,认为知识经济将像钢铁和蒸汽改变城市一样被AI重塑,未来组织将跨越数千智能体与人类、跨时区持续运转[9]
谷歌母公司重金“砸”算力 意图在人工智能竞赛中缩小差距
北京商报· 2025-12-24 09:32
核心观点 - 谷歌母公司Alphabet以47.5亿美元现金收购数据中心和能源基础设施公司Intersect,旨在加速数据中心和电力设施建设,以支持其人工智能领域的扩张并应对激烈竞争 [1][3] 战略收购与资产整合 - Alphabet将以47.5亿美元现金收购Intersect,并承担其相关债务,交易预计在2026年上半年完成 [1][4] - 收购将获得Intersect正在开发的数据中心项目及数吉瓦规模的能源资产,并吸纳其核心团队 [3] - Intersect在交易后将保持独立运营,由其创始人兼首席执行官继续领导,并与谷歌技术基础设施团队密切合作 [3][4] - Intersect在加州及得克萨斯州的部分运营及在建资产不包含在此次收购范围内 [4] 数据中心与能源基础设施扩张 - 此次收购旨在帮助Alphabet更快地投建新的数据中心及电力设施 [3] - Intersect将探索多种新兴能源技术,以扩大并多元化能源供应,支持谷歌在美国的数据中心投资 [3] - 谷歌与Intersect此前已有战略合作,目标是在美国开发数吉瓦规模的数据中心产能,并计划在本十年末之前投资200亿美元用于可再生能源基础设施建设 [3] - 谷歌近期在全球范围内加码数据中心投资,包括计划向印度南部投资超100亿美元建设1吉瓦规模的数据中心,以及投资10亿美元在泰国建立数据中心 [5] 人工智能竞争背景与战略动机 - 谷歌在人工智能领域面临激烈竞争,主要对手包括OpenAI [1][6] - OpenAI为满足自身需求,已投入超过1.4万亿美元用于建设数据中心 [6] - 谷歌联合创始人坦承公司在AI浪潮初期因过于保守和迟疑而错失先机,给了OpenAI机会 [7] - 收购Intersect被视为谷歌保持竞争力、加速算力部署、降低运营成本、确保能源供应稳定的重要战略行动 [5][6] - 公司首席执行官表示,此次收购将帮助扩大产能,灵活建设发电设施以匹配数据中心负荷增长,并重新构想能源解决方案 [6] 产品与技术进展 - 谷歌近期发布了更具效率、更经济的人工智能模型Gemini 3 Flash,以取代原有的Gemini 2.5 Flash [7][8] - Gemini 3 Flash在基准测试中分数高于Gemini 3 Pro,运行速度达到Gemini 2.5 Pro的3倍,成本仅为Gemini 3 Pro的四分之一 [8] - Gemini 3 Flash定价为每百万输入令牌0.5美元、每百万输出令牌3美元,并已成为谷歌搜索中AI模式的默认模型 [8] - 谷歌搜寻允许用户在AI模式中使用更高级的Gemini 3 Pro模型及图像生成工具 [8] - 谷歌计划于2026年推出与三星合作制造的、基于“世界模型”技术的AI智能眼镜,旨在实现从语言处理向物理世界交互的范式转变 [9]
Will Google Pass Nvidia in 2026 as the World’s Biggest Company?
Yahoo Finance· 2025-12-24 02:25
市场地位与竞争格局 - 谷歌母公司Alphabet现已成为领先的人工智能软件公司 并已超越微软[3] - 公司市值距离超越苹果成为全球第二大公司已不足2000亿美元[3] - 在LLMArena排名前十的人工智能模型中 谷歌占据四席 而OpenAI的最佳模型仅排名第八[7] - 在文本模型之外 谷歌最新的Nano Banana Pro图像模型表现远超OpenAI的GPT图像模型 并在文生视频模型领域处于领先地位[8] 业务发展驱动力 - 尽管微软将Bing搜索引擎与ChatGPT整合 但用户并未抛弃谷歌 因为ChatGPT无法提供与直接搜索相同的可靠性[6] - 公司初期推出的Bard模型虽令人失望 但此后取得了显著进展 其Gemini 3 Pro模型的发布使OpenAI进入“红色警戒”模式[7] - 谷歌不仅在软件领域领先 也已开始进军人工智能硬件行业并获得订单[4] 硬件业务进展 - Meta正在就价值数十亿美元的谷歌张量处理单元采购进行谈判[9] - Anthropic已从谷歌购买了100万颗张量处理单元 而非从英伟达购买[9]
谷歌母公司重金“砸”算力
北京商报· 2025-12-23 23:10
收购交易核心信息 - 谷歌母公司Alphabet以47.5亿美元现金收购数据中心和能源基础设施公司Intersect,并承担其相关债务 [1] - 交易预计在2026年上半年完成,但需满足常规交割条件 [3] - 交易完成后,Intersect将保持独立运营,并由其创始人兼首席执行官Sheldon Kimber继续领导 [2] - 此次收购不包括Intersect在加州的运营及在建资产,以及其在得克萨斯州已有的部分运营资产 [3] 收购的战略目的与资产 - 收购旨在加速数据中心建设与能源供应布局,以支持人工智能领域发展 [1][4] - 通过直接控制数据中心及电力基础设施,公司能更快部署AI算力资源,降低运营成本,并确保能源供应稳定 [4] - 公司将收购Intersect正在开发中的数据中心项目,以及数吉瓦规模的能源资产,并吸纳其核心团队 [2] - Intersect将探索多种新兴能源技术,以扩大并多元化能源供应,支持公司在美国的数据中心投资 [2] - 公司此前已持有Intersect的少数股权,双方曾计划在本十年末之前投资200亿美元用于可再生能源基础设施建设 [2] 人工智能领域的竞争背景 - 公司在人工智能领域面临激烈竞争,主要对手包括OpenAI [1] - OpenAI已投入超过1.4万亿美元用于建设数据中心 [5] - 公司联合创始人谢尔盖·布林坦承,公司在AI浪潮初期因担心产品风险而在算力扩展和产品化上投入保守、迟疑不决,这给了OpenAI市场机会 [6] 为保持竞争力采取的其他举措 - 上个月,公司拟发行至少30亿欧元债券,为AI扩张计划融资 [3] - 公司计划向印度南部地区投资超100亿美元,建设一座1吉瓦规模的数据中心 [3] - 公司在2024年底宣布计划投资10亿美元在泰国建立先进的数据中心 [3] - 公司近期发布了更具效率、成本更低的人工智能模型Gemini 3 Flash,其运行速度达到Gemini 2.5 Pro的3倍,成本仅为Gemini 3 Pro的四分之一 [7] - 公司计划于2026年推出与三星合作制造的、基于“世界模型”技术的AI智能眼镜,旨在实现AI与物理世界的交互 [8]
倒反天罡,Gemini Flash表现超越Pro,“帕累托前沿已经反转了”
36氪· 2025-12-22 18:12
Gemini 3 Flash性能表现 - 在SWE-Bench Verified测试中获得78%的分数,超越自家旗舰Gemini 3 Pro的76.2% [1][5] - 在AIME 2025数学测试中,结合代码执行能力得分高达99.7%,逼近满分 [5] - 在Humanity's Last Exam测试中,不使用工具得分为33.7%,与Pro版37.5%的成绩处于同一梯队 [5] - 在多项核心基准测试中表现超越上一代旗舰Gemini 2.5 Pro,并在编程和多模态推理等维度反超GPT-5.2 [5] - 响应速度是Gemini 2.5 Pro的3倍,Token消耗量减少30% [7] 产品定价与成本效益 - Gemini 3 Flash输入价格为每100万Token 0.50美元,输出价格为每100万Token 3.00美元 [2][6] - 价格高于Gemini 2.5 Flash(输入0.30美元/百万Token,输出2.50美元/百万Token),但考虑到性能和速度提升,仍具吸引力 [7] - 其成本显著低于Gemini 3 Pro(输入2.00美元/百万Token,输出12.00美元/百万Token) [2][6] - 在竞品中,其输入成本低于Claude Sonnet 4.5 Thinking(3.00美元/百万Token)和GPT-5.2 Extra high(1.75美元/百万Token),但高于Grok 4.1 Fast Reasoning(0.20美元/百万Token) [6] 技术战略与模型发展路径 - 公司团队揭示战略逻辑:Pro模型的主要作用是“蒸馏”出Flash模型,探索智能上限,而Flash则通过蒸馏技术继承Pro能力并优化延迟、成本和吞吐量 [8][9][11] - 未来Pro模型可能主要作为“生成器”,专门生产高质量的Flash模型 [11] - 团队认为Scaling Law并未失效,通过持续扩大规模仍能实现性能飞跃,前方“看不到墙” [11] - 未来扩展重点将从预训练阶段的算力堆叠,转移到推理侧的扩展(Test-time Compute) [12] - 后训练(Post-training)被认为是目前最大的“未开垦绿地”,在开放式任务上提升空间巨大 [12] 行业影响与技术启示 - Flash的表现打破了“模型越大越好”和“参数至上”的迷信,证明了更便宜、更快的模型可以更聪明 [3][13] - 这一结果标志着“帕累托前沿”发生反转,挑战了行业对“旗舰版”的盲目崇拜 [3][14] - 技术关键在于强化学习,Flash集成了最新的Agentic RL研究成果,而非Pro的简单蒸馏版 [13] - 证明提升模型能力不单纯依赖堆砌参数,通过先进的后训练算法(如RL),小模型可实现“降维打击” [14]