Workflow
AGI
icon
搜索文档
没了遥控器,还被扔进荒野,具身智能该「断奶」了
机器之心· 2025-12-09 11:17
文章核心观点 - 在真实、复杂的户外场景中,当前机器人的自主能力面临严峻挑战,频繁“翻车”,特别是在感知与操作方面存在显著短板 [4][8][9] - 行业普遍高估了人形机器人的通用能力,短期内(如五年内)走进家庭承担家务的目标难以实现 [11] - 实现具身智能真正落地的“必选项”是让机器人“丢掉遥控器”,具备全自主的感知、决策与执行能力 [11] - 尽管面临挑战,但比赛中部分机器人的成功表现(如完成500米全自主定向越野)也展示了技术进步的真实希望 [57][59][65] 感知能力面临的困境 - 户外光照变化严重影响机器人视觉感知,强光下深度相机(如RealSense)的主动光结构几乎失效,导致机器人无法识别透明或反光物体(如矿泉水瓶、白色水壶)[14][16] - 复杂变量(如透明与反光、材质差异、颜色变化、光照波动)使得操作任务极其困难,抓取香蕉和矿泉水瓶对机器人而言是完全不同的任务 [23] - 机器人严重缺乏真实的物理信息与触觉反馈,而触觉在人类操作行为中与视觉同等重要 [23] - 部分队伍通过回归“传统视觉+几何”路线并极致打磨,或在高保真模拟器中复现真实噪声,成功实现了复杂任务(如垃圾分拣、吊桥穿越)的全自主完成 [26][28] 智能决策与任务规划能力不足 - 当前多数机器人被形容为只有“20岁身体,3岁智商”,缺乏在开放环境中进行长链任务规划与决策的能力 [31] - 复杂的长链任务(如自主浇花包含8个子任务)难倒了所有参赛机器人,没有一台能实现全自主完成 [32] - 即使采用大模型(VLA模型)进行高层语义理解,其在真实场景中的物理细节理解与操作精度仍不足,导致队伍不得不依赖遥操 [34] - 机器人在任务流程中缺乏异常处理能力,一旦某个环节出错(如水龙头卡住、道具形变),就会陷入停滞,无法自主调整 [37][38][40] 硬件与算力瓶颈 - 主流系统架构采用“大模型+小模型”协同范式,但异构算力(CPU、GPU、NPU)集成面临体积、功耗与高效协同的挑战 [51][52] - 算力不足是突出限制,即使采用豪华端侧配置(如一台Intel NUC主控加两块英伟达算力板),仍面临延迟高、耗电大的问题,无法支撑更大规模模型推理 [52][53] - 实现高质量感知和自适应控制(如力控、重心实时调整)需要更高的算力和更优的本体性能,目前仍有差距 [56] - 行业需要低功耗、高性能的专用芯片和轻量化模型,以让机器人的身体能承载其大脑的智能 [56] 不同机器人形态的发展差异 - 四足机器人在“能走”这一维度已取得质变,有两台四足机器人在比赛中成功完成了500米级、充满挑战的自然地形全自主定向越野 [59][61] - 双足/人形机器人在平衡、力控、地形适应方面远比四足困难,重心高、支撑面小,技术挑战更陡峭,发展道路更长 [61][62][64] - 机器人要真正进入人类世界,需同时具备“能走、能操作、能改造环境”三大能力,目前后两者仍有巨大研究空间 [61] - 在吊桥穿越任务中,面对50cm间隙,四足机器人选择直接跳过,而双足机器人需借助工具(如移动木板)才能通过,这体现了高级智能行为的差距 [43][44][45][49] 赛事价值与行业方向 - 赛事设计直面真实世界的扰动,旨在系统验收机器人的核心能力,并通过碰撞暴露其真正弱点,从而指引行业突破方向 [65][66] - 人工智能的未来方向是机器智能与物理世界的深度融合,AI必须从数据认知走向环境交互和行动执行 [66] - 失败(“翻车”)是进步过程中的正常现象,是迈向成功的必要步骤 [65]
对话金沙江创投朱啸虎:直面AI浪潮下的激流与暗礁
新浪财经· 2025-12-09 10:41
专题:未竟之约:张小珺访谈录 由新浪财经 、微博着力打造,微博财经 × 语言即世界工作室联合出品的泛财经人文对话栏目《未竟之 约》首期深度访谈即将上线。主持人张小珺对话金沙江创投主管合伙人朱啸虎,直面AI浪潮下的激流 与暗礁。 以下为对话实录: 张小珺:Hello,大家好,我是小珺。欢迎来到微博财经与语言及世界工作室联合出品的高端人物访谈 节目《未尽之约》,我们希望和还未完成愿望的人一起去抵达还未完成的旅途。 2024年3月,我曾经发表过一篇报道,叫作《朱啸虎讲了一个中国现实主义AIGC故事》,那使他以犀利 的观点为人所熟识。那么今天,我们将继续记录他在这波全球AIGC浪潮中的新鲜的辛辣的观。 辛辣的观察。 新鲜的辛辣的观察。 今天,我们将继续记录他在这波全球AIGC浪潮中的新鲜的、辛辣的观察。 哈喽Allen,先给观众朋友们打个招呼。 朱总:大家好。 张小珺:这是我们近两年的第三次聊天,也是《朱哮虎讲了一个中国现实主义AIGC故事的第三次连 载》,我们想持续记录你在这波AI浪潮中的观察笔记。 朱啸虎:chatGPT会成为一个超级入口,对META构成威胁 张小珺:ChatGPT会成为一个新的超级入口吗? 那从 ...
谷歌突砍Gemini免费版炸锅,数据养模遭背刺?GPT-5.2突袭Gemini 3,Demis Hassabis:谷歌须占最强位
AI前线· 2025-12-08 15:18
谷歌收紧Gemini API免费政策 - 谷歌大幅收紧Gemini API免费层级的限制,Pro系列已取消,Flash系列每日请求次数从250次降至仅20次,对小型项目开发者造成打击[2] - 谷歌已从其“批量API速率限制”列表中删除了Gemini免费API项,标志着免费API的彻底结束[3] - 此前,谷歌曾推出极具吸引力的免费套餐,例如Gemini 1.5 Flash每天提供高达15亿个免费Token,包括每分钟15次请求、每分钟100万个Token以及每天1500次请求的权限[4] 开发者反应与谷歌策略转变 - 政策变动未提前告知,导致依赖该服务的自动化脚本和实验性项目突然停摆,引发开发者不满[5] - 开发者认为谷歌在通过免费政策收集足够数据并取得领先优势后,正转变策略以推进盈利,开始进行付费转化[5] 大模型竞争格局与性能对比 - 竞争激烈,OpenAI计划将GPT-5.2的发布时间从12月底提前至12月9日,以回应谷歌Gemini 3[6] - 网传基准测试数据显示,GPT-5.2在多项评测中领先于Gemini 3 Pro,例如在Humanity‘s Last Exam(学术推理)上得分67.4%,而Gemini 3 Pro为37.5%[7] - 谷歌Gemini 3 Flash已登陆LM Arena,被视为对标GPT-5.2的产品[7] - 截至2025年底,用户在桌面和移动网页端使用Gemini的平均停留时长达到约7.2分钟,首次超过ChatGPT的约6分钟[6] 谷歌对Gemini 3的评价与未来方向 - 谷歌对Gemini 3的个性、风格和能力表示满意,认为其实现了阶跃式的智能提升,尤其在简洁回答和合理反驳方面[11] - Gemini 3在游戏制作和前端/网站开发方面展现出强大能力,能够理解高层次指令并生成细致输出[12] - 谷歌未来的三个主要发力方向是:模态融合、世界模型和智能体系统[19][20] - 在模态融合方面,谷歌正推进多模态理解与生成,特别是视频处理能力,并开发如Gemini Live的实时交互功能[19] - 在世界模型方面,谷歌正在开发如Genie 3的交互式视频模型,可生成具有一分钟连贯性的模拟世界[20] - 在智能体系统方面,谷歌愿景是打造“通用助手”,并预计未来一年在可靠性上会有重大进展,使其能够完成完整任务[20][21] 谷歌的竞争决心与资源投入 - 谷歌DeepMind联合创始人兼CEO Demis Hassabis表达了与OpenAI竞争到底的决心,强调必须处于最强位置[10] - 公司持续需要更多算力以支持广泛研究,并主张将Scaling Law(规模定律)推到极限[13][14] - Hassabis认为,实现AGI可能需要五到十年,且除了规模化,可能还需要一两次类似Transformer级别的重大突破[14] 行业竞争态势与人才争夺 - 全球AI大模型竞争白热化,Hassabis认为美国与西方在算法创新上仍领先,但中国的领先优势可能只剩“几个月”而非“几年”[22] - 在AI人才争夺上,谷歌寻找“使命驱动”的人才,并凭借其全栈能力、顶尖研究、工程技术和基础设施吸引顶尖科学家与工程师[16]
哈萨比斯:DeepMind才是Scaling Law发现者,现在也没看到瓶颈
量子位· 2025-12-08 14:07
Scaling Law的现状与历史 - 谷歌DeepMind首席执行官哈萨比斯在Axios AI+峰会上力挺Scaling Law,认为其对于实现AGI至关重要[1][6] - 哈萨比斯指出,Scaling Law最早的发现者并非OpenAI,而是DeepMind团队,其内部在2017至2018年期间的研究已发现相关规律,并称之为“Chinchilla Scaling Laws”[6][14][17] - 基于对Scaling Law有效性的确认,DeepMind调整了研究方向并投入更多资源,这被认为是其在大模型领域取得成功、推动Gemini从1.0演进到3.0时代的关键[18] Scaling Law与AGI(通用人工智能)的关系 - 公司认为,无论AGI最终形态如何,Scaling都将是其中的关键组成部分,且当前Scaling尚未到达极限,有必要继续沿此路线将系统推向最大化[21][22] - 哈萨比斯提出,单靠Scaling Law也有可能达成AGI,因为大量数据和计算资源的投入是展现类人智慧能力的合理途径[7][23] - 同时,他也猜测实现AGI可能还需要一两个类似Transformer或AlphaGo级别的重大突破,并预测这个时间点可能在5到10年内[24][26] 对未来12个月AI发展的预测 - **多模态融合**:完整的多模态融合将是主流演进方向,谷歌DeepMind正全力推进,旨在通过交叉融合图像、视频、文本和音频来全面提升模型的推理和创造力[27][28][30] - **视觉智能突破**:以谷歌Nano Banana Pro等图像模型为例,视觉理解能力有显著进展,未来将在更丰富的分析、故事讲述和分步视觉推理方面继续探索[31][32][33] - **世界模型普及**:世界模型是行业关注重点,也是哈萨比斯个人的工作重点,例如谷歌8月上线的世界模型Genie 3,预计下一年该领域将持续受到业界关注[35][36][37] - **Agent可靠性提升**:哈萨比斯认为,现有Agent系统尚不完全可靠,但预计再有一年时间,Agent将能开始接近于可靠地完成委托任务[38][39][40] Gemini的发展与目标 - Gemini 3的成功验证了Scaling Law的有效性,其全网爆火被视为谷歌打了一场漂亮的翻身仗[4][5] - Gemini 3的独到之处在于个性化的深度、简洁的回答、温和反驳不合理观点的能力,并能一键式生成商业级游戏,展现了其基座架构在理解高层次指令和输出高精度细节方面的优势[43][44][45][46] - 公司对Gemini设定的最终目标是成为“通用万能助手”或“通用助手”,下一代Gemini将延续现有优势,出现在更多设备上并无缝融入日常生活,其使用频率将变得和使用手机一样频繁[9][41][46][47]
Google DeepMind CEO:AGI 还差 1–2 个突破?
36氪· 2025-12-08 10:42
AGI实现时间表与关键突破 - Google DeepMind CEO Demis Hassabis预测,通用人工智能(AGI)可能在5到10年内实现,距离AGI仅差一到两个AlphaGo级别的技术突破 [2][3][13] - 该预测并非基于模型参数规模,而是基于当前模型在理解能力、判断能力和创造能力方面的具体进展 [3][12] 当前AI模型已具备的核心能力 - 模型从文本专家进化为多模态理解系统,例如Gemini能够理解视频内容并解读动作背后的深层意图,展现出洞察能力 [3][4][6] - 模型具备独立的判断力,能够在被指出错误时进行温和反驳,显示出对上下文的理解和表达平衡能力,开始向稳定人格型系统靠近 [7][8][10] - 模型展现出产品级创造能力,例如能够一键生成可玩的小游戏原型或完整的前端网页,这需要其对代码结构、设计逻辑和交互体验有整体理解 [11][12] 当前模型与AGI的关键差距 - 模型不具备持续学习能力,无法在使用过程中通过互动成长或根据经验改正错误,在线学习和长期记忆系统是关键突破点之一 [16] - 模型无法执行长期规划,缺乏进行长链式推理和制定、执行多步长期目标的能力,底层结构并非为多步决策系统设计 [17][18] - 智能体系统仍不稳定,无法在复杂环境中可靠地执行多步骤任务,因此尚不能将整个任务完全委托给AI并确信其完成 [19][20] - 模型缺乏跨对话的稳定记忆,无法在多次互动中保持一致的立场、记住用户的长期偏好或根据上下文调节行为,这需要更底层的架构设计 [21][22] 实现AGI的关键技术路径 - 发展“世界模型”是核心路径之一,例如DeepMind的Genie模型能够生成具备物理一致性和时空连贯性的虚拟环境,使AI从理解画面跨越到理解物理规律和推演真实世界 [25][26][27] - 发展稳健的“智能体系统”是另一核心路径,目标是打造能够自主规划、执行任务并根据结果调整的AI,使其从回答问题转变为完成目标,并嵌入到各种生活与工作场景中 [28][29][30] - 单纯扩大大型语言模型(LLM)的规模不会带来AGI,真正的突破将来自世界建模和智能体系统的技术创新 [30] 全球AI竞争格局 - 中美在AGI研发上处于平行赛道,竞争窗口正在压缩,西方目前在算法和创新层面领先,但中国(如Qwen和DeepSeek模型)在技术能力、执行层面和迭代速度上紧跟,差距仅为几个月而非几年 [35][36] - 在AGI竞赛中,真正的护城河并非资金或GPU数量,而是将研究、工程和产品全链条打通的能力,安全是前提,速度是关键 [2][37] 领先AI公司的核心竞争优势 - 科学方法是根本优势,开发AI被视为运用科学方法逼近人类智能本质的过程,而非简单的技术进化 [39][40] - 领先公司(如DeepMind)采取不迷信单一路线的全面试错策略,同时探索强化学习、认知架构等多种技术路径,并严格追踪数据表现,其核心非技术资产是科学决策能力 [41][42][43] - 真正的竞争优势在于将世界级的研究、工程和基础设施三者深度融合,具备把从未被解决过的问题转化为真正可用产品的独特能力 [44]
谷歌祭出Transformer杀手,8年首次大突破,掌门人划出AGI死线
36氪· 2025-12-08 09:01
谷歌DeepMind对AGI发展路径的预测 - 谷歌DeepMind CEO Hassabis预测,具备或超越人类能力的通用人工智能(AGI)可能在2030年之前实现,距离实现AGI仅剩5到10年时间 [1][11] - 实现AGI需要1-2个类似Transformer或AlphaGo级别的重大技术突破 [1][4] - 通往AGI的道路存在风险,包括恶意使用AI可能导致的灾难性后果,甚至存在非零的灭绝级风险 [13] 当前AI系统的能力与局限 - 谷歌DeepMind对AGI的定义要求很高,需全面具备人类所有认知能力,包括创造力和发明能力 [16] - 当前大语言模型能力参差不齐,在某些领域达到博士水平甚至能获奥林匹克金牌,但在持续学习、在线学习、长期规划和多步推理等关键能力上存在明显缺陷 [16][18] - 谷歌Gemini模型已展现出超出预期的“抽象理解”和“元认知”能力,例如能理解电影场景的象征意义,但开发人员对其潜力的探索可能不足10% [14][15] 谷歌下一代AI架构Titans的技术突破 - 谷歌在NeurIPS 2025大会上发布了全新AI架构Titans,被视为Transformer的“最强继任者” [6][21] - Titans架构完美融合了RNN的极速响应和Transformer的强大性能,旨在解决Transformer在处理超长上下文时计算成本飙升的瓶颈 [7][24] - Titans引入了一种全新的神经长期记忆模块(一个深层多层感知机MLP),能够主动学习并即时更新参数,实现“测试时”记忆,在高达200万token的上下文中保持高召回率和准确率 [8][26][29][43] 统一理论框架MIRAS及新模型 - 谷歌同时提出了MIRAS理论框架,为序列建模提供了统一视角,将各种架构视为解决“融合新信息与保留旧记忆”核心问题的不同手段 [33][34] - MIRAS通过四个关键设计维度定义序列模型:记忆架构、注意偏置、保留门和记忆算法 [36][37] - 基于MIRAS框架,谷歌构建了YAAD、MONETA、MEMORA三款独特的无注意力模型,这些模型在语言建模和常识推理任务中表现出色,验证了探索非均方误差优化机制的优势 [40][41][42] Titans架构的性能表现 - 在多项基准测试中,Titans架构在同等参数规模下,性能优于最先进的线性循环模型(如Mamba-2和Gated DeltaNet)以及Transformer++基线模型 [40][41] - 在BABILong超长上下文推理基准测试中,Titans以更少的参数量,表现优于包括GPT-4在内的所有基线模型,并展示了可有效扩展到超过200万token上下文窗口的能力 [43] - 这些新架构保持了高效的并行化训练和快速的线性推理速度 [42] 未来AI发展趋势 - Hassabis指出,未来12个月的关键趋势包括:继续扩展现有AI系统规模,这至少会成为最终AGI的“关键构件” [3][18] - 多模态融合将彻底打通,实现类人的视觉智能、语言与视频的深度融合,世界模型成为主流,智能体达到可靠应用水平 [9] - 行业认为,Titans可能是谷歌自Transformer以来的首个重大突破,并预测采用该架构的Gemini 4可能即将推出 [45][47]
腾讯研究院AI速递 20251208
腾讯研究院· 2025-12-08 00:01
生成式AI技术进展 - 英伟达发布20年来最大更新CUDA Toolkit 13.1,核心是基于tile的编程模型CUDA Tile,抽象化张量核心等专用硬件,并新增Green Context运行时支持、MPS内存局部性优化分区和静态SM分区,cuBLAS引入双精度单精度模拟提升FP64矩阵乘法性能 [1] - 谷歌在NeurIPS 2025发布Titans架构和MIRAS框架,融合RNN极速响应与Transformer强大性能,引入神经长期记忆模块,在200万token上下文中召回率和准确率最高 [2] - 谷歌向Ultra用户推出Gemini 3深度思考模式,采用IMO和ICPC金牌推理技术,在ARC-AGI-2、HLE、GPQA Diamond等基准测试中性能超越Gemini 3 Pro,并通过多轮迭代式思考机制在复杂任务上表现出色 [3] - 伯克利、纽约大学等机构提出GenMimic方法,让机器人通过观看AI生成视频零样本复现人类动作,研究推出GenMimicBench数据集(428个生成视频),并在宇树G1机器人上验证可行性 [4] 主要科技公司战略动态 - Meta战略重心从“元宇宙优先”转向“AI硬件优先”,计划对Reality Labs部门削减高达30%预算,将超轻薄MR头显Phoenix从2026年下半年推迟至2027年上半年,并计划2026年发布限量版可穿戴设备Malibu 2 [5][6] - Meta通过收购AI硬件初创公司Limitless并从苹果挖来人机界面设计副总裁艾伦·戴伊等高管,加速AI可穿戴设备布局 [6] - 苹果硬件技术高级副总裁Johny Srouji(M系列和A系列芯片核心功臣)正认真考虑离职,库克考虑破天荒设立CTO职位挽留,过去一周苹果还失去了AI主管、设计负责人、法务负责人和政府事务主管等多位高管 [7] - AI教父Hinton断言谷歌凭借Gemini 3、自研芯片、强大数据与研究团队正在超越OpenAI,Sensor Tower数据显示ChatGPT月活增速放缓至6%,而Gemini月活同期跃升30%,用户日均使用时长翻倍增长至11分钟 [10][11] AI行业应用与市场趋势 - OpenRouter和a16z联合报告基于100万亿Token元数据显示,开源模型流量占比达30%,中国开源模型占比从1.2%飙升至近30%,推理优化模型流量占比飙升至50%以上 [8] - 编程应用占总AI流量50%以上统治生产力领域,角色扮演占开源流量52%统治创造力领域,亚洲付费使用量从13%翻倍至31%,中文以近5%份额成为全球第二大AI交互语言 [8] - AI搜索正从为人类设计转向为智能体重构,大多数涉及网络搜索的企业选择外包给专业API供应商而非自建,深度研究被视为Agent搜索主导和最具货币化的形式 [9] - Anthropic发布Claude驱动的访谈工具,对1250名专业人士进行大规模访谈,核心发现包括:86%认为AI节省时间但69%提到使用污名,41%认为工作安全而55%表示焦虑,48%考虑转向管理监督AI系统 [12] - 创意工作者中97%称AI节省时间但面临经济焦虑和污名压力,科学家中79%提到信任和可靠性问题是主要障碍,91%渴望在研究中获得更多AI辅助 [12]
徐新成为张一鸣“新股东”,以3.4万亿估值拿下字节跳动部分股权;任正非强调AI重在应用;理想AI眼镜重量仅36g丨AI产业周报
创业邦· 2025-12-07 09:08
文章核心观点 文章汇总了2025年11月29日至12月5日期间全球人工智能领域的重大新闻与投融资动态,核心观点在于展示AI技术在多领域(如机器人、大模型、芯片、应用)的快速迭代与商业化进程,以及资本市场对AI产业持续且高强度的关注与投入 [5][6] 行业动态与公司进展 机器人领域 - **美的集团**首次官宣布局三类机器人,包括工业机器人智能化、家电机器人化、人形机器人价值化,并特别提出“超人形机器人”概念,旨在突破人形极限以在特定场景实现最高效率和最低成本 [7][8] - **众擎**发布全尺寸人形机器人T800,身高1.73米,自重75公斤,续航4-5小时,公司称其性能超越80%的1.7米男性,综合运营成本仅为人力成本的1/3,定价18万元起 [15] - **特斯拉**人形机器人“擎天柱”团队发布了其跑步视频,刷新了实验室个人纪录 [25] - **宇树科技**已完成IPO辅导工作,该公司是全球首家公开零售高性能四足机器人并最早实现行业落地的公司 [20] - **商汤科技**联合创始人王晓刚出任大晓机器人董事长,该公司将于12月18日发布产品及国内开源商业应用的“开悟”世界模型3.0 [20] - **清华大学**正式成立具身智能与机器人研究院 [24] 大模型与AI应用 - **字节跳动**发布120亿参数视频理解大模型Vidi2,新增精细时空定位功能,能处理数小时原始素材并生成片段,其视频理解能力据称超越Gemini3 pro [18] - **OpenAI**为应对竞争进入“红色警戒”状态,推迟广告业务以集中资源改进ChatGPT,同时正在开发代号为“大蒜”的新模型,据称在编程与逻辑推理测试中优于谷歌Gemini3.0及Anthropic Opus4.5 [13][29] - **可灵**推出视频生成2.6模型,提供“音画同出”能力,能在单次生成中输出带音效的完整视频,视频长度最长可达10秒 [11][12] - **阶跃星辰**开源了GUI Agent技术套组GELab-Zero及4B参数模型,该模型在手机、电脑端GUI任务榜单上取得SOTA成绩 [18] - **豆包手机助手**计划对AI操作手机能力进行规范化调整,将限制刷分、金融类应用及部分游戏场景的使用 [9] - **蔡浩宇旗下AI公司**上线聊天软件AnuNeko,功能包括聊天、查资料、解答问题,但无法生成表格PPT且数据库停留在2023年 [11] - **京东**宣布数字人直播免费向所有商家开放 [17] - **京东、美团、拼多多等8家平台企业**签署全国首份《促进AI技术规范应用承诺书》,以规范AI技术在电商领域的应用 [21] - **小鹏汽车**就AI生成的虚假低俗视频正式报警,谴责滥用AI技术抹黑公司形象的行为 [27] 芯片与基础设施 - **亚马逊云科技**推出定制AI芯片Trainium3,运算速度是上一代的四倍,与使用同等GPU的系统相比,可将训练和操作AI模型的成本降低多达50% [30] - **清微智能**完成超20亿元人民币C轮融资,资金将投向下一代可重构芯片研发及智算场景落地 [18] - **英伟达CFO**反驳“AI泡沫论”,指出新增算力在不断叠加,全球经济处于向AI数据中心基础设施转型的“早期阶段”,并预测到2030年末全球AI投资将达3万亿至4万亿美元 [24][25] 企业战略与资本市场 - **Anthropic**已启动IPO筹备工作,最早或于2026年上市,据传其在一轮私人融资谈判中的估值将超过3000亿美元 [12] - **徐新掌管的今日资本**以约3亿美元收购字节跳动部分股权,对应估值高达4800亿美元(约合人民币3.4万亿元) [19] - **三星电子**成立AI研究院,并任命30多岁的常务李康旭为首任负责人,以引领下一代AI技术研究 [21] - **Meta**聘请了苹果资深人机界面设计负责人Alan Dye担任首席设计官 [22] - **朱啸虎**评论OpenAI上市,认为其在一级市场募资非常容易,估值3000亿美元的融资远超市,上市没有必要性 [22] - **理想汽车**发布AI眼镜Livis,重量仅36克,比行业主流轻20%,续航达18小时 [9] - **Mistral AI**正式发布基于Apache 2.0开源协议的Mistral 3模型系列 [32] - **Anthropic**收购开发工具初创公司Bun,将其作为AI编码产品的基础架构 [32] - **谷歌联合创始人布林**捐赠了价值逾11亿美元(约77亿元人民币)的Alphabet股票,主要流向其创立的非营利机构 [29] 投融资概览 整体情况 - 本周期全球披露AI融资事件22起,较上一周期减少9起,其中14起披露金额,总融资规模为76.48亿元人民币,平均融资金额为5.46亿元人民币 [35] - 融资阶段分布:早期14个、成长期4个、后期4个 [38] - 本周国内AI领域已披露融资总额为4.22亿元人民币,融资额最高的为具身智能机器人研发商**戴盟机器人**,完成1亿元人民币A轮融资 [44] - 本周海外AI领域已披露融资总额为72.27亿元人民币,融资额最高的为AI图像生成模型开发商**Black Forest Labs**,完成3亿美元B轮融资 [53] 地区分布 - 本周国内获投AI企业地区主要集中在广东(6起)、上海(2起)、安徽(2起)、北京(2起)、山东(1起) [41] 其他融资事件 - **他山科技**(AI触觉感知)在三季度连续完成A3、A4轮数亿元融资,共有13家资方入局 [19][20] - **超智**(上海智能机器人研发商)完成天使轮融资,投资方包括卡倍亿、宏润建设 [49] - **美酷瑞**(上海AI游戏开发商)完成天使+轮融资 [49]
百度AI王牌昆仑芯赴港IPO,国产算力突围迎关键试炼
搜狐财经· 2025-12-05 22:44
公司IPO计划与估值 - 昆仑芯正在筹备赴香港上市,最快可能在2026年第一季度向港交所递交申请 [2][3] - 公司已完成新一轮2.83亿美元融资,投后估值达29.7亿美元(约210亿元人民币) [2] - 自2021年独立融资以来,公司估值从约130亿元人民币增长至210亿元,四年间增长近60% [4] - 最新一轮融资引入了国新基金下属高层次人才基金、中移和创、山证投资等具有国资背景的投资机构 [2][5] 公司背景与战略意义 - 公司前身为百度智能芯片及架构部,于2021年4月独立融资,百度目前持股59.45% [4] - 分拆上市有助于释放百度AI算力资产价值,推动市场按照科技股估值体系对百度进行价值重估 [6] - 上市可为昆仑芯提供更多资源以加速研发和市场拓展,巩固百度在AI基础设施领域的生态布局 [6] - 公司选择香港上市,考虑了港股对科技公司更灵活的规则及香港作为国际金融中心吸引国际资本的优势 [6] 技术实力与产品进展 - 公司2024年营收已超过10亿元人民币,领先于部分同业 [6] - 已量产的第三代产品P800系列采用自研XPU-P架构,其FP16算力达345TFLOPS,性能超过英伟达H20芯片的148TFLOPS [7] - P800系列显存规格比同类主流GPU高出20%-50%,单机8卡即可运行671B参数的DeepSeek-V3/R1等超大模型 [7] - 百度智能云已点亮国内首个全自研的“三万卡”集群(基于昆仑芯3代),集群实现了99.5%的有效训练时长和超过96%的线性加速比 [8] - 公司已发布面向大规模推理场景的M100芯片(计划2026年上市)和面向超大规模多模态模型的M300芯片(计划2027年面世) [6][7] - 第一代昆仑芯(2018年)已部署超2万片,第二代(2021年)累计部署数万片,产品实现了从“能用”到“好用”再到“领先”的跨越 [9] 商业化进展与市场验证 - 2025年8月,公司中标中国移动10亿级AI计算设备集采项目,标志着产品进入国家核心信息基础设施采购名单 [10] - 公司在金融领域取得突破,其P800芯片在招商银行项目中,对Qwen系列性能支持远超同类型国产芯片,部分多模态模型推理性能达全行业领先水平 [11] - 公司客户已扩展至能源电力(国家电网、南方电网)、制造业(中国钢研)、教育科研(同济大学)等多个关键领域 [11] - 公司与数百家客户合作,将AI算力输送至互联网、运营商、智算、金融、能源电力、汽车等行业 [12] - 百度内部业务(如搜索引擎、文心一言大模型、自动驾驶)为昆仑芯提供了天然的“试验场”和首发客户,形成了“内部验证+外部推广”的模式 [12][13] 财务预测与行业竞争 - 摩根大通预计公司2026年营收将飙升至83亿元人民币,较2024年增幅达6倍,并有望在2025年实现盈亏平衡 [17] - 国产AI芯片行业正处集中冲刺资本市场节点,摩尔线程已在科创板上市,沐曦即将上市,壁仞等公司也在加速推进IPO进程 [6] - 市场竞争加剧,华为昇腾在政务、运营商市场根基深厚,其他国产芯片公司上市融资后将使竞争更加激烈 [21] - 部分客户可能同时采购英伟达和国产芯片,使国产芯片始终面临与行业“黄金标准”的直接性能、生态和服务比较 [22] 发展挑战与生态建设 - 公司在开发者社区规模、工具链成熟度上与英伟达的CUDA生态仍有显著差距,复杂多卡训练场景下的兼容性可能成为客户迁移障碍 [18] - 公司对百度飞桨框架的深度绑定,虽保证了在百度生态内的最佳性能,但可能影响其在更广泛开源社区中的接受度 [18] - 当前订单多依赖政策性集采与百度生态联动,如果中国移动等大客户占比过高,可能导致公司议价能力受限 [19] - 山证投资在本轮融资中完成超亿元战略投资,并表示将围绕AGI领域的“算力、存力、运力”核心环节持续加码,为公司带来产业资源联动 [23]
谷歌全线开挂!Gemini 3 Deep Think夺多项推理SOTA,Gemini亚洲新团队也官宣了
AI前线· 2025-12-05 16:41
Gemini 3 Deep Think模式发布与性能表现 - 谷歌正式上线Gemini 3的Deep Think模式,该模式显著加强推理能力,能处理复杂、多步骤及创新的问题,包括超难的科学和数学题 [2] - 在衡量通用智能核心能力的ARC-AGI基准测试中,Gemini 3 Deep Think在两个榜单均拔得头筹 [3][4] - 在测试基础抽象推理的ARC-AGI-1中,其答题正确率达87.5%,击败了GPT-5系列和Claude Opus 4.5等模型 [4] - 在测试高阶推理场景的ARC-AGI-2中,其正确率达45.1%,比非深度思考模式的Gemini 3 Pro(正确率31.1%)高出14%,而GPT-5 Pro在此项正确率仅为18.3% [6] - 在人类最后考试(HLE)和聚焦高阶科学问题的GPQA Diamond两项高难度评测中,Gemini 3 Deep Think也均取得第一名 [7][8] - 目前该模式仅向Google AI Ultra订阅用户开放 [11] 市场与用户反馈 - 社交媒体用户对Deep Think模式在HLE和ARC测试中超过40%的收益率表示赞赏 [13] - 有用户分享实例,称Gemini 3 Deep Think成功解决了一个让其耗费数日的stack underflow bug,其答案比同样能解决该问题的Claude Opus 4.5更明确,且能自信指出bug确切位置,但运行速度较慢 [14][15] - 有用户称赞其创意场景推理能力,称获得了前所未见的最佳输出之一 [16] - 也有用户提出实际使用效果未达预期,希望优化AGI相关功能 [17] 谷歌DeepMind组织与团队动态 - 谷歌DeepMind宣布在新加坡成立全新的Gemini研究团队,由95后华人科学家Yi Tay带队 [20][21] - 新团队将专注于高级推理、LLM/RL以及改进Gemini、Gemini Deep Think等前沿SOTA模型,并向Google Brain创始成员之一Quoc Le汇报 [21] - 位于美国Mountain View的团队近期凭借Gemini Deep Think,已在国际数学奥林匹克竞赛(IMO)和国际大学生程序设计竞赛(ICPC)中斩获金牌 [21] - 团队规模不会很大但人才密度极高,正在招募全球顶尖人才,并与Quoc Le、Denny Zhou、Mostafa Dehghani、Noam Shazeer等AI领域传奇人物合作 [27] - 团队还将吸纳Victor Tran、Lê Minh Thang、薛之、Shane Gu等当代行业顶尖人才 [27] - Gemini团队诞生于2023年谷歌将Google Brain与DeepMind合并为Google DeepMind的重组,旨在整合科研与工程以打造与GPT系列竞争的基础模型 [29][30] - 该团队是一个覆盖算法设计、超大规模训练、多模态系统构建到产品化落地的全链路超级团队,已推出Ultra、Pro、Flash三大全系模型 [30] 谷歌其他AI产品进展 - 谷歌正式推出Google Workspace Studio,深度整合Gmail、Docs、Sheets、Drive、Chat、Calendar等办公应用,允许用户不写代码、在几分钟内创建自己的AI Agent,以自动化从简单提醒到跨系统流程的复杂办公任务 [31] - Workspace Studio基于谷歌最强大的Gemini 3,具备推理、多模态理解和跨应用调用能力,可根据示例自动执行情感分析、内容生成、优先级排序、智能通知等任务 [32] - 有社交媒体用户表示该产品解决了痛点,希望马上使用 [33] - 有用户看好谷歌(股票代码$GOOGL),并猜测是否会有更多企业采用Google Workspace并放弃微软 [34] - 有用户分享使用体验,称其彻底改变了邮件处理方式 [35]