AGI - 财报，业绩电话会，研报，新闻 - Reportify

AGI

搜索文档

别让米其林主厨削土豆，英伟达用“小脑指挥大脑”，重构AGI生产力

36氪· 2025-12-12 09:35

觉得大模型消耗的算力过大，英伟达推出的8B模型Orchestrator化身「拼好模」，通过组合工具降本增效，使用30%的预算，在HLE上拿下37.1%的成绩。最近，NVIDIA Research发现，只要经过适当微调，小模型已足以「指挥」大模型英伟达研究团队的新模型Orchestrator仅有 80 亿参数（8B）的模型，不仅比以往的工具使用类AI智能体准确率更高、成本更低，还能在工具选择上精准对齐用户的偏好。在HLE基准测试中，Orchestrator斩获了37.1%的高分，一举超越了GPT-5（35.1%），同时在效率上提升了2.5倍。在tau2-Bench和FRAMES测试中，Orchestrator同样以大幅优势领先 GPT-5，而其成本仅为后者的30%左右。在多项指标上，Orchestrator均实现了性能与成本的最佳平衡，并能出色地泛化至未曾见过的工具中。预印本链接：https://arxiv.org/abs/2511.21689 为什么「强模型+工具」还是不够好？面对Humanity's Last Exam（HLE）这类超难综合推理考试，现在的大模型虽然「什么都懂一点」，但一到 ...

英伟达(US:NVDA)

“连姥姥都问我，你知道DeepSeek吗？”

第一财经· 2025-12-12 09:11

文章核心观点 - MiniMax创始人闫俊杰在访谈中反思了公司在面对DeepSeek等竞争对手时的挑战与应对核心在于承认自身认知不足与执行不坚决并强调了坚持技术驱动路线、重视人才激励以及对中国AI人才优势的信心他认为大模型行业参与者将越来越少但市场在扩大未来成功的关键在于想象力与坚持[3][6][8][12][13][14] 创始人反思与竞争认知 - DeepSeek的广泛认知给MiniMax带来巨大触动创始人闫俊杰反思团队在某些关键节点上降低了要求、思考不够深入、选择不够坚定而竞争对手DeepSeek则拥有独特的认知和长期技术积累[3][5][6] - 公司经历的大部分挑战最终都转化为如何提升自身能力的问题团队在受到打击时反而能变得更好是做得比较好的方面[6] 公司治理与人才激励 - 面对士气低迷公司恢复信心的方式包括：拆解问题并用第一性原理论证可行性以鼓舞士气以及通过发钱让员工的努力被看见和反馈发钱被认为是管用的[7] - 2025年9月 MiniMax启动了百万美元期权激励计划根据贡献程度向员工提供几十万美元到几百万美元不等的激励覆盖模型算法、产品、市场、增长、职能等多个岗位并计划对突出贡献者进行即时期权激励[7] 技术路线与产品战略 - DeepSeek的出现可能让MiniMax对技术路线更加坚定公司经历了约半年的迷茫纠结于技术驱动与复制移动互联网经典增长路线之间最终认定在AGI赛道上公司只能选择技术驱动的方式尽管风险更高[8] - MiniMax独特的打法是ToC和出海其角色陪伴类应用Talkie在海外获得了大量用户目前用户量最大的产品是Talkie 而收入方面最大的是视频和API[8] - 针对外界对公司布局大语言模型、语音、视频等多模态业务的“不聚焦”质疑创始人认为真正的AGI一定是多模态输入输出团队计划先将每个模态走通再在接下来几个月整合到下一代模型中并援引OpenAI的Sora2作为多模态融合的成功范例[9][10] 行业格局与中外对比 - 国内大模型与海外顶尖模型的技术差距在缩小但投入成本远低于海外例如谷歌、OpenAI、Anthropic和xAI的估值可能是中国公司的100倍技术或许只领先5% 但投入可能在50至100倍之间[12] - 中国AI人才是重要的优势推动DeepSeek取得成功以及MiniMax内部起到关键作用的人才基本都来自本土且往往是他们的第一份工作创始人认为如果中国年轻人中出现本土技术天才可能成为AI领域的突破点[12] - 根据MacroPolo的报告来自中国的顶尖AI研究人员占比从2019年的29%提升到了2022年的47%[12] 未来展望与行业判断 - 创始人认为明年做大模型的公司会更少行业已从“百模大战”演变为仅剩几家公司在一个越来越大的市场里参与者越来越少只要能持续迭代并证明价值资金就不是最重要的问题[13] - 目前大模型尚未进入存量竞争也不会出现一两家通吃的局面不同模型有不同特点例如OpenAI长于推理对话 Anthropic强于代码和Agent 谷歌在多模态方面领先而中国模型在效果上或许差5% 但成本可能是海外的1/10[13] - AI行业不是互联网的延续大模型时代真正的产品是模型本身未来各岗位边界将变得模糊最核心的竞争力是想象力谁拥有最好的想象力、最能坚持、对社会价值大谁就会成功[14]

Artificial Intelligence

Artificial Intelligence

Artificial Intelligence

Artificial Intelligence

腾讯研究院AI速递 20251212

腾讯研究院· 2025-12-12 00:25

Meta的战略调整与重大投资 - Meta神秘AI项目“牛油果”(Avocado)发布计划从2025年底推迟至2026年第一季度，其训练使用了Google Gemma、OpenAI gpt-oss和Qwen模型，并可能采取闭源方式 [1] - 在Llama 4发布后效果未达预期，Meta重新思考开源战略，成立MSL超级智能实验室，并以143亿美元引入28岁的AI负责人Alexandr Wang [1] - MSL部门裁员600人，但不涉及核心的TBD Lab团队，同时公司宣布投资270亿美元建设Hyperion数据中心 [1] 大模型应用生态集成 - Adobe将其Photoshop、Express和Acrobat工具集成至ChatGPT，用户可通过文字描述直接使用图片美化、设计信函和编辑PDF等功能，目标面向ChatGPT超8亿的周活跃用户 [2] - 这些集成工具在ChatGPT中可免费使用，但不包含Generative Fill等高级功能，这是OpenAI将更多第三方应用引入ChatGPT的举措之一 [2] - 今年10月首批加入ChatGPT的第三方应用包括Spotify、Zillow和Figma等 [2] AI模型与技术的开源发布 - 智谱发布工业级语音合成系统GLM-TTS，仅用10万小时数据训练便实现“3秒”音色复刻，在字错误率和情感表达上达到开源SOTA水平 [3] - GLM-TTS采用两阶段生成范式，并基于GRPO算法融合了CER、相似度、情感、笑声四维度的正则化奖励机制 [3] - 模型已在Hugging Face和ModelScope开源，用户可通过Z.ai、智谱清言及BigModel平台体验和调用API [3] AI视频与内容创作工具进展 - 商汤Seko 2.0发布多剧集创作功能，支持最高100集连续创作，声称一个人30分钟即可完成一集短剧，实现从剧本到成片全流程自动化 [4] - 该工具核心优势在于保持资产库的主体和场景一致性，并能自动关联前后剧情，其数据采集成本仅为真机遥操方案的10% [4] - 工具集成了Vdiu、海螺、可灵等主流视频大模型，并推出限时活动，商汤自研生图模型限免一周，月高级会员提供65折优惠 [4] AI助手功能拓展 - 腾讯元宝AI助手推出QQ群智能未读消息总结功能，能将群聊记录提炼成结构清晰的总结报告 [5] - 功能具体包括热聊话题归类、精准信息追踪（筛选@提及消息）、群文件整合和原文直达索引 [6] - 元宝已支持添加为QQ好友进行一对一对话，其电脑版、浏览器插件及移动APP均已上线 [6] 太空计算与AI前沿 - 初创公司Starcloud发射的Starcloud-1卫星搭载H100芯片，其算力比以往太空GPU强100倍，并成功在轨运行谷歌Gemma，训练出首个太空大型语言模型 [6] - 该模型基于Karpathy的nanoGPT用莎士比亚语料训练，可用文艺复兴时期语言风格回答问题，并能进行实时情报分析 [6] - Starcloud计划打造5GW的轨道数据中心并配备4公里太阳能板，预计成本仅为地面数据中心的1/10，SpaceX和谷歌等巨头均已布局该领域 [6] 具身智能与数据采集技术 - 灵初智能发布全球首个具身原生人类数据采集方案Psi-SynEngine，包含便携式外骨骼触觉手套数采套装、大规模in the wild数采数据管线等 [7] - 该方案数据获取成本仅为真机遥操方案的10%，定位精度达亚毫米级，可完整采集手部手臂全部自由度和全手触觉信息 [7] - 公司同步发布Psi-SynNet-v0大规模真实世界多模态数据集，覆盖视觉、语言、触觉、动作，已构建上万小时规模并计划明年突破百万小时量级 [7] AI行业趋势与投资观点 - a16z预测到2026年，AI将彻底重塑各行业，Agent-native基础设施将成为必需品，系统核心瓶颈在于多Agent协调能力而非算力存储 [8] - 消费级AI产品重心正从“提高效率”转向“增进连接”，更“懂我内心”的产品比“帮我做事”的产品有更好的用户留存 [8] - AI绝大部分市场机会在传统垂直行业而非硅谷，视频将成为可“进入”的仿真环境，CRM将变成基础设施，Agent将成为交互核心 [8] 中国AI公司的发展与竞争力 - MiniMax创始人闫俊杰强调全模态发展是AGI的必由之路，公司在语言模型、视频、音频赛道均做到全球领先，音频全球第一、视频第二，未来将探索多模态融合 [9] - MiniMax-M2以61总分位居全球大语言模型第五、开源第一，其采用10B激活参数（总参数230B）的MoE架构，算力成本仅为Claude4.5的8%，上线一个多月tokens调用量突破1万亿次 [9] - AI时代核心竞争力是想象力而非技能，中国公司需要本土创新而非“拿来主义”，关键人才均为本土培养，真正的技术天才将在两三年内出现 [10]

Meta Platforms(US:META)

Artificial Intelligence

Artificial Intelligence

独立开发者的AGI焦虑，何处有解？

36氪· 2025-12-11 19:05

文章核心观点 - AGI浪潮显著降低了软件开发的技术门槛，催生了独立开发者群体的崛起，但行业内部机遇与挑战并存，呈现出严重的收入分化与“赢者通吃”现象 [2][3] - 绝大多数独立开发者面临收入不稳定、市场竞争激烈、资源匮乏等多重生存挑战，成功案例仅属于极少数 [8][10][11] - 为应对挑战，行业生态开始出现从线上社区到线下实体空间的探索，旨在为独立开发者构建支持系统，促进合作与资源整合 [20][21][22] 独立开发者定义与现状 - 独立开发者通常指不隶属于大型公司、独立从事数字产品开发的个人或极小团队 [4] - 在中国独立游戏社群indienova，约一半注册团队的成员仅有一人，开发者需独自承担多项工作 [4] - AGI技术（如GPT-5、Claude Opus）及其工具链极大降低了全栈开发的技术门槛，重塑了竞争格局 [3] 业务模式与收入现实 - 独立开发者收入来源多元，主要包括：技术服务、应用/Agent销售、知识变现、开源与捐赠 [7] - 一项2025年基于超千份样本的调研显示，仅约20%的独立开发者收入能达到或超过一线城市稳定薪资水平，超过半数开发者收入在温饱线波动 [8][10] - 2025年Steam上架的超过1.5万款新作中，有40%的游戏总收入不足100美元 [15] 市场挑战与成功案例对比 - 市场呈现极端分化，“赢者通吃”，在AI等领域，前10%的头部团队拿走了市场上90%的资金 [17] - 成功案例稀少且耀眼：例如，一位17岁AI开发者四个月赚100万美元；一款AI美食应用五个月收入1.2万美元；一个Side Project被Wix以8000万美元（约6亿人民币）收购 [11] - 更多案例反映出现实残酷：一款Steam游戏投入4年时间、6万美元（约43.8万元人民币），首周仅售出621份，总收入7100美元 [11][12] - 其他挑战包括：社会保障缺失、个体难敌公司系统作战、缺乏交流环境、个人与家庭后顾之忧等 [17][18] 行业生态与支持系统探索 - 面对挑战，独立开发者对“连接”与“支持系统”的渴望强烈，寻求聚集与合作 [20] - 行业开始探索线下实体空间以创造更多合作机会，例如北京中关村的AI北纬社区服务计划与杭州魔搭社区开发者中心 [21][22] - 行业活动如“AGI时代国际数字游民（独立开发者）发展研讨会”旨在整合政策、社区与资源，启动国际数字游民基地 [22]

独立开发者

Software Development

独立开发者

Software Development

MiniMax 闫俊杰和罗永浩四小时访谈：走出中国AI的第三条路，大山并非不可翻越

36氪· 2025-12-11 16:11

当整个 AI 圈都在为 DAU（日活跃用户数）和融资额焦虑时，MiniMax 创始人闫俊杰却表现出一种近乎冷酷的淡漠。坐在罗永浩对面的闫俊杰，并不像一位掌管着 AI 独角兽企业的技术新贵。他拒绝谈论改变世界，反而坦承恐惧。那种恐惧不是来自商业竞争，而是来自技术本身——当模型的能力开始超越人类时，创造者反而成了最先感到不安的人。用 1/50 的筹码通往 AGI 在巨头环伺、算力短缺、热钱褪去的 2025 年，MiniMax 正在进行一场关于认知的修正：不再沿用移动互联网的逻辑，即通过大规模投放换取增长、通过堆砌功能留住用户，而是回归本质：把模型当作最重要的产品。在大模型时代，真正的产品其实是模型本身，传统意义上的产品更像是一个渠道。如果模型不够聪明，产品做得再好也没有用。在罗永浩和闫俊杰这期对谈里，我发现 MiniMax 这家 AI 公司从创业第一天就选择了注定与主流背道而驰的技术路径。当所有人都试图寻找中国的 OpenAI 和 Sam Altman 时，闫俊杰却在试图证明「非天才」的价值。MiniMax 的故事不是关于天才的灵光乍现，而是一场关于如何在资源受限的缝隙中，通过极度理性地计算 ...

交错思维（Interleaved Thinking）

Artificial Intelligence

交错思维（Interleaved Thinking）

Artificial Intelligence

地平线苏箐：未来三年自动驾驶行业将告别范式迭代狂飙

中国经营报· 2025-12-11 12:28

在苏箐看来，这一阶段的核心命题，是将现有技术的潜力发挥到极致，比如地平线将持续提升芯片算力与模型容量，以统一范式推进L2到L4的融合，让城市L2从20万级车型下探至10万级市场，让准L4系统以平民化价格走进大众。同时，强化工程与组织能力，应对海量长尾场景的打磨，这才是穿越周期的关键。 "自动驾驶的终极目标，是造出能替代人类司机的机器。这场长跑，在范式革命之后，考验的是行业沉下心来做'精活'的耐力。在未来几年内，能够把L4级别的车，以平民化的价格送到用户手上。这才是我们所有人辛苦了这20年做这一行的意义所在。" （文章来源：中国经营报） "未来三年，自动驾驶行业将告别范式迭代的狂飙，进入极致优化的'苦日子'。" 12月9日，在"2025地平线技术生态大会"上，作为深耕自动驾驶20年的老兵，一向"反共识"的地平线副总裁&首席架构师苏箐分享了对自动驾驶未来趋势的判断。值得一提的是，对于当下，苏箐则给出了冷静的判断："行业需要清醒。当前深度学习已显露天花板迹象，AGI基础理论暂无突破信号，下一轮内核重构至少还需5—20年的技术沉淀。未来三年，自动驾驶行业将告别范式迭代的狂飙，进入极致优化的'苦日子' ...

Scaling Law（规模定律）

Scaling Law（规模定律）

朱啸虎：英伟达回调一下更健康

新浪财经· 2025-12-11 11:49

【朱啸虎：英伟达回调一下更健康】如何看待英伟达的回调？朱啸虎表示，"我觉得是回调一下更健康，为了明年的进一步爆发，肯定能打一个更好的基础。"不过他同时表示，应该有比英伟达更好的一些标的。谈到OpenAI Sam Altman，朱啸虎认为他嘴上说一套，但做的是另外一套。嘴上可能说的是 AGI，但事实上做的都是在应用端。专题：未竟之约：张小珺访谈录责任编辑：李思阳专题：未竟之约：张小珺访谈录【朱啸虎：英伟达回调一下更健康】如何看待英伟达的回调？朱啸虎表示，"我觉得是回调一下更健康，为了明年的进一步爆发，肯定能打一个更好的基础。"不过他同时表示，应该有比英伟达更好的一些标的。谈到OpenAI Sam Altman，朱啸虎认为他嘴上说一套，但做的是另外一套。嘴上可能说的是 AGI，但事实上做的都是在应用端。责任编辑：李思阳 ...

英伟达(US:NVDA)

Z Potentials｜26岁连续创业者陈锴杰：Scale Agentic RL开启模型下半场，但决胜点在于产品Taste

Z Potentials· 2025-12-11 11:28

文章核心观点 - 马卡龙是一款定位于“个人生活助理”的AI产品，其核心愿景是让AI进入并改善用户的真实生活，通过创建和使用个性化“小应用”来串联和解决用户割裂的生活需求，并强调产品应具备动态、有生命力和主动性的“朋友”特质，而非冰冷的工具 [2][4][12][17] - 公司认为AI模型智能提升的下半场核心路径在于规模化智能体强化学习，并在此技术方向进行了重点投入，已实现将万亿参数模型的强化学习训练成本压缩至原来的十分之一 [9][30][31][35] - 面对潜在竞争，公司认为其核心壁垒在于极致的“产品品味”和独特的“朋友式”交互体验，这种在细节中形成的用户心智锚点使其能与ChatGPT等通用助手并存，而非被替代 [9][41][43] 创始人背景与创业历程 - 创始人陈锴杰年仅26岁，已有三次创业经历：第一次在大二休学后创立家庭智能系统公司，年收入达千万人民币，后因ToB业务节奏慢、关系重而退出；第二次创业探索AI互动游戏；第三次在ChatGPT出现后，先后推出AI互动小说产品Midreal和生活助理产品马卡龙 [5][6][7][10] - 创业驱动力最初源于对校园生活成长速度的不满和新鲜感挑战，后续持续创业则是因为享受创业带来的个人综合能力成长 [11] - 产品理念的演变：从创造让用户“逃避现实”的沉浸式体验，转向创造能“改变现实”、解决实际生活问题的工具 [4][10] 马卡龙产品定位与特点 - **产品定义**：一个可以帮用户“制作属于你自己的小应用”的个人生活助理，旨在解决生活场景中数据割裂、应用臃肿的问题 [12][13] - **核心功能**：用户可通过对话，一句话生成服务于健康、运动、饮食、出行、预算管理等生活场景的小应用，所有创建的小应用都会成为AI的长期记忆，使其越用越懂用户 [4][12] - **设计理念**：追求三个关键词——Dynamic（价值交付方式动态多元，不限于文字）、Vibrant（产品有生命力、有记忆）、Proactive（像朋友一样主动关心和提供帮助） [9][21][22] - **与竞品差异**：定位为“朋友”而非“助理”，追求更贴心、更主动的交互体验，例如任务完成后会主动通知，而非让用户自行查找历史记录 [17][42] 用户画像与市场切入点 - **用户演变**：早期用户为开发者和产品经理，用于测试边界；当前核心用户已转向海外“新女性”群体，年龄在大学毕业至40岁左右，面临家庭、职场等多重压力，既需要情绪安慰也需要实际问题解决能力 [19] - **用户案例**：包括为父母创建体检应用、为管理财务创建省钱应用、创建家庭写真转换器改善家庭关系、心理咨询师创建日记系统等，体现了产品提供真实生活帮助的价值 [20][24] - **市场机会**：观察到AI能力在工作场景已快速覆盖，但在生活侧仍存在巨大空白，同时技术已成熟到可编写完整后端代码，支撑小应用开发 [16] 运营数据与产品指标 - **用户规模**：产品已拥有约30万用户 [9][26] - **小应用生态**：社区中已诞生近20万个小应用 [9][26] - **关键指标**：目前最关注小应用的创建率，新用户中约有30%会创建自己的应用；但长期目标是降低创建率，提升小应用的分享、复制和自动调用率，实现从“创建交付价值”到“使用交付价值”的转变 [9][26][28] - **用户粘性**：社区深度用户每天约有3到5次真实使用 [9] 技术架构与核心优势 - **技术核心**：以规模化智能体强化学习为核心，认为这是提升模型智能的关键路径，预训练已接近极限 [9][31][35] - **技术成果**：公司是全球除Thinking Machines外，唯一进行万亿参数大模型LoRA强化学习的团队，通过算法组合已将1万亿参数级模型的强化学习训练成本压缩到原来的十分之一 [30][31] - **模拟环境**：构建了复杂的模拟训练环境，可像“时间机器”一样回放用户交互过程，用不同策略重跑任务以生成训练数据，这是训练的关键难点 [33] - **记忆管理**：开发了创新的记忆管理方法，将整个记忆轨迹视为记忆本身，并通过智能遗忘过程管理，在Locomo基准测试上取得了93%的SOTA准确率 [32] 竞争策略与发展规划 - **竞争观**：认为与ChatGPT等通用助手是并存关系，而非零和替代，核心壁垒在于独特的“产品品味”和“朋友式”交互体验形成的用户心智 [9][41][43] - **先发优势**：体现在更快的用户反馈循环、更深的场景思考以及积累的用户数据，使得团队能持续快速迭代并“跳步”发展 [44] - **GTM与品牌**：早期通过创始人“Build in Public”来建立用户情感连接，因为AI产品迭代快，将注意力留在创始人身上比留在具体产品版本上更稳定 [45] - **商业模式探索**：未来可能的方向包括：对小应用交易进行抽成；或通过与生活场景深度结合的支付服务变现 [45] - **长期愿景**：持续围绕Personal Agent演进，坚持Dynamic、Vibrant、Proactive的方向，目标是达到1亿日活跃用户 [39][46]

Scale Agentic RL

Artificial Intelligence

马卡龙（Macaron）

Scale Agentic RL

Artificial Intelligence

马卡龙（Macaron）

AI大家说 | 重磅嘉宾齐聚，近期Dwarkesh Podcast都聊了些什么？

红杉汇· 2025-12-11 08:04

文章核心观点 - 文章通过总结Dwarkesh Podcast中多位AI行业领袖的深度访谈，揭示了当前AI技术发展范式的关键转变、未来AGI的形态构想以及行业竞争格局的演变趋势[2] Ilya Sutskever的观点 - 认为无脑堆算力的“暴力美学”时代已经翻篇，预训练开始式微，数据快用光了，后续发展更依赖研究直觉，回到了需要“拼品味、拼直觉”的手搓时代[5] - 提出“情绪”是进化赋予人类的精准价值函数，让AI拥有“情绪”或“直觉”是通往真正智能的必经之路[6] - 认为真正的AGI更像一个“15岁的天才少年”，学习能力极强，并且未来智能体可以“合并智能”，瞬间获得海量经验[7] Satya Nadella的观点 - 提出模型厂商可能遭遇“赢家诅咒”，模型作为可替换的计算部件非常脆弱，而掌握“场景权”和用户数据流更为关键，微软通过将AI深度集成到Office和GitHub等应用来巩固优势[10] - 指出GitHub的未来定位是“AI智能体的总部”，通过控制代码仓库来管理由不同AI生成的代码，从而掌握AI时代的管理权[11] - 预测SaaS模式将终结，未来将转向为AI Agent提供“数字实体”、身份认证、安全环境和云端电脑等基础设施，并按AI“员工”数量或资源消耗收费[12][13] Andrej Karpathy的观点 - 认为当前大型语言模型是通过预训练模仿互联网数据产生的“幽灵”，拥有知识但缺乏肉体直觉和常识，并非像动物一样进化而来[16] - 批评强化学习效率极低，其奖励信号如同“透过吸管吸取监督信号”，无法对模型复杂的推理步骤提供精细反馈，导致幻觉和逻辑问题[17] - 提出未来AGI的“认知核心”可能只需10亿参数，主张将记忆与认知剥离，知识应存储于外部而非全部记在模型内部[18] 图灵奖得主Sutton的观点 - 指出当前LLM只是在模仿人类语言，缺乏对“客观真相”的追求，没有目标的系统只能称为“行为系统”而非“智能系统”[21] - 强调生物界不存在监督学习，未来的AI应像野兽一样从“体验流”中通过尝试-反馈来学习，而非依赖人类标注的数据[21] - 将AI的诞生视为宇宙从“复制时代”进入“设计时代”的第四道门槛，是人类首次创造出原理可知、可被随意修改的智能体，是宇宙级的质变[22] Sergey Levine的观点 - 认为机器人不需要全知全能的世界模型，只需具备为完成具体任务而生的“隧道视野”，强大的目标感本身就是感知过滤器[25] - 提出在物理世界中，“失忆”或“在当下”的不费脑子的快速反应是高级智能的表现，未来机器人架构可能是“健忘”的小脑配合“博学”的大脑[26] - 指出2009年自动驾驶失败的原因是车辆缺乏常识，而当前机器人浪潮的变量在于通过视觉语言模型获得了先验知识，使其能零样本处理边缘情况[27]

微软(US:MSFT)

Dwarkesh Podcast

Dwarkesh Podcast

这是2025年度AI十大趋势，4个维度10大结论，“开源AI进入中国时间”

搜狐财经· 2025-12-10 23:20

文章核心观点 - 报告指出，2025年AI正从“工具时代”迈向“伙伴时代”，其发展将深刻重塑经济结构、社会形态和人类生活方式 [3] - 中国AI正从“参与者”转向“领导者”，在开源生态、芯片自主、AGI路径等基础层面加速布局，展现出从“跟跑”到“并跑”乃至“领跑”的体系化能力 [28][31] 算力与芯片 - 算力已成为影响国家和企业战略的关键资源，算力经济是智能产业第一大引擎，全球AI算力需求推动超大规模数据中心建设进入算力工厂时代 [5][6] - “东数西算”、“太空超级计算机”等国家工程正系统构建高效、绿色的全国一体化算力网络 [6] - 芯片层面，GPU主导地位受到挑战，NPU在端侧普及，ASIC/FPGA迎来增长 [8] - 中国正加速构建自主可控的算力生态，国产“芯片+SDK+框架”方案已在千亿级模型训练中得到验证，DeepSeek等模型针对昇腾芯片深度优化，标志着全栈国产化能力迈入新阶段 [11] 大模型技术与架构 - 预训练决定大模型格局梯队，架构创新决定预训练水平 [5] - 混合专家模型成为主流选择，其“大参数、小激活”的设计让模型可在不显著增加成本的情况下扩充容量，中国头部模型团队正普遍采用这一思路 [13] - 为突破Transformer的O(n²)复杂度瓶颈，线性注意力和稀疏注意力等新架构快速发展，让模型能够更高效地处理长文本、视频理解等需要长程依赖的任务 [13] - 2025年，大模型落地进入“推理时间”，模型在多模态深度推理、自适应推理、边缘推理加速等方面持续突破，任务复杂度推动推理框架持续进化 [15] 应用与交互范式 - 信息AI处于应用期，物理AI处于研发期，具身智能成合流风口 [5][17] - 世界模型与VLA（视觉-语言-动作）框架成为技术焦点，具身智能正从小规模商业订单走向更广泛的应用探索 [17] - 自变量机器人自主研发的“Great Wall”模型系列已实现从感知到高精度操作的端到端控制，在复杂任务中展现出了强大的泛化能力 [20] - AI正在重塑流量入口，从PC互联网、移动互联网迈向Agentic互联网，AI智能体具备感知、规划、决策、执行的闭环能力，正逐步取代传统App，操作系统亦向超级Agent演进 [5][20] - 构建智能助手的关键在于对用户个性化知识的理解与调用，例如腾讯的ima知识库允许用户构建专属知识库并与大模型深度结合，实现“知识即能力”的模式 [22] 多模态与硬件 - 多模态成为AI应用落地关键，视频、3D、代码依次展现生产力，新一代AI系统能够同时处理和理解文本、图像、声音、视频等多种信息类型，实现跨模态的关联理解和生成 [5][22] - 报告预测，未来2-3年内，随着技术能力成熟，AI会成为相关产业的标准工具 [22] - AI硬件百端齐放，轻量化模型和边缘计算技术成熟，推动AI能力向手机、汽车、IoT设备等终端普及，端侧AI解决了数据隐私、网络延迟和成本效率三大核心问题 [5][22] 科研与开源生态 - AI正从科研工具升级为科研主体，开启自主科学发现新范式，在材料、化学、生物、医疗等领域，AI的复杂问题解决能力已触及博士水平 [5][25] - 腾讯与广州呼吸健康研究院联合开发的DeepGEM病理大模型，仅通过常规病理切片图像即可在1分钟内高精度预测肺癌基因突变，将检测成本降低数倍 [27] - 开源AI进入中国时间，DeepSeek、Qwen等开源模型在全球社区影响力迅速提升，下载量位居前列 [5][28] - 在AGI领域，中国正通过开源生态、自主芯片、国家算力网络与产学研协同，走出一条独特的“中国路线” [30]