Workflow
AGI
icon
搜索文档
别让米其林主厨削土豆,英伟达用“小脑指挥大脑”,重构AGI生产力
36氪· 2025-12-12 09:35
觉得大模型消耗的算力过大,英伟达推出的8B模型Orchestrator化身「拼好模」,通过组合工具降本增效,使用30%的预算,在HLE上拿下37.1%的成 绩。 最近,NVIDIA Research发现,只要经过适当微调,小模型已足以「指挥」大模型 英伟达研究团队的新模型Orchestrator仅有 80 亿参数(8B)的模型,不仅比以往的工具使用类AI智能体准确率更高、成本更低,还能在工具选择上精准对 齐用户的偏好。 在HLE基准测试中,Orchestrator斩获了37.1%的高分,一举超越了GPT-5(35.1%),同时在效率上提升了2.5倍。 在tau2-Bench和FRAMES测试中,Orchestrator同样以大幅优势领先 GPT-5,而其成本仅为后者的30%左右。 在多项指标上,Orchestrator均实现了性能与成本的最佳平衡,并能出色地泛化至未曾见过的工具中。 预印本链接:https://arxiv.org/abs/2511.21689 为什么「强模型+工具」还是不够好? 面对Humanity's Last Exam(HLE)这类超难综合推理考试,现在的大模型虽然「什么都懂一点」,但一到 ...
“连姥姥都问我,你知道DeepSeek吗?”
第一财经· 2025-12-12 09:11
文章核心观点 - MiniMax创始人闫俊杰在访谈中反思了公司在面对DeepSeek等竞争对手时的挑战与应对 核心在于承认自身认知不足与执行不坚决 并强调了坚持技术驱动路线、重视人才激励以及对中国AI人才优势的信心 他认为大模型行业参与者将越来越少 但市场在扩大 未来成功的关键在于想象力与坚持[3][6][8][12][13][14] 创始人反思与竞争认知 - DeepSeek的广泛认知给MiniMax带来巨大触动 创始人闫俊杰反思团队在某些关键节点上降低了要求、思考不够深入、选择不够坚定 而竞争对手DeepSeek则拥有独特的认知和长期技术积累[3][5][6] - 公司经历的大部分挑战最终都转化为如何提升自身能力的问题 团队在受到打击时反而能变得更好是做得比较好的方面[6] 公司治理与人才激励 - 面对士气低迷 公司恢复信心的方式包括:拆解问题并用第一性原理论证可行性以鼓舞士气 以及通过发钱让员工的努力被看见和反馈 发钱被认为是管用的[7] - 2025年9月 MiniMax启动了百万美元期权激励计划 根据贡献程度向员工提供几十万美元到几百万美元不等的激励 覆盖模型算法、产品、市场、增长、职能等多个岗位 并计划对突出贡献者进行即时期权激励[7] 技术路线与产品战略 - DeepSeek的出现可能让MiniMax对技术路线更加坚定 公司经历了约半年的迷茫 纠结于技术驱动与复制移动互联网经典增长路线之间 最终认定在AGI赛道上 公司只能选择技术驱动的方式 尽管风险更高[8] - MiniMax独特的打法是ToC和出海 其角色陪伴类应用Talkie在海外获得了大量用户 目前用户量最大的产品是Talkie 而收入方面最大的是视频和API[8] - 针对外界对公司布局大语言模型、语音、视频等多模态业务的“不聚焦”质疑 创始人认为真正的AGI一定是多模态输入输出 团队计划先将每个模态走通 再在接下来几个月整合到下一代模型中 并援引OpenAI的Sora2作为多模态融合的成功范例[9][10] 行业格局与中外对比 - 国内大模型与海外顶尖模型的技术差距在缩小 但投入成本远低于海外 例如 谷歌、OpenAI、Anthropic和xAI的估值可能是中国公司的100倍 技术或许只领先5% 但投入可能在50至100倍之间[12] - 中国AI人才是重要的优势 推动DeepSeek取得成功以及MiniMax内部起到关键作用的人才基本都来自本土 且往往是他们的第一份工作 创始人认为 如果中国年轻人中出现本土技术天才 可能成为AI领域的突破点[12] - 根据MacroPolo的报告 来自中国的顶尖AI研究人员占比从2019年的29%提升到了2022年的47%[12] 未来展望与行业判断 - 创始人认为 明年做大模型的公司会更少 行业已从“百模大战”演变为仅剩几家公司 在一个越来越大的市场里 参与者越来越少 只要能持续迭代并证明价值 资金就不是最重要的问题[13] - 目前大模型尚未进入存量竞争 也不会出现一两家通吃的局面 不同模型有不同特点 例如OpenAI长于推理对话 Anthropic强于代码和Agent 谷歌在多模态方面领先 而中国模型在效果上或许差5% 但成本可能是海外的1/10[13] - AI行业不是互联网的延续 大模型时代真正的产品是模型本身 未来各岗位边界将变得模糊 最核心的竞争力是想象力 谁拥有最好的想象力、最能坚持、对社会价值大 谁就会成功[14]
腾讯研究院AI速递 20251212
腾讯研究院· 2025-12-12 00:25
Meta的战略调整与重大投资 - Meta神秘AI项目“牛油果”(Avocado)发布计划从2025年底推迟至2026年第一季度,其训练使用了Google Gemma、OpenAI gpt-oss和Qwen模型,并可能采取闭源方式 [1] - 在Llama 4发布后效果未达预期,Meta重新思考开源战略,成立MSL超级智能实验室,并以143亿美元引入28岁的AI负责人Alexandr Wang [1] - MSL部门裁员600人,但不涉及核心的TBD Lab团队,同时公司宣布投资270亿美元建设Hyperion数据中心 [1] 大模型应用生态集成 - Adobe将其Photoshop、Express和Acrobat工具集成至ChatGPT,用户可通过文字描述直接使用图片美化、设计信函和编辑PDF等功能,目标面向ChatGPT超8亿的周活跃用户 [2] - 这些集成工具在ChatGPT中可免费使用,但不包含Generative Fill等高级功能,这是OpenAI将更多第三方应用引入ChatGPT的举措之一 [2] - 今年10月首批加入ChatGPT的第三方应用包括Spotify、Zillow和Figma等 [2] AI模型与技术的开源发布 - 智谱发布工业级语音合成系统GLM-TTS,仅用10万小时数据训练便实现“3秒”音色复刻,在字错误率和情感表达上达到开源SOTA水平 [3] - GLM-TTS采用两阶段生成范式,并基于GRPO算法融合了CER、相似度、情感、笑声四维度的正则化奖励机制 [3] - 模型已在Hugging Face和ModelScope开源,用户可通过Z.ai、智谱清言及BigModel平台体验和调用API [3] AI视频与内容创作工具进展 - 商汤Seko 2.0发布多剧集创作功能,支持最高100集连续创作,声称一个人30分钟即可完成一集短剧,实现从剧本到成片全流程自动化 [4] - 该工具核心优势在于保持资产库的主体和场景一致性,并能自动关联前后剧情,其数据采集成本仅为真机遥操方案的10% [4] - 工具集成了Vdiu、海螺、可灵等主流视频大模型,并推出限时活动,商汤自研生图模型限免一周,月高级会员提供65折优惠 [4] AI助手功能拓展 - 腾讯元宝AI助手推出QQ群智能未读消息总结功能,能将群聊记录提炼成结构清晰的总结报告 [5] - 功能具体包括热聊话题归类、精准信息追踪(筛选@提及消息)、群文件整合和原文直达索引 [6] - 元宝已支持添加为QQ好友进行一对一对话,其电脑版、浏览器插件及移动APP均已上线 [6] 太空计算与AI前沿 - 初创公司Starcloud发射的Starcloud-1卫星搭载H100芯片,其算力比以往太空GPU强100倍,并成功在轨运行谷歌Gemma,训练出首个太空大型语言模型 [6] - 该模型基于Karpathy的nanoGPT用莎士比亚语料训练,可用文艺复兴时期语言风格回答问题,并能进行实时情报分析 [6] - Starcloud计划打造5GW的轨道数据中心并配备4公里太阳能板,预计成本仅为地面数据中心的1/10,SpaceX和谷歌等巨头均已布局该领域 [6] 具身智能与数据采集技术 - 灵初智能发布全球首个具身原生人类数据采集方案Psi-SynEngine,包含便携式外骨骼触觉手套数采套装、大规模in the wild数采数据管线等 [7] - 该方案数据获取成本仅为真机遥操方案的10%,定位精度达亚毫米级,可完整采集手部手臂全部自由度和全手触觉信息 [7] - 公司同步发布Psi-SynNet-v0大规模真实世界多模态数据集,覆盖视觉、语言、触觉、动作,已构建上万小时规模并计划明年突破百万小时量级 [7] AI行业趋势与投资观点 - a16z预测到2026年,AI将彻底重塑各行业,Agent-native基础设施将成为必需品,系统核心瓶颈在于多Agent协调能力而非算力存储 [8] - 消费级AI产品重心正从“提高效率”转向“增进连接”,更“懂我内心”的产品比“帮我做事”的产品有更好的用户留存 [8] - AI绝大部分市场机会在传统垂直行业而非硅谷,视频将成为可“进入”的仿真环境,CRM将变成基础设施,Agent将成为交互核心 [8] 中国AI公司的发展与竞争力 - MiniMax创始人闫俊杰强调全模态发展是AGI的必由之路,公司在语言模型、视频、音频赛道均做到全球领先,音频全球第一、视频第二,未来将探索多模态融合 [9] - MiniMax-M2以61总分位居全球大语言模型第五、开源第一,其采用10B激活参数(总参数230B)的MoE架构,算力成本仅为Claude4.5的8%,上线一个多月tokens调用量突破1万亿次 [9] - AI时代核心竞争力是想象力而非技能,中国公司需要本土创新而非“拿来主义”,关键人才均为本土培养,真正的技术天才将在两三年内出现 [10]
独立开发者的AGI焦虑,何处有解?
36氪· 2025-12-11 19:05
文章核心观点 - AGI浪潮显著降低了软件开发的技术门槛,催生了独立开发者群体的崛起,但行业内部机遇与挑战并存,呈现出严重的收入分化与“赢者通吃”现象 [2][3] - 绝大多数独立开发者面临收入不稳定、市场竞争激烈、资源匮乏等多重生存挑战,成功案例仅属于极少数 [8][10][11] - 为应对挑战,行业生态开始出现从线上社区到线下实体空间的探索,旨在为独立开发者构建支持系统,促进合作与资源整合 [20][21][22] 独立开发者定义与现状 - 独立开发者通常指不隶属于大型公司、独立从事数字产品开发的个人或极小团队 [4] - 在中国独立游戏社群indienova,约一半注册团队的成员仅有一人,开发者需独自承担多项工作 [4] - AGI技术(如GPT-5、Claude Opus)及其工具链极大降低了全栈开发的技术门槛,重塑了竞争格局 [3] 业务模式与收入现实 - 独立开发者收入来源多元,主要包括:技术服务、应用/Agent销售、知识变现、开源与捐赠 [7] - 一项2025年基于超千份样本的调研显示,仅约20%的独立开发者收入能达到或超过一线城市稳定薪资水平,超过半数开发者收入在温饱线波动 [8][10] - 2025年Steam上架的超过1.5万款新作中,有40%的游戏总收入不足100美元 [15] 市场挑战与成功案例对比 - 市场呈现极端分化,“赢者通吃”,在AI等领域,前10%的头部团队拿走了市场上90%的资金 [17] - 成功案例稀少且耀眼:例如,一位17岁AI开发者四个月赚100万美元;一款AI美食应用五个月收入1.2万美元;一个Side Project被Wix以8000万美元(约6亿人民币)收购 [11] - 更多案例反映出现实残酷:一款Steam游戏投入4年时间、6万美元(约43.8万元人民币),首周仅售出621份,总收入7100美元 [11][12] - 其他挑战包括:社会保障缺失、个体难敌公司系统作战、缺乏交流环境、个人与家庭后顾之忧等 [17][18] 行业生态与支持系统探索 - 面对挑战,独立开发者对“连接”与“支持系统”的渴望强烈,寻求聚集与合作 [20] - 行业开始探索线下实体空间以创造更多合作机会,例如北京中关村的AI北纬社区服务计划与杭州魔搭社区开发者中心 [21][22] - 行业活动如“AGI时代国际数字游民(独立开发者)发展研讨会”旨在整合政策、社区与资源,启动国际数字游民基地 [22]
MiniMax 闫俊杰和罗永浩四小时访谈:走出中国AI的第三条路,大山并非不可翻越
36氪· 2025-12-11 16:11
当整个 AI 圈都在为 DAU(日活跃用户数)和融资额焦虑时,MiniMax 创始人闫俊杰却表现出一种近乎冷酷的淡漠。 坐在罗永浩对面的闫俊杰,并不像一位掌管着 AI 独角兽企业的技术新贵。 他拒绝谈论改变世界,反而坦承恐惧。那种恐惧不是来自商业竞争,而是来自技术本身——当模型的能力开始超越人类时,创造者反而成了最先感到不安 的人。 用 1/50 的筹码通往 AGI 在巨头环伺、算力短缺、热钱褪去的 2025 年,MiniMax 正在进行一场关于认知的修正:不再沿用移动互联网的逻辑,即通过大规模投放换取增长、通过 堆砌功能留住用户,而是回归本质: 把模型当作最重要的产品 。 在大模型时代,真正的产品其实是模型本身,传统意义上的产品更像是一个渠道。如果模型不够聪明,产品做得再好也没有用。 在罗永浩和闫俊杰这期对谈里,我发现 MiniMax 这家 AI 公司从创业第一天就选择了注定与主流背道而驰的技术路径。 当所有人都试图寻找中国的 OpenAI 和 Sam Altman 时,闫俊杰却在试图证明「非天才」的价值。MiniMax 的故事不是关于天才的灵光乍现,而是一场关 于如何在资源受限的缝隙中,通过极度理性地计算 ...
地平线苏箐:未来三年 自动驾驶行业将告别范式迭代狂飙
中国经营报· 2025-12-11 12:28
在苏箐看来,这一阶段的核心命题,是将现有技术的潜力发挥到极致,比如地平线将持续提升芯片算力 与模型容量,以统一范式推进L2到L4的融合,让城市L2从20万级车型下探至10万级市场,让准L4系统 以平民化价格走进大众。同时,强化工程与组织能力,应对海量长尾场景的打磨,这才是穿越周期的关 键。 "自动驾驶的终极目标,是造出能替代人类司机的机器。这场长跑,在范式革命之后,考验的是行业沉 下心来做'精活'的耐力。在未来几年内,能够把L4级别的车,以平民化的价格送到用户手上。这才是我 们所有人辛苦了这20年做这一行的意义所在。" (文章来源:中国经营报) "未来三年,自动驾驶行业将告别范式迭代的狂飙,进入极致优化的'苦日子'。" 12月9日,在"2025地平线技术生态大会"上,作为深耕自动驾驶20年的老兵,一向"反共识"的地平线副 总裁&首席架构师苏箐分享了对自动驾驶未来趋势的判断。 值得一提的是,对于当下,苏箐则给出了冷静的判断:"行业需要清醒。当前深度学习已显露天花板迹 象,AGI基础理论暂无突破信号,下一轮内核重构至少还需5—20年的技术沉淀。未来三年,自动驾驶 行业将告别范式迭代的狂飙,进入极致优化的'苦日子' ...
朱啸虎:英伟达回调一下更健康
新浪财经· 2025-12-11 11:49
【朱啸虎:英伟达回调一下更健康】如何看待英伟达的回调?朱啸虎表示,"我觉得是回调一下更健 康,为了明年的进一步爆发,肯定能打一个更好的基础。"不过他同时表示,应该有比英伟达更好的一 些标的。谈到OpenAI Sam Altman,朱啸虎认为他嘴上说一套,但做的是另外一套。嘴上可能说的是 AGI,但事实上做的都是在应用端。 专题:未竟之约:张小珺访谈录 责任编辑:李思阳 专题:未竟之约:张小珺访谈录 【朱啸虎:英伟达回调一下更健康】如何看待英伟达的回调?朱啸虎表示,"我觉得是回调一下更健 康,为了明年的进一步爆发,肯定能打一个更好的基础。"不过他同时表示,应该有比英伟达更好的一 些标的。谈到OpenAI Sam Altman,朱啸虎认为他嘴上说一套,但做的是另外一套。嘴上可能说的是 AGI,但事实上做的都是在应用端。 责任编辑:李思阳 ...
Z Potentials|26岁连续创业者陈锴杰:Scale Agentic RL开启模型下半场,但决胜点在于产品Taste
Z Potentials· 2025-12-11 11:28
文章核心观点 - 马卡龙是一款定位于“个人生活助理”的AI产品,其核心愿景是让AI进入并改善用户的真实生活,通过创建和使用个性化“小应用”来串联和解决用户割裂的生活需求,并强调产品应具备动态、有生命力和主动性的“朋友”特质,而非冰冷的工具 [2][4][12][17] - 公司认为AI模型智能提升的下半场核心路径在于规模化智能体强化学习,并在此技术方向进行了重点投入,已实现将万亿参数模型的强化学习训练成本压缩至原来的十分之一 [9][30][31][35] - 面对潜在竞争,公司认为其核心壁垒在于极致的“产品品味”和独特的“朋友式”交互体验,这种在细节中形成的用户心智锚点使其能与ChatGPT等通用助手并存,而非被替代 [9][41][43] 创始人背景与创业历程 - 创始人陈锴杰年仅26岁,已有三次创业经历:第一次在大二休学后创立家庭智能系统公司,年收入达千万人民币,后因ToB业务节奏慢、关系重而退出;第二次创业探索AI互动游戏;第三次在ChatGPT出现后,先后推出AI互动小说产品Midreal和生活助理产品马卡龙 [5][6][7][10] - 创业驱动力最初源于对校园生活成长速度的不满和新鲜感挑战,后续持续创业则是因为享受创业带来的个人综合能力成长 [11] - 产品理念的演变:从创造让用户“逃避现实”的沉浸式体验,转向创造能“改变现实”、解决实际生活问题的工具 [4][10] 马卡龙产品定位与特点 - **产品定义**:一个可以帮用户“制作属于你自己的小应用”的个人生活助理,旨在解决生活场景中数据割裂、应用臃肿的问题 [12][13] - **核心功能**:用户可通过对话,一句话生成服务于健康、运动、饮食、出行、预算管理等生活场景的小应用,所有创建的小应用都会成为AI的长期记忆,使其越用越懂用户 [4][12] - **设计理念**:追求三个关键词——Dynamic(价值交付方式动态多元,不限于文字)、Vibrant(产品有生命力、有记忆)、Proactive(像朋友一样主动关心和提供帮助) [9][21][22] - **与竞品差异**:定位为“朋友”而非“助理”,追求更贴心、更主动的交互体验,例如任务完成后会主动通知,而非让用户自行查找历史记录 [17][42] 用户画像与市场切入点 - **用户演变**:早期用户为开发者和产品经理,用于测试边界;当前核心用户已转向海外“新女性”群体,年龄在大学毕业至40岁左右,面临家庭、职场等多重压力,既需要情绪安慰也需要实际问题解决能力 [19] - **用户案例**:包括为父母创建体检应用、为管理财务创建省钱应用、创建家庭写真转换器改善家庭关系、心理咨询师创建日记系统等,体现了产品提供真实生活帮助的价值 [20][24] - **市场机会**:观察到AI能力在工作场景已快速覆盖,但在生活侧仍存在巨大空白,同时技术已成熟到可编写完整后端代码,支撑小应用开发 [16] 运营数据与产品指标 - **用户规模**:产品已拥有约30万用户 [9][26] - **小应用生态**:社区中已诞生近20万个小应用 [9][26] - **关键指标**:目前最关注小应用的创建率,新用户中约有30%会创建自己的应用;但长期目标是降低创建率,提升小应用的分享、复制和自动调用率,实现从“创建交付价值”到“使用交付价值”的转变 [9][26][28] - **用户粘性**:社区深度用户每天约有3到5次真实使用 [9] 技术架构与核心优势 - **技术核心**:以规模化智能体强化学习为核心,认为这是提升模型智能的关键路径,预训练已接近极限 [9][31][35] - **技术成果**:公司是全球除Thinking Machines外,唯一进行万亿参数大模型LoRA强化学习的团队,通过算法组合已将1万亿参数级模型的强化学习训练成本压缩到原来的十分之一 [30][31] - **模拟环境**:构建了复杂的模拟训练环境,可像“时间机器”一样回放用户交互过程,用不同策略重跑任务以生成训练数据,这是训练的关键难点 [33] - **记忆管理**:开发了创新的记忆管理方法,将整个记忆轨迹视为记忆本身,并通过智能遗忘过程管理,在Locomo基准测试上取得了93%的SOTA准确率 [32] 竞争策略与发展规划 - **竞争观**:认为与ChatGPT等通用助手是并存关系,而非零和替代,核心壁垒在于独特的“产品品味”和“朋友式”交互体验形成的用户心智 [9][41][43] - **先发优势**:体现在更快的用户反馈循环、更深的场景思考以及积累的用户数据,使得团队能持续快速迭代并“跳步”发展 [44] - **GTM与品牌**:早期通过创始人“Build in Public”来建立用户情感连接,因为AI产品迭代快,将注意力留在创始人身上比留在具体产品版本上更稳定 [45] - **商业模式探索**:未来可能的方向包括:对小应用交易进行抽成;或通过与生活场景深度结合的支付服务变现 [45] - **长期愿景**:持续围绕Personal Agent演进,坚持Dynamic、Vibrant、Proactive的方向,目标是达到1亿日活跃用户 [39][46]
AI大家说 | 重磅嘉宾齐聚,近期Dwarkesh Podcast都聊了些什么?
红杉汇· 2025-12-11 08:04
文章核心观点 - 文章通过总结Dwarkesh Podcast中多位AI行业领袖的深度访谈,揭示了当前AI技术发展范式的关键转变、未来AGI的形态构想以及行业竞争格局的演变趋势[2] Ilya Sutskever的观点 - 认为无脑堆算力的“暴力美学”时代已经翻篇,预训练开始式微,数据快用光了,后续发展更依赖研究直觉,回到了需要“拼品味、拼直觉”的手搓时代[5] - 提出“情绪”是进化赋予人类的精准价值函数,让AI拥有“情绪”或“直觉”是通往真正智能的必经之路[6] - 认为真正的AGI更像一个“15岁的天才少年”,学习能力极强,并且未来智能体可以“合并智能”,瞬间获得海量经验[7] Satya Nadella的观点 - 提出模型厂商可能遭遇“赢家诅咒”,模型作为可替换的计算部件非常脆弱,而掌握“场景权”和用户数据流更为关键,微软通过将AI深度集成到Office和GitHub等应用来巩固优势[10] - 指出GitHub的未来定位是“AI智能体的总部”,通过控制代码仓库来管理由不同AI生成的代码,从而掌握AI时代的管理权[11] - 预测SaaS模式将终结,未来将转向为AI Agent提供“数字实体”、身份认证、安全环境和云端电脑等基础设施,并按AI“员工”数量或资源消耗收费[12][13] Andrej Karpathy的观点 - 认为当前大型语言模型是通过预训练模仿互联网数据产生的“幽灵”,拥有知识但缺乏肉体直觉和常识,并非像动物一样进化而来[16] - 批评强化学习效率极低,其奖励信号如同“透过吸管吸取监督信号”,无法对模型复杂的推理步骤提供精细反馈,导致幻觉和逻辑问题[17] - 提出未来AGI的“认知核心”可能只需10亿参数,主张将记忆与认知剥离,知识应存储于外部而非全部记在模型内部[18] 图灵奖得主Sutton的观点 - 指出当前LLM只是在模仿人类语言,缺乏对“客观真相”的追求,没有目标的系统只能称为“行为系统”而非“智能系统”[21] - 强调生物界不存在监督学习,未来的AI应像野兽一样从“体验流”中通过尝试-反馈来学习,而非依赖人类标注的数据[21] - 将AI的诞生视为宇宙从“复制时代”进入“设计时代”的第四道门槛,是人类首次创造出原理可知、可被随意修改的智能体,是宇宙级的质变[22] Sergey Levine的观点 - 认为机器人不需要全知全能的世界模型,只需具备为完成具体任务而生的“隧道视野”,强大的目标感本身就是感知过滤器[25] - 提出在物理世界中,“失忆”或“在当下”的不费脑子的快速反应是高级智能的表现,未来机器人架构可能是“健忘”的小脑配合“博学”的大脑[26] - 指出2009年自动驾驶失败的原因是车辆缺乏常识,而当前机器人浪潮的变量在于通过视觉语言模型获得了先验知识,使其能零样本处理边缘情况[27]
这是2025年度AI十大趋势,4个维度10大结论,“开源AI进入中国时间”
搜狐财经· 2025-12-10 23:20
文章核心观点 - 报告指出,2025年AI正从“工具时代”迈向“伙伴时代”,其发展将深刻重塑经济结构、社会形态和人类生活方式 [3] - 中国AI正从“参与者”转向“领导者”,在开源生态、芯片自主、AGI路径等基础层面加速布局,展现出从“跟跑”到“并跑”乃至“领跑”的体系化能力 [28][31] 算力与芯片 - 算力已成为影响国家和企业战略的关键资源,算力经济是智能产业第一大引擎,全球AI算力需求推动超大规模数据中心建设进入算力工厂时代 [5][6] - “东数西算”、“太空超级计算机”等国家工程正系统构建高效、绿色的全国一体化算力网络 [6] - 芯片层面,GPU主导地位受到挑战,NPU在端侧普及,ASIC/FPGA迎来增长 [8] - 中国正加速构建自主可控的算力生态,国产“芯片+SDK+框架”方案已在千亿级模型训练中得到验证,DeepSeek等模型针对昇腾芯片深度优化,标志着全栈国产化能力迈入新阶段 [11] 大模型技术与架构 - 预训练决定大模型格局梯队,架构创新决定预训练水平 [5] - 混合专家模型成为主流选择,其“大参数、小激活”的设计让模型可在不显著增加成本的情况下扩充容量,中国头部模型团队正普遍采用这一思路 [13] - 为突破Transformer的O(n²)复杂度瓶颈,线性注意力和稀疏注意力等新架构快速发展,让模型能够更高效地处理长文本、视频理解等需要长程依赖的任务 [13] - 2025年,大模型落地进入“推理时间”,模型在多模态深度推理、自适应推理、边缘推理加速等方面持续突破,任务复杂度推动推理框架持续进化 [15] 应用与交互范式 - 信息AI处于应用期,物理AI处于研发期,具身智能成合流风口 [5][17] - 世界模型与VLA(视觉-语言-动作)框架成为技术焦点,具身智能正从小规模商业订单走向更广泛的应用探索 [17] - 自变量机器人自主研发的“Great Wall”模型系列已实现从感知到高精度操作的端到端控制,在复杂任务中展现出了强大的泛化能力 [20] - AI正在重塑流量入口,从PC互联网、移动互联网迈向Agentic互联网,AI智能体具备感知、规划、决策、执行的闭环能力,正逐步取代传统App,操作系统亦向超级Agent演进 [5][20] - 构建智能助手的关键在于对用户个性化知识的理解与调用,例如腾讯的ima知识库允许用户构建专属知识库并与大模型深度结合,实现“知识即能力”的模式 [22] 多模态与硬件 - 多模态成为AI应用落地关键,视频、3D、代码依次展现生产力,新一代AI系统能够同时处理和理解文本、图像、声音、视频等多种信息类型,实现跨模态的关联理解和生成 [5][22] - 报告预测,未来2-3年内,随着技术能力成熟,AI会成为相关产业的标准工具 [22] - AI硬件百端齐放,轻量化模型和边缘计算技术成熟,推动AI能力向手机、汽车、IoT设备等终端普及,端侧AI解决了数据隐私、网络延迟和成本效率三大核心问题 [5][22] 科研与开源生态 - AI正从科研工具升级为科研主体,开启自主科学发现新范式,在材料、化学、生物、医疗等领域,AI的复杂问题解决能力已触及博士水平 [5][25] - 腾讯与广州呼吸健康研究院联合开发的DeepGEM病理大模型,仅通过常规病理切片图像即可在1分钟内高精度预测肺癌基因突变,将检测成本降低数倍 [27] - 开源AI进入中国时间,DeepSeek、Qwen等开源模型在全球社区影响力迅速提升,下载量位居前列 [5][28] - 在AGI领域,中国正通过开源生态、自主芯片、国家算力网络与产学研协同,走出一条独特的“中国路线” [30]