AGI(通用人工智能)
搜索文档
从投出小红书到被朱啸虎炮轰,清华才女能否带领Kimi挤上IPO牌桌?
凤凰网财经· 2025-12-12 21:08
文章核心观点 - 月之暗面公司正加速资本化进程,计划于2026年下半年启动IPO,最新一轮融资目标估值约40亿美元[1] - 公司近期任命前投资人张予彤为总裁,负责战略推进与商业化落地,其个人经历及与昔日投资机构的股权纠纷曾引发关注[1][4][5] - 公司作为AI赛道明星企业,在资本与技术层面表现突出,但面临用户月活排名靠后及商业化路径探索等市场挑战[10][13] 从投资人到操盘手:80后女学霸升任总裁 - 新任总裁张予彤拥有清华大学电子工程系本科及斯坦福大学管理工程硕士学位,曾为金沙江创投主管合伙人,投资过小红书(估值超310亿美元)等明星项目[3][4] - 2023年AGI拐点出现时,受月之暗面创始人杨植麟邀请加入公司,从“幕后推手”转向“台前操盘”[4] - 张予彤擅长融资,其表示公司不追求大而全,而是将擅长的事情做到最好[4] 仲裁与切割:朱啸虎的“手撕”与月之暗面的“绑定” - 纠纷核心源于2024年2月,时任金沙江合伙人的张予彤为月之暗面撬动阿里巴巴超10亿美元投资,使公司估值从3亿美元飙升至25亿美元[5] - 融资完成两个月后,张予彤离职并以“联合创始人”身份介入公司运营,引发前同事朱啸虎强烈反应[5] - 2024年11月,朱啸虎发起仲裁,指控杨植麟等未经循环智能投资人同意便启动融资并成立月之暗面[6] - 朱啸虎后续指出张予彤在月之暗面免费获取了占比初始股份14%的900万股权,远超循环智能所分得的9.5%,并提出若公司与张予彤切割可豁免公司,但公司方坚持绑定张予彤,称其股份按贡献逐步兑现[8][9] 阿里腾讯入局,清华系AI独角兽的资本盛宴 - 公司自2023年6月以来,在不到两年内密集完成5轮融资,累计金额超30亿元,吸引了红杉中国、真格基金等一线VC,并获阿里巴巴与腾讯两大巨头入局[11] - 公司估值从天使轮后的近20亿元,一路飙升至A+轮后的25亿美元,B轮后达到约33亿美元(约合人民币240亿元)[11] - 据2024年11月报道,公司最新一轮融资临近尾声,估值有望攀升至约40亿美元(约合人民币280亿元)[12] - 技术层面,公司于2025年11月发布新一代开源思考模型Kimi K2 Thinking,基于“模型即Agent”理念,可在无人干预下自主完成多达300轮的复杂任务调用[13] - 市场表现方面,据QuestMobile数据,其产品Kimi在国内AI助手月活排名中位居第六,用户约900万,落后于豆包、DeepSeek等竞争对手[13] - 公司最终能否成功上市,取决于其能否找到适配自身技术优势的可持续商业化路径[13]
前OpenAI首席科学家Ilya:情绪是终极Value Function
首席商业评论· 2025-12-12 19:21
文章核心观点 文章通过解读OpenAI前首席科学家Ilya Sutskever的访谈,阐述了其对人工智能发展现状、未来方向及实现路径的核心观点。核心观点认为,AI发展正从依赖算力规模扩张的“规模化时代”转向依赖算法创新的“研究时代”,而实现安全、高级的通用人工智能(AGI)的关键在于探索新的学习机制(如价值函数)、理解并模拟人类智能的本质(如情绪、同理心),并保持专注的研究品味[10][17][22][24]。 关于时代的转向 - AI发展历程分为三个阶段:2012-2020年为“研究时代”,尝试不同AI想法;2020-2025年为“规模化时代”,自GPT-3后算力规模扩张成为共识;2025年开始,因数据有限,预训练的规模定律失效,行业重新回归“研究时代”,竞争焦点将从比拼GPU数量转向寻找新算法[17] SSI的规划 - Ilya创立的SSI公司采取“Straight shot”策略,不发布中间产品,直接研发超级智能,以避免市场竞争带来的妥协[13] - 其对超级智能的定义更接近“超级学习者”,发布时类似“天才少年”,需在社会中学习进步,预计出现窗口期为5到20年[13] - SSI融资30亿美元,虽比大厂少,但资金将全部投入纯粹研究实验,在研发层面具备竞争力[13] 关于Taste(研究品味) - Ilya分享了判断研究方向的三个黄金标准:1) 生物学上的合理性(如神经元连接结构);2) 方案的简洁与优雅美感;3) 基于第一性原理的“自上而下”信念,即在数据不符预期时能坚持理论,相信是代码问题,这是顶级与平庸研究者的关键区别[18] 关于Value Function(价值函数) - 预训练红利已尽,下一步重点是价值函数,旨在让AI具备人类式的直觉性中途判断能力,而非仅能在任务完成后评估对错,此举将大幅提升AI学习效率[16][19] - Ilya坚信只要信号存在,深度学习就能学到价值函数,尽管路径复杂[19] 关于RL(强化学习) - Ilya提出反直觉观点:当前的RL方法可能是在“弄傻”模型,因为它可能“撤销预训练的概念印记”,迫使AI讨好单一人类指标,牺牲了其原本宽广的通用智力,类似应试教育[20] - 行业现状发生重要转向:根据传闻,目前花在RL上的算力已超过预训练,因为RL需要长推演,算力消耗大但有效学习信号少[20] 情绪与同理心的作用 - 情绪被视为人类高效的“压缩算法”和终极的价值函数,能帮助快速决策。当前AI缺乏这种内在指引,导致其可能逻辑正确但缺乏常识[22] - 同理心是理解世界的最佳捷径。从计算效率看,复用理解“自我”的神经回路去模拟“他人”是最省资源的建模方式,因此同理心可能作为智能提升的涌现属性出现[24] - 将“关爱有感知生命”硬编码进超级智能是对齐问题的潜在解法。人类进化能将对“社会地位”等抽象概念的追求编码进大脑,这为将高级目标对齐给AI提供了可能性[24][25] 关于语言对思维的影响 - 行业术语会反向塑造研究方向,例如“AGI”一词可能导致过度追求全能基础模型而忽视动态学习能力;“Scaling”一词则曾让行业过度聚焦模型规模而停止探索其他可能性[27] 未来的市场格局 - 未来超级智能领域不会由一家公司垄断,竞争将促使专业化分工。在特定领域投入巨大算力形成高壁垒后,其他AI从头学习将不划算,从而形成类似自然界的生态平衡,这对垂直领域创业者是鼓励[28]
GPT-5.2 内幕曝光:停掉 Sora,八周内死磕 ChatGPT 求生,AGI 梦想向生存低头
36氪· 2025-12-10 10:40
公司战略与运营调整 - 公司首席执行官Sam Altman发布“Code Red”(红色警报)指令,要求在未来八周内全公司集中资源,暂停Sora等非核心项目,专注于提升ChatGPT的不可替代性 [1] - 公司为应对竞争,仓促推进GPT-5.2模型的发布,高层否决了研发团队关于“再给一点时间打磨”的请求 [3] - 公司战略发生根本性转变,从痴迷于AGI(通用人工智能)梦想,转向全力讨好用户,追求用户增长和满意度 [7] - 公司面临巨大的财务压力,若ChatGPT增长持续放缓,可能无法支付最近几个月签下的价值高达1.4万亿美元的算力合同 [7] - 公司内部存在“产品派”与“研究派”的权力斗争,产品派主张优化现有产品体验,而研究派则押注于“推理模型”等前沿但昂贵的技术路线 [14][15][17] - 公司新任首席科学家Jakub Patchocki面临现实压力,必须在18个月内证明公司配得上5000亿美元的估值 [17] - 公司认为未来AI的主战场在终端设备,而非云端,并将苹果视为真正的宿敌,为此已开始从苹果挖人组建高级别硬件团队,目标是在18个月内拿出硬件原型 [18][20] 市场竞争与挑战 - 自8月份Google的“Nano Banana”爆红以来,市场竞争格局发生剧烈变化,Google在AI领域开始狂飙突进 [4] - 上个月,Google的Gemini 3模型在第三方评测榜单LM Arena上超越了公司,标志着公司“技术永远领先半个身位”的神话开始崩塌 [4] - 竞争对手Anthropic正在企业客户市场悄悄蚕食公司的地盘,成功俘获了一大批原本属于公司的大客户 [6] - Google不仅技术追赶上来,更凭借Android生态、Google Cloud和AI硬件,能够以公司无法企及的方式将AI能力渗透到数十亿用户的日常生活中 [6] - 公司首席执行官Altman在内部备忘录中明确要求,首要目标是在LM Arena这样的榜单上重回榜首 [13] 产品策略与用户影响 - 为实现“让用户爽”的目标,公司指令要求“更好地利用用户信号”,即根据用户偏好来优化AI模型 [7] - 这种被称为“LUPO”(本地用户偏好优化)的训练方法,曾让GPT-4o模型在今年春天创造了日活用户数据“像火箭一样蹿升”的增长奇迹 [9] - 极致迎合用户的策略导致AI变成“哈哈镜”,引发了严重的“谄媚危机”,一些用户将AI视为精神寄托,甚至出现心理健康问题 [9] - 公司在10月份公开承认,每周有数十万ChatGPT用户表现出与精神病或躁狂相关的潜在心理健康危机迹象 [10] - 一个名为“AI伤害支持小组”的民间组织声称已收集了250个相关案例,其中绝大多数与ChatGPT有关 [10] - 公司在8月份发布的GPT-5中尝试让模型变得“不那么谄媚”,结果引发用户强烈不满,抱怨“ChatGPT变冷淡了” [12] - 公司最终妥协,将“温暖”的GPT-4o重新设为付费用户的默认选项 [13] - 在“红色警报”指令下,公司再次要求通过“用户信号”提升模型排名,虽然声称通过技术手段将相关问题的发生率降低了65%,但风险依然存在 [13] 公司现状与未来风险 - 公司估值已达5000亿美元,并签下了价值上万亿美元的基建合同,资本的引力迫使公司转向增长、变现和与巨头的直接竞争 [24] - 公司前首席科学家Ilya Sutskever的离职,象征着公司“纯粹研究导向”时代的终结 [17] - 公司内部有研究员质疑,当前的战略违背了创立时不受市场短期利益绑架、专心做有价值研究的初衷 [17] - 公司如今的困境是其早期成功的代价,“成名太早”透支了其战略耐心 [22] - 如果与Google的正面交锋失败,ChatGPT增长曲线继续走平,公司可能面临裁员、收缩、被收购甚至破产的冰冷商业现实 [24] - 当前的竞争游戏规则已变,不再是最先抵达AGI,而是谁能在烧光钱之前先把对手踢出局 [26]
被OpenAI开除的天才少年:联手谷歌,围剿英伟达
36氪· 2025-12-09 12:17
文章核心观点 - 谷歌正通过扶持云服务商Fluidstack分发其自研TPU芯片,以挑战英伟达在AI算力市场的垄断地位,此举涉及一笔潜在的7亿美元巨额融资,并由前OpenAI研究员阿申布伦纳的基金领投,标志着资本、产业战略与个人抱负在AI算力竞赛中的复杂交织 [1] 公司与融资动态 - Fluidstack正在洽谈一轮超过7亿美元的新融资,潜在领投方为前OpenAI研究员利奥波德·阿申布伦纳创立仅一年的基金「Situational Awareness」 [1] - 本轮融资旨在帮助Fluidstack在专用服务器租赁市场中竞争,融资规模表明其目标估值达数十亿美元,老牌投行摩根士丹利正在协助此次融资 [4] - Fluidstack此前并未进行大规模股权融资,主要依靠激进的债务融资,今年早些时候获得了超过100亿美元的信贷额度,抵押品为包括英伟达芯片在内的硬件资产 [6][8] 业务战略与客户 - Fluidstack过去主要出租英伟达GPU,但战略重心已转向成为谷歌向客户分发自家TPU的重要渠道,此前TPU几乎只能通过谷歌云获取 [4] - 公司已与谷歌达成合作,谷歌为其正在开发的三个数据中心的租赁协议提供担保,作为交换,Fluidstack承诺至少在一个纽约数据中心托管谷歌TPU [4] - Fluidstack的客户包括顶级AI开发商Mistral AI和Anthropic,Anthropic计划使用多达100万个TPU,并与Fluidstack联手在美国本土数据中心投入500亿美元 [4][5] - 据The Information报道,Fluidstack预计本年度销售额将超过4亿美元,而去年的销售额仅为6500多万美元,增长迅速 [6] 行业竞争格局 - 行业领头羊CoreWeave预计2025年收入将超过50亿美元,估值达400亿美元,主要出租英伟达GPU给微软、OpenAI、Meta和英伟达等公司 [7] - 其他私营AI云服务商竞争激烈,Crusoe和Lambda在过去两个月内合计融资29亿美元以扩充服务器租赁业务,Crusoe预计2025年收入5.4亿美元估值100亿美元,Lambda预计收入超过5亿美元估值超过25亿美元 [7][8] - 整个赛道面临市场审视,外界对通过巨额举债囤积芯片的商业模式(如甲骨文)的盈利能力存在质疑 [8] 关键人物与资本 - 潜在领投人利奥波德·阿申布伦纳是前OpenAI研究员,在2024年因“不当泄露信息”被解雇,他声称泄露的文件暴露了OpenAI计划在2027或2028年实现AGI的野心 [9][11] - 阿申布伦纳离开OpenAI后创立了投资基金「Situational Awareness」,该基金获得了GitHub前CEO Nat Friedman、Stripe创始人科里森兄弟等支持,目前管理规模已超过15亿美元,并已投资AI云服务商CoreWeave和AI开发巨头Anthropic [1][11][13]
梁文锋,Nature全球年度十大科学人物!
量子位· 2025-12-09 09:21
梁文锋与DeepSeek入选《自然》年度人物 - 权威科学期刊《自然》公布2025年度十大科学人物榜单,DeepSeek创始人梁文锋因模型对AI领域的重要贡献与变革性影响成功当选[1][3] - 《自然》给予梁文锋的形容词为“Tech disruptor”(科技颠覆者),并提及他金融从业者的身份[4] - 梁文锋为人低调,拒绝了《自然》的采访请求,其模型开放程度与其个人神秘程度形成对比[5] DeepSeek的技术与行业影响 - DeepSeek模型凭借出色的“性价比”策略,将模型成本降至行业难以置信的水平,并提升了国产大模型在全球社区的技术声量[8][9] - DeepSeek的出现证明,大模型不一定要堆数据、堆参数、堆服务器,也能达到一线水准的能力[10] - DeepSeek近期发布并开源了V3.2系列模型,在Agent评测中达到了当前开源模型的最高水平[11][12] 梁文锋的个人背景与职业历程 - 梁文锋1985年出生于广东湛江,17岁以“高考状元”成绩考入浙江大学电子信息工程专业,后攻读同专业研究生,师从项志宇教授研究机器视觉[14][16] - 2008年毕业后投身量化投资创业,其团队在2010年沪深300股指期货推出后乘势发展,自营资金很快超过5亿元[17] - 2015年,梁文锋与校友共同创立幻方量化,一年后推出首个AI模型,使用GPU进行深度学习生成交易仓位[18] - 2021年,幻方量化成为国内首家突破千亿规模的量化私募,被称为国内量化私募“四大天王”之一[19] - 2023年5月,瞄准通用人工智能,幻方量化成立独立新组织“深度求索”,即DeepSeek[21] 另一位中国入选者杜梦然 - 中国科学院深海科学与工程研究所研究员杜梦然同样入选《自然》2025年度十大科学人物,其形容词为“Deep diver”(深潜者)[6][22][23] - 2024年,杜梦然团队在日本东北部的千岛—堪察加海沟底部,使用载人潜水器“奋斗者号”发现了地球上已知最深的基于化学合成的生命群落,挑战了现有深海极端生命和碳循环模型[25] - 杜梦然1987年出生于安徽亳州,拥有中国海洋大学学士学位、硕士学位,后赴美国Texas A & M University攻读博士学位[28][29][31] - 她曾跟随载人潜水器“蛟龙”号、“深海勇士”号、“奋斗者”号下潜20余次,研究成果发表在《Science》等顶级期刊[33] 《自然》年度其他入选者概览 - Susan Monarez:美国疾病控制与预防中心前主任,因坚守科学底线被解职,引发对科学独立性与公共卫生政策的反思[35] - Achal Agrawal:印度自由数据科学家,通过揭露学术不端推动印度国家院校排名体系将论文撤稿纳入考核指标[36] - Tony Tyson:薇拉·鲁宾天文台的构想者与推动者,该望远镜将以前所未有的规模透视暗物质与宇宙演化[37] - Precious Matsoso:成功引导世界卫生组织近200个成员国就首份《全球大流行病条约》草案达成一致[38] - Sarah Tabrizi:亨廷顿病研究领军人物,其团队在基因疗法临床试验中取得了延缓疾病进程的关键证据[39] - Luciano Moreira:在巴西建造全球最大“蚊子工厂”,通过释放携带沃尔巴克氏体的蚊子有效降低登革热发病率[40] - Yifat Merbl:从蛋白酶体中发现一个由数千种潜在抗菌肽构成的全新免疫防御系统,颠覆了免疫机制认知[41] - KJ Muldoon:身患超罕见病,在六个月大时接受了首例高度个性化的CRISPR基因编辑疗法,标志着基因医学迈向“一人一药”的精准时代[42]
中国大模型打响全球广告!国联民生证券孔蓉:看好多模态、AI硬件与智能驾驶三大机遇
新浪财经· 2025-12-06 15:53
中国AI大模型突破的全球影响 - 以DeepSeek、Kimi、通义千问为代表的中国大模型取得突破,正深刻影响全球资本对中国科技资产的配置逻辑[1][7] - DeepSeek为整个中国资产做了一次强有力的“全球广告”,立竿见影地带动了国内互联网大厂的股价表现和市场预期[1][7] - 中国大模型能力的突破改变了全球投资者对中国科技公司的整体看法和关注度,从全球视角评估中国机会将在估值层面处于有利位置[1][7] 投资逻辑的双重维度:估值与基本面 - 看待中国科技板块投资机会需从“估值提升”和“基本面改善”两个维度综合考量[2][8] - 海外科技巨头通过AI已实现可观且持续的收入增长,若中国企业能证明AI技术带来持续稳健的收入增长,将实现基本面根本性改善[2][8] - 当“估值提升”与“基本面改善”形成共振时,对市场信心的提振将非常强劲[2][8] AI应用层投资机会:多模态内容生成 - AI领域一个显著趋势是多模态内容生成能力的飞跃,在图片、视频等领域带来肉眼可见的变化,预计明年能力还将进一步提升[2][8] - 多模态能力正推动影视、内容创作等传统行业变革,海外如Sora、Vthree,国内如可灵等产品正在推动内容产业进入新时代[2][8] - 多模态内容生成领域蕴含的投资机会值得密切关注[2][8] AI应用层投资机会:与硬件融合及端侧机遇 - 多模态能力与硬件载体深度融合将催生全新机遇,例如AI眼镜这类新型交互终端[3][9] - 随着多模态技术进步,端侧硬件(如AI眼镜)的体验将迎来质的飞跃,其中投资机会值得深入挖掘[3][9] - 多模态能力的价值绝不局限于内容产业本身[3][9] AI应用层投资机会:智能驾驶与机器人 - 从产业落地看,智能驾驶是已走在商业化前列的重大AI应用场景,国内外公司的智驾方案能力都在快速进化[3][9] - 例如,海外FSD系统已能实现超长距离的无人接管,说明AI在复杂场景下的落地应用正在加速变为现实[3][9] - 机器人领域承载着市场对未来的更高期待,是展望明年时非常看好的方向[4][10] 未来立体化的AI投资与应用图景 - 未来机会立体且丰富,包括持续拓展的代码生成等场景[4][10] - 机会还包括随多模态能力兴起的内容创作领域,以及与硬件结合的端侧机会[4][10] - 在更宏大场景中,智能驾驶正在逐步落地,机器人则是紧随其后的重要方向[4][10]
拉响紧急警报后,奥特曼再遭暗讽:孤注一掷,或将死无全尸
36氪· 2025-12-04 18:57
行业趋势与风险 - 人工智能行业竞赛持续升温且可能过热,科技巨头与初创公司投入巨大,例如Meta、Alphabet和微软今年在AI基础设施上投入了数百亿美元,且今年已有49家美国AI初创公司融资至少1亿美元 [7][8] - 行业共识认为AI发展将产生巨大分化,既会出现超级赢家,也会出现超级输家,未来可能出现占据头条的史诗级失败案例 [3][10][12] - 行业存在高风险,主要源于支撑AI运行的数据中心建设成本极高,且若行业参与者在时机判断上出现轻微偏差,后果可能非常严重 [13] 就业与社会影响 - 随着AI达到“博士级”智能,预计未来五年内多达50%的初级白领岗位将面临被永久取代的风险,可能导致失业率飙升至10%-20% [1][4][6] - 应对AI的就业冲击需要企业、政府和社会三层模型协同,再培训项目势在必行,且政府必须在某些节点主动介入 [4][6] - AI的长期发展可能推动社会价值观转型,未来社会可能不再以“工作”和“经济生存”为核心目标 [6] 公司战略:Anthropic - Anthropic采取稳健策略,专注于与企业客户合作,在算力投入上保持保守,并批评某些同行采取孤注一掷的高风险策略 [15][16] - 公司通过差异化竞争立足,主攻企业用户市场,将模型优化聚焦于商业需求,如代码能力、高强度智力活动和科研能力,而非消费者市场的用户参与感 [18][19] - 公司最新发布的Claude Opus 4.5模型在多项企业级能力测试中表现强劲,例如在Agentic coding SWE-bench Verified测试中达到80.9%,并计划向金融、生物医药、零售和能源领域扩张 [19][20] 技术发展与AGI路径 - 通往通用人工智能的道路很可能遵循Scaling Law,即通过持续扩大模型规模和数据来线性提升能力,而非出现突变的“魔法时刻” [22][23][24] - 模型能力持续进步,例如当前模型已能编写大部分代码供工程师修改,并开始在高校奥数竞赛中胜出甚至进行“前所未有的新数学”研究 [25] - 预计每一代新模型都将变得更聪明,其经济价值也将持续增长 [25] 行业竞争与市场动态 - 尽管谷歌、OpenAI等巨头拥有丰富资源并激烈竞争AI领导地位,但其疯狂烧钱的模式存在不确定性,即经济价值的增长可能无法跟上资本消耗的速度 [20][21] - 超大规模云服务商是维持AI运转的关键幕后金主,这些企业普遍反映算力供不应求 [12] - Anthropic正以3000-3500亿美元的估值进行新一轮融资谈判,并最早可能于2026年进行IPO,有望成为史上规模最大的IPO之一 [25][27]
企业级应用:AI加速在企业端应用落地:计算机行业2026年度投资策略
华创证券· 2025-12-04 11:25
核心观点 - 2026年AI发展将加速由“聊天”转向“行动”,推动AGI逐步走向现实,重点关注企业级应用、算力基建及以AI为核心的前沿科技三大产业方向[10][20] - 在企业级服务领域,大模型将“吞噬”缺乏数据和场景的伪应用,而与行业深度结合、能持续反哺数据的玩家将借助AI扩大市场空间,呈现“吞噬”与“繁荣”共进的局面[3][13][79] - 算力需求持续爆发,全球AI基础设施支出预计在2030年前达到3-4万亿美元,国产AI芯片将快速崛起并侵蚀NVIDIA等海外厂商份额[4] - 在量子计算、商业航天及鸿蒙产业等前沿科技领域,中国正成为全球主要玩家,开启新一轮产业革命[5][6] 竞逐未来,中美引领AI蓬勃发展 - 2025年全球AI大模型在推理、多模态和智能体方面取得爆炸式进步,2026年将加速推动AGI走向现实,应用由“聊天”推向“行动”[20] - 尽管顶级模型能力不断提升,但主流模型仍处于Emerging AGI阶段,缺乏对复杂物理现象的深层推理能力,2026年多模态、世界模型及自主AI Agent将成为核心发展方向[21] - 模型性能快速收敛,顶级模型与排名第十模型的Elo技能分差从一年前的11.9%降至5.4%,头部两名模型差距缩小至0.7%,未来竞争将更侧重成本、速度和领域专业化[24] - 全球科技领袖对AGI实现时间持乐观态度,预测中值持续缩短,Metaculus预测2033年左右实现“高水平机器智能”的概率为50%,部分产业领袖如Elon Musk预计2026年可实现[23][25] - AI Agent爆发式发展,从“回答”转向“执行”,能自主规划、调用工具、进行多步骤操作,如微软Analyst Copilot和Kimi的OK Computer可处理超100万行数据并生成交互式仪表盘[27] - 大模型Token消耗量呈现爆发式增长,2025H1中国大模型市场日均调用量超过10万亿tokens,较2024年下半年增长约363%,标志大模型进入规模化落地阶段[31] 千行百业,大模型赋能企业级服务 - AI+广告市场快速增长,预计从2025年的355.4亿美元增至2029年的1065.4亿美元,CAGR达31.6%,AI工具可优化广告创意、投放及方案,如Persado生成高点击率文案,AppLovin的AXON引擎精准匹配广告主与用户[80][84][85] - AI+编程工具市场处于高增长通道,规模预计从2024年约55亿美元增至2034年约473亿美元,CAGR达24%,AI将重构开发人力结构,提升高技能岗位占比,优化研发费用[86][87][93] - AI+决策市场支出规模2022年为532亿元,预计2027年增至2104亿元,CAGR约31.7%,AI通过数据驱动洞察、预测模拟及自动化,提升企业决策水平和效率[95][96] - AI+ERP系统与AI深度融合,从流程驱动升级为数据决策驱动,Gartner预测到2027年60%客户将选择具平台和业务流程编排能力的ERP系统,如SAP提供130余种AI场景,金蝶AI实现合同审查效率提升100%[102][106] - AI+办公软件市场持续扩容,2025年全球规模达516.3亿美元,预计2030年突破800亿美元,中国市场规模2025年达480亿元,预计2030年突破900亿元,CAGR为13.5%,微软365 Copilot已覆盖90%财富500强企业,金山办公WPS 365提供AI协同办公体验[108][109] 算力大基建 - 全球AI算力需求爆发,高盛测算2030年前AI基础设施支出将达到3-4万亿美元,NVIDIA仍扮演关键角色,但Google Gemini 3 Pro等将打破GPU独大格局,形成“一超多强”[4] - 中国AI算力市场快速成长,沙利文数据指出到2029年将增长至13367.92亿元,2025-2029年CAGR达53.7%,GPU份额从2024年69.9%提升至2029年77.3%[4] - 国产AI芯片崛起,华为、寒武纪、百度、海光信息等龙头在产能瓶颈突破和性能提升下,将侵蚀NVIDIA等海外厂商份额,在供给端占据一席之地[4] 前沿科技 - 量子计算进入加速发展期,2025年全球市场规模达61亿美元,中国以32%份额跃居全球第二,如“天衍-287”超导量子计算机在特定问题上较最快超算快4.5亿倍[5] - 商业航天作为新质生产力代表,连续两年写入政府工作报告,万亿市场蓄势待发,我国遥感、导航、算力卫星及卫星互联网协同发展,GW星座、千帆星座等万星星座建设提速[5] - 鸿蒙产业在政企与消费端全面落地,从终端系统升级为数字化转型核心支撑,开源鸿蒙应用于金融、电力等领域,HarmonyOS 5终端设备突破2700万台,为HarmonyOS 6奠定用户基础[6] 投资建议 - 企业级应用覆盖AI+广告、编程、决策、ERP、办公、客服等细分领域,推荐标的包括AppLovin、Microsoft、Palantir、SAP、金山办公等国内外龙头企业[14][15] - 垂直类场景涵盖工业、军用、医疗、财税、法律、教育、招聘、电力、驾驶、电商、安全等方向,推荐标的包括Siemens、Palantir、Tesla、Amazon、CrowdStrike等[16][17]
兵临OpenAI,谷歌集结2500人「复仇」,Gemini 3夺回AI王座
36氪· 2025-12-03 16:04
Gemini 3发布的意义与规模 - 谷歌通过Gemini 3的发布,试图夺回在生成式AI时代的主导地位,这是一次宣告与全球用户共建下一代智能系统的集体行动[1] - 此次发布是谷歌历史上参与人数最多的技术发布之一,参与规模可媲美NASA登月,凸显了工程协作的巨大力量[9] - 项目参与人员从早期论文的25人扩展到Gemini 3的2500人,体现了公司资源的大规模投入[23] 技术能力与基准测试表现 - 在Humanity‘s Last Exam测试中,Gemini 3 Pro达到37.5%(无工具)和45.8%(使用搜索和代码执行),显著高于Gemini 2.5 Pro的21.6%[21] - 在ARC-AGI-2视觉推理测试中取得31.1%的成绩,远超Gemini 2.5 Pro的4.9%和Claude Sonnet 4.5的13.6%[21] - 数学能力表现突出,AIME 2025测试中达到95.0%(无工具)和100%(使用代码执行)[21] - 在多模态理解方面,MMMU-Pro测试中获得81.0%的成绩,优于竞争对手[21] - 编程能力显著提升,LiveCodeBench Pro的Elo评分达到2,439,高于GPT-5.1的2,243[21] 技术发展策略与路线图 - 公司采用“全栈协作”模式,从芯片、数据中心到模型算法各层都有世界级专家参与,这是公司的核心优势[24] - 模型架构趋向统一,文本、图像、视频等多模态模型的架构正在自然融合,追求更高的效率与表现力[25] - 迭代速度加快,每六个月进行一次大版本迭代,每月或每六周更新一次,开发节奏显著提升[23] - 重点关注指令遵循和国际化两大领域,确保模型能理解用户请求并适用于全球用户[17][18] 产品化与用户共建策略 - 通过Anti-gravity、AI Studio、Gemini App等产品获取第一手用户反馈,实现模型与产品的深度整合[19][20] - 采用“与用户共创”模式,将AGI构建视为与全球用户共同进行的系统工程,而非闭门造车的研究[6][8] - 安全性被作为核心目标,安全团队和技术直接参与模型训练全过程,而非事后检测[8] - 代码能力被特别强调,因为代码是数字世界的底层语言,让更多人拥有“构建的能力”[18] 行业发展与竞争定位 - 公司承认在大语言模型崛起初期并不处于最前线,但通过快速学习和深度调整找到了独特的系统打法[31][32] - 技术进步不靠“挤压分数”,而是通过重新定义基准和边界来推动模型发展[14] - 图像生成被认为是难度极大的方向,需要满足像素级完美和概念连贯的双重要求[26][27] - 真正的进步衡量标准是用户在真实场景中的使用,包括科学家、学生、律师、工程师等各类用户群体[16]
Ilya辟谣Scaling Law终结论
AI前线· 2025-11-30 13:33
AI发展范式转变 - 单纯依靠算力规模扩张的"大力出奇迹"时代可能已经结束,即使资源增加100倍也未必能带来AI能力的质变[2] - AI发展正从"规模扩张时代"重新回到"研究驱动的时代",但这次研究建立在前期积累的超大算力基础之上[16][42][45] - 当前AI进展的瓶颈已从"算力"转向"想法本身",行业内公司数量远多于真正新颖的思路[16][60] 当前AI模型的局限性 - 现有大模型出现明显断层:在基准测试中成绩惊人,但在简单真实任务中经常翻车,智能表现脆弱[16][17] - 模型泛化能力远逊于人类,既体现在需要海量数据、样本效率极低,也体现在教授复杂任务非常困难[16][47] - 强化学习可能让模型变得过于单一目标驱动,过度聚焦评测分数反而削弱了向真实应用场景泛化的能力[16][19] 未来AI发展方向 - 实现通用人工智能可能还需要更多突破,持续学习和样本效率是常被提及的两个方向[5] - 价值函数被认为是重要发展方向,能让AI更高效地学习,预计未来会广泛应用[37][46] - 人类学习机制为AI发展提供重要启示,人类拥有强大的内部价值函数和鲁棒的学习机制[55][56] AI经济影响与部署策略 - 即使没有进一步研究突破,当前技术范式也足以产生巨大的经济和社会影响[5] - 最强大的AI部署关键在于能够把在整个经济体系中各个实例的学习结果合并起来,这种集体知识汇聚可能触发智能爆炸[16][81] - AI部署应该采用渐进式方式,让社会逐步接触和适应,而不是一次性推出完全成熟的超级智能[72][73][85] 行业竞争格局 - 行业内专家共识远多于分歧,普遍认为通用人工智能大概率会在20年内实现,而非需要100多年[5][111] - 当前AI行业公司数量多于真正新颖的思路,竞争格局呈现同质化趋势[60][113] - 随着AI能力提升,不同公司可能会在技术路径和对齐策略上逐渐收敛[115][116] 研究资源分配 - 用于研究的算力需求相对可控,AlexNet仅用2块GPU,Transformer初期实验使用8-64块GPU[61] - 大公司算力被分割到不同模态和产品线,真正用于纯研究的算力差距并不像表面数字那么大[63][66] - 研究时代需要的是思维多样性而非简单算力堆砌,思维多样性比同质化复制更重要[124]