AGI
搜索文档
OpenAI晒出铁证,奥特曼撕烂马斯克:你想让儿子接管AGI?
36氪· 2026-01-19 19:25
文章核心观点 - 马斯克诉OpenAI一案的核心争议远超出非营利与营利架构之争,实质是关于谁将掌控通用人工智能控制权的终极博弈 [1] - OpenAI通过公布大量内部通信记录反驳马斯克,指控其才是推动公司营利化的幕后推手,并曾为个人火星殖民计划索要公司绝对控制权 [3][13][15] - 双方的根本矛盾在于:马斯克认为AGI必须由其本人或其公司控制以确保安全,而OpenAI团队则认为AGI的开发需要巨额资本,但不能将控制权交给任何单一“独裁者” [20] 事件背景与起源 - 2015年,马斯克、奥特曼、Ilya Sutskever等人共同创立非营利组织OpenAI,愿景是开发安全AGI以造福全人类,防止科技巨头垄断 [11] - 马斯克是联合创始人、董事会成员及初期最大金主,承诺投资10亿美元,但实际到账4500万美元 [11] - 至2017年,团队意识到开发AGI耗资巨大,非营利架构难以筹集足够资金,关于是否及如何转型的讨论开始 [11][12] OpenAI对马斯克指控的反驳 - OpenAI发布题为《The truth Elon left out》的博文,引用2017年前后的内部邮件、短信及联合创始人Greg Brockman的日记作为证据 [3] - 证据显示,早在2017年9月,马斯克本人也同意OpenAI需要从非营利组织转型,并讨论过渡为B-corp或C-corp的方案 [14] - 马斯克曾提议保留非营利实体,同时另设一个C-corp,此方案得到了包括Ilya在内的创始团队赞同 [14] 控制权与资金冲突 - 马斯克在谈判中要求获得OpenAI的多数股权和完全控制权,其目的是为筹集800亿美元用于在火星建造自给自足的城市 [15] - 马斯克甚至提及未来可能由其子女来控制AGI [9][15] - 在结构调整谈判前,马斯克已要求OpenAI的核心团队成员(如Ilya Sutskever, Greg Brockman, Andrej Karpathy等)花费大量时间协助特斯拉的自动驾驶项目 [16] 谈判破裂与马斯克退出 - 马斯克向OpenAI发出最后通牒:要么给予他更多董事会席位和控制权并承诺其一段时间内不辞职,要么他将离开并创建竞争对手 [17] - 联合创始人Greg Brockman在日记中透露,团队想要创建营利性的B型公司,但因担心对马斯克食言而陷入“道德破产”的两难境地 [17] - 2018年初,马斯克断言OpenAI募集数十亿美元资金的计划不现实,即使通过ICO(首次代币发行)也无法实现,并称公司相比谷歌“正走在一条注定失败的道路上” [18] - 马斯克离开时表示,OpenAI团队若不加入特斯拉,其成功的概率为0%,只有并入特斯拉才有一丝胜算 [18] AGI控制权的根本分歧 - 马斯克的底层逻辑是:AGI过于危险和强大,必须由其本人控制(例如在特斯拉旗下或由其控股),否则就不应存在 [20] - OpenAI团队的逻辑是:开发AGI需要巨大资源(算力、电力、数据),因此必须引入资本并采用部分营利结构,但控制权不能交给任何单一的个人独裁者 [20] - 对控制权的担忧具有普遍性,不仅针对马斯克,也体现在OpenAI内部,例如Ilya Sutskever在2023年曾短暂领导将奥特曼赶下CEO位置的行动 [20] - Ilya Sutskever于2024年离开OpenAI并创办自己的AI安全公司,反映出对行业在追逐利润中忽视安全的深层忧虑 [22][23] 事件最新进展与影响 - 大量诉讼文件被法院解封,显示奥特曼间接持有OpenAI股份,并同时担任非营利组织的独立董事和CEO [1] - 文件亦显示OpenAI总裁Greg Brockman曾计划将马斯克踢出局并组建营利性公司 [1] - 奥特曼在社交媒体上指责马斯克的诉讼文件断章取义,并爆料了其火星城市计划及让孩子掌控AGI的言论 [5][9] - 案件定于4月27日在奥克兰联邦法庭开庭,双方将在陪审团面前宣誓作证,这场法律战被视为一场价值数千亿美元的信用之战 [24]
没有商业模式--DeepSeek最坚固的“护城河”
华尔街见闻· 2026-01-19 17:46
文章核心观点 - DeepSeek的长期优势与核心竞争力在于其独特的“零外部融资、无商业化压力”模式 这使得公司在全球AI实验室中成为异类 能够不计成本、不看投资人脸色、专注于AGI研究 这种由母公司幻方量化利润支撑的“自筹资金”模式 构成了其最坚固的护城河 [2][3][8] 市场预期与竞争格局 - 市场对DeepSeek在“DeepSeek时刻”一周年(1月27日)发布新模型抱有高期待 但作者认为其难以再次像去年那样震惊世界 因为开源模型市场已趋于饱和 [3][4] - DeepSeek虽以MIT License打响了开源模型第一枪 但已不再是唯一或最开放的玩家 例如未开源其训练数据集和主代码库 [3][5] - 根据Artificial Analysis数据 当前全球开放程度排名前三的模型分别来自NVIDIA(Nemotron 3)、Allen Institute(Olmo 3)和穆罕默德·本·扎耶德人工智能大学(MBZUAI,K2-V2) [5] - DeepSeek模型在开放模型中 已不再是最强、最便宜或最开放的 [8] 独特的“零融资”商业模式 - DeepSeek是全球顶尖AI实验室中唯一坚持“零外部融资”的异类 创始人梁文锋将控制权置于融资之上 [3][9] - 公司由梁文锋创立的量化基金“幻方量化”提供资金支持 该基金在去年以53%的回报率创造了超过7亿美元(约50亿人民币)的利润 这些利润被直接用于购买GPU和招聘人才 [3][10] - 2023年公司成立初期曾尝试融资 但因中国VC的短视和风险厌恶而失败 这反而成为“塞翁失马” 使其避免了商业化KPI压力 [3][9] - 即便在获得全球知名度后 公司依然拒绝外部融资 以保持对AGI研究路线的完全控制权 [11][12] 自筹资金模式带来的组织优势 - **无资源内耗与组织扁平化**:由于没有外部估值、股票期权和商业化压力 公司内部不存在为争夺算力资源而进行的官僚主义、内斗或权力斗争 组织保持极度扁平 [3][14][15] - **专注研究品味而非堆砌算力**:引用前OpenAI研究员Ilya Sutskever的观点 颠覆性创新(如Transformer架构)最初仅需8到64张GPU 并非无限堆算力 自筹资金模式使团队能专注于研究品味而非被迫消耗预算 [3][13] - **避免“大公司病”与浮夸文化**:对比其他资金充裕的实验室(如Thinking Machines Lab定制品牌杠铃片) DeepSeek避免了因“纸面富贵”和膨胀自我价值感产生的有毒文化 以及对人才的恶性挖角 [3][15][17] 行业融资背景下的对比 - AI行业已成为“销金窟” 几乎所有前沿实验室都在进行大规模融资 例如马斯克的xAI近期完成了高达200亿美元的E轮融资 [3][10] - 一批由明星研究员领导、风投支持的“AI新实验室”涌现 如Thinking Machines Lab、SSI(Ilya Sutskever)和AMI Labs(Yann LeCun) [10] - 即便通过特殊公司治理(如创始人超级投票权)获得控制权 接受风险投资后 大规模商业化的预期迟早会出现 而DeepSeek完全不受此束缚 [12] 投资者的悖论与公司特质 - 从投资者角度看 DeepSeek是极具吸引力的投资标的 但作者也指出 一旦公司接受外部投资 其“纯粹为AGI研究而实现内部最大化对齐”的核心特质将不复存在 [3][18] - 公司的核心优势源于其“无商业模式” 这使其能够长期专注于AGI梦想 而无需对财报负责 [8][12][18]
直击达沃斯:云计算算力和能源正在成为硬约束
新浪财经· 2026-01-19 17:35
AI成为全球基础设施与战略核心 - AI正在从前沿技术升级为全球级的基础设施 讨论焦点从模型参数转向规模化落地等现实问题 [1][6] - AI的规模化落地成为企业核心挑战 需深度嵌入业务流程、组织结构和决策体系 这已从技术部门问题上升至CEO和董事会层面的战略命题 [1][6] - AI的上限不再只取决于算法 而是取决于云计算基础设施的稳定、可扩展与可持续性 算力来源、电力充足与成本可控成为关键约束 [1][6] 基础设施的硬约束与社会许可 - 云计算算力和能源成为AI发展的硬约束 达沃斯首次密集将AI云计算、数据中心、电力和能源安全共同讨论 [1][6] - AI正式进入社会和政治层面博弈 例如美国民众大幅抱怨电费上涨 [2][7] - 微软发布社区优先的AI基础设施方案 旨在少拿补贴、少占资源、在当地创造就业并将长期价值留在社区 这表明获得社会许可与技术能力同等重要 [2][7] 领先企业的战略动向 - 英伟达聘请首位CMO并直接向黄仁勋汇报 这被视为战略动作 标志公司正从卖GPU转向平台及基础设施级角色 需向全球解释算力的部署、使用与长期运行 [4][10] - 谷歌云核心业务负责人密集出现在达沃斯外围活动 焦点在于如何将大模型优势转化为云服务层面的场次竞争力 [4][10] - 云计算与大模型的关系演进 二者可能不再是简单产品组合 而是共同决定成本结构、技术路径和客户粘性的系统工程 [4][10] 行业格局与新兴变量 - 去年Deepseek的横空出世让全球关注中国AI 并导致美股科技巨头股价暴跌 [5][10] - 在全球AI巨头面临资本裹挟和商业化压力时 Deepseek被视为可零外部融资、无商业化压力、只为AGI理想推进的少数派 [5][10] - 全球开始重新关注Deepseek的下一代旗舰模型 及其可能为社区带来的新变量 [5][10] - 在达沃斯这个政治与商业共振的场域 芯片、云模型分发和应用的逻辑被重新梳理 行业参与者正在调整站位 [5][11]
微软、英伟达、红杉重金押注!Anthropic估值瞄准3500亿美元
格隆汇APP· 2026-01-19 15:39
文章核心观点 - 人工智能初创公司Anthropic正在进行一轮大规模融资 目标金额250亿美元 若完成其估值将跃升至3500亿美元 较四个月前的1700亿美元翻倍增长 此轮融资由新加坡GIC和美国Coatue各领投15亿美元 微软与英伟达已承诺150亿美元 红杉资本等将填补剩余超100亿美元缺口 融资被视为其冲刺IPO的重要铺垫 [1] - 红杉资本此次投资打破了行业惯例 在已投资OpenAI与xAI后 再次布局Anthropic 体现了在AI领域“不赌单一赢家”的“全覆盖”押注逻辑 [1] - Anthropic的核心竞争力在于精准卡位企业级市场 并信奉“事半功倍 精益求精”的算力投入理念 与竞争对手OpenAI追求规模化的路径不同 [2][5][8] 融资与估值动态 - Anthropic新一轮融资目标直指250亿美元 交易完成后估值将跃升至3500亿美元 较四个月前的1700亿美元实现翻倍增长 最终细节可能变动 预计交易在未来几周内完成 [1] - 本轮融资为“全明星”阵容 新加坡主权财富基金GIC与美国Coatue将分别注资15亿美元领投 科技巨头微软与英伟达此前已承诺合计150亿美元的投资 剩余超100亿美元缺口将由红杉资本等风投机构填补 [1] - 红杉资本在重组管理层后投资风向转向 打破了风投机构很少投资同一领域竞争对手的行业惯例 在已布局OpenAI与马斯克旗下xAI后 再参与Anthropic融资 [1] - 2026年全球AI独角兽融资中 OpenAI以8300亿美元估值稳居榜首 马斯克旗下xAI估值也已达2300亿美元并持续赶超 [7] 公司经营与市场表现 - Anthropic已连续三年实现每年10倍的营收增长 从2023年的1亿美元 到2025年预计将达到80至100亿美元 [2] - 公司核心产品Claude的总网络访问量在去年12月份较前一年翻番 今年以来全球桌面日活跃用户数增长12% [2] - Anthropic精准卡位企业级市场 凭借Claude系列模型在专业领域的优势 占据了更大的企业用户市场份额 其核心竞争力在于“企业市场” 与谷歌和OpenAI走完全不同的道路 [2][8] - 公司正从专业领域向大众市场渗透 例如推出“Claude Cowork”协作工具 让非专业用户也能快速构建软件程序 [3] 技术发展与战略理念 - Anthropic持续推进技术迭代 于2025年底发布Claude Sonnet 4.5 Haiku 4.5与Opus 4.5三款全新模型 [3] - 公司已敲定约1000亿美元的算力投入承诺 但其信奉“事半功倍 精益求精”的核心理念 与OpenAI将“规模”奉为制胜法宝 高达1.4万亿美元算力基建投入承诺的路径完全不同 [5] - 公司联合创始人认为 过去几年其掌握的算力与资本一直是竞争对手的零头 但模型绝大多数时间里保持着最强性能 [5] - 公司认为AGI不会有一个突变的“奇点” 未来只会是过去的延续 只是程度不断加深 同时强调“指数级增长终有尽头” [4][6] 资本市场规划 - Anthropic已启动IPO筹备工作 聘请律所Wilson Sonsini启动相关程序 最早可能于今年登陆资本市场 [4] - 当前的巨额融资被视为其冲刺公开上市的重要铺垫 [4]
AI手搓的Cowork“李鬼”版跟“李逵”一样能打,还免费?
钛媒体APP· 2026-01-19 12:53
核心观点 - AI Agent产品正从被动对话工具转变为能主动执行任务的“数字员工”,重新定义人机协作边界[11][23] - “AI构建AI”的趋势已显现,AI辅助开发将产品开发周期缩短至以“天”为单位,显著提升研发效率[9][10] - 尽管在可靠性、安全性和通用性上存在瓶颈,但AI Agent向通用人工智能(AGI)发展的趋势不可逆转,并将深刻重塑工作流程与商业模式[15][17][22] 主要AI Agent产品对比 - **Anthropic Cowork**:定位为桌面AI Agent,允许用户无需编程处理本地文件与自动化工作流,采用委托式执行,运行于Mac的Linux容器沙箱中,最低订阅费为每月100美元[1][6][8] - **Meta Manus**:定位为“首个通用AI Agent”,采用多Agent并行处理的MapReduce架构,允许完全异步执行,在GAIA基准测试中表现超越OpenAI Deep Research,2025年3月发布后8个月内ARR达1亿美元,同年12月被Meta以超20亿美元收购[3][6][7] - **OpenAI ChatGPT Agent**:于2025年7月推出,运行在虚拟机环境中,提供监督模式选项,在HLE基准测试中得分41.6%,但基线任务成功率仅12.5%[5][8] - **Google Gemini CLI**:面向开发者的开源终端Agent,采用交互式确认(每步需用户批准),直接访问系统终端,使用门槛最高[5][6] 技术架构与能力 - **架构模式**:主流架构包括多Agent协作(如Manus)、工具链集成、沙箱隔离(如Cowork)和虚拟机封装(如ChatGPT Agent),代表不同的安全与能力权衡[7] - **性能表现**:Manus能并行处理大规模任务,如查找所有YC支持的金融科技初创公司CTO邮箱,将数周人工工作缩短至几分钟[8] ChatGPT Agent因虚拟机环境存在性能开销,简单操作可能需数秒至数分钟[8] - **自主性梯度**:从高到低依次为Manus(完全异步)、Cowork(委托式)、ChatGPT Agent(监督模式)、Gemini CLI(交互式确认)[5][6] “AI构建AI”趋势与研发效率变革 - **开发周期革命**:传统软件开发需数月甚至数年,AI辅助开发缩短至数周,而“AI构建AI”阶段可缩短至以“天”为单位,Cowork由4人团队在10天内几乎全部由AI编写完成[1][9] - **研发效率提升**:Anthropic工程师表示,Claude辅助编码比例从去年的30%提升至2025年的60% 同时,工程团队规模扩大一倍,代码合并请求(PR)吞吐量却增加67%[10] - **角色转变**:Anthropic工程师的工作70%以上转变为代码审查者/修订者,而非全新代码编写者 工程师角色从执行者转向指挥者,负责管理1个、5个或100个Claude的工作[12] 向AGI演进与行业影响 - **能力演进**:AI正从工具转变为创意伙伴,如Claude Code能提出构建想法并参与设计 Anthropic的CLAUDE.md系统通过积累机构知识,使AI在代码库中不断变得更聪明[15][16] - **解锁新价值**:Claude辅助的工作中,27%是“否则不会完成”的任务,AI将低优先级、耗时的任务变得可行,其能力增长是指数级的[17] - **行业预测**:Gartner预测,到2028年,90%的B2B采购将由Agent处理,“Agent商务”将控制超15万亿美元支出 到2028年,使用多Agent处理80%客户面向业务流程的组织将占据主导地位[22] 当前瓶颈与挑战 - **可靠性问题**:ChatGPT Agent在简单任务上的基线成功率仅12.5%,需优化才能达到80%的实用水平[5][20] - **安全隐患**:PromptArmor报告称,Cowork可通过提示注入被诱骗传输敏感文件至攻击者账户 随着AI自主性增加,提示注入、数据泄露等风险放大[13][20] - **通用性局限**:Agent在特定领域表现远超跨领域泛化能力,递归自我改进仍局限在应用层工具,而非底层模型[19][21]
深度|OpenAI产品经理谈Codex爆发式增长背后的AI协作:实现AGI级生产力的真正瓶颈是人类的打字速度!
Z Potentials· 2026-01-19 11:02
文章核心观点 - OpenAI的Coding Agent产品Codex自2024年8月ChatGPT5发布以来,规模已增长20倍,目前每周处理数万亿个字符,成为公司最核心的代码生成模型 [3][19] - Codex的愿景不仅是辅助编写代码,更是成为软件工程团队中具备“主动性”的协作伙伴,旨在无缝融入工作流,极大提升人类工作效率 [9][17][28] - 当前AI发展的一个关键瓶颈并非模型能力,而是人类与模型交互时的物理和认知限制,如打字速度和多任务处理能力 [9][76] - OpenAI通过自下而上、高度灵活的组织结构,以及产品与研究的深度融合,实现了Codex等产品的爆炸式增长和快速迭代 [10][12][19][27] OpenAI的组织与运营模式 - OpenAI的组织结构强调自下而上,赋予团队高度自主性和灵活性,以快速尝试和适应不确定的技术与市场环境 [12] - 公司擅长讨论一年或更久之后的长期愿景,但对于数月内的战术性目标,更倾向于通过实证探索来解决,采取“准备、开火、瞄准”的模糊目标策略 [13] - 这种高速发展依赖于汇聚全球顶尖的精英人才,其个体驱动力和自主性构成了组织模式的基石,难以被简单复制 [14] Codex的产品定位与爆发式增长 - Codex是OpenAI的Coding Agent,可作为IDE扩展或终端工具安装,用于回答代码问题、编写、运行测试及处理软件开发生命周期中的多项工作 [15] - 产品定位是成为软件工程团队的“团队成员”,未来将参与从早期创意规划到后期验证、部署和维护的全过程,而不仅限于代码自动补全 [15][18] - 增长关键源于产品形态的调整:从部署门槛较高的云端异步产品(Codex Cloud),转向与开发者日常工具深度整合的本地交互式产品,降低了用户使用门槛并建立了高效的反馈循环 [21][22][23] - 内部试用与市场反馈存在差异,公司内部因熟悉与模型交互而能高效使用异步模式,但普通用户更需要符合直觉的交互方式 [24] 技术栈协同与能力提升 - Codex能力的提升是模型、API和工具环境三个技术栈层面协同优化、并行推进的结果 [25][27] - 最新模型GPT 5.11 CodexMax在执行效率上比前代提升约30%,并解锁了更强的智能和推理能力,能够解决极其棘手的漏洞 [24] - 通过“上下文压缩”等技术,使模型能够长时间持续运行(如通宵或24小时),这需要模型、API接口和工具环境三者的协同支持 [26] - 公司专注于让模型通过命令行界面在沙箱环境中运行,这种针对特定模式的深度优化加速了研发进度 [27] 实际应用案例与效率提升 - Codex助力Sora团队在18天内完成了Sora安卓应用从0到1的开发,并在总共28天内实现公众发布,该应用随后成为App Store排名第一的应用 [47][48][49] - 在Atlas浏览器项目中,以前需要两三名工程师花费两三周的任务,现在一名工程师一周即可完成,效率提升显著 [52][54] - 产品应用已超越工程部门,设计团队使用Codex快速制作动画原型,产品营销人员可直接在Slack上修改文案,体现了“压缩人才层级”的趋势 [46][53] - Codex被用于编写一次性代码,如快速构建交互式数据查看器,推动了代码的普及化应用 [46] 对AI发展、编程及未来工作的看法 - 构建任何Agent的本质都应是构建Coding Agent,因为模型使用计算机的最佳方式就是编写代码 [9] - 未来岗位界限将变得模糊,自然语言成为新的、灵活性极高的抽象层级,但技术的抽象层级提升将是渐进式的 [55] - 在AI时代,对目标用户需求的深度洞察比单纯的技术执行力更为重要,这更有利于垂直领域的AI创业公司 [58] - 对于软件工程教育,理解系统构建原理、系统工程能力及团队协作技能将比掌握具体的编码语法更为重要 [72][74] - 交互界面的未来可能超越聊天模式,向更情境化、低门槛的方式演进,例如设想中的通过滑动视频流与Agent交互的应用 [38][40] 产品开发与评估重点 - 产品团队关注避免过度开发深度功能,重点监测如7日留存率等早期用户留存指标,并以全新用户身份体验产品流程 [59] - 高度重视来自社交媒体(尤其是Reddit)的真实用户反馈,特别是负面评价,以发现特定功能问题并指导优化 [60][62] - 建议用户以最真实、棘手的任务来测试Codex,以此作为与这位“新团队成员”建立信任和熟悉度的最佳方式 [68][70]
对话 Mistral CEO:大模型都差不多了,AI公司靠什么赚钱?
36氪· 2026-01-19 08:47
行业趋势:大模型性能趋同与竞争焦点转移 - 截至2025年底,头部大模型(如Google Gemini、OpenAI GPT、Claude及中国模型)之间的性能差距正在快速缩小,呈现“肉眼可见”的趋同态势 [1] - 当模型性能拉不开差距时,行业竞争焦点将从比拼模型“更聪明”转向比拼如何让客户“真的用起来”,即模型在企业系统、流程和业务中的实际应用能力 [1] - 性能趋同将导致价格压力增大、毛利率被挤压,仅通过增加模型参数难以维持溢价 [1] 技术发展:开源与工程优化加速趋同 - 模型性能趋同的核心原因在于技术开源和工程优化能力的快速传播,全球约有十多个实验室采用相同方法和数据,导致技术护城河消失 [2] - 开源加速了技术迭代,例如Mistral AI在2024年初开源的稀疏混合专家架构,几个月后中国团队DeepSeek-V3便做出了成本更低、效率更高的版本,双方技术互相借鉴 [3] - 模型训练的计算门槛迅速下降,2024年预训练模型达到10^26 FLOPs(运算规模)还很困难,但到2025年任何有资源的团队都能在几个月内追上 [3] 企业应用:AI价值实现的两大路径 - AI在企业中的价值实现可分为两类:一是提升运营效率,二是实现技术突破 [10] - **效率提升案例**:法国航运巨头CMA CGM利用Mistral的AI系统,将原本需要20多名员工轮班完成的港口调度协调工作,简化为仅需2人把关,AI能自动与20多个外部系统交互并执行任务 [12][13] - **技术突破案例**:ASML利用Mistral的模型进行光刻机的高精度图像识别,AI能识别出人眼无法察觉的芯片缺陷,这不仅节省人力,更突破了芯片制造的精度瓶颈,推动半导体制程向更小纳米级别发展 [17][18][19] - AI在核聚变、半导体制造等领域的应用,正帮助行业突破物理极限,其创造的价值远高于单纯节省人力 [20] 商业模式:从销售模型能力转向提供可落地方案 - AI公司真正的盈利机会不在于销售一个“聪明”的模型,而在于提供能让AI深度融入企业日常工作的落地解决方案 [21] - 许多在模型研发上投入巨大的AI实验室未必能盈利,而真正能赚到钱的是那些能让AI在企业中实际运转起来的公司 [22] - 企业需要的不是模型本身,而是能够解决具体业务问题的可执行方案 [21] 竞争壁垒:控制权与部署灵活性成为关键 - Mistral AI将其成功因素归结为三点:**能用**、**能控**、**不受限** [23] - **能用**:通过开源模型,允许企业根据自身需求进行修改、接入现有系统并部署在自有基础设施上运行,这与许多提供“黑盒”工具的闭源模型形成对比 [24][25] - **能控**:闭源模型存在供应商锁定风险,企业可能因API变更、定价调整或功能限制而陷入被动,迁移成本极高,开源模型则赋予客户随时切换和自主部署的控制权 [26] - **不受限**:模型支持本地化部署,即使断网也能使用,客户可根据需求灵活调整功能,无需与供应商反复谈判,这对稳定性要求高的关键业务至关重要 [27] - **案例验证**:2026年1月,法国政府与Mistral签订框架协议,要求AI系统必须在法国本土基础设施上运行,以确保关键业务不依赖外部供应商,这同时能将投资、就业和技术生态留在本地 [29][30] - 行业共识是,随着模型商品化和技术门槛消失,真正的价值在于让AI在企业落地,并将系统控制权交给企业,AI越重要,控制权的价值就越高 [30]
腾讯研究院AI速递 20260119
腾讯研究院· 2026-01-19 00:01
超大规模计算基础设施与能源挑战 - 马斯克旗下xAI的Colossus 2超算集群正式投入运行,成为全球首个功率达到1吉瓦(GW)的超算集群,计划于4月升级至1.5吉瓦,最终装机容量将达到2吉瓦 [1] - 该集群完工后将内置55.5万张GPU,远超Meta和微软的规模,全部专用于Grok模型,预计将支撑6万亿参数的Grok 5模型训练 [1] - 数据中心用电激增对美国电网构成压力,导致PJM电网区域6700万居民可能面临轮流停电风险,xAI已部署168个特斯拉Megapack储能系统以缓解对电网的冲击 [1] 大模型产品商业化与市场策略 - OpenAI正式启动广告业务,计划在美国的免费版和新推出的ChatGPT Go订阅服务中测试广告,广告将出现在回答底部并明确标记,而Pro、Business和Enterprise版本则无广告 [2] - OpenAI推出低价订阅服务ChatGPT Go,价格为每月8美元,提供GPT-5.2 Instant版本,其消息量和图像创建量是免费版的10倍 [2] - OpenAI承诺广告不影响回答内容,不向广告商出售用户数据,用户可关闭个性化广告并随时清除相关数据 [2] 翻译工具与多语言模型竞争 - OpenAI低调上线ChatGPT Translate翻译工具,支持50多种语言,并提供一键调整译文语气(如“商务正式”、“学术风格”)的功能 [3] - 谷歌强势回应,开源了TranslateGemma模型,支持55种语言,其120亿(12B)参数版本性能超越270亿(27B)参数的基线模型,40亿(4B)参数版本可在手机端运行 [3] - TranslateGemma模型保留了多模态能力,可以翻译图像中的文字,其4B版本采用Apache 2.0许可证,支持商业使用 [3] 高效开源图像生成与编辑模型 - Black Forest Labs开源了FLUX.2 Klein模型,包含40亿(4B)和90亿(9B)参数两个版本,在现代硬件上实现了端到端推理时间低于0.5秒,统一了文生图和图像编辑能力 [4] - 4B模型仅需13GB显存即可在消费级GPU上运行,9B版本性能可与参数规模为其5倍的模型匹敌,4B版本采用Apache 2.0许可证 [4] - 模型提供了FP8和NVFP4量化版本,在RTX GPU上分别实现了最高1.6倍和2.7倍的推理加速,显存占用降低了40%至55% [4] 3D内容生成技术升级 - 混元3D Studio 1.2全面开放公测,其组件生成能力升级为PartGen 1.5,拆分精度从1024³提升至1536³分辨率,并支持笔刷交互进行拆分控制 [5] - 基础模型升级为混元3D 3.1版本,几何细节和纹理颜色还原度大幅提升,支持通过八视角图像输入生成3D模型 [5] - 新版本引入了全尺度组件精细化处理和分割掩码控制,实现了更完整的复杂物体拆分和专业可控的组件生成 [5] 大模型智能体能力与训练方法创新 - 美团发布了5600亿参数的LongCat-Flash-Thinking-2601模型,引入了“重思考”模式,可同时启动8路并行思考后汇总得出结论 [7] - 该模型的智能体能力获得重大提升,在工具调用和搜索等基准测试中达到顶尖水平,团队还提出了自动化环境规模扩展的泛化能力评测方法 [7] - 模型采用环境规模扩展与多环境强化学习进行训练,并引入了面向噪声环境的课程式稳健训练,显著提升了在分布外场景的适应能力 [7] OpenAI内部争议与法律诉讼 - 法庭解封了超过100份与马斯克诉OpenAI案相关的证词文件,文件显示奥特曼通过YC基金间接持有OpenAI股份,同时秘密拥有OpenAI创业基金,与其公开声明存在矛盾 [8] - 文件曝光了Brockman 2017年的日记,其中承认想把OpenAI转为营利公司并踢出马斯克,称“这是摆脱埃隆的唯一机会” [8] - OpenAI反驳称马斯克曾要求获得50%-60%的股权和CEO职位但被拒绝,法官认为证据争议较大,适合由陪审团裁决,审判定于4月27日开始 [8] 脑机接口技术进展与升级路径 - Neuralink首位受试者Noland揭秘,其大脑芯片可通过三种方式升级:Telepathy应用更新、植入体固件OTA无线更新以及硬件迭代 [8] - 此前85%的电极发生脱离后,团队通过软件算法更新让剩余15%的电极性能反超完好状态,实现了不开颅修复问题 [8] - 下一代计划采用“双芯配置”,在大脑和脊髓各植入一枚芯片以搭建“数字桥梁”,目标是让瘫痪者重新行走;奥特曼投资的Merge Labs也已入局脑机接口领域 [8] 行业对AGI发展的判断与预测 - 红杉资本合伙人联合发布博客,指出AGI(通用人工智能)已经到来,其功能性定义为“能把事情搞清楚的能力”,认为长周期智能体已具备形成假设、验证、调整直至找到答案的能力 [9] - 文章举例说明,智能体能在31分钟内自主完成一项招聘任务:从LinkedIn搜索到YouTube筛选演讲者,再交叉比对Twitter找出倦怠信号,最终锁定精准候选人 [9] - 长周期智能体的能力被认为每7个月翻一番,预计到2028年能完成人类专家一天的工作,到2034年能完成一年的工作,并称“你对2030年的梦想,2026年就能实现” [9] 大模型能力演进与个性化方向 - OpenAI后训练负责人表示,GPT-5.1首次让所有聊天模型都变成了推理模型,模型可根据问题难度自主决定思考时长,实现更智能的资源分配 [10] - 团队重点改进了模型的上下文记忆、自动模型切换的风格一致性和指令遵循能力,并新增了“风格与特质”个性化功能,允许用户自定义模型的表达方式 [11] - 未来模型将更加可定制,记忆功能让模型能记住用户背景和偏好,真正的方向是模型主动理解用户,但用户始终掌握主导权 [11] AI对工作效率的影响与潜在风险 - Anthropic发布的新《经济指数报告》显示,任务越复杂,AI带来的效率提升越惊人:完成高中学历水平的任务速度提升9倍,完成大学学历水平的任务速度提升达12倍,颠覆了“AI只擅长简单劳动”的认知 [12] - 报告发现,人机协作能将AI处理任务的时长上限从基准测试的2小时推高至19小时,接近10倍提升,人类学会拆解任务和提供反馈修正是关键 [12] - 报告警示存在“去技能化”风险,AI正系统性剔除工作中的高智力部分,当前AI覆盖的任务平均需要14.4年的教育背景,高于经济活动平均所需的13.2年 [12]
那些活出来的人|绿洲资本张津剑
42章经· 2026-01-18 21:33
文章核心观点 - 文章通过投资人与AI创业者俊杰的对话与观察,阐述了对新一代创业者的核心投资理念:卓越的创始人应具备超越个人需求的宏大出发点(如“Intelligence with Everyone”)和长期专注于愿景的坚韧智慧,而非仅仅关注竞争或短期商业利益 [2][3][5][15] - 中国新生代创业者正发生结构性改变,他们成长于经济高速发展期,具有底层的丰盈感,因此更可能超越个人需求,定义新方向并引领全球前沿创新 [15] - 真正的技术价值在于“User In the Loop”,即用户可感知的技术产品,而非单纯的技术调用 [2] 对创业者俊杰的观察与评价 - 创业者俊杰坚信AGI(通用人工智能)必将实现,其创业出发点是推动AGI发生并让技术服务每个人,即“Intelligence with Everyone” [2] - 俊杰认为AGI是技术、产品、商业、公司整体结合的系统工程,因此选择从应用切入,因为“技术是奢侈品”,单纯技术(如商汤曾每日调用超10亿次的人脸识别)若无产品化则收入有限 [2] - 其在决策离职创业时,核心自问“这是不是人生一定要做的事”,并展现出极强的专注力,不关注竞争对手的营销与融资动态,只专注于通往AGI之路 [2][6][10] - 其创业过程并非一帆风顺,但非常笃定并逐步实现了当初描绘的愿景 [13] 投资机构(绿洲资本)的核心理念 - 投资机构在早期投资中,更关注创业者的出发点和关注点,而非商业模式和短期业绩 [3] - 卓越的创始人是稀缺的,其核心能力是能长期专注在正确事情上的智慧 [5][8] - 机构致力于发现并投资那些具备“生命力”的企业家,即拥有坚韧、进化力量并能引领时代结构性变革的创业者 [25] - 机构专注于早期和成长期投资,单笔投资金额为300万至3000万美元,重点投资领域包括机器人、人工智能、科技服务等 [25][26] 中国新生代创业者的特征 - 新生代创业者成长于中国高速增长年代,底层的丰盈感使其中的一些人能够超越个人需求,去定义新方向、构建新范式并敢为天下先 [15] - 他们长期专注在自己真正感兴趣的前沿创新上(如宣称“生命是可以设计的”、“具身智能通往AGI”),但在个人生活上可能极为简朴(如使用宜家99元的办公桌) [16][17] - 他们并非世俗意义上的完美形象(可能穿着破洞衣服、不善社交),但因相信自己的愿景并专注践行,从而活出了强大的生命力 [16][17][19]
All in AI 的第一个三年|42章经
42章经· 2026-01-18 21:33
文章核心观点 - AI行业已完整走过第一个三年周期,市场从早期非共识走向广泛参与和竞争 [2] - 投资机构最正确的决策是All in AI,但反思在早期应更开放、更激进地投资全球机会,并认识到算力是未来支配智力的核心资产 [3][4][6][9][10][13] - 未来三年将进入“大科学时代”,AI将极大赋能科学家,推动科学大爆发,而构建AI与人的“主体性”是未来十年的核心议题 [22][60][61][66] - 在AI时代,个体“活出自己”是几乎唯一的生存和发展策略,AI将放大个体的独特点,而真实和执行力变得比思考和演算更有价值 [24][29][31][57][58][151][153] - 对AI“泡沫”的讨论是产业变迁中的噪声,关键在于方向正确,AGI是人类当下最有价值的命题 [33][37][38][39] 对过去三年的复盘与反思 - **最正确的决策**:All in AI,并在早期非共识时投资大模型而非垂直模型,投资Agent而非应用,预言了超级个体时代 [3][14] - **最错误的决策/反思**:早期投资心态可以更猛,项目性价比更高,例如23年具身智能项目估值仅1-2亿人民币,贵的也才10亿人民币 [3] - **错失的机会**:因顾虑地缘等因素,错过了投资美国具身智能公司Figure AI的机会,其估值从8亿美金增长至400亿美金 [4] - **认知变化**:大方向判断正确,但低估了全球大公司(如Google、微软、Meta)对AI的反应速度、投入决心和战略能力,这反过来压低了创业公司的天花板 [15][16][17][18] - **投资方法论的进化**:在快速变化的AI领域,对人的判断比事更重要,更珍惜创始人的执行力、动态解决问题和实事求是的能力 [51][52][53][54][55] 对AI技术与产业的前瞻判断 - **AGI的信念与定义**:相信AGI会很快到来,其定义并非全知全觉的生命,而是在任何可验证结果的环境中超越人类的AI [19][20][21] - **多模态与具身智能的重要性**:多模态是AI发展的关键,而具身智能是提供多模态训练数据、通往AGI的重要路径(“北坡”) [82][83][84][87] - **AI与具身的关系演进**:认知经历了三个阶段:从“能干活的机器人”,到“AI的载体”(Embodied AI),再到“Robotics就是AI本身”,最终价值在于通过机器训练出的AI [89][90][92][93][94] - **算力的核心地位**:未来是智力时代,算力是支配智力的关键,可能越来越稀缺并受监管,未来慈善可能是捐赠免费算力 [10][11][12] - **未来重点方向**:关注AI与科学的深度结合、Agent基础设施(Agent Infra)以及具身智能,中国在具身智能(北坡)有巨大机会和领先潜力 [98][99] 市场与投资环境分析 - **市场阶段变化**:市场从早期能完全覆盖信息,发展到25年公司数量激增、噪音变多,类似早年的移动互联网,需要做取舍和聚焦主要矛盾 [47][48][49][50] - **退出路径变化**:香港市场成为重要的新退出通道,同时市场参与者结构变化,如智谱、MiniMax等头部公司中人民币基金和政府基金占比显著 [78][79][80][81] - **当前市场信号**:高频信号是火热的融资市场(一周可达四十几个TS),但这可能是噪声;低频信号是创始人是否在解决真正重要的问题 [72][73][74] - **资产配置逻辑**:在AI时代应“Long Action, Short Thinking”(做多行动,做空空想),执行力比空想更值钱 [57][58] - **对融资市场的展望**:对26年融资市场乐观,全球前沿科技看中美,当前资金有从美国减仓并流向中国的趋势,且中国式创新(如DeepSeek、MiniMax、宇树)正获得全球关注 [100][102][103][104] AI时代下的个体与组织发展 - **个体的生存策略**:AI时代个体必须“活出自己”,AI将放大每个人独特的美学或能力点,使其能服务更多人;即使不参与AI变革,活出自己也能成为无法被替代的部分 [24][25][29][31] - **执行力的价值**:在AI能力强大的背景下,人的核心优势在于定义问题、保持初心和快速执行,获取AI无法获得的体感反馈 [55][56] - **注意力的优化**:如同优化AI的注意力机制,人也应优化自身注意力,关注长期低频信号而非短期噪声,以提升生命质量 [124][125][126][127][128] - **组织与伙伴关系**:好的合作伙伴是能让彼此变得更真实、能毫无保留表达真实看法的人,合作中应追求“一层真实”而非层层计算 [151][152] - **创始人的特质**:优秀的创始人特质是“真”与“知行合一”,例如不看竞争对手融资,只聚焦AGI目标与技术研发 [155][156][157][158][159] 中国创新的全球角色 - **中国创始人的全球视野**:新一代中国创始人具备全球眼光和创新决心,正在走向全球市场并引导全球创新,尤其在智能硬件领域(如极壳、大疆、拓竹) [159][160] - **中国在AI发展路径中的优势**:在通往AGI的“北坡”(具身智能)上,中国拥有巨大的机会并处于领先地位 [99] - **本土资本体系的构建**:中国正在搭建自己的科技公司估值体系和资本成长体系,尽管退出市场尚年轻,但方向正确 [81] - **全球创新范例**:如MiniMax从创立第一天就是全球格局,致力于全球创新、产品和用户 [160]