现有路径不通？OpenAI、亚马逊考虑改变大模型训练方式

AI模型训练范式变革 - 行业顶尖研究人员正质疑并探讨放弃“先预训练、后后训练”的通用标准流程，转而采用在训练早期就为特定任务引入精选数据的新模式 [1] - 这一转变旨在解决现有模型的效率低下和“裂脑问题”等缺陷，核心观点是如果模型最终用途确定，预训练阶段就应引入高度相关的数据 [1] - 方法论的调整将深刻改变开发格局，市场可能从“一个通用模型适应所有场景”走向“基于不同数据集构建专用模型”的时代 [1] 专用模型发展趋势与组织影响 - 市场已出现分化迹象，OpenAI正通过路由器将ChatGPT查询分流至不同模型处理，并开发了如GPT-5-Codex等专用模型 [2] - 训练早期决定纳入哪些数据将直接决定模型能力边界，例如增加数学和代码数据可能造就卓越编程助手但牺牲创意写作能力 [4] - 未来若转向为不同目的训练完全独立的模型，将要求公司对研究团队进行彻底重组 [2][4] 硬件创新与资本动向 - 光子芯片初创公司Neurophos完成了由比尔·盖茨旗下Gates Frontier领投的1.1亿美元A轮融资，微软旗下M12也参与其中 [5] - Neurophos致力于设计光子AI芯片，目标是在2028年交付一款速度与效率是英伟达Blackwell芯片50倍的芯片 [6] - OpenAI的定制推理芯片正在进行“流片”，且价值超过5000亿美元的Stargate基础设施项目已建成过半，进展超乎想象 [6] 行业整合与竞争动态 - 软件公司Lightning AI与数据中心提供商Voltage Park合并，新公司估值超过25亿美元 [7] - Yelp同意以3亿美元收购AI代理初创公司Hatch [7] - 苹果正与谷歌谈判，计划利用谷歌云基础设施及TPU芯片来推出更新版Siri，并计划最早于2027年推出AI驱动的可穿戴设备 [7] - 英伟达CEO黄仁勋据报正准备前往中国，试图在这个战略市场重新站稳脚跟 [7] 监管、伦理与宏观经济影响 - Anthropic发布了Claude的新版“宪法”，新文件减少了指令性，给予模型更多判断空间，并提及模型可能具有某种“意识”或“道德地位”的可能性 [7] - 白宫经济顾问委员会发布报告预测，生成式AI将引发美国经济的深刻转型，有望显著提振生产力和增长 [7]