AI研究范式转变 - 行业顶尖研究人员正探讨放弃“先预训练、后微调”的通用训练范式,转向在训练早期就为特定任务引入精选数据的新模式 [2][3] - 新方法旨在解决现有模型的效率低下和“裂脑问题”等缺陷,核心观点是若模型最终用途已确定,预训练阶段就应引入高度相关的数据 [3][6] - 这一根本性转变由亚马逊的David Luan等人倡导,OpenAI和Thinking Machines Lab的研究人员也表示认同 [3][6] 行业格局与开发模式重塑 - 方法论调整将深刻改变AI行业开发格局,市场将从“一个通用模型适应所有场景”走向“基于不同数据集构建专用模型”的时代 [4] - 开发团队可能不再需要按预训练和微调阶段进行人为分割,而是整合为统一的训练团队,以提高针对性 [6] - 训练早期决定纳入哪些数据将直接决定模型的能力边界,例如增加数学和代码数据可能造就卓越编程助手,但牺牲创意写作能力 [8] 公司战略与市场分化 - OpenAI已通过路由器将ChatGPT查询分流至不同模型处理,并开发了如GPT-5-Codex等专用模型,反映出消费者需求与公司高端目标间的差异 [4][8] - 若进一步深化专用模型路线,OpenAI可能需要彻底重组其研究团队以适应完全不同的模型训练需求 [4][9] - 市场已出现分化迹象,未来AI市场将涌现大量基于不同基础数据集训练的专用模型,而非对同一预训练模型进行后期修补 [8] 硬件创新与资本动向 - 光子芯片初创公司Neurophos完成由比尔·盖茨旗下基金领投的1.1亿美元A轮融资,其目标是在2028年交付一款速度效率是英伟达Blackwell芯片50倍的芯片 [11] - OpenAI定制推理芯片正在进行“流片”,即制造前的最后一步,且价值超过5000亿美元的Stargate基础设施项目已建成过半 [11] - 微软高管Marc Tremblay表示,现代AI推理对电力和算力需求巨大,行业需要计算层面的突破 [11] 行业整合与竞争动态 - 软件公司Lightning AI与数据中心提供商Voltage Park合并,新公司估值超过25亿美元 [13] - Yelp同意以3亿美元收购AI代理初创公司Hatch,谷歌DeepMind通过许可协议聘请了语音AI初创公司Hume AI的CEO及多位顶尖工程师 [13] - 苹果正与谷歌谈判,计划利用其云基础设施及TPU芯片来推出更新版Siri,并计划最早于2027年推出AI驱动的可穿戴设备 [13] - 英伟达CEO黄仁勋据报正准备前往中国,试图在这个战略市场重新站稳脚跟 [13] 监管、伦理与宏观经济影响 - Anthropic发布了Claude的新版“宪法”,新文件减少了指令性,给予模型更多判断空间,并罕见提及模型可能具有某种“意识”或“道德地位”的可能性 [14] - 白宫经济顾问委员会发布报告预测,生成式AI将引发美国经济的深刻转型,有望显著提振生产力和增长 [14]
现有路径不通?OpenAI、亚马逊考虑改变大模型训练方式
硬AI·2026-01-25 19:33