AI 月报：10 亿美元训练不出 GPT-5；低成本中国开源大模型走红；AI 幻觉不全是坏处

技术进展 - OpenAI训练GPT-5遇阻，已投入20个月和至少10亿美元算力成本，但性能提升未达预期，两次从头训练均未突破博士生水平目标[4] - 数据短缺迫使OpenAI采用人工生成数据（工程师/科学家每日5000字）和模型生成数据（o1模型）补充，但规模仍远低于GPT-4的10万亿字训练量[5] - o3模型在CodeForces编程竞赛得分比o1提升44%，数学测试EpochAI解决25.2%问题（其他模型<2%），但AGI评测得分因数据预训练存在争议[7][9] - 强化学习重要性提升，OpenAI推出RFT微调方法，LangChain报告显示人类反馈强化学习应用增长18倍[5][9] - 世界模型取得突破：DeepMind的Genie 2生成可交互虚拟场景，李飞飞团队实现AI图片转3D场景，CMU/英伟达开源机器人模拟系统Genesis[14] 行业竞争 - Google Gemini 2.0 Flash系列模型抢占Chatbot Arena前三，OpenAI首次失去榜首地位[18][21] - 中国开源模型崛起：DeepSeek-V3以578万美元训练成本逼近GPT-4o性能，Qwen2.5-plus超越Meta Llama 3.1[23][26] - 芯片领域博通市值破万亿美元，2024年AI收入增长220%至122亿美元，为Google/Meta等提供自研芯片方案[29] - 英伟达推出B300 GPU适配o系列模型，算力/显存提升50%，xAI计划将H100算力中心从10万张扩展至100万张[33][34] 应用与商业化 - OpenAI推出12项ChatGPT升级：订阅费最高2000美元/月，集成Sora视频生成、电话交互、生产力工具插件等功能[36] - Agent成为新趋势，Google Gemini 2.0专为Agent优化，YC预测其市场规模将比SaaS大10倍[12][13] - 大模型嵌入传统行业：Salesforce招聘2000人推广AI Agent，微软Phi-4模型（140亿参数）性能超越更大模型[38][12] - AI硬件进展：Meta计划为Ray-Ban眼镜增加屏幕，OpenAI重组机器人团队，中国预计2025年出现"百镜大战"[40] 投融资动态 - 21家AI公司获超5000万美元融资：中国智谱AI获30亿元（估值200亿元），阶跃星辰聚焦多模态模型，Liquid AI开发新型神经网络架构[42][43] - 基础设施领域Databricks融资86亿美元（估值620亿美元），Tenstorrent获7亿美元开发RISC-V架构AI芯片[44] - 应用层公司多成立于ChatGPT前：Zest AI（金融风控）、Tractian（工业设备监测）、Speak（语言学习）等获大额融资[46][47][48] 科学价值 - 大模型"幻觉"被科学家重新定义：加速抗生素研发（MIT）、生成全新蛋白质（诺奖得主Baker实验室获100项专利）[50][51]