群体智能时代 - 财报，业绩电话会，研报，新闻

群体智能时代

搜索文档

36氪· 2025-09-03 20:17

AI发展速度超预期 - 2022年专家预测AI到2025年仅有2.3%和8.6%概率获得国际数学奥林匹克金牌但2024年谷歌DeepMind和OpenAI的通用大模型已提前实现这一目标 [1][3][6] - 预测研究院承认AI在国际奥数竞赛表现惊艳专家和超级预测者在MATH、MMLU、QuALITY等基准测试中预测几乎全军覆没 [20][21] - 麦肯锡2017年预测AI在2037年达到人类平均创造力水平实际2023年已实现达到前1/4创造力水平的目标比原预测2055年提前30年达成 [26][28] 技术性能突破 - GPT-4 Turbo在2024年4月MATH数据集测试达到87.82% 远超专家预测的21.4%概率 [24] - GPT-4o和Claude 3.5 Sonnet在2024年年中MMLU测试达到88.7% 远超预测的25.0%可能性 [24] - RAPTOR+GPT-4在2023年6月QuALITY Hard子集得分69.3 比预测截止日期提前整整一年 [24] 模型能力演进 - 谷歌Gemini从仅文本输入升级为多模态（文本/音频/图像）推理能力从一般提升至多步骤问题解决和精细分析 [29] - OpenAI从GPT-3.5仅文本输入升级为GPT-4o多模态律师考试排名从后10%提升至前10% [29] - 模型参数规模实际达10万亿远低于专家预测的100万亿和超级预测者预期的400万亿 [25] 普及化与成本优化 - GPT-5上线后付费用户使用推理模型比例从7%升至24% 免费用户接触顶尖模型比例从近零提升至7% [46] - AI运行成本急剧下降两年前需花费数美元的提示任务现在免费用户可轻松运行 [48][50] - 谷歌图像模型"nano banana"支持自然语言指令无需复杂提示词工程且成本足够开放给免费用户 [52][53] 行业应用影响 - AI正进入"大众智能"时代强AI像谷歌搜索一样易获取衍生出数千种意想不到的用途包括疾病诊断和情感陪伴 [41][54] - 所有机构需重新思考如何在智能普及环境中运作包括如何重建信任和保留人类专业经验价值 [55][56] - 技术性能提前达成里程碑自然语言理解达到人类中位数水平的时间从预测2027年提前至2023年 [28]