Workflow
跨越鸿沟
icon
搜索文档
大模型的 5 月:热闹的 30 天和鸿沟边缘
晚点LatePost· 2024-05-29 22:00
技术进展放缓 - 大模型行业在5月密集发布13场发布会和10多款新模型,但技术突破有限,GPT-4o语言能力与GPT-4持平,GPT-5未发布[2][4] - 多模态成为技术焦点,OpenAI、Google、微软推出能处理语音、图像的模型,但产品仍处Demo阶段并引发侵权和隐私问题[4] - GPT-4o在文本处理能力上提升有限:MMLU提升2.5%、HumanEval提升3.6%、MGSM提升2.3%、DROP下降3%[11] 行业竞争格局 - OpenAI和Google将核心模型API价格降低50%,中国公司降价更激进,幻方模型价格比行业低90%以上[8][29] - 字节、阿里、百度、腾讯等大公司跟进降价甚至免费,价格战加剧[8][30] - 降价驱动因素包括技术优化(模型架构调整、分布式推理)、小模型策略、芯片性能提升(英伟达GB200推理性能提高30倍)[31] 商业化挑战 - 红杉资本估算行业GPU投入达500亿美元但收入仅30亿美元,商业化进展慢于互联网等历史技术变革[21] - 微软、Google、Meta计划继续投入数百亿美元购买GPU为未来应用爆发做准备[22] - 杀手级应用探索集中在语音助手(GPT-4o与Siri整合)、搜索引擎(Google AI Overviews)、操作系统(微软Recall)等方向[24][26] 创业公司困境 - Adept、Stability AI、Humane等明星AI创业公司寻求出售,估值在7.5-10亿美元区间[33] - 中国头部大模型公司融资门槛提高,单轮融资达数亿美元,投资方集中于大型科技公司[33] - 应用层创业窗口仍在,秘塔搜索用户增长超500%,但受限于模型能力进展,半年内缺乏创新产品[35][36] 技术发展方向 - 优质训练数据接近耗尽,行业转向多模态和小模型策略[13][18] - GPT-4o实现端到端语音架构,响应时间从秒级降至毫秒级,更接近人类对话体验[13] - 图像理解能力显著提升,在MMMU数据集上得分69.1%,比GPT-4 Turbo提高6个百分点[17][18] 监管动态 - 欧盟通过《人工智能法案》,要求披露训练数据版权和AI生成内容标识[41] - 美国推进限制开源模型出口的法案,众议院外交事务委员会已投票通过[41] - 25位科学家联名呼吁加强AI监管,认为AGI风险迫近,而杨立昆等学者认为当前模型远未达到智能水平[38][40]