Workflow
Meta、微软掌门人巅峰对话:大模型如何改变世界?
36氪·2025-05-07 10:32

大模型竞争格局 - 阿里4月29日发布开源模型Qwen并官宣登顶全球开源模型榜首 [1] - Meta在4月30日首届LlamaCon大会上发布对标ChatGPT的Meta AI App和Llama API预览版 [1] - Meta的Llama 4系列模型于4月6日抢先发布 [1] 技术转型与深度应用 - 纳德拉将AI浪潮视为继客户端-服务器、互联网、移动互联网、云计算后的第五次技术转型 [4][5] - 当前技术栈面临结构性调整需基于第一性原理重构 例如AI训练工作负载需完全不同的存储系统设计 [5] - 多模型协同工作阶段已至 可通过编排、智能体和MCP/A2A协议构建深度应用 [8][10] - 技术进步叠加带来每6-12个月10倍的性能提升 价格同步下降推动消费增长 [7][8] 开源与闭源生态 - 微软早期通过Windows NT与Unix互操作性验证开源对业务的益处 [11] - 企业客户倾向用开源模型提炼自有知识产权 超大规模云提供商需同时支持闭源/开源模型 [12] - Azure通过计算/存储/网络+AI加速器构建基础设施 GitHub Copilot作为工具加速开发 [12][14] AI生产力变革 - GitHub Copilot功能从代码补全演进至智能体工作流 微软内部20%-30%代码由AI生成 [15][19] - 扎克伯格预测2026年50%应用开发将由AI完成 工程师将转型为"智能体小队"技术领导 [4][25] - 传统工作流被颠覆 如销售会议准备从邮件文档转向AI实时整合CRM/网络/内部数据 [16] 模型蒸馏与混合应用 - Llama 4 Maverick通过蒸馏实现文本性能对标DeepSeek 图像多模态表现突出 [33] - 蒸馏技术可从20倍大模型中提取90%-95%能力 降低开发者使用门槛 [34][35] - Meta开发代号Little Llama的8b小模型 适配笔记本/手机端 [36] - 混合模型(MOE+推理)可实现灵活调整延迟 是未来重要方向 [37] 模型性能数据 - Llama 4 Maverick在Artificial Analysis Intelligence Index得分为50.5 成本$0.36/M Tokens [34] - Gemini 2.5 Pro Preview输出速度达209(Composite Avg) 但TTFT延迟高达29.93ms [34] - GPT 40成本最高达$7.5/M Tokens Claude 3.7在MMLU-Pro评分0.84领先 [34]