Workflow
AI月报:当AI包办一切,未来不是拼效率,而是拼“品味”
36氪·2025-06-23 11:47

行业趋势 - 模型竞赛进入冷却期,AI发展重点转向产品化与生态整合,各大平台争夺用户入口、智能体标准和终端能力 [1][2] - 2025年被称为"智能体元年",关键词从"更大模型"转向"Agent"、"自主执行"、"连接器"和"委派编程" [2] - 商业模式从MaaS(模型即服务)转向RaaS(结果即服务),AI从成本中心转化为利润引擎,按实际产出或价值分成计价 [5][20][21][22] 技术演进 - 基础模型实现"操作系统级更新",新一代模型如GPT-4.5、Gemini 2.5 Pro具备"自我对话"和多步推理能力,思维方式接近人类 [4][5] - 开源社区推动模型认知能力升级,新增长时记忆、自我提升、目标分解等模块,实现从被动应答到主动思考的转变 [4][5] - 智能体(Agent)成为AI落地的关键载体,具备环境感知、自主规划、工具调用、数据连接和多步任务执行能力 [7][8][9][10][11][12] 应用场景 - 智能体重构人机交互模式,界面从"工具栏+菜单"变为"自然语言+智能执行",可自动完成跨平台复杂任务(如整合Google Docs/Gmail生成PPT) [10][11][12] - AI编程进入全面委派阶段,开发者角色从编码转向架构设计,AI可独立完成需求分析、编码、测试、部署全流程 [14][15][16][17][18] - 科技巨头加速布局智能体生态:微软Copilot Studio、百度心响App、字节跳动"扣子空间"等,推动AI向"数字员工"进化 [13] 性能表现 - Gemini 2.5 Pro在科学推理(GPQA单次尝试84%正确率)、数学(AIME 2025单次86.7%)等基准测试中领先 [3] - Claude 3.7 Sonnet在多次尝试任务中表现优异(数学AIME 2025多次尝试93.3%,科学GPQA多次尝试84.8%) [3] - 代码生成领域OpenAI模型单次尝试通过率74.1%,LiveCodeBench v5测试中Grok 3 Beta多次尝试达79.4% [3] 职业影响 - 人类核心竞争力转向品味、判断力和方向感,工程师需从"实现者"转型为"问题定义者"和"AI团队管理者" [25][26][27] - 工作组织方式重塑,人类角色更接近"指挥官",负责目标设定、结果审核和战略规划,而非具体执行 [13][18][28] - 编程价值重心从编码技能转向产品设计、系统架构和决策能力,AI接管重复性工作释放人类创新潜力 [18][25]