速递 | 谷歌Gemini 3.1 Pro实测:AI从“会说”到“会干活”,普通人也能捡钱

文章核心观点 - 谷歌发布的Gemini 3.1 Pro是一次“真升级”,其核心价值在于显著提升了处理复杂任务的能力,并将AI的应用从“回答”推向“交付”[1][3] - 此次更新通过强化推理、长上下文、工具使用和代码生成等能力,正在压缩“从想法到成品”的时间,这将改变普通人的工作方式和创业公司的商业模式[15] 四大核心亮点 - 亮点1:推理能力“真涨脑子”:在专门考核新题型逻辑的ARC-AGI-2基准测试中,Gemini 3.1 Pro的verified分数达到77.1%,相比上一代Gemini 3 Pro的31.1%有飞跃性提升,意味着模型从“背题库”转向理解“出题人逻辑”[5][7] - 亮点2:长上下文落地:支持高达100万tokens的上下文窗口,使其能够一次性处理如完整合同、邮件、纪要等大量关联文档,实现“把大工程装进脑子里”[6] - 亮点3:工具使用能力增强:支持函数调用、结构化输出、代码执行及联网搜索,使其能像“会用工具的同事”一样执行多步、可靠的智能体工作流,从提供建议转向交付结果[8] - 亮点4:“vibe coding”原型生成:能够根据文字提示直接生成可用于网页的动画SVG、复杂系统可视化及交互式3D场景原型,大幅降低了产品原型制作的门槛和成本[9] 对普通人的影响 - AI的价值正从“会说”转向“会做作业”,普通人需要提升的是任务拆解和最终判断能力,而非简单的工具使用技能[12] - 最值钱的时间应用在“提出好问题”和“做最终判断”上,应避免成为“人肉复制粘贴机”[12] - 应将AI作为“外挂大脑”用于提升效率(提速),而非用于偷懒[15] 对创业者的机会 - 核心机会在于“把散装行业经验变成可复制产品”[13] - 许多行业知识存在于非结构化载体(如微信群聊、老师傅经验、复杂Excel表)中,新模型能理解并输出结构化结果,使创业公司有机会将行业经验封装为“可交付的智能体流程”[13] - 创业者应聚焦于开发能嵌入业务流程、产生现金流的“生产力引擎”,而非炫技性的“花活”,其售卖的核心是“结果”而非“AI”本身[13][15]

速递 | 谷歌Gemini 3.1 Pro实测:AI从“会说”到“会干活”,普通人也能捡钱 - Reportify