Workflow
Gemini 3 发布后的几点思考
傅里叶的猫·2025-11-21 18:52

Gemini 3模型能力提升 - 推理能力显著增强,推理链明显比2.5时代长,复杂任务拆解更自然,幻觉减少[5] - 编程能力夸张,可从手绘草图在十几秒内生成完整的响应式页面,细节基本无需修改[5] - 多模态进步巨大,视频理解、3D空间感和动态交互等能力已能落地到实际产品中[5] 对行业竞争格局的影响 - Cursor等代码工具面临巨大短期压力,Gemini 3在前端能力上形成降维打击,生成质量和速度拉开距离[6] - Manas、JinSpark等通用Agent厂商优势被削弱,大模型自身能力提升降低了包装工具的价值[6] - 垂直Agent在金融风控、政务、军工等有强行业壁垒和数据安全要求的场景中相对安全[6] 定价策略与成本分析 - 定价不降反升,原因在于长链推理和多模态能力消耗大量算力,MOE模型激活路径增多导致推理成本客观上浮[7] - 公司倾向于将顶级能力卖出溢价,与OpenAI的降价策略形成对比[7] - 长期看,能力提升带来的效率提升可抵消部分成本,且后续将推出精简版、蒸馏版使价格逐步下降[8] 国内外技术差距与客户选择 - 纯文本能力差距已不大,国内模型如DeepSeek再迭代几个月可在许多场景基本持平[9] - 多模态领域差距明显,尤其在动态交互、3D认知和具身智能方面,差距约6-12个月,主要受算力和训练经验限制[9] - 客户选型趋于务实:写文档、客服、简单数据分析等场景国内模型够用;实时UI、复杂视频理解、3D设计等场景仍需Gemini或Claude;金融、政务等数据安全要求高的场景选择离线部署国产模型或自建垂类小模型[11] 公司商业模式与收入来源 - 广告仍是基本盘,AI搜索和动态交互页中的场景化广告变现效率将显著提升[10] - ToC订阅日益重要,如Gemini Pro、anti-gravity等生产力工具通过谷歌账号体系实现月付几十美元[10] - ToB业务通过云API、TPU及垂类解决方案捆绑销售,企业客户愿为稳定性和定制化付费[10]