Workflow
智能体能力
icon
搜索文档
展望2026,AI行业有哪些创新机会?
36氪· 2025-11-28 16:37
全球大模型格局 - 全球大模型发展呈“双核驱动”态势,技术路径上闭源与开源并行,地缘格局上美国与中国成为两大核心力量[10] - 美国在算力、算法和人才方面积累深厚,主导闭源领域;中国将开源作为重要发展方向,有助于应对供应链不确定性和外部制约[13] - 头部闭源模型形成OpenAI、Anthropic与Google“三驾马车”之势,OpenAI的GPT系列在综合能力方面具备优势,Anthropic聚焦专业场景,Google的Gemini路线更倾向于“全面而均衡”[17] 开源模型的崛起 - 2025年是中国大模型发展的“破局之年”,DeepSeek横空出世,在全球范围内率先以开源方式复现具备“长链推理”能力的大模型[18] - DeepSeek通过创新训练机制将推理过程中的Token成本大幅压缩,实现“低成本,长推理”范式,迅速引爆开发者社区[18] - 除DeepSeek外,通义千问和Kimi等国产大模型也已陆续开源,共同探索兼具技术深度与生态广度的新型开源路径[18] - 开源对中国而言是一种系统性战略,本土开源模型获得广阔应用试验场,并激活了中国庞大的工程师红利,实现算力、数据与人才的高效协同[19] 端侧模型发展 - 2025年“端侧推理”成为模型落地的重要战场,在云端训练昂贵、推理成本上升的背景下,部分推理能力迁移到设备端执行[20] - 端侧模型参数量级在几亿到数十亿,具备低延迟响应、强隐私保护和几乎可忽略的运行成本优势[21] - 家庭与办公场景成为端侧模型的典型载体,安防摄像头、家用机器人等开始依赖本地推理完成视觉理解和任务执行[21] 大模型关键技术演进 - 大模型从单一文本能力迈向更复杂综合形态,四大技术趋势包括原生多模态融合、推理能力、长上下文窗口与记忆机制,以及智能体能力[22] - 前沿大模型正转向原生多模态架构,将图像、语音、文本等多种模态嵌入同一共享向量表示空间,实现更高效一致的理解与生成[23] - 推理能力成为核心标配,模型在训练阶段学习“如何一步步思考”,在推理阶段采用“延长思考时间”等机制提升判断能力[24][26] - 新一代模型支持超长上下文并结合外部记忆存储机制,能够在多次交互中持续追踪用户身份和偏好,成为具备长期认知能力的数字伙伴[27] 训练范式与架构探索 - 大语言模型经历范式转变,从以大规模预训练为核心单一路径,演进为融合后训练精调与运行时计算增强的多阶段协同体系[31] - 能力提升遵循三条“规模法则”:预训练规模法则构建基础能力,后训练规模法则注入任务导向行为模式,测试时规模法则提升准确性[32][33][34] - Transformer仍是绝对主流架构,但研究者积极探索线性注意力模型、混合注意力机制和文本扩散模型等替代或混合方案[37] 物理AI和世界模型 - 世界模型和物理AI成为行业新焦点,物理AI指能够感知现实环境、理解物理规律并采取有效行动的智能系统[38] - 世界模型是AI在“脑海中构建的微型世界”,能模拟和预测未来状态,具备“内部模拟-预演-规划”能力,提升系统泛化能力和安全性[38] - 2025年世界模型领域迎来多项标志性进展,DeepMind发布Genie3,OpenAI推出Sora2,World Labs发布Marble,NVIDIA Isaac Sim获得业界广泛关注[44] 产业链与基础设施 - 算力基础设施层面英伟达领先地位依然稳固,市值一度突破5万亿美元,多元化生态虽已萌芽但远未成熟[47] - AI行业从依赖少数云厂商支持转向多方参与的“循环式资金支持”模式,形成以英伟达和OpenAI为核心的“软硬双核”驱动结构[48][51] - 截至2025年8月全球AI应用的年度经常性收入约300亿美元,但行业全链条成本需达到约6000亿美元年收入才能实现合理回报,存在数千亿美元亏损缺口[51] 应用层发展机遇 - 大模型公司通过打造“超级助手”和布局开发者工具、AI搜索等,希望成为下一代人机交互的入口掌控者[53][54] - AI应用创业者的机会存在于大模型边界之外的垂直领域,需要深度行业理解、复杂工作流整合或强用户关系沉淀的场景[55] - 成功创业路径包含三个关键策略:抢跑模型能力、搭建灵活脚手架、将护城河转向用户数据侧积累[56] AI应用进化与挑战 - AI应用从被动响应的对话工具向具备目标感与自主性的智能体进化,经历对话、Copilot、有限智能体和自主智能体四个阶段[61] - 软件开发方式发生根本转变,核心工作转向“上下文工程”,即动态编排提示词、记忆、状态与工具调用[62][65] - 高达95%的组织未能从生成式AI投入中获得可衡量的商业回报,出现“生成式AI鸿沟”,主因是应用场景错配和难以捕捉隐性知识[65][66] - AI应用面临“成本悖论”,尽管单位Token推理成本下降,但由于链式推理导致Token调用量大幅攀升,公司整体支出可能不降反升[67] 2026年AI行业展望 - 技术方向关注在线持续学习,期待模型能实现终身学习模式,在线持续地学习、感知反馈、自我调整[73] - 经济影响关注AI能否打破“生产率悖论”,当大模型承担智力工作、机器人接管体力任务,可能推动全要素生产率提升[74][75] - 投资逻辑从“技术叙事”回归“商业基本面”,投资者更关注项目是否具备真实竞争壁垒、清晰可持续的经济模型和规模效应[76]