Workflow
VLA (Vision Language Model)
icon
搜索文档
中兴通讯崔丽:AI应用触及产业深水区 价值闭环走向完备
21世纪经济报道· 2026-01-01 07:07
文章核心观点 - AI大模型发展正从基础设施向上层应用演进,基座大模型将收敛,但垂域模型与应用将极大丰富,成为引发技术变革的关键[1] - 物理AI是重要关注窗口,正加速具身智能、自动驾驶等领域演进,但技术路线存在分歧,软性基础尚在夯实[1] - 2025年进入“Agent元年”,AI技术正从Copilot辅助模式向自主行动的Agent模式迈进,目标是全价值链的业务重构,但规模化落地仍面临挑战[6][7] - 部分行业凭借信息密集、数据结构化程度高、价值闭环快等特征,已率先借力AI完成价值闭环,进入数智化转型“深水区”[1][9][11][12] 物理AI的技术路线与分歧 - 物理AI存在两条核心路线竞争:世界模型与视觉语言模型[2] - Sora等模型标志着AI从“预测者”向“模拟者”进化,是从数据驱动到模型仿真驱动、物理对齐、通用模拟的范式转移[2] - 当前Sora仅是“视觉模拟器”,而非真正的“物理世界模型”,因其缺乏因果推理、反事实推演和物理一致性,常出现违背物理逻辑的“物理幻觉”[2] - 世界模型路线分化为“生成派”与“表征派”:生成派通过海量感官数据归纳世界规律,适合做数据工厂或仿真训练;表征派通过构建内在结构推演世界状态,适合做决策大脑和实时推理[3] - 应用于具身智能的VLA模型将控制问题转化为序列建模,优势在于零样本泛化,但缺乏因果推理且依赖训练数据覆盖度;世界模型主张构建环境内部模型进行虚拟试错,样本效率远超VLA[3] - 产业界正呈现VLA与世界模型融合的趋势,例如利用VLA进行高层策略规划,利用世界模型进行底层动作验证[4] 网络架构向AI原生演进 - 网络架构正从“云原生”向“AI原生”演变[5] - 云原生解决了互联网应用的弹性伸缩和敏捷开发需求,互联网流量以“南北向”为主,数据包小而离散,对时延抖动有一定容忍度[6] - 大模型时代流量特征转向分布式“同步计算”,带来“大象流”、丢包零容忍、微秒级时延敏感等特点,需要网络做到“万无一失”[6] - AI原生网络的核心是极致的性能无损和算网协同,具备内生智能、确定性保障和算网一体等关键特征[6] - 应用层面,云原生应用以K8S为底座,以微服务架构为代表;AI原生应用以“大模型+Agent”为底座,以Agent及Agent间通信为代表;两者将趋于融合成为云智一体原生应用[6] Agent元年的机遇与挑战 - 2025年被称为“Agent元年”,将推动千行百业更彻底转型,从效率提升转向业务重构[6][7] - Agent从实验室走向企业核心生产系统的“最后一公里”面临多重挑战[8] - 在高可靠性行业,需解决随机性模型与确定性业务之间的矛盾、确保长程任务稳定性、构建可信安全边界[8] - 核心业务中,AI“幻觉”是不可接受的风险,企业无法容忍“黑盒”在没有人类审核下做出关键决策[8] - 由于上下文窗口限制,处理跨天、跨周的复杂任务链时,模型易出现记忆丢失或逻辑断裂,导致开发复杂度指数级增长[8] - Agent使用工具可能带来沙箱逃逸、资源耗尽和数据泄露等安全风险[8] - 企业现有IT环境复杂,存在接口标准化缺失、数据孤岛等问题,同时需平衡推理维护成本与投资回报率[8] 行业应用与价值闭环 - 能率先实现AI价值规模化复制的行业具备关键特征:信息密集、数据结构化程度高、具备强反馈机制、价值闭环极快、有一定容错度、具备一定范围泛化能力[9] - 数字化转型较好的行业更容易进行智能化转型[10] - 教育、医疗、软件开发、智能制造、城市治理等行业可能率先完成价值闭环[11] - 制造业凭借高度结构化数据环境和明确效率指标,成为AI价值变现的“排头兵”[11] - 城市治理依托海量多模态数据和公共安全需求,正通过“城市智能体”模式实现从被动响应到主动预防的跨越[11] - 数智化转型进入“深水区”意味着AI从外围辅助系统进入核心生产系统,如网络运营、电网调度、城市应急指挥等[12] - “深水区”将面临“三多”:多模态数据、多厂家设备、多业务场景;“三新”:新技术、新架构、新安全威胁;“三跨”:跨领域知识融合、跨系统数据调用、跨组织流程协同[12] 技术路径:通用大模型与行业小模型的协同 - 驱动行业AI发展并非“通用基础大模型+行业精调”与“从零构建行业专属小模型”的二选一,而应采用“云边协同”的混合路径[12] - “通用基础大模型+行业精调”是构建企业“大脑”的最有效路径,解决了认知层面的通用性与专业性矛盾,能以低成本继承通用逻辑能力,解决知识密集型任务[12] - 从零构建行业专属小模型是构建企业“四肢”的可行方案,在非自然语言、极致边缘和极致隐私场景下不可或缺,解决了感知与执行层面的效率、适配和安全问题[12] - 面对工业领域的振动波谱、雷达信号、基因序列等“非自然语言”数据,通用模型的先验知识可能成为噪音,需从零构建专用的CNN或Transformer模型[13] - 对于极致时延和功耗场景,如矿山无人驾驶卡车或高速贴片机,推理时延需控制在毫秒级,算力受限于嵌入式芯片,训练一个参数量在几百万到几亿的专用小模型是唯一可行方案[13] - 面向对数据隐私和主权有极致要求的场景,如金融或核心基础设施,为确保模型无潜在偏见或后门,会选择完全物理隔离环境下的从零训练[13] - AI本身已在重塑软件工程,高效利用AI代码大模型试错,可在一定程度上加速试错和降低成本[13]