Workflow
场景闭环
icon
搜索文档
端侧AI落地路径:从算力下沉到场景闭环
21世纪经济报道· 2025-12-11 16:00
行业趋势:端侧AI的落地与结构性迁移 - 人工智能正经历从云端向终端设备的结构性迁移,2025年被AMD称为“AI智能体元年”的开端,AI正从对话助手演变为具备任务执行能力的生产力工具 [1] - 端侧AI落地需满足严苛条件:运行百亿参数级基座模型、加载企业专有知识库、支持多智能体协作、处理超长上下文并保障数据不出域 [1] - 端侧AI的真正落地不能仅靠算力堆砌,还需在硬件架构、应用场景和生态协同上形成完整闭环 [1] 核心挑战:端侧AI部署的障碍与需求 - 端侧AI部署面临三重障碍:算力不足、成本过高、生态割裂 [2] - 传统消费级PC受限于显存容量与内存带宽,难以承载主流开源大模型(如Llama 3 70B、DeepSeek-R1 70B等) [2] - 企业若选择专用AI服务器,需承担数十万元硬件投入、专用机房部署及持续运维成本,而云服务则在数据隐私、响应延迟和长期费用上存在硬伤 [2] - 在医疗、金融、制造等强监管行业,“数据不能出院”是不可逾越的红线 [2] 硬件架构创新:实现算力下沉的关键 - 端侧AI的落地路径是通过硬件架构创新,在桌面级设备中实现“完整推理闭环” [2] - 关键突破在于统一内存架构(UMA)与异构计算单元的整合 [3] - 端侧AI设备必须兼顾兼容性与实用性,符合主流AI PC规范的设备可无缝运行Office、Photoshop等主流生产力工具,同时支持AI加速,实现日常工作与智能推理一体化 [3] - 设备需支持ECC内存纠错、7×24小时高负载运行,并提供PCIe x16、USB4 V2等高速接口以便未来扩展 [3] - 部分产品采用模块化主板设计,支持快速拆装,便于维护升级 [3] - 硬件创新的核心是在极致小型化前提下,重构计算、存储与互联资源的分配逻辑,使桌面级设备具备接近服务器级的推理能力,同时保留消费电子的易用性与灵活性 [4] 应用场景闭环:从技术到业务的嵌入 - 端侧AI要产生实际价值,必须嵌入具体业务流程,形成“数据—模型—行动”的闭环 [5] - 产品定义的核心逻辑是“从先锋用户需求出发,向大众市场下沉” [5] - 早期采用者多为技术极客、超级个体户或行业先锋,其超前需求(如本地运行医生考试模型、自动制作播客并模拟人声)驱动软硬件协同优化 [5][6] - 医疗领域:某三甲医院测试的AI辅助诊断系统基于本地部署的GPT-OSS 120B模型,在美国医师执照考试中得分89分,达到执业水平,并能实时辅助年轻医生判读影像,本地部署满足“数据不能出院”的合规要求 [6] - 教育领域:高校正将“与AI协同工作”纳入通识教育体系,一台具备96GB共享显存的工作站可同时运行多个教学实例,支持全班并发操作,且数据完全隔离,形成“一人一机一模型”的新范式 [6] 软硬件生态与产业链协作 - 场景实现依赖于完整的软硬栈,自研操作系统提供企业级数据安全(如快照备份、全盘加密、RAID冗余),并内置AI相册、影视墙、P2P远程访问等功能,支持Docker容器化,使设备从“存储盒子”进化为“边缘智能服务器” [7] - 产业链协作模式正在升级,芯片厂商不再仅提供硬件,而是与整机厂商共同定义AI Agent平台,围绕具体行业痛点反向推动技术迭代,缩短从技术到应用的转化链路 [7] - 未来,端侧AI的规模化普及仍需突破模型压缩、量化效率与开源生态等瓶颈 [7]
阿里的具身智能逻辑:广泛布局“躯体”后,终于要跟“大脑”融合了
观察者网· 2025-10-09 18:05
公司战略与行动 - 阿里巴巴于2025年10月8日正式建立“机器人和具身智能小组”,标志着其战略从生态投资转向核心自研 [1][10] - 阿里巴巴集团CEO吴泳铭在2025年9月24日的云栖大会上为具身智能落地做出战略背书,判断行业正进入AI的“自主行动”阶段,并明确将联合英伟达推动该领域发展 [2] - 阿里巴巴在过去两年进行了一系列机器人领域投资,包括2024年2月投资法奥意威、2024年10月联合领投星动纪元近3亿元Pre-A轮、2025年3月参与逐际动力A+轮融资(累计达5亿元)、2025年6月联合领投宇树科技C轮、2025年9月重金领投自变量机器人A+轮 [6][7][8][9][10] - 阿里巴巴的战略路径是“一脑多形”,即以通义千问大模型为通用智能核心,适配驱动其投资的各类机器人硬件 [11][12] - 阿里巴巴计划利用其庞大的业务生态(如菜鸟、饿了么、天猫)作为天然的数据来源和测试场景,并凭借超3800亿元建设的云和AI硬件基础设施来降低研发和迭代成本 [14][16] 行业竞争格局 - 具身智能赛道巨头林立,模式各异:特斯拉采用全栈自研模式打造擎天柱,Figure AI与OpenAI结盟构成“AI大脑+硬件身体”组合,Google DeepMind通过发布RT系列模型探索通用AI控制 [2] - 2025年10月8日,阿里巴巴与软银的同时出手将行业竞赛推向“产业级”规模与“生态级”对抗的新阶段 [3] - 软银集团于同日宣布以近54亿美元现金收购ABB集团旗下的“机器人与离散自动化事业部”,旨在融合“人工超级智能和机器人技术” [4][5] - 英伟达CEO黄仁勋判断AI与机器人将带来“数万亿元”的长期增长机会,行业玩家已达成让AI进入物理世界“干活”的共识 [5] 技术路径与挑战 - 行业面临的核心挑战是让AI在物理世界中有效“干活”,目前仍是一片“荒漠” [6] - 阿里巴巴与英伟达合作,将集成NVIDIA Isaac Sim仿真工具与Cosmos测试平台,通过标准化接口与通义大模型联动,为不同形态机器人提供统一训练环境 [12] - 行业共同挑战是跨越人工智能“软”世界与机器人“硬”世界之间的天堑,包括硬件底层架构、通信协议和数据接口的差异,以及核心硬件物理极限和高昂成本 [15] - 阿里巴巴的独特优势在于其业务生态可提供海量真实场景,以“内部消化”方式极大降低数据采集和模型试错成本 [16]