搅局者来了!智谱重磅开源AutoGLM,让“豆包手机”人人可造!官方:AI手机不该掌握在少数厂商手中
AI前线·2025-12-09 14:26

AutoGLM模型开源发布 - 智谱于2023年4月开始研发能让AI像真人一样使用手机的技术,并在32个月后,于2025年4月将其核心AI Agent模型AutoGLM完整开源[2][3] - 开源内容包括:训练好的核心模型、手机操作能力框架与工具链、覆盖50多个高频中文App的可直接跑通的Demo、针对Android的适配层与示例工程、以及文档和快速上手指南[15] - 模型以MIT许可证开放,所有代码以Apache-2.0许可证托管在GitHub仓库中[10] AutoGLM的核心能力与技术 - AutoGLM具备手机操作能力,包括点击、滑动、输入、截图理解、流程恢复、噪声处理等,能稳定完成外卖点单、机票预订等长达数十步的复杂操作流程[5] - 模型已支持上百个主流APP[6] - 其能力基于三大核心技术突破:1) 创新的双层Agent结构,将行为拆分为负责思考的Planner和负责执行的Grounder,解决了“看得懂但点不准”的难题,使GPT-4o视觉模式的网页任务执行成功率从18%提升至36.4%[26][27];2) 自进化式的Curriculum RL强化学习框架,赋予模型错误恢复能力[29];3) 在包括上千台云端虚拟手机的大规模可控环境中训练,极大地扩展了Agent的准确性和泛化能力[9][30][31] 开源动机与行业愿景 - 智谱认为“AI手机”是大势所趋,但非一家公司能完成,也不应被极少数厂商垄断,开源旨在将AutoGLM打造成行业可共同拥有和打磨的公共底座[12][14] - 通过开源和私有化部署,企业和开发者可在自己的合规环境中完整掌控数据、日志和权限,解决AI手机面临的隐私问题[16][17] - 智谱希望分享其技术积累,将走过的路变成行业在Agent爆发时代的起跑线,自身定位为AI手机生态中开放、易集成的关键拼图,而非取代手机厂商[18][47] AI手机行业现状与前景 - 据IDC预计,2026年中国新一代AI手机出货量将达到1.47亿台,占总体市场的53%[36] - 赛迪顾问判断,2027年AI手机销量将跃升至1.86亿部,占比56.1%[36] - 2023年中国AI手机销售量为1100万部,占全球22%;2024年预计出货量超过3500万部,市场占有率约12%[41] - 目前AI手机实际体验仍处早期阶段,存在“宣传大于实际”的问题,跨App操作成功率受限于权限、界面变化等工程难题[42][43] 行业技术路线与竞争格局 - 行业技术路线主要分为两派:依赖App授权的“意图框架”和无需授权、依靠读屏与模拟操作的“视觉路线”[44] - 字节跳动的“豆包手机”尝试将GUI Agent做到系统级,其首批约3万台供内部测试,核心团队由多个硬件团队整合而来,目标是探索“大模型+超级App+硬件”的新形态[46] - 第三方AI在手机中大规模落地面临权限、数据、应用配合等挑战,手机厂商普遍倾向与可控性更强的大模型公司合作,如OPPO选择阶跃星辰,荣耀、三星采用智谱[46]