Workflow
AutoGLM
icon
搜索文档
从深夜炸场到凌晨跑路:Manus败退新加坡,“镀金”回来就能赢?
钛媒体APP· 2025-09-30 19:10
Manus产品发布与市场反应 - 2025年3月6日凌晨,智能体产品Manus发布,邀请码在二手平台被炒至数万元,最高标价达十万元[1] - 产品演示视频展现出独立思考、任务分解和工具调用等跨越式能力,宣称能像主动能动的实习生一样交付完整成果[3] - 发布后产品被质疑性能不稳定、存在宕机现象,能力边界未如宣传清晰,导致口碑迅速滑落[3] Manus业务调整与团队变动 - 2025年7月,公司进行大刀阔斧裁员,清空国内社交媒体内容,官网显示地区不可用,并撤出中国市场[3] - 国内团队约120人,仅核心研发团队约40人迁往新加坡,其余约80名非核心员工被裁,裁员补偿为N+3或2N[4] 资本驱动与融资环境 - 2025年5月,Manus获得美国风投Benchmark领投的7500万美元B轮融资,但受美国财政部对外投资安全计划审查[6] - 投资机构要求公司将总部迁出中国以规避合规风险,确保接入OpenAI、Anthropic等国际AI生态[6] - 产品表现与市场期待存在落差,导致口碑崩塌,虽获腾讯等战略性投资,但未扭转国内资本市场处境[5] 市场竞争与商业化挑战 - 中国市场在流量与应用场景上具吸引力,但内卷严重和短平快商业化期待放大产品未成熟时的负面反馈[7] - 海外市场除中美外竞争未达白热化,Manus技术产品理念更易脱颖而出,获得国际资本青睐[6] - 公司选择全力押注海外,避开本土市场激烈厮杀,寻求更易拔尖和付费意愿更高的国际市场[7] 战略重心转移与全球化布局 - 公司将重心迁至新加坡,彻底摆脱国内因预期过高而陷入的被动局面,相当于按下重启键[9] - 短期通过海外融资与低竞争市场实现降维打击,长期可能采取出口转内销策略,以国际巨头身份重返中国[10] - 创始人认为中国创业者应更激进地全球化,参与全球竞争,类似MiniMax等公司也优先面向国际市场[10] 中国市场后续发展 - Manus撤出后,国内智谱、MiniMax、阶跃星辰等公司迅速扩展Agent能力并推出产品[12] - 互联网巨头如百度、阿里、腾讯、字节将Agent能力植入已有产品矩阵,转化为稳健的场景化服务[12] - Manus的离去激发本土玩家紧迫感,市场焦点从谁先出Demo转向谁能稳定交付和场景中量产[13] 技术演进与市场影响 - 通用型智能体打磨需要复杂真实世界数据和多元用户反馈,放弃中国市场可能割舍快速进化机会[14] - 中国大模型技术取得长足进步,依托大而全的产业优势加速探索金融、制造、医疗等商业化落地[14] - 有观点认为公司搬到海外仍被视作中国公司,出海策略可能为未来发展设置无形上限[15]
借道“无障碍”,AI助手可能在盯着你
创业邦· 2025-09-25 12:27
AI Agent市场前景与竞争格局 - 2025年是AI Agent元年,厂商正积极推出和迭代端侧AI助手[4] - 全球AI手机渗透率预计在2027年达到约40%,出货量有望达5.22亿部[9] - AI Agent市场规模预计将从2024年的51亿美元增长至2030年的471亿美元,复合年增长率高达44.8%[17] - 2025年AI Agent将迎来规模化落地浪潮,其通过智能化任务处理重构标准化作业流程的潜力备受期待[16] - 各大厂商纷纷布局,包括苹果发布Apple Intelligence、小米推出MiLM、vivo推出蓝心大模型、OPPO推出安第斯、荣耀推出魔方等端侧大模型[9] - AI厂商如OpenAI推出智能体Operator,智谱推出手机智能体AutoGLM,也开始试水端侧业务[9] AI Agent的技术路径与挑战 - 行业存在两种主要技术路径:接口模式和纯视觉方案(调用无障碍权限)[11] - 接口模式需要手机厂商和应用厂商签订意图框架,互通接口,其特点是安全但依赖生态,开发成本高[11][12] - 纯视觉方案直接调用无障碍权限,开发快、通用性强,但存在用户操作慢、准确率不高以及隐私安全风险[11][12] - 核心挑战在于如何跨过App间的区隔,实现AI对手机的操作[9] - 大部分厂商为快速低成本抢占市场,选择使用无障碍权限这一现存功能模块来实现AI Agent功能[12] 数据安全与隐私风险 - 开放无障碍权限使AI应用基本"全知全能",可能读取支付密码、聊天记录等敏感信息,并可随意点击[4][6] - 用户跨APP的数据使用需要双重授权,但无障碍权限一旦开放就跨过了第三方APP授权环节,用户数据若被滥用可能无法追责[12] - 端侧大模型部署环境下存在隐私保护三大缺陷:知情同意流于形式、多方主体责任划分不清以及用户权利难以实现[12] - 超半数受访者遇到了数据隐私和安全问题,60.09%的受访者认为AI可能会不受控制地收集和处理个人信息[17] - 已有诈骗案例显示,诈骗软件通过"屏幕共享"功能获取用户银行卡账号、密码、验证码,并直接操控手机完成转账[16] - 有AI应用在读屏时未区分信息敏感程度,导致将用户群名称中的小区信息直接引用到作文中[16] 行业规范与企业应对措施 - 行业已推出多项规则,如中国软件行业协会发布《移动互联网服务可访问性安全要求》,要求智能体在获得用户明确授权后方可启用无障碍服务[21] - 中国信通院联合多家公司提出《关于共建终端智能体生态的倡议》,开展打通终端智能体与第三方应用交互接口等工作[21] - 企业需提高对用户隐私风险的防范意识,例如苹果推出Apple Intelligence时特别强调了隐私保护,并开发了"隐私云计算系统"[19] - 企业应明确界定实现功能所必需采集的最小屏幕区域和数据范围,建立针对屏幕数据采集的专项数据质量管理规范[19] - 服务推向市场前可先采取小范围测试,OpenAI和Anthropic的智能体使用截屏功能时会限定在浏览器或沙盒环境中[19] - 当前行业规则并非强制,企业采纳与否凭自愿[12][21]
借道「无障碍」,AI助手可能在盯着你
36氪· 2025-09-21 17:37
AI Agent市场发展与前景 - 2025年是Agent元年,厂商积极推出和迭代端侧AI助手[1] - Counterpoint预测2027年全球AI手机渗透率约40%,出货量有望达5.22亿部[2] - Markets and Market预测AI Agent市场规模将从2024年的51亿美元增长到2030年的471亿美元,复合年增长率高达44.8%[9] - IDC咨询分析称2025年AI Agent将迎来规模化落地浪潮[9] 行业参与者布局 - 苹果公司发布端侧大模型Apple Intelligence,将新Siri定位为手机智能助手[2] - 国产手机厂商推出小米MiLM、vivo蓝心大模型、OPPO安第斯、荣耀魔方等端侧大模型[2] - AI厂商如OpenAI推出智能体Operator,智谱推出手机智能体AutoGLM[2] 技术实现路径 - 行业内存在两种技术路径:接口模式和纯视觉方案[3] - 接口模式需手机厂商和应用厂商达成协议,签订意图框架,互通接口实现操作[3] - 纯视觉方案直接调用无障碍权限等系统级权限,无需第三方App允许[3] - 接口方案安全但依赖生态,开发成本高;无障碍权限方案开发快、通用性强但存在安全风险[3][4] 安全风险与挑战 - 无障碍权限使AI应用基本"全知全能",可能读取支付密码、聊天记录等敏感信息[1] - 用户跨APP数据使用需要双重授权,但无障碍权限跨过了第三方APP授权环节[4] - 实践中存在隐私保护三大缺陷:知情同意流于形式、主体责任划分不清、用户权利难以实现[4] - 已有诈骗案件利用无障碍权限,通过"屏幕共享"功能获取银行卡信息完成转账诈骗[7][8] - 部分AI应用不加分辨地读取所有屏幕信息,导致隐私泄露[9] 行业规范与监管 - 中国软件行业协会发布《移动互联网服务可访问性安全要求》,要求智能体获得用户明确授权后方可启用无障碍服务[13] - 中国信通院联合多家公司提出《关于共建终端智能体生态的倡议》,开展交互接口打通工作[13] - 目前行业规则非强制性,企业采纳与否凭自愿[4][14] - 监管侧可采取敏捷性治理思路,发布专项合规指引,快速响应技术迭代带来的新型风险[14] 企业应对措施 - 苹果推出Apple Intelligence时特别强调隐私保护,专门开发"隐私云计算系统"[12] - 企业需明确界定实现功能所必需采集的最小屏幕区域和数据范围,避免过度采集[12] - 需建立针对屏幕数据采集的专项数据质量管理规范,明确各环节安全性要求[12] - 服务推向市场时可先采取小范围测试,保证功能合规安全[12]
AI浏览器被曝重大安全漏洞,2分30秒内完成盗号
21世纪经济报道· 2025-08-26 20:54
AI浏览器安全漏洞事件 - Perplexity公司AI浏览器Comet存在重大安全漏洞 攻击者可通过论坛评论区隐藏恶意指令诱导AI智能体泄露用户邮箱 验证码等敏感信息 盗号过程仅需2分30秒 [1] - 漏洞由竞争对手Brave浏览器安全团队发现 攻击步骤包括在Reddit帖子添加剧透标签隐藏指令 用户使用"总结当前网页"功能时AI自动执行恶意操作 [1] - Perplexity声称漏洞已提前修复且无用户数据泄露 但Brave团队表示7月25日报告后问题未完全解决 公司未分享修复方案 [2] AI智能体行业安全风险 - "间接提示词攻击"成为AI智能体核心安全风险 攻击者可通过网页 PDF或聊天消息注入隐藏指令使大模型偏离用户原始请求 [3] - 交互界面简化导致开发者低估攻击风险 实际攻击隐蔽性增强 案例显示攻击者可劫持智能体窃取WhatsApp用户聊天记录 [3] - 传统网络安全体系不足 需建立全新安全与隐私架构 用户授权AI处理银行 医疗等敏感数据时风险成倍增加 [2][3] 行业安全防护方案 - Brave提出AI浏览器"四道防线":区分用户指令与网页内容 检查任务符合性 敏感操作需用户确认 代理模式与常规浏览隔离 [4] - 谷歌 OpenAI等公司避免推出类似Comet功能 转向虚拟机与云浏览器模式 阿里巴巴无影云和智谱AutoGLM"虚拟手机"属同类探索 [4] 行业竞争格局 - 智能体成为2025年核心竞争领域 海外苹果 Anthropic 谷歌 OpenAI与国内百度 字节 腾讯 阿里全面投入布局 [3]
单任务成本约0.2美元 智谱要用云端Agent抢市场
第一财经· 2025-08-20 22:45
产品升级与功能拓展 - 智谱于8月20日将Agent产品AutoGLM升级至2.0版本 新增云端执行模式 与阿里云及腾讯云合作 不占用用户本地设备资源 [2] - 新版本支持操作美团、京东、小红书、抖音等数十个高频应用 较初期版本仅支持微信点赞、淘宝购物等功能显著扩展 [2] - 云端模式解决本地化运行限制(如3月版本需通过GUI界面操作) 确保任务持续执行且不影响用户其他设备使用 [2][3] 技术路线演进 - 公司采用"模型即Agent"技术路径 通过端到端强化学习直接赋予模型Agent能力 而非依赖人类专家轨迹学习 [3] - 实现Deep Research与Browser-use Agent技术融合 使Agent能处理大量数据并充分挖掘生产资料价值 与ChatGPT Agent技术方向一致 [3] - 技术迭代驱动从本地化运行(如小红书14天养号任务)向云端虚拟机架构迁移 解决设备依赖与任务中断问题 [2][3] 成本结构与商业化 - AutoGLM单任务成本约0.2美元(含模型与虚拟机) 预计随规模化和商业化推进进一步压缩 [5] - C端产品目前免费 B端采用定制化报价模式 未披露标准调用价格 [5] - 国内Agent单任务定价区间为0.008-0.04元人民币(中金数据) 海外商业化定价多为0.5-2美元/任务 [5] 行业市场动态 - 海外B端Agent市场处于结构性拐点 生态布局与技术演进同步催化市场空间打开 [5] - 2025年以来国内用户对AI应用认知度提升(受DeepSeek等推动) Agent市场需求端瓶颈逐步疏通 [5]
单任务成本约0.2美元,智谱要用云端Agent抢市场
第一财经· 2025-08-20 21:12
产品升级与功能迭代 - 公司于8月20日将旗下Agent产品AutoGLM升级至2.0版本,开启云电脑与云手机执行任务模式 [2] - 此次升级主要与阿里云及腾讯云合作,在云端运行Agent程序,不占用用户本地设备存量 [2] - 产品迭代从去年10月持续至今,初级版本可实现微信点赞、淘宝购物、携程订票等功能,11月升级后新增会议总结、文档处理、网页搜索与总结等功能 [2] - 今年3月升级的“沉思”产品可完成在小红书14天养号接商单任务,但为本地化运行 [2] - 2.0版本将可操作应用增至美团、京东、小红书、抖音等几十个高频应用 [2] 技术路线演进 - 公司相信“模型即Agent”,Agent能力正直接被模型通过端到端强化学习的方式吸纳 [3] - 去年Agent方案更多依赖于对人类专家轨迹的学习,无法完成未见过的任务类型 [3] - 在“沉思”产品上实现了Deep Research(深度研究)与Browser-use Agent(网页智能体)的融合,以阅读大量数据并发挥生产资料价值 [3] - 本地化运行存在硬伤,如无法保证Agent任务在操作者关机等情况下的持续操作,使云端形态成为必要 [3] 成本与商业化 - 此次Agent产品全量放开基于成本下降,AutoGLM单任务成本约0.2美元,未来随着规模化与商业化进程推进,成本将进一步压缩 [5] - 单次任务成本依据任务难易程度及消耗的token数量变动,C端产品目前免费,B端调用价格暂未披露,B端定制化产品一般进行单独报价 [5] - 据中金研究报告,国内扣子空间单任务定价在0.008-0.04元人民币,海外Agent商业化定价在0.5-2美元(单任务)居多 [5] - 海外Agent商业化处于结构性拐点,生态布局与技术演进正同步催化广阔市场空间的打开 [5] - 自2025年以来,随着用户对AI应用认知程度提升,国内Agent市场需求端的卡点正在逐步疏通 [5]
手机“自动驾驶”时代来了,智谱还让手机拥有“云替身”
歸藏的AI工具箱· 2025-08-20 16:54
核心观点 - 智谱推出新版AutoGLM 实现全球首个手机通用Agent 通过云手机技术跨平台操控设备 支持复杂多应用任务执行 显著提升移动端操作效率并拓展AI应用场景 [1][3][4] 技术能力 - 云手机Agent在云端运行任务 解放用户本地设备资源 支持iOS、安卓和网页全平台客户端 [4] - 实现跨应用程序自动泛化任务执行 即将新增定时任务功能 [4] - 多模态内容识别能力突出 能处理高德地图等界面复杂、元素密集的应用 [9] - 通过手机虚拟机解决权限控制问题 避免与用户设备权限冲突 [24] 应用场景 - 生活服务: 自动规划行程 例如跨大众点评和高德地图完成餐厅筛选与通勤查询 涉及20余次点击操作 [7][9] - 比价购物: 同步搜索京东和拼多多商品 例如大疆无人机 京东最低价4837.9元 拼多多百亿补贴价4219元 提供优惠详情和购买建议 [11][14] - 内容运营: 检索小红书、抖音热门内容并整合加工 提供发布策略和互动数据侧重点 [16][17] - 适老化支持: 帮助老人操作腾讯视频等复杂APP 例如通过筛选功能找剧集并加入收藏 [19][21] 行业影响 - 中国互联网80%流量集中于移动端 AutoGLM通过云手机技术突破用户时间限制 创造无限注意力经济增长通道 [24][28] - 解决国内特殊环境需求: 必需操作依赖手机APP 与海外以网页为主的服务模式存在显著差异 [22] - 面临验证码和反爬机制等执行障碍 需与互联网巨头协同构建稳定Agent运行环境 [26] - 手机Agent化成为不可避免趋势 模型能力已达标 生态建设成为关键发展因素 [26]
厉害了,智谱造了全球首个手机通用Agent!人人免费,APP甚至直接操控云电脑
36氪· 2025-08-20 15:34
产品发布与核心功能 - 智谱发布全球首个手机通用Agent AutoGLM 可免费使用 [2] - AutoGLM通过云端执行任务 不占用本地资源且不影响设备正常使用 [4][23] - 支持生活助手和办公助手两类任务 例如点外卖、比价、生成调研报告等 [5][14][16] 技术实现与行业突破 - 基于云端智能手机和云电脑执行任务 预装应用并支持跨APP操作 [13][22] - 依托GLM-4.5和GLM-4.5V模型 整合推理、编码、研究等多项能力 [32] - 解决行业痛点:本地设备算力有限且任务执行干扰用户体验 [24] 应用场景与生态扩展 - 支持手机、PC、智能音箱、车载系统及物联网设备集成 [26] - 推出移动端API和开发者生态共建计划 开放能力赋能第三方产品 [26] - 办公场景中可自动生成基于近100份参考源的数千字调研报告 [17] 战略定位与行业影响 - AutoGLM是智谱AGI路线图中实现L3"自主学习智能体"的关键步骤 [29] - 行业玩家积极布局云端Agent 如阿里云推出无影AgentBay [25] - 提出3A原则:全时待命、零干扰运行、全域设备连接 [35][36][37] 用户体验与效率提升 - 复杂任务如跨平台比价可自主执行 用户仅需发起指令 [14] - 原需一天完成的调研报告生成任务 现仅需几分钟 [17][21] - 云端备用机机制释放本地存储空间 提升设备运行流畅度 [23]
智谱的手机智能体内测10月后终上线,能否缓解隐私担忧?
南方都市报· 2025-08-20 15:17
产品发布与核心特性 - 智谱旗下手机Agent产品AutoGLM于8月20日正式上线苹果和安卓应用商店 距离首次发布已10个月 [1] - 产品由最新语言模型GLM-4.5与视觉推理模型GLM-4.5V驱动 成本较接入国外模型的智能体大幅下降 [1] 技术架构与执行方式 - 采用云手机方案 智能体任务执行从手机终端迁移到云端 通过腾讯云手机服务调用云端桌面App [2] - 无需索取手机终端系统敏感权限 不占用终端屏幕和算力 用户可同步操作其他事项 [2] - 支持操作抖音 小红书 美团 京东等40多款高频应用 覆盖点外卖 订机票 查房源 预约健康服务等场景 [2] - 执行能力封装为API 开发者可接入AI眼镜等可穿戴设备 通过Rokid AI眼镜演示点咖啡指令 [3] 用户体验与操作流程 - 使用前需在云手机桌面登录各App个人账号 指令需具体以提升执行准确度 [2] - 出于资金安全考量 智能体不能直接付款下单 需人为接管完成最后一步 [2] - 云手机登录导致手机终端相应App账号自动退出 后续需重新登录带来不便 [2] 隐私安全机制 - 产品不再调用终端设备无障碍权限和录屏权限 仅读取云设备屏幕内容 [4] - 系统将云设备图像发送给大模型分析 模拟人类操作方式完成任务 [4] - 隐私政策强调仅为完成指令获取屏幕信息 采取严格数据加密保护措施 不用于其他目的 [4] - 云手机界面明确告知不保存第三方App账号密码 非任务状态不获取屏幕信息 [5] 市场与监管背景 - 应用商店对智能体产品隐私安全性要求严格 AutoGLM经大量迭代达到上架标准 [4] - 此前无障碍权限使用受工信部门严格管控 因涉及敏感权限且可能超出原设计目的 [4] - 部分用户在社交平台对产品隐私安全仍存担忧 [5]
中美AI竞争加剧:OpenAI对手智谱发布智能体应用,奥尔特曼称美国低估中国AI威胁
钛媒体APP· 2025-08-20 13:13
智谱AI产品发布 - 智谱发布全球首个手机Agent智能体应用产品AutoGLM 2.0版本 基于纯国产模型GLM-4.5和GLM-4.5V驱动 具备推理、代码与多模态能力 支持iOS、安卓和网页全平台 [3] - AutoGLM 2.0突破硬件限制 通过Agent+云手机技术在任何设备和场景下运行 实现从"言"到"行"的范式转变 [3][10] - 产品定位C端用户 通过多智能体系统帮助用户平行处理工作和日常任务 实现"1(用户)+N(智能体)"的能力扩展 [3] 技术性能与测试表现 - 在Device Use基准测试中 AutoGLM整体表现优于ChatGPT Agent、UI-TARS-1.5和Claude 4 Sonnet 其中在OSWorld测试中获得48.1分 远超ChatGPT Agent的42.9分 [11][12] - 在Browser Use测试中达到87.7分 在Mobile Use的AndroidWorld测试中获得75.8分 均领先竞争对手 [12] - 技术实现基于端到端异步强化学习突破 结合GLM-4.5系列模型原生能力 支持推理、编码、研究和GUI操作等多类任务 [10] 公司融资与生态布局 - 智谱累计完成约11次融资 总金额超125亿元人民币 投资方包括红杉中国、高瓴资本、阿里巴巴、腾讯等头部机构及多地国资 [7] - 公司定位开放平台 与高通、三星、英特尔、荣耀等硬件厂商合作 在AIPC和智能助手领域落地应用 [9] - 使用成本低于竞争对手 DeepSeek 最低仅需8个英伟达H20芯片即可运行GLM-4.5系列模型 [7] 行业竞争与中美AI发展 - 2024年中国人工智能产业规模超7000亿元人民币 连续多年保持20%以上增长率 截至3月共有346款生成式AI服务完成备案 [5] - OpenAI CEO奥尔特曼表示美国低估中国AI进展 中国在推理和技术探索方面可能更快构建能力 中美AI竞赛复杂度超出简单领先排名 [5][17] - 中国开源模型DeepSeek V3训练成本不到600万美元 性能媲美ChatGPT 促使OpenAI改变模型发布策略并首次推出开放权重模型 [13][17][18] 市场发展与预测 - 2025年被行业称为"智能体爆发年" 百度、阿里、腾讯等互联网大厂密集布局 智能体市场进入协同作战阶段 [7] - 仅2024年上半年就有超50款智能体产品发布 包括字节跳动的扣子空间和360的多智能体蜂群系统 [7] - IDC预测到2027年60%的大型企业将采用协作型智能体系统 业务流程效率提升50%以上 [20]