阶跃 AI 桌面伙伴
搜索文档
模力工场 032 AI 应用榜:桌面 Agent 强势来袭,阶跃登顶本周榜首
AI前线· 2026-02-13 16:08
行业核心趋势 - AI应用的主战场正从“会不会回答问题”转向“能不能把事做完”,进入执行与交付阶段[21] - 用户关注的核心从模型能力转向执行稳定性、流程完整度和对真实工作场景的适配程度[21] - 趋势是AI正在从能力展示进入到执行与交付阶段,能嵌入用户工作流并承担连续、可验证任务的应用更可能被长期留存[23] 桌面Agent类应用 - 桌面Agent形态集中出现,AI正从“对话框里的助手”走向“接管桌面的执行者”[5] - 此类AI开始在真实桌面环境中操作网页、处理本地文件、生成办公文档,并能跨多个应用连续执行任务[5][21] - **阶跃AI桌面伙伴**:定位为更懂中文办公的国产桌面AI伙伴,全平台支持,深度整合钉钉、飞书等本土工具,提供截图提问、智能整理、定时任务等功能[7] - **WorkAny**:艾逗比开发的开源跨平台桌面智能体,可通过安全沙盒执行脚本,处理文件整理、文档生成、网页制作等任务,支持自定义模型与并行处理[9] 学习与知识管理类应用 - 应用演进路径强调结构化理解、完整流程和长期使用,而非单次生成[21] - **智谱清言AI学习搭子**:植入在智谱清言生态中的学习辅助模块,擅长将教材、文档和概念转化为知识地图、卡片和讲解内容,并配套随堂测试[11] - **Thetawave AI**:偏重输入端的学习整理工具,支持录音、视频、文档、网页等多源内容转写,并生成结构化笔记、思维导图和测验[13] - **Notebook LM**:Google推出的研究型笔记工具,偏重“资料理解与问答”,围绕用户上传的材料进行摘要、提问和交互式研究整理[13] 内容与视频创作类应用 - 应用演进路径强调全流程生成与效率提升,向“可持续使用的生产力工具”靠拢[21] - **道影AI**:AI视频全链路生产平台,面向短剧、漫剧等专业内容创作者,实现从剧本到成片的一体化设计与规模化生产[12] 开发与编程协作类应用 - **OpenCode**:为Vibe Coding场景设计的AI编程工具,将聊天、代码编辑、文件树和终端集成在同一界面,支持skill封装与多模型切换,对编程新手友好[15] 专业与底层能力类应用 - **Mureka V8**:昆仑万维推出的AI音乐生成平台,可从自然语言或歌词直接生成结构完整、编曲成熟、人声自然的音乐作品[22] - **Prism**:OpenAI推出的学术写作结构梳理与格式排版工具,擅长在开题与文献综述阶段将思路系统化、可视化,并处理LaTeX排版与参考文献管理[22] - **蓝耘元生代**:以自研MetaGen智能算力操作系统为核心,面向企业提供集算力调度、模型服务与数据生成于一体的智算云平台[22] 其他有趣应用 - **Flora**:节点式创意AI平台,通过“无限画布”把文本、图像和视频生成串成可复用的工作流,适合品牌视觉、广告概念等跨媒介创作场景[19] 榜单机制与影响力 - 模力工场AI应用榜排名基于用户真实使用、测评与社区讨论热度,本周共有25款应用上架新榜[5] - 榜单权重维度包括:评论数(核心指标)、收藏与点赞(次级指标)、推荐人贡献[24] - 上榜应用可通过极客邦科技旗下全媒体矩阵(如InfoQ、AI前线、极客时间等)进行传播,触达千万级技术决策者、开发者及AI用户[24]
对话阶跃AI:做桌面 Agent,要比 Claude Cowork 往前一步
Founder Park· 2026-01-19 18:01
行业趋势:AI Agent向桌面端与本地化发展 - 基于本地的AI Agent产品成为关注重点,例如Anthropic的Claude Cowork和阶跃星辰的“阶跃AI桌面伙伴” [2][3] - 行业参与者选择桌面端Agent的共同原因在于探索更大的场景拓展空间和上下文可能性,尽管存在关机无法执行和安装渗透率低于网页应用的缺点 [10][11] - 未来发展方向被认为是端云协同,同时具备本地和云端能力,但出于成本考虑,当前厂商优先选择其中一边进行探索 [10] 产品定位与战略:阶跃AI桌面伙伴的探索 - 该产品被公司定义为“探索型”产品,是其在“AI+终端”战略下的一次创新尝试,旨在验证用户场景与技术假设,并为长期目标积累底层能力 [15][16] - 产品的核心构想是在现有的Web、App和数据库之上,叠加一层以用户为中心的“Agent加工层”,旨在围绕用户需求构建“新结果”和“新状态” [17] - “新结果”包括新信息、新媒介和新操作界面;“新状态”则指能改变用户与世界关系的行为,如自动填表、发送消息等 [18][19] - 产品当前更聚焦于“任务执行”场景,因公司认为AI对“浏览操作”体验的提升尚不够痛 [20] 场景选择与切入逻辑 - 公司选择从电脑端切入,因其能深度集成浏览器和本地工具,并安全获取用户资产;车机方向也被视为有潜力的领域,因其数据开放度高且语音交互自然 [22] - 办公场景被优先选择,因为其任务复杂、手动成本高,即便AI Agent成功率只有60%-70%,用户也愿意尝试;相比之下,生活场景对失败率的容忍度更低 [23] - 产品最初瞄准的两个核心场景是文件处理和批量信息获取,这源于对非技术人员真实痛点的观察,如数据分析、格式转换、以及运营人员手动更新数据表等 [24][26][27] - 从终端选择与场景交叉的逻辑看,在电脑端探索办公场景是一个顺理成章的中间路径,最终愿景是让Agent取代电脑,用户只需做决策 [23] 核心功能与用户反馈 - “妙计”功能是关键探索,它类似于给模型使用的workflow或技能,能简化操作、降低使用门槛、沉淀脚本资产,并探索自主学习的可能性 [12][29][30] - 用户最高频的任务分布约为:文件处理占40%,信息获取占30%,其余30%为长尾需求(如快问快答) [43] - 在文件处理场景中,出现了多样化的用例,包括HR自动汇总出勤表、算法工程师自动下载并重命名论文文件,以及家长创建可自动更新的错题本等 [43][44] - “主动服务”被认为是所有Agent应有的能力,公司正从预设场景和开放用户自定义规则两方面进行探索,以解决用户教育和使用门槛问题 [33][35][36] 产品发展现状与挑战 - Agent的整体渗透率仍处于早期阶段,许多用户并未意识到其可用场景,需要产品进行引导和教育 [12][34] - 产品开发周期紧凑,从开发到上线不到一个半月,通过不断调整优先级和根据用户反馈补充能力来推进 [41] - 当前面临的关键问题包括:提升Agent能力(更稳、更快、成本更低),以及提高Agent在用户中的渗透率 [12] - “妙计”功能的用户引导目前不够强,公司计划通过加强功能露出、增加预设推荐和优化引导路径进行改进 [32] 模型与产品的协同关系 - 模型能力依然非常重要,强模型自带流量和势能;但同时,模型之外的因素如个人数据接入、场景教育、工具细节设计等的重要性也在提升 [45][46] - 产品可以反哺模型研发,例如“妙计”可以作为衡量模型能力的benchmark,产品也能帮助积累高质量的合成数据和环境反馈信号 [49] - 行业趋势从做单一的“功能点”转向整合能力,即如何串联功能并嵌入用户工作流 [47] 交互设计与行业观察 - 用自然对话的形式解决任务对用户来说成本最低,优于让用户去应用商店寻找和学习独立工具 [56][59] - 行业内在交互上有创新尝试,例如Hero AI在输入过程中自动判断需求维度,以及Sky.app对悬浮窗形态的探索 [50][51][53] - 类似于MineContext的产品也在探索全局记忆和上下文理解,表明该方向仍有很大空间 [54] - 对于Agent工具商店类产品,核心仍需回归解决用户实际问题,难点在于许多用户连自己的需求都难以描述 [55]