Workflow
Expert Agents
icon
搜索文档
MiniMax把自家“实习生”放出来了!
量子位· 2026-01-20 21:04
文章核心观点 - AI Agent正从割裂的工具进化为深度嵌入工作环境、理解完整职业上下文的“长期合伙人”,其核心在于直接交付最终结果的能力 [1][2][3] - MiniMax推出的AI原生工作台Agent 2.0,通过Desktop App与Expert Agents两大载体,旨在实现这一愿景,将内部已验证的高效工作流产品化并开放给外部用户 [4][40][41] Agent 2.0的核心组件与能力 - **Desktop App:打通云端与本地,具备强大执行力** - 核心逻辑是将云端模型能力连接到本地电脑,能直接读取本地文件与操控网页,介入实际工作流 [5][6][7] - 可主动调取本地资源处理任务,例如处理人才库表格、审核历史合同、调用创作素材,使用户无需手动搬运信息 [7][8] - 通过实际案例验证能力:能独立联网调研20款Micro-SaaS产品,自动检索其盈利模式、流量来源等信息,并将结果填回本地表格 [9][10][11][12] - 执行复杂任务时采用分组搜索的“串并联混合”方式,平衡速度与并发 [15] - 能基于调研数据自动生成图文并茂的深度调研报告,并调用专家模块生成完整的PPT文档 [12][20][22][28] - **Expert Agents:注入私有知识,成为垂直领域专家** - 专注于让AI适应具体任务场景,解决通用模型在处理高度专业化任务时的不足 [24][25] - 用户可将私有知识库(如SEO玩法、量化交易策略)注入Agent,使其产出符合特定标准的高质量结果 [26] Agent作为“长期合伙人”的三大核心能力 - **记忆的连续性**:理想的Agent应像老练的同事,能逐渐理解并记住用户的工作偏好与习惯,而非每次对话都重新开始 [31][32] - **对隐性经验的消化能力**:Agent需能将行业标准与团队内部操作流程内化为本能,直接交付符合团队标准的专业成果 [33][34] - **对业务环境的敏锐嗅觉**:Agent应连通业务系统,主动感知环境变化并实时响应,这是区分演示工具与实战工具的关键 [35] Agent在MiniMax内部的实际应用案例 - **全球商务组**:Agent能快速处理涉及20个不同国家潜在客户的名单,自动进行背景调查并生成20封定制化的破冰邮件 [36] - **设计组**:设计师可通过“Vibe Coding”直接指挥Agent修改代码,例如调整官网字体,无需等待前端排期 [37] - **产品经理**:Agent能像侦探一样介入调查用户投诉(如积分消耗异常),查明原因(用户上传37个超大文件)并主动拟定安抚方案与邮件草稿 [37] - **研发部门**:Agent能通读晦涩的运维手册,在系统报警时自动分析并给出建议;能像技术负责人一样自动拆解需求列表,接管基础代码的编写与测试 [38][39][40]
刚刚,MiniMax来承包你的桌面了
机器之心· 2026-01-20 19:24
行业趋势与竞争格局 - 2026年被预期为AI智能体(Agent)赛道新一轮爆发之年,行业竞争已进入白热化阶段[1] - 市场出现分化,主要参与者专注于两大方向:提升工作效率与重塑日常生活体验[1] - 国外如Anthropic发布Cowork,国内如千问APP上线“任务助理”,表明国内外厂商均在积极布局[1] MiniMax Agent 2.0产品核心升级 - 公司于2026年1月20日发布第二代智能体产品MiniMax Agent 2.0,将其定位为“AI原生工作台”,在产品形态和能力上进行了深度重构[2] - 产品核心目标是从“靠谱的AI伙伴”升级为能自主执行复杂任务的“进阶型智能协作伙伴”,在自动化执行的广度、深度和专业度上全方位加强[2][5] - 产品升级建立在三大核心支柱之上:桌面端应用、垂直领域专家智能体(Expert Agents)以及用户自定义专家智能体的能力[2][3][5] 核心支柱一:桌面端应用(MiniMax Agent Desktop) - 桌面端应用让智能体跳出浏览器,能够直接操作本地文件和环境,并启动网页自动化任务,实现了本地与云端工作的无缝连接[2] - 该应用已上线Windows和Mac双版本,通过一个全局视角渗透到各职能角色的核心工作流中,旨在将人类从重复性劳动中解放出来[2][3] - 其核心设计是深度打通本地文件,用户指定工作目录后,AI可读取、分析并批量处理该目录下的所有文件,体现了“AI原生工作台”的思路[7][9] 核心支柱二:垂直领域专家智能体(Expert Agents) - Expert Agents旨在打造垂直领域的顶级专家分身,通过封装私有知识和行业独家标准操作流程(SOP)来武装用户[3] - 相比1.0时代依赖的、只能提供70分通用专家组合的多专家系统,Expert Agents可将专家水平提升至95分甚至100分,可靠性有质的飞跃[3] - 官方提供大量开箱即用的Expert Agents以降低操作门槛,用户可在桌面和网页双端限时免费体验该功能[3][4] 核心支柱三:用户自定义专家智能体 - 用户可通过提供更多上下文信息和更自由的自定义设置,创建更懂用户、提供个性化服务的专家智能体[5] - 创建过程简单直观,用户可将行业经验、部门SOP或复杂业务逻辑转化为可重复调用的模块[24][28] - 在面对复合任务时,用户可指挥一支由特定领域专家组成的数字团队进行协作,实现了从“单点能力”向“专家协作”的转变[26][28] 产品实测与功能展示 - 在“刷选题”任务测试中,智能体在2分多钟内成功编写脚本并完成可行性测试,还能提供后续实现定时任务的教程[11] - 在复杂的“读论文并制作技术图谱”任务中,智能体耗时约6分钟,完成了下载文档、分析解读、技术追溯并最终生成和部署展示网页的全流程[12][13][14][15][17] - 在“从多个文档中提取技术博客并制作PPT”的繁琐任务中,智能体耗时23分钟,完成了格式转换、内容读取、链接访问、内容总结及PPT生成等一系列操作[17][18][19] - 智能体能够处理本地环境任务,例如根据用户指令,自动调用本地已安装的ffmpeg工具,对文件夹中的多个视频进行不同倍率的加速处理[22][23] - 多智能体协作功能允许用户启用多个配置好的专家子代理,围绕一个主题进行多视角的深度讨论,由主智能体担任主持人进行调度[26] 战略定位与底层能力支撑 - MiniMax Agent 2.0的战略是重新定义AI能力边界,其重点不在于展示“想得有多聪明”,而在于证明“能把事做到哪一步”,核心是以任务完成率为中心的设计[29][30] - 产品定义的“AI原生工作台”意味着交互逻辑从“人要被动适应Agent”变为“Agent主动适应人”,智能体主动进入工作环境并持续推进任务[30][31][33] - 产品能力背后是公司在模型层面的持续升级:2025年6月的Lightning Attention技术将长序列计算成本从二次方降为线性;10月发布的M2模型定位为Agent & Code Native,采用交错思维和MoE架构,总参数达2300亿,激活参数100亿,其API价格仅为Claude Sonnet 4.5的8%;12月的M2.1模型则深入后端语言,具备全栈工程能力[32] - 公司内部已形成快速自我强化的迭代闭环:模型能力首先被用于内部研发与办公核心流程,据悉过去数周内公司内部接近100%的员工开始使用Agent,高频的真实业务使用反馈又驱动下一轮模型和系统升级[32]