Manus

搜索文档
模型与「壳」的价值同时被低估?真格基金戴雨森 2025 AI 中场万字复盘
Founder Park· 2025-08-02 09:09
以下文章来源于真格基金 ,作者与你同在的 真格基金 . 专注早期投资,欢迎投递商业计划书至 dream@zhenfund.com 这是一期 真格基金管理合伙人戴雨森的访谈实录,也是2025年中,对于整个 AI 行业的一次半年 度复盘。 戴雨森从投资人的视角出发,围绕近期的AI 热点分享了很多有价值的看法,包括:OpenAI 的通用 大语言模型首次达到了 IMO 国际数学奥林匹克金牌水准意味着什么、 ChatGPT Agent 的发布 、 RL研究的进展、AI 应用和 「套壳」的价值都 被低估了、基础模型未来演进的方向等等。 戴雨森认为,2025 年,属于各行各业的「李世石时刻」,可能才刚刚开始。 超 10000 人的「AI 产品市集」社群!每天推荐一款 AI 应用。 邀请从业者、开发人员和创业者,飞书扫码加群: 进群后,你有机会得到: 01 OpenAI 拿下 IMO 金牌, 又一个李世石时刻 Q:最近有哪几件重要的事值得展开聊聊? 戴雨森: 确实过去这个周末发生了很多事情。我觉得最重要的一件是 OpenAI 的一个新模型,在 IMO (国际数学奥林匹克)2025 年的题目上获得了金牌级别的成绩。具体来说是六 ...
2025WAIC后,谁能把Agent做成现金牛?
36氪· 2025-07-30 12:37
Agent行业现状 - 2025世界人工智能大会参展Agent平台约50家,其中仅20余家宣称已实现盈利,占比不到一半 [1] - 非盈利Agent平台主要集中于企业服务、工业智能、金融科技、智能硬件及个人效率工具领域 [1] - 具身智能仍处概念阶段,Agent成为行业焦点 [2] Agent技术演进 - 大模型发展至2025年,单轮对话局限性凸显,复杂任务处理需求推动Agent技术发展 [2] - 上下文技术增强及MCP协议出现推动Agent架构成熟 [2] - 典型应用包括Cursor(自动写代码)、Manus(项目管理)等工具 [2] 资本市场动态 - 2025年初Agent领域融资活跃:Cursor融资9亿美元,Manus获7500万美元,OpenAI以30亿美元收购Windsurf [3] - 资本涌入加速概念验证向实际产品转化 [3] 商业模式分析 - 盈利Agent需满足年合同额(ACV)≥50万元且毛利率≥60% [5] - 典型成本结构:7×24小时产线巡检Agent年运营成本超100万元(云服务20万+人力80万) [6] - 医疗合规Agent合规成本占项目30%,金融风控Agent月均算力成本15万元 [7] 成功案例特征 - 黑湖小工单客单价1万元/年,覆盖2.5万家工厂,毛利率65%-70% [8] - 智能座舱Agent单笔合同额数百万,工业检测Agent采用按量收费模式 [8] - 盈利关键:大额合同、系统深度集成、高毛利率 [8] 收费模式创新 - 系统级绑定:智能座舱Agent按车辆抽成300-500元/台,年规模可达十亿级 [9][10] - 效果分成:银行反欺诈Agent按拦截坏账比例分成 [10] - 资源单元销售:容犀Agent按并发坐席数收费(500-2000元/月/坐席) [11][12] 行业壁垒 - 医疗行业需通过等保三级认证,合规成本占比高 [15][16] - 金融行业需接入风控中台并满足监管审计要求 [17][18] - 汽车行业需实现车规级7×24稳定运行 [19] - 核心壁垒:业务流程嵌入能力、合规资质、系统对接能力 [20] 未来发展趋势 - 当前Agent处于定制化阶段,类似90年代信息化建设 [21] - 可能终局: - 底层垄断:云厂商+芯片商主导基础设施 [22] - 超级聚合商:整合碎片化Agent形成完整服务链 [23][24] - 潜在赢家:SaaS厂商、系统集成商、行业平台公司 [25]
技术狂飙下的 AI Assistant,离真正的 Jarvis 还有几层窗户纸?
机器之心· 2025-07-30 09:30
01 通用 Agent 架构受限,任务智能还停留在「样板房」? - 当前 AI Assistant 的核心挑战集中在智能规划与调用、系统延迟与协同、交互记忆与拟人性以及商业模式与落地路径四个维度 [2] - 在任务执行智能方面,一条核心路线是构建长程、循环、可泛化的通用任务框架,实现从目标理解到任务完成的全过程 [2] - 通用框架的代表 Manus 采用「多步任务规划 + 工具链组合」架构,将 LLM 用作「控制中心」,但在实际测试中对复杂网页结构的抓取覆盖不足 [4] - MetaGPT 强调通用框架需叠加「代码执行、记忆管理与系统调用」等组件,但存在延迟高、调用链复杂、成本不可控等问题 [4] - 「逐场景做透」的技术路线更强调低门槛部署与稳定性,适用于「弱通用、强完成」的应用需求,但在非结构化任务或领域迁移时表现明显下降 [4] - Browser-Use 类路径支持 Agent 模拟浏览器登录、填写表单、抓取信息、提交交易等功能,但稳定性、安全性与权限系统仍未成熟 [6] - 无代码出工具(No‑Code Agent Builder)正成为下一代 AI Assistant 的推荐解决方案,如 AutoGen Studio、Base44 和 StackAI 等 [6][7] 02 一句话唤醒万物,AI Assistant 要补齐的系统短板有哪些? - AI Assistant 最终要以语音为主要形态和用户进行交互,系统优化层面面临语音交互低延迟、全双工语音、能力与硬件/系统行动绑定等挑战 [8]
40% AI Agent将被淘汰,投资人都在投什么?
创业邦· 2025-07-28 17:00
AI智能体赛道现状与竞争格局 - 行业热议焦点转向场景化落地能力,各公司拉上客户站台展示实际应用[2] - Manus退出中国市场引发对通用型Agent前景的讨论,朱啸虎预测大模型将吃掉90%的Agent[2] - 创业公司做通用Agent难度较大,大厂如阿里兼具模型和流量优势[3][10] Agent定义与发展趋势 - Agent被定义为能全链条、全自动解决长线程问题并通过语义对话修正的数字员工[7] - 未来大部分AI应用可能Agent化,包括个人和企业级应用[8] - 垂直类AI SaaS在法律、医疗等领域已显现明显进展,编程领域自动化工具逐步实现更多功能[10] 投资人青睐的项目特点 - 扎根垂直行业、深度了解行业生态和隐性规则的项目更受青睐[11] - 核心壁垒在于行业数据飞轮效应,依赖客户数据沉淀和产品迭代[13] - 看重团队兼顾国内外市场能力,出海能力对AI应用类项目尤为关键[14] 行业案例与失败教训 - Manus曾估值5亿美元,但核心技术依赖第三方模型,被讽刺为"AI套壳智能体"[17] - 澜码科技因融资断裂导致运营困难,寻求并购机会[18] - 阶跃星辰聚焦智能终端Agent,覆盖一半头部国产手机厂商,与吉利合作推出AI智能座舱[19] 垂直领域应用案例 - 阶跃星辰拓展金融财经、内容创作、零售等领域,与上海电信合作数字电话亭[21] - 月之暗面展出Kimi2模型,主打代码能力和Agentic任务处理[21] - 百望股份与沐曦科技联合发布跨境贸易合规智能体,瞄准"一带一路"需求[21] 行业竞争趋势 - 竞争从技术参数比拼转向场景化落地能力较量[22] - 解决具体行业痛点、实现商业闭环的项目更受青睐[22] - 消费电子、汽车、金融、制造等领域成为主要战场[19][21][22]
Agent爆火,华人赢麻了
36氪· 2025-07-24 18:36
华人AI Agent创业热潮 - 2025年以华人为主角的AI Agent创业热潮席卷全球,Manus和Genspark成为代表性产品[3][7][8] - Genspark在45天内实现3600万美元年度经常性收入(ARR),10周上线8个产品[4][5] - Manus发布当月MAU达2300万,获Benchmark领投7500万美元融资,投后估值超5亿美元[9][10] 代表性公司及产品表现 - MainFunc的Genspark浏览器通用Agent发布45天ARR达3600万美元[5][24] - Monica团队的Manus通用Agent发布当月MAU达2300万[9] - Flowith的Neo无投放ARR达130万美元,6月Web访问量101万[15] - 360的纳米AI超级搜索智能体6月Web访问量达1.57亿[15] - 阿里夸克AI 6月Web访问量超8400万[15] 技术驱动因素 - Claude 3.7 Sonnet混合推理模型提升编程和开发性能[16] - MCP(模型上下文协议)实现AI自由调用外部工具[16] - Agent产品形态从简单聊天演进为能自主规划任务并交付结果的智能体[12] 行业趋势与挑战 - 通用Agent增长红利消退:Manus月访问量从3月2376万次降至6月1730万次,Genspark从4月888万次降至6月769次[19] - 地缘政治影响:Manus退出中国市场可能与美国财政部监察有关[20][21] - 大厂在通用Agent领域进展缓慢,初创公司凭借灵活高效占据优势[26][27][29] 产品发展策略 - 快速响应技术:Manus团队3个月完成产品开发,Lovart团队2个月完成研发[30][31] - 专注用户体验:Manus4次重构智能体框架提升运行速度[32] - 垂类Agent成为新方向:LiblibAI发布设计Agent Lovart,蔡浩宇推出AI游戏《Whispers from the Star》[37][39] 商业化表现 - Genspark仅用9天实现1000万美元ARR,远超AI Coding企业Cursor的21个月[25] - 垂类Agent表现突出:Lovart发布5天注册用户超10万,ListenHub首发当天DAU 5000+[39] - OpenAI的Agent"Deep Research"促使20%用户升级至200美元/月的Pro会员[36]
「Manus+景鲲」领衔主演,华人AI Agent全球狂欢
36氪· 2025-07-24 18:07
行业动态 - 2025年全球科技圈聚焦华人AI Agent,Genspark和Manus成为代表性产品[1][3][4] - Agent行业在2025年迎来"文艺复兴",技术跃升推动产品形态成熟,用户规模和收入显著增长[6][7] - Claude 3.7 Sonnet模型和MCP协议发布,为Agent生态发展提供关键技术支撑[9] - 垂直领域Agent开始崛起,LiblibAI、米哈游等公司在多模态、游戏等细分市场布局[29][31] 公司表现 - MainFunc旗下Genspark实现45天3600万美元ARR,10周上线8个产品的爆发式增长[1] - Monica团队开发的Manus发布当月MAU达2300万,获Benchmark领投7500万美元融资,投后估值超5亿美元[4] - 阿里夸克AI月访问量超8400万,高考志愿报告Agent累计生成1000万份报告[8] - 360纳米AI超级搜索智能体月访问量达1.57亿,美图RoboNeo登顶国内App Store分类榜[8] 产品特征 - 新一代Agent具备自主规划任务、调用外部工具的能力,突破传统聊天机器人局限[6] - Manus定义了显示思维链对话框+任务执行可视化面板的产品范式,被多家公司模仿[10][12] - 通用Agent面临PMF验证问题,Manus和Genspark月访问量分别从2376万/888万下滑至1730万/769万[13] - 垂直领域Agent在图像设计、视频编辑、编程等场景取得突破性进展[31] 市场趋势 - Agent实现高营收速度惊人,Genspark仅用9天达到1000万美元ARR,远超Cursor的21个月[17] - 初创公司在通用Agent领域表现激进,大厂受制于组织惯性和政策限制进展缓慢[18][22] - 地缘政治影响显现,Manus裁撤中国团队转向新加坡市场,面临海外融资压力[14][15] - 行业共识认为未来通用Agent将由模型厂商主导,创业公司需转向垂直领域发展[28][29] 技术发展 - 第三方模型性能提升和低代码工具降低开发门槛,推动Agent产品快速迭代[6][23] - Monica团队4次重构智能体框架,优化运行速度和可扩展性[25] - 产品开发周期大幅缩短,Manus和Lovart分别仅用3个月和2个月完成开发[24][25]
悄悄大撤退,Manus带走了哪些秘密?
钛媒体APP· 2025-07-22 08:47
公司发展历程 - Manus由中国团队打造,2023年3月上线,一度被热捧为"下一个DeepSeek",主打能直接执行任务的智能体功能 [1] - 内测邀请码被炒作至10万元一个,市场热度极高,被称为"国运级产品" [1] - 2024年4月母公司蝴蝶效应完成7500万美元B轮融资,估值达5亿美元 [6] - 2024年7月突然清空国内社交媒体、关闭官网、解散中国团队,创始人肖弘携核心成员迁至新加坡 [1][6] 市场表现与用户反馈 - 月访问量在3月达到峰值2376万人次,5月回落至1616万,6月小幅回升至1730万 [10] - 用户体验与宣传差距较大,出现"推荐南极用火锅优惠券"等低级错误 [12] - 产品介绍和资料几乎全为英文,国外市场反响平淡,未在主流科技媒体引发关注 [4] 商业模式与技术架构 - 依赖外部大模型API拼接,无自研底层技术,被业界质疑为"极致套壳玩家" [12] - 联合创始人公开宣称"极致的套壳就是胜利",缺乏核心技术护城河 [13] - 处理复杂任务需调用多API,导致服务器容量不足和天价运营成本 [13] 资本运作与监管环境 - B轮融资由美国风投Benchmark领投,资金用途明确指向美、日、中东市场 [8] - 美国监管机构紧盯B轮融资,推测迁往新加坡是为规避资本管制和芯片限制 [9] - 英伟达获准向中国销售H20芯片后,芯片受限的出走理由存疑 [10] 行业对比与全球化路径 - 与华为、TikTok、DeepSeek等公司不同,Manus选择迁出本土应对压力 [18] - 创始人称希望证明"中国出生的创始人能在新环境做好全球化产品" [14] - 行业案例显示全球化并非必须迁出本土(如TikTok、Temu) [15][18] 团队背景与营销策略 - 创始人肖弘毕业于华中科技大学,此前创立AI浏览器插件Monica并专注海外市场 [3] - 营销采用"限量邀请码+煽动性话术+关键词绑定"组合拳,制造稀缺感和话题性 [5] - 被质疑为"出口转内销"营销,通过特定博主造势而非真实产品力 [4]
Manus“跑路”风波背后,AI Agent的商业化困局
36氪· 2025-07-22 07:20
Manus公司的崛起与困境 - 2025年3月凭借"智能体自主完成任务"演示视频迅速走红,一周内吸引200万用户预约,内测码被炒至10万[1] - 硅谷风投Benchmark领投7500万美元,公司估值飙升至5亿美元[3] - 实际产品依赖OpenAI的GPT-4和Anthropic的Claude等第三方API拼接,执行复杂任务时频繁卡壳[4] - 定价19-199美元/月但实测效果差,电商比价漏数据、金融建模偏差超15%、视频生成出现畸形生物[6][7] 通用AI Agent行业现状 - 行业预测到2027年约40%项目因成本失控或商业模式不清晰被淘汰[3][9] - 同质化严重,本质是调用大模型API加定制前端界面,护城河稀薄[11] - 麦当劳与IBM合作开发的AI Agent因餐厅环境频繁出错被弃用[12] - 采用免费获客模式但服务成本高,融资断裂导致现金流危机[14] 成功企业的突围策略 - GenSpark聚焦办公自动化等垂直场景,上线45天实现3600万美元年收入,金融报告撰写时间从3天缩短至8小时[20] - Salesforce的Agentforce提供可解释AI决策和按需付费模式,年化收入达10亿美元[24] - 医疗Agent PathChat通过数据积累将肿瘤识别准确率从78.1%提升至89.5%[27] - 成功企业共同点:深度绑定业务流程、量化ROI、构建数据闭环生态[18][22][25] 行业发展趋势 - 通用Agent陷入"泛而不精"困境,缺乏统一底层架构设计[15] - 垂直领域专业型Agent通过场景化解决方案建立壁垒[20][27] - 生态化发展成为护城河,如Salesforce允许第三方开发行业应用[27] - 技术需聚焦实际场景创造可量化价值才能持续发展[28]
季逸超亲述 Manus 构建之谜,一文读懂 AI 智能体的上下文工程
AI科技大本营· 2025-07-21 18:08
上下文工程的核心观点 - Manus团队选择基于上下文工程而非端到端训练构建AI Agent,将产品迭代周期从数周缩短至几小时,保持与底层模型发展的正交性[2][3] - 上下文工程是实验科学,团队通过四次重构Agent框架总结出"随机研究生下降"方法论,即通过手动调试提示词和经验猜测寻找局部最优解[3] - KV缓存命中率是生产级AI Agent最关键指标,直接影响延迟和成本,优化后可使Claude Sonnet模型输入token成本从3美元/百万降至0.3美元/百万[5][8] KV缓存优化策略 - 保持提示词前缀稳定性,避免在系统提示开头插入时间戳等可变元素导致后续缓存失效[13] - 采用只增不减的上下文管理策略,确保序列化过程确定性,避免JSON键顺序变化破坏缓存[13] - 明确标记缓存断点,在系统提示后设置断点以适配不支持自动增量缓存的推理框架[13] 操作空间管理 - 避免动态增删工具定义,工具变更会导致后续所有动作和观察结果的KV缓存失效[12] - 采用感知上下文的状态机进行logits掩码,而非直接移除工具,防止模型产生格式错误输出[15] - 设计统一工具名前缀(如browser_/shell_),便于在特定状态下强制选择某类工具[18] 外部上下文设计 - 将文件系统作为无限容量的外部记忆,训练模型按需读写文件实现结构化存储[23] - 采用可恢复的压缩策略,保留URL或文件路径等关键信息而非永久删除内容[26] - 状态空间模型若掌握基于文件的记忆能力,可能催生新型高效Agent架构[26] 注意力与错误管理 - 通过复述机制(如todo.md文件)将核心目标持续写入上下文末端,防止50次工具调用链中的目标漂移[27][31] - 保留失败尝试和错误信息在上下文中,使模型能隐式更新内部认知降低重复错误概率[35] - 错误恢复能力是衡量Agent智能的关键指标,但被多数基准测试低估[35] 少样本提示优化 - 少样本提示可能导致行为定式,如在简历审查任务中机械重复相似操作[36] - 通过引入序列化模板变体、调整措辞等增加多样性打破思维定式[37] - 上下文同质化会加剧Agent脆弱性,需保持受控随机性激活模型注意力[38]
一个任务50次调用,成本狂砍90%?Manus首次公开上下文工程秘诀,一堆反复重写换来的教训
AI前线· 2025-07-21 15:04
核心观点 - 公司选择押注于上下文工程而非端到端训练模型 使产品迭代周期从几周缩短至几小时 并与底层模型进步保持正交关系 [1][2] - 上下文工程是实验科学 已四次重建Agent框架 通过"随机梯度下降"方法实现局部最优解 [2] - KV缓存命中率是生产阶段AI Agent最重要的单一指标 直接影响延迟和成本 缓存与非缓存token成本相差10倍 [4][5] - 文件系统被视为最终上下文 解决长上下文窗口痛点 实现无限大小、持久化存储和结构化外部记忆 [18][21] - 通过"背诵"机制操纵模型注意力 典型任务需50次工具调用 持续更新待办事项列表保持目标聚焦 [26][30] - 保留错误回合是改进Agent行为的有效方法 错误恢复是真正Agent行为的清晰指标 [32][35] - 少样本提示在Agent系统中可能适得其反 需增加多样性打破行为模式 [36][37] KV缓存设计 - 平均输入输出token比例达100:1 缓存显著降低生成第一个token时间和推理成本 [4][5] - 提高KV缓存命中率三原则:保持提示前缀稳定、上下文只追加内容、明确标记缓存断点 [8][9] - 时间戳等动态元素会破坏缓存 序列化稳定性是关键 某些框架需手动插入缓存断点 [9] 工具管理策略 - 工具数量激增导致模型选择低效 应避免迭代中动态添加/移除工具 [11] - 采用上下文感知状态机管理工具可用性 通过屏蔽token对数而非修改定义来约束动作选择 [11] - 工具定义位于上下文前端 变更会导致后续KV缓存失效 可能引发模式违规或幻觉动作 [14] - 设计一致前缀的动作名称(如browser_/shell_) 实现无状态对数处理器的工具组选择 [15] 文件系统应用 - 128K token上下文窗口在现实场景仍不足 存在观察数据过大、性能下降和成本高三大痛点 [18][20] - 压缩策略需保持可恢复性 如保留URL可恢复网页内容 文档路径可恢复文档内容 [24] - 文件系统操作实现结构化外部记忆 可能为状态空间模型(SSM)解锁新Agent类型 [24] 注意力管理 - 创建并持续更新todo.md文件是故意设计的注意力操纵机制 [26][27] - 通过重写待办事项将全局计划推入模型近期注意力范围 避免50次工具调用中的目标偏离 [30] 错误处理机制 - 保留错误回合使模型能隐式更新内部信念 减少重复错误概率 [35] - 错误恢复能力是真实Agent行为的指标 但被学术基准低估 [35] 少样本提示优化 - 语言模型会模仿上下文中行为模式 重复动作可能导致漂移和幻觉 [36] - 引入结构化变化(序列化模板/措辞/格式噪声)打破模式 增加多样性提升鲁棒性 [37][38]