Workflow
Founder Park
icon
搜索文档
万字拆解:Manus 的 PMF 到底是什么,以及谁在为它一直买单?
Founder Park· 2026-01-30 11:33
文章核心观点 - 文章通过对AI产品Manus用户行为的深度分析,指出当前AI应用指标(如收入、用户数)的“疯涨”已难以反映真实情况,并探讨了AI生产力工具赛道的核心竞争约束[6][7] - 分析认为,Manus的成功在于其精准找到了产品市场契合点,即承接“不做不行,自己做太累,雇人又觉得不划算”的任务,成为一种新的数字劳动形态[16] - 文章提出,与移动互联网时代争夺“用户时间”不同,这一代AI真正争夺的是“人类可被外包的经济效用总量”,即现实世界中由人完成的任务结构及其经济价值[65] - 文章推断,AI的终局形态可能不是单一的超级智能体,而是一套分布在**不同任务层级上的智能系统网络**,并分化出垂直Agent、AI+人类服务、Copilot等不同产品形态[68][70] Manus的使用场景和产品价值 - 用户真实使用行为高度集中在几类具体任务结构中:Office三件套(Word、PPT、Excel)、网站/App/工作流搭建[14] - 用户付费动机集中在四种产品价值上:**认知代工**(用户不想亲自做)、**能力解锁**(用户原本不会做)、**替代人力/降本**(比雇人便宜)、**执行托管**(用户不愿参与繁琐执行)[18] - Manus最稳固的价值在于处理目标清晰、路径可预期、执行冗长琐碎、人类不愿持续介入的真实劳动[67] 关键对比:ChatGPT与Manus的差异 - **调研与信息整理**:ChatGPT等研究型工具停留在“给建议、找资料”的辅助层面,而Manus在用户感知中更接近“可以外包出去的执行型研究系统”,能交付可直接使用的成果物[19] - **文件处理**:ChatGPT能力被用户视为“窗口内的文本生成与理解”,而Manus已进入“文件级操作与跨格式工作流”层级,能直接从PDF或JPG中理解信息并生成Excel、PPT等多种格式文件[21][22] - **任务托管**:ChatGPT需要用户实时在场监督和频繁介入,而Manus可在用户离线情况下持续执行完整流程[25] - **系统权限**:Manus可以通过SSH连接真实服务器,并在获得PAT后向Github提交代码、配置云服务,而GPT-5即便具备代理能力也无法进入真实系统权限环境[27] - 综合来看,ChatGPT在用户眼中更像一个**认知层产品**,擅长对话、思考与规划;而Manus已进入**执行层**,承担真实工作流中的生产角色[29] Manus的核心用户画像 - **将Manus视为“比雇人便宜”的执行资源**:这类用户会直接对比Manus与初级员工、外包服务的成本。例如,有用户提到雇佣自由职业者制作写作指南需250美元,而Manus完成仅需12美元,相当于打了90%的折扣[30][33] - **用Manus跑固定工作流**:用户使用Manus解决跨步骤、跨系统、可重复执行的流程性任务,关注其能否作为稳定执行节点嵌入现有工作流,减少人工操作[34] - **原本不会写代码,但用Manus做出了东西**:这类用户不具备专业编程能力,但通过Manus推进了网站建设、游戏开发等项目,体验了跨越技术门槛的突破感[37][40][41] - **积分消耗大,将过程视为“上课”**:这类用户对失败和成本有高耐受性,愿意通过大量试错学习。例如,一位HR专业人士在过程中消耗了近10,000 credits,并将其视为在线学费[42][43] 对Manus的进一步发现 - **AI工具形成分工体系**:用户并未从ChatGPT迁移至Manus,而是形成分工——ChatGPT用于高不确定性、强交互的思考阶段;Manus用于目标明确、执行琐碎、用户不愿介入的阶段。用户会先用ChatGPT打磨提示词,再将确定任务交给Manus以节省积分[45][46] - **存在积分消耗无上限的狂热用户**:部分用户会在单个项目中持续投入数万甚至数十万credits。有用户表示在6个月的项目中花费了近300K credits,认为用不到3000美元获得价值百万美元的代码是超值的[49][50] - **为自由职业者与小企业主提供“低配组织形态”**:Manus让个体在不雇人的情况下,拥有接近一个小团队的执行能力,完成商业闭环[52][53] - **覆盖“商业杂活”的长尾市场**:Manus高频处理的是输入输出明确、逻辑不复杂、但不可或缺的零散任务(如报税、填表、自动化Excel),让知识工作者外包执行性任务,释放注意力用于核心判断与决策[56][57] - **用户的积分焦虑本质是“执行不确定性”的定价问题**:Agent按过程(token/credits)计费,但价值在于交付结果,这种成本与结果的解耦导致用户因无法预估成本上限而产生焦虑,抑制其交付更复杂任务[59][60] 从Manus看AI时代的竞争与机会 - **AI竞争的“稳态约束”是经济效用**:与移动互联网争夺“用户时间”不同,AI争夺的是“人类可被外包的经济效用总量”,即有多少真实工作及其经济价值人类愿意授权给AI执行[65] - **AI产品争夺三种份额**:任务份额(share of tasks)、决策份额(share of decisions)、产出份额(share of outputs)[66] - **Manus并非终局,剩余机会在于分化**:未来AI产品可能分化为三类:深度嵌入垂直领域的**专业型Agent**;由人类承担责任兜底的**AI+人类服务**;嵌入人类工作过程的**协作型Copilot**[68] - **决定AI天花板的关键**:在于能否进入更高价值、更高责任、更高决策密度的任务结构[69]
Clawdbot开发者:未来一大批应用都会消失,提示词就是新的interface
Founder Park· 2026-01-29 20:41
项目概况与市场热度 - Clawdbot(后改名为Maltbot)是当前最热门的AI项目,在X平台一夜成名,在谷歌上的搜索量超过了Claude Code和Codex [2] - 该项目在Github上的标星增长趋势几乎是直线上升,目前已达到98K [3] 创始人背景与项目起源 - 项目创始人Peter Steinberger是iOS生态系统最早的开发者之一,开发经验可追溯到iOS 2.0时代,在开源社区贡献了大量项目 [5] - Steinberger于2011年创立了PSPDFKit,用13年时间将其从开发者工具发展为B2B软件巨头,并以超过1亿欧元的价格出售,实现了财富自由 [5] - 在“退休”三年后,Steinberger于2023年5月萌生了开发个人智能体的想法,但当时认为大公司会很快推出类似产品,因此等待至11月,发现市场仍无理想解决方案后决定自己开发 [6][7][13] - 项目起点源于创始人自身痛点:在使用Codex执行长时间任务时,需要不断手动输入“continue”来维持,因此希望有一个AI能代为照看其他智能体 [14] 产品理念与开发哲学 - 开发核心信条是“玩得开心”,认为学习新技术的最佳方式是去玩和折腾,创始人将其称为“agentic engineering” [10] - 项目从解决自身需求出发,仅用一小时就完成了与WhatsApp集成的基础原型,通过组合现有开源工具和编写“胶水”代码快速实现功能 [15] - 产品提供了一种全新的交互方式,技术细节被隐藏,用户感觉像是在与一个“朋友”或“幽灵”交谈 [20] - 强调“直接与AI交谈”(Just Talk To It)的开发范式,认为开发者不应被复杂的提示词工程或工作流框架限制,而应培养与AI协作的直觉 [42][48] 技术架构与设计选择 - 坚持“CLI First,Not GUI”的设计理念,认为图形用户界面(GUI)扩展性不强,而命令行(CLI)才是真正具备扩展能力的方式,智能体天生就懂Unix系统 [11][24] - 认为大多数模型上下文协议(MCP)都应该被做成命令行工具(CLI),因为CLI可调用、可组合,且能避免在上下文中持续占用token产生成本 [11][27][28] - 项目设计为插件化,允许用户专注于开发自己的小模块,而无需改动核心,像一个AI黑客的天堂 [22] - 项目支持用户轻松切换使用所有主流模型,包括竞争对手的模型以及本地模型,将其视为一个游乐场和绝佳的学习方式 [22] 市场趋势与行业展望 - 创始人认为2023年是“编程智能体”之年,而2024年将是“个人助理”之年,Clawdbot的出现唤醒了人们对个人智能体的真实需求 [11][21] - 预测未来一大批应用将会消失,因为用户与事物的交互方式将彻底改变,大多数应用会被简化为API,提示词将成为新的界面 [11][31] - 用户将不再需要订阅提供通用功能的初创公司服务,而是拥有能精确解决自身问题的超个性化软件,且成本更低 [11][32] - 非技术人员也能通过自然语言与智能体交流并构建所需工具,这代表了软件开发方式的巨大转变 [32] 模型性能与使用偏好 - 在模型能力上,认为Anthropic的Opus模型遥遥领先,是最好的模型,其“性格”在Discord等场景中表现更接近人类 [33] - 在编程方面,更偏好使用OpenAI的Codex,因为它能驾驭大型代码库,只需给出提示就有95%的把握能将代码直接推送至主分支并正常工作 [33] - 为运行本地模型,使用了顶配的Mac Studio(512GB内存),并认为未来运行硬件的“黑客文化”模式需要改变,本地运行可以绕过一些企业服务繁琐的审批流程 [35] 项目现状与未来计划 - 项目爆火后,Discord服务器以创始人无法处理的速度增长,不得不借助AI来回答常见问题 [21] - 由于项目流量巨大,应Anthropic要求将项目名从Clawdbot改为Maltbot,改名过程充满挑战 [34] - 目前面临的主要挑战是安全威胁模型的变化,因为项目从个人一对一使用场景被用在了不被信任的公共环境中 [38] - 创始人正在组建团队,并考虑将项目发展成一个社区、基金会或非营利组织,而非传统公司,以确保其比个人更长久 [40][41]
BAI、高瓴领投,ThetaWave李文轩:我们想成为下一代年轻人默认的知识获取入口
Founder Park· 2026-01-28 16:04
公司融资与运营现状 - 近期完成数百万美金Pre-A轮融资,投资方包括BAI Capital、高瓴创投、MBA Fund,老股东奇绩创坛跟投 [2] - 在2025年下半年突破一百万美元年度经常性收入,目前现金流收入已能覆盖公司开支 [3] - 用户留存数据表现强劲,次月留存率在80%以上,三月留存率在65%以上 [3] 创始人背景与创业历程 - 创始人李文轩大一辍学创业,ThetaWave AI是其第三款产品,公司主体未变但中间更换过方向 [4][8][10] - 高中时期曾与合伙人开发用于自闭症儿童的AI情绪监测手环,并在6个连锁福利院推广,被《人民日报》报道 [7] - 大学期间在朋友创业公司工作,大一暑假决定All in AI创业并拿到第一笔投资 [8] - 创业方向选择遵循“想做的”、“能做的”、“可做的”三圈交集原则,最终聚焦于AI驱动的个性化知识输入场景 [12][13][14] 产品定位与市场验证 - 产品定位为“AI-Native知识内容平台”,核心愿景是成为“每个人默认的获取知识的入口”和定义新一代内容平台的公司 [4][78] - 从微观个人需求(大学考试临时抱佛脚)和宏观市场调研(高价笔记交易)验证了需求,上线后两到三周内获得前十名付费用户 [15][16] - 核心用户画像是欧美大学教育体系中,对成绩有要求但不愿付出过多精力学习的主流大学生群体 [21] - 产品价值主张可概括为五个字:“考前急救包”,直击用户心智 [68] 产品功能与核心交互 - 核心交互流程是“拖入-整理-生成”:用户拖入文档,AI分析并结构化知识,生成知识图谱及各类学习资料(图文笔记、思维导图、题库、闪卡、播客、视频等) [30] - 提供实时课堂笔记纪要功能,AI根据课程上下文补全笔记,与文档拖入共同构成两个知识输入入口 [31] - 产品心智从早期的“知识管理/多学”转向“帮助用户快速搞定/少学”,强调让用户在更短时间内掌握知识 [33][34] - 坚持原则,未添加帮助用户作弊(如代写论文)的功能,并砍掉了数据表现不佳的游戏化学习功能 [35] 增长策略与用户数据 - 当前每天新增几千名注册用户,月活跃用户突破10万 [22] - 付费率稳定在5%到7%之间波动,活跃用户中约百分之四十多为免费用户,百分之六十多为付费用户 [22] - 最有效的获客渠道是TikTok和Instagram,通过“全球社媒营销UGC矩阵”运营,管理300多个矩阵账号,与大量KOC/KOL合作,每月以低成本获取上亿流量 [25][26] - 本地化策略关键在于内容适配当地审美,而非简单语言翻译,通过寻找当地KOL/KOC并套用爆款内容框架来实现 [27] 竞争分析与差异化优势 - 与NotebookLM等工具定位不同,ThetaWave AI专注于帮助用户理解知识并完成学习闭环,目标是成为新一代内容平台,而非单纯的研究或生成工具 [49][50] - 竞争优势在于工程化能力、内容矩阵运营能力以及团队对爆款内容的“taste”(网感) [52][53] - 公司是AI创业团队中最年轻的团队之一,兼具对AI产品的深刻理解与年轻化的网感,构成长期竞争优势 [54] - 产品本质是特定场景下模型能力的更好分发渠道,将使用门槛从70分降至10分,长期壁垒在于积累的个人上下文和模型缺乏的领域内容 [56] 技术架构与产品理念 - 产品与特定模型耦合度低,未绑定单一模型,综合考量成本、速度与毛利 [57] - 有意向用户隐藏模型选择能力,聚焦于解决问题本身而非底层技术 [58] - 强调图形化/结构化界面在知识获取场景的效率优势,通过富文本交互等获取更明确的用户意图数据 [43] - 用户与生成内容的交互数据(如编辑、修改)构成数据飞轮,用于持续优化生成结果,逼近用户意图 [44] - 已应用个性化学习路径,例如根据用户已做题目和错题情况动态生成后续练习题 [45] 商业模式与未来规划 - 短期目标是在2026年内将ARR提升至1000万美元,认为通过现有模式打透更多市场即可实现 [76] - 长期突破天花板的关键在于从效率工具升级为“个性化交互工具+个性化内容”的内容平台,目标达到上亿美元ARR体量 [76][77] - 计划伴随核心用户(大学生)成长,逐步拓展至职场、兴趣等终身学习场景,通过内容与人群泛化扩大用户群体 [29] - 未来可能探索新的软件或硬件载体,以更好地实现“动态知识”形态的呈现,但前提是产品定义必须击中真实需求 [60][61][79] 团队与文化 - 团队规模不到十人,主要由在各个领域有成果的00后组成 [69] - 组织架构遵循“AI First”原则,按结果而非职能划分职责,探索AI时代的新组织形态 [69] - 招聘看重对AGI时代的信念以及从第一性原理思考问题的能力 [70] - 倾向于招聘精通AI工具的通才,并让成员参与业务全流程,以适应未来“十人独角兽”甚至“一人独角兽”的趋势 [71] 行业认知与创业哲学 - 认为所有成功的C端产品都能够在10个字以内让用户理解其核心价值 [67] - 创业需要坚持“反人性的理性”,即基于理性推理做决策,不受感性信息或普遍质疑的影响 [74][75] - 看好AI在非娱乐专业内容领域的机会,认为该领域供给严重不足,体验提升空间巨大 [60] - 认为即使进入AGI时代,人类获取知识的需求依然存在,既是做出宏观判断的基础,也是寻找意义感的途径 [82][83]
Agent 真正的护城河,正在从工具转向记忆资产
Founder Park· 2026-01-27 17:36
文章核心观点 - 行业正从依赖长上下文和RAG技术转向构建独立的、工程化的AI记忆层,以解决AI Agent在长期一致性、跨任务协作和个性化体验方面的根本瓶颈 [5][21][23] - 独立的Memory层需具备分层管理、统一调度和治理能力,将记忆从模型附属功能升级为可迁移、可复用、可审计的系统级资产,这是AI基础设施发展的必然趋势 [20][21][33][48] - 模型厂商的内生记忆与第三方独立记忆基础设施将长期共存,分别对应强化入口锁定和实现记忆主权与可迁移性两种不同的产业逻辑 [34][37][41] AI记忆成为独立层的必要性 - 传统方法如增长模型上下文长度和RAG存在根本缺陷:长上下文导致推理成本飙升、噪声增加及模型性能折损;RAG则存在被动、割裂、更新慢(以周为单位)及无法支撑长期协作经验沉淀等问题 [12][13][15][16][17] - 行业面临三大硬约束:1) 注意力计算成本与性能要求记忆需被精确、可控地注入;2) 跨系统、跨端、多模型并用的工作流要求记忆可复用与迁移;3) 企业治理与合规要求记忆可修改、删除和审计 [20] - 独立的Memory层能将记忆作为一等系统资源进行统一调度与管理,使AI智能从“当下正确”升级为“长期一致、可积累、可演化”,是AI Agent乃至所有大模型的关键基础设施 [21][23] 工程化记忆系统的核心能力 - 需要解决存储与算力的成本效率平衡:存储需根据访问频率对海量数据进行动态分层(内存、磁盘、S3对象存储成本差异可达数十倍);算力需避免将记忆无差别塞回上下文,否则会显著推高推理时延、吞吐压力与显存占用 [26] - 必须对记忆进行差异化管理与分层:类似人类大脑,需将记忆分为不同类型并赋予不同权重进行统一调度,例如参数化记忆(低频通用知识)、激活记忆(短期工作状态)和明文记忆(可解释、可治理的外显信息) [27][29][30] - 核心是全局调度系统:负责统筹记忆的写入、存储、唤醒、更新与淘汰全流程,实现统一抽象、统一调度、统一治理,使记忆成为上层智能体与应用的共同依赖,并能适应多模态记忆资产的发展 [32][33] 模型厂商记忆与独立记忆层的路线差异 - 模型厂商(如OpenAI、Google、Anthropic)正将记忆内生进模型与入口,旨在打造更连贯、更个性化的产品体验闭环,但可能导致用户维护成本高(如ChatGPT和Claude月费向200美元迈进)、切换成本高(SOTA模型平均保质期仅35天)以及体验割裂化 [34][35][36] - 独立Memory层旨在将记忆打造为可治理、可迁移、可复用的资产,支持在不同模型与工作流之间保持连续性,其代表性产品如记忆张量的MemOS,以“操作系统”视角承载个人与组织记忆 [37][40] - 市场已出现“记忆共享”交互形态,例如MemOS-MindDock可将用户分散在多个AI助手(如ChatGPT、Gemini、DeepSeek、通义)的历史对话与偏好统一为个人记忆档案,强调“记忆跟人走/跟组织走”,体现了用户对记忆主权的要求 [40] 记忆作为资产层的行业影响与前景 - 专业工作场景(如编程、产品设计)和AI陪伴赛道(如硬件玩具芙崽)是记忆系统最先受益的领域,因其高度依赖上下文积累、版本演进与情感连接的长期记忆管理 [42][47] - 在组织协作中,记忆系统(如MemOS的MemCube概念)需支持多Agent、多部门场景下的记忆隔离、权限管控与可观测性,以减少协作摩擦,成为可协作的“AI同事” [41][48] - 记忆基础设施层的构建已成为创业热点,其核心价值在于:无论模型如何快速迭代、入口如何更换,长期价值都能沉淀在独立、可迁移、可治理的记忆系统之上 [46][48][49]
这可能是今年门槛最低的黑客松比赛,速来!
Founder Park· 2026-01-26 12:07
Skill概念的市场热度与生态发展 - 2026年初,Skill概念的热度持续攀升,并迅速超越Agent、MCP等概念,成为各家产品争相支持的功能[2] - 在过去的十几天里,Skill生态正在以数倍的速度持续扩张[2] - Skill主张将专家的工作标准作业程序打包成可复用的资源包,其特点是搭建不难、易于分享且能交付结果[3] - 创建Skill不需要编码或拖拽搭建工作流,只需有一套可复用的标准作业程序,门槛比Vibe Coding还低,旨在让人人都能成为创作者[3] 行业主要参与者的战略动向 - 扣子2.0率先跟进Skill功能,并快速推出「技能商店」[4] - Founder Park联合扣子举办了Skill招募大赛,旨在促进最佳标准作业程序实践的分享,让能力成为一种流动的交换资源[5] - 大赛的核心倡导是将可标准化的执行工作交给Skill,使人的能力和时间能聚焦于决策和创造[6] Skill招募大赛的赛题设置 - 大赛设置职场和极客两个赛道,参与者可选择单个或多个赛题进行Skill开发[6] - **职场赛道**征集能将日常工作方法论、专业领域知识、复杂性流程封装转化为可复用能力的实用性Skill,旨在助力职场人提效减负[7] - **工作效率提升方向**:针对述职汇报、会议协作、项目跟进等高频办公场景,将个人沉淀的标准作业程序转化为技能,例如自动整理会议纪要并输出行动项、项目进度自动同步提醒等[9] - **市场营销创作方向**:面向内容创作者与营销从业者,打造具备强交付能力的营销类技能,覆盖从内容策划到素材投放的全流程场景[10] - **金融专业分析方向**:面向金融从业者,打造满足一致性规范、可审计、强决策支撑核心需求的技能,如财报关键指标速读、行业动态跟踪等[11] - **极客赛道**聚焦视觉冲击力、技术门槛与代码能力、交互体验的魔法感,面向开发者征集具备技术突破性与体验创新性的Skill[12] - **强视觉冲击特效方向**:鼓励打造高质量视觉特效能力,包括酷炫粒子效果、沉浸式3D空间场景,以及玻璃拟态、流体流动等创意光影表现[13] - **可视化库封装与应用方向**:征集可作为Skill能力模块独立调用的可视化方案,如动态智能图表、交互式地图等组件封装[14] - **代码创意交互方向**:倡导基于编程语言实现具有创意表达的交互型技能,例如网页动画生成、新颖的手势交互逻辑,或结合陀螺仪、摄像头等硬件能力的联动效果[15] 赛事激励机制与开发者支持 - 入选的优质Skill将公布至扣子技能商店页面[17] - 提供流量扶持,为优秀Skill加码商店内曝光资源,助力技能触达更广泛用户群体[17] - 对符合条件的优质Skill开放付费权限,开发者可依托技能售卖实现创作变现[18] - 提供额外的社区福利:极客赛道入选Skill可获得500元京东礼品卡,职场赛道入选Skill可获得300元京东礼品卡,名额共计10份,按报名顺序发放[19] - 提供扣子周边作为奖励,福利名额有限,按报名顺序依次发放[19] 高质量Skill的定义与构建标准 - 一个快速判断Skill是否成立的方法是:其方法论在固定输入条件下,能稳定产出可直接使用的结果,且在该场景下的效果与确定性明显优于通用大模型工具[25] - 高质量Skill的核心标准是具备专业领域知识,非通用Agent能完成,本质上应像一个高度专业的虚拟员工,能独立、可靠地完成一项完整、有价值的任务[26]
网易云音乐前 CTO 曹偲:代码越来越不重要,好的架构才是软件工程核心
Founder Park· 2026-01-26 12:07
Toco AI 的产品定位与核心差异 - 公司核心产品Toco AI旨在将**确定性和工程性**带入AI Coding领域,解决软件工程中的架构和可维护性难题,而不仅仅是提升代码生成能力[2] - 公司认为单纯的代码能力提升不能解决领域内所有问题,因此专门打造了**AI架构师**功能,以解决软件工程的架构难题[2] - 与Cursor、Claude Code等概率性、freestyle工具不同,Toco AI强调软件研发的**工程化属性**,即需要规范、约束和严谨性[11] - 公司通过引入**建模方法论和建模工具**来实现确定性和工程性,并确保这是一个端到端的工具,而非单纯的建模工具,从而完整交付需求[12] 对“AI架构师”与软件架构的理解 - **AI架构师**旨在解决软件架构和复杂性问题,公司将架构分为**技术架构**和**业务架构**[13] - 技术架构可以被内化到引擎中,由AI辅助解决,用户无需过度关心;而业务架构最熟悉的是产品经理和了解业务的人,经过AI和产品的解释反而更容易理解[13][14] - 公司认为**架构是对业务的抽象方法**,并非高不可攀,其目标是将其**普世化、平民化、内嵌化**[14] - 公司强调,软件只要被长期使用就**一定会变得复杂**,因此良好的架构和可维护性是软件**应该必备的特质**,而非仅大型软件专属[23][24] - 业务架构是**对现实世界的精准还原和未来预测**,这部分很难被AI取代,决策权核心仍在人类手中[29][32][33] 目标客户与典型应用场景 - 目标客户主要包括两类:**小型SMB企业**以及需要重构或构建新模块的**中大型系统**[16][17] - 对于SMB企业,Toco AI相当于**内嵌了一个架构师**,能帮助其用业内最佳实践构建架构良好的系统(如电商管理系统)[16] - 对于中大型系统,Toco AI是一个**架构驱动平台**,能帮助维护架构不被劣化、协助团队持续协作,并实现研发过程的**数字化管理**[17] - 公司长远目标是为AI Coding建立**软件开发中的抽象层**,成为像Spring之于Java、K8s之于运维那样的行业标准,前期核心用户将是**资深开发者**[22] - 产品目前最擅长**业务系统的服务端**开发,未来会向前端或BI侧延展,公司将其类比为**封闭赛道的L4级解决方案**[25] 对AI Coding行业趋势的研判 - 公司认为2025年是AI Coding火热的一年,但行业兴奋点将从写代码本身,转向如何让AI Coding**可持续地为软件开发提供长期价值**[28] - 随着AI代码生成能力增强,**模式化的代码将越来越不重要**,编程语言和技术栈之争会慢慢消亡(黑盒化),而**对业务的描述、理解和长期规划**将变得越来越重要[29][40] - 行业内正形成共识:AI Coding需要与**软件工程结合**,代码之上的**架构开始变得越来越重要**[28][29] - AI Coding的实际生产采纳率在大型系统中可能只有**百分之十几**,这促使行业寻找通过抽象来减轻软件复杂度的新出路[49][63] - 人类社会的**数字化进程不会停止**,只要数字化中的确定性部分存在,Coding就会长期存在,AI接管的是非确定性表达部分[51] 产品的技术路径与行业定位 - 公司产品可被视为用**AI-Native的方式重做UML**,在AI时代让业务抽象的方法论焕发新的生命力[52][56] - 与90年代的UML相比,AI时代能更好地把控抽象度(例如只抽象80%的信息),并解决设计与代码不一致的问题,**拓宽了人与AI的通信带宽**[53][54] - 公司选择从**Java**切入,因为其工程化理念与产品更近,且Java开发者群体最大,便于获客和解决问题[59][60] - 公司的发展思路是先成为一家**产品公司**,再成为一种**行业标准公司**,并计划将引擎内核部分开源[61] - 产品更适合**Greenfield(新建)项目**或对Brownfield(遗留)系统中常变更的重要模块进行“最后一次重构”,从而建立新的、设计良好的可维护体系[63][64] 竞争优势与市场观点 - 公司不认为存在绝对的技术壁垒,但建立产品有**时间优势**,可转化为竞争壁垒[49] - 公司欢迎大厂参与类似产品开发,认为需要更多人一起**做大市场和做好用户教育**,因为“架构很重要”在当前并非大众普遍认知[49] - 与Cursor等工具相比,Toco AI的优势在于能更好地解决**过去无法有效进行的重构问题**,帮助系统变得规整并长期保持,其长期市场想象空间更大[66][67] - 产品在复杂度上没有绝对瓶颈,从很小的会议室管理系统到像**网易云音乐**这样有近千开发人员、十几年的复杂系统(top 0.1%)都可以支持[68][69] - 公司认为工程的意义在于**拉齐协作水平**,而Toco AI正是为了提供更适合大众协作活动的工具,而不仅仅是服务于高水平个体[70][72]
走一步看一步、两三个月就迷茫一次:字节扣子的两年「创业」
Founder Park· 2026-01-25 09:04
文章核心观点 - 字节跳动旗下产品“扣子”经历了从无代码聊天机器人构建平台到聚焦“职场AI”伙伴的战略演进,其发展路径并非顶层规划,而是内部创业团队基于用户反馈和市场变化不断“辗转腾挪”的结果,最终通过Vibe Coding、技能商店、长期计划等能力,定位为“白领用户的技术伙伴”[1][2][20][22] 产品定位与战略演进 - 产品定位从“扣子开发平台”升级为“扣子编程”,并明确迈向Vibe Coding方向,最新版本定位为“职场AI,就用扣子”[1] - 扣子并非字节技术路线下的规划产品,更像一个内部早期创业团队“野生”生长,其从0到1的过程具有研究价值[2] - 团队最初目标是打造让每个人获得编程能力的平台,但因2023年大模型编码能力及工程环节不成熟而放弃,转而从“无代码聊天机器人构建平台”切入[4] - 项目于2023年底以Coze为名在海外上线,2024年初在国内上线名为“扣子”,上线至今已两年[5] - 早期增长依靠用户新鲜感红利,但留存不理想,团队曾焦虑迷茫[6] - 团队通过分析用户行为,发现高频场景来自企业内部,从而统一思想,全力投入工作流开发,使产品价值得到认可,从“抢跑”变为“领先”[7] - 团队将核心用户定义为“严肃开发者”,即有商业化目的或用于提升工作效率的开发者,这标志着一个战略转向[10] - 产品最终进化方向是从“做工具”转向“造伙伴”,旨在建立AI与用户间新的协作关系,提升粘性与长期价值[20][21] 关键功能与产品形态发展 - 工作流调用量持续攀升且用户稳定,这个为解决大模型不稳定性而设计的方案,意外决定了产品下一阶段的“腾挪”方向[6] - 2025年4月发布“扣子空间”,主攻办公Agent,覆盖AI写作、PPT、设计、Excel、网页、播客等场景[10][11] - 扣子空间上线后,团队对大模型进步变得渴望,例如豆包大模型升级至1.6版本时,扣子空间留存率直接上涨10个百分点[11] - 团队通过Agent RL参与推动模型变强,利用用户提出的复杂真实问题作为高质量训练素材[12] - 以做PPT场景为例,团队基于豆包大模型进行后训练和自标注数据,使产品能力依赖模型跃迁,实现了从“雕琢工程”到同时“雕琢模型”的转变[12] - 扣子空间App已更名为扣子,成为主入口,未来将是一个整合扣子空间、扣子编程、技能商店等能力的all-in-one产品[13] - 扣子2.0提出了包含Vibe Agent、Vibe Workflow和Vibe App三层的Vibe Coding,并配套推出Vibe Infra,用户只需用日常语言描述需求即可生成应用[14] - Vibe Infra通过与火山引擎结合,一键完成云端开户、发布、域名注册、上线运维等复杂流程,提供了生产级一站式体验[15] - 技能商店允许用户上传和下载技能包,将人的“经验”沉淀为可被大模型调用的长期资产,企业也可借此沉淀公司“Skill资产”[16][17] - “长期计划”功能可帮助用户持续完成某项任务,如每天早上7点汇总新闻发至邮箱[17][19] 商业模式与生态构建 - 工作流功能成功后,产品推出了更明确的付费路径,且团队在2025年初设定的半年目标已达成[7] - Vibe Infra的推进可能为火山引擎带来大量C端用户,因为小白用户的第一个AI应用和云服务账户可能来自火山引擎[15] - 企业可以直接利用扣子企业版完成组织全面AI化,因为产品门槛低而上限高[15] - 当AI被视为工作伙伴而非工具时,其价值才能放大,这可能使AI应用超越上一代移动互联网App[21][22] - 产品的最终目标是建立类似“白领们的私人技术伙伴”般的信任基础与持续“履约能力”循环,服务目标是那些想构建工作Agent却未被很好服务的白领,以及期待利用AI增效的企业管理者[23]
2026 年的「创业」,就从一个 Skill 开始吧
Founder Park· 2026-01-23 21:31
Skill概念的市场热度与生态发展 - 2026开年,Skill概念热度持续攀升,迅速超越Agent、MCP等概念,成为各家产品争相支持的功能[2] - 在过去十几天里,Skill生态正在以数倍的速度持续扩张[2] - Skill主张将专家的工作SOP打包成可复用的资源包,其特点是搭建不难、易于分享且能交付结果[3] Skill的核心优势与市场进入门槛 - 创建Skill不需要Coding或拖拽搭建工作流,只需一套可复用的SOP即可,门槛比Vibe Coding还低,旨在让人人都能成为创作者[3] - 扣子2.0率先跟进Skill功能并快速推出「技能商店」,显示出主流平台对该趋势的快速响应[4] Skill招募大赛概况与目标 - Founder Park联合扣子举办Skill招募大赛,旨在鼓励分享最佳SOP实践,让能力成为一种流动的交换资源[5] - 大赛核心理念是将可标准化的执行工作交给Skill,使人的能力和时间聚焦于决策和创造[6] 大赛赛道设置与具体要求 - 大赛设置职场和极客两个赛道,参与者可选择1个或多个赛题进行Skill开发[6] - **职场赛道**:征集将日常工作方法论、专业领域知识、复杂性流程封装为可复用能力的实用性Skill,以助力职场人提效减负[7] - **工作效率提升方向**:针对述职汇报、会议协作、项目跟进等高频办公场景,将个人SOP转化为可复用技能,如自动整理会议纪要并输出行动项[9] - **市场营销创作方向**:面向内容创作者与营销从业者,打造具备强交付能力的营销类技能,覆盖从内容策划到素材投放的全流程场景[10] - **金融专业分析方向**:面向金融从业者,打造满足一致性规范、可审计、强决策支撑核心需求的专业技能,如财报关键指标速读、行业动态跟踪[11] - **极客赛道**:聚焦视觉冲击力、技术门槛与代码能力、交互体验的「魔法感」,征集具备技术突破性与体验创新性的Skill[12] - **强视觉冲击特效方向**:鼓励打造高质量视觉特效能力,如酷炫粒子效果、沉浸式3D空间场景、玻璃拟态等,需支持与交互行为的联动并兼顾性能[13] - **可视化库封装与应用方向**:征集可作为Skill能力模块独立调用的可视化方案,如动态智能图表、交互式地图等组件封装[14] - **代码创意交互方向**:倡导基于编程语言实现具有创意表达的交互型技能,如网页动画生成、新颖手势交互逻辑或结合硬件能力的联动效果[15] - 以上方向仅作为创作参考,不构成对技能形态或实现方式的限制,开发者可自由融合多个方向进行创作[16] 赛事奖励机制 - 入选优质Skill将公布至扣子技能商店页面[17] - 提供流量扶持,为优秀Skill加码商店内曝光资源[17] - 对符合条件的优质Skill开放付费权限,开发者可实现创作变现[18] - Founder Park社区提供额外福利:极客赛道入选Skill奖励500元京东礼品卡,职场赛道入选Skill奖励300元京东礼品卡,名额共计10份,按报名顺序发放[19] - 提供扣子周边作为奖励,福利名额有限,按报名顺序依次发放[19] 活动赛程与参与方式 - 报名提交通道自即日起开启,至2月9日20:00截止[20][21] - 赛事仅接受报名通道开启后才创建的Skill报名[21] - 报名时需填写Skill ID或Skill链接,需至少完成Skill创建后再提交报名表单[22] - 活动赛程包括:征集启动与提交Skill(即日起至2月9日20:00)、专家团队调研评审(2月9日至2月13日)、获选结果公布(2月14日)、奖励发放(2月27日至3月6日)[23] 高质量Skill的构建标准与判断方法 - 一个快速判断Skill是否成立的方法是:看其方法论能否在固定输入条件下,稳定产出「可直接使用」的结果,且在该场景下的效果与确定性明显优于通用大模型工具[25] - 高质量Skill的核心标准是:具备专业领域知识(非通用Agent能完成),本质上是一个产品,应像一个高度专业的虚拟员工,能独立、可靠地完成一项完整、有价值的任务[26]
Sensor Tower 年度应用报告:AI 应用牌桌已定, ChatGPT「赚麻了」
Founder Park· 2026-01-23 21:31
文章核心观点 - AI正在全面重塑移动应用市场,其增长在2025年未减速反而加速,成为市场发展的核心驱动力[5] - 移动应用市场整体进入以商业变现为重心的“下半场”,用户增长进入平台期,对用户注意力的争夺异常激烈[8][18] - 非游戏类应用收入首次超过游戏,其中生成式AI是主要增长动力,市场商业化能力普遍增强[20][28] - 移动端已成为用户接触和使用AI的最主要入口和核心平台[62] 移动市场总体表现 - 2025年移动市场关键数据创下历史新高:全球应用内购(IAP)收入同比增长10.6%,达到1670亿美元;总下载量接近1500亿次,同比增长0.8%;用户总使用时长达5.3万亿小时,同比增长3.8%,人均每天使用约3.6小时[5][16][17][19] - 市场重心彻底向“赚钱”倾斜,IAP收入高速增长,但下载量和用户时长增速放缓[5][16][18] - 非游戏类应用的IAP收入首次超过游戏,达到约850亿美元,同比增长21%,是五年前的2.8倍[20][26] - 非游戏类应用收入增长主要来自AI,但几乎所有应用类别都实现了收入增长[28] - 游戏类应用收入增长较为平稳,同比仅增长1.3%[21] AI应用市场表现 - AI应用增长势头迅猛:2025年下载量翻倍,达到38亿次;IAP收入增长超过三倍,突破50亿美元[54] - 用户粘性显著增强:AI应用总使用时长达到480亿小时,是2024年的3.6倍,2023年的近10倍[58] - 用户互动深度增加:AI应用会话量突破1万亿次,增速超过下载量增速,表明市场重点从用户获取转向用户互动和留存[60] - AI助手(AI Assistant)是最受欢迎的AI应用类别,2025年全球下载量排名前十的AI应用全是AI助手,以ChatGPT、Google Gemini和DeepSeek为代表[47] - AI助手类应用使用时长暴增426%,按使用时长计算已进入前十大细分赛道[40] - AI图像与视频生成功能成为头部厂商的发力重点,新功能发布显著拉动了用户增长[72] 头部应用与竞争格局 - 2025年共有18款应用年收入达到10亿美元,游戏和非游戏类各占一半[34] - ChatGPT以34亿美元的IAP收入位居全球年收入榜第三,成为有史以来最快达到30亿美元年收入的应用[31] - 下载量、IAP收入、月活用户全球TOP10应用榜单显示,ChatGPT、Google Gemini等AI助手,以及TikTok、CapCut等社交与视频编辑应用占据领先地位[11] - AI领域竞争格局集中化:OpenAI和DeepSeek两家“顶尖AI发行商”的下载量份额从2023年的21%猛增至近50%;Google、腾讯等“科技巨头”份额从14%涨至近30%[67] - 下载量排名前25的应用中,头部之外的其他所有玩家份额仅剩约四分之一[68] 市场细分与用户行为 - 在Top 20细分赛道中,有15个的IAP收入增速不低于10%[22] - AI助手和短剧类应用是年度增长最快的两大细分领域,在下载量和IAP收入上增长惊人[43][45][46] - 社交媒体应用仍是用户时长大头,总时长近2.5万亿小时,同比增长5%,人均每天超90分钟[37] - AI陪伴(AI Companion)类应用使用时长猛增68%,但增长势头有所放缓[42] - 移动端成为AI应用主要入口:2025年底,仅美国前十大AI助手总用户数超2亿,其中超一半(1.1亿)为移动端用户,而2024年初纯移动用户仅1300万[61] - 16%的用户会同时在移动和网页端使用AI助手,跨设备使用越来越普遍[62] 行业生态与趋势 - 头部1%的发行商占据了92%的IAP总收入(1540亿美元)和81%的总下载量[69] - 其余99%的发行商IAP收入增速已超过头部1%,其收入占总收入的8%(131亿美元),高于2019年的5%,自2023年生成式AI兴起后增长明显提速[69] - AI在某种程度上拉低了开发门槛,帮助小团队更快开发应用,缩小技术差距[71] - 不同代际用户偏好不同:年轻人更偏爱效率、创造力和社交类应用(如AI应用),年长用户更关注旅行、体育和购物类应用[76][77] - 不同性别用户偏好不同:在美国,ChatGPT、Discord等应用更受男性青睐,而Pinterest、TikTok等更受女性青睐[82][85]
对话 Robopoet 孙兆治:全行业销量最高的 AI 陪伴玩具,Fuzozo 是如何「养成」的?
Founder Park· 2026-01-22 18:06
产品表现与市场定位 - 公司首款AI陪伴机器人“芙崽”于2025年6月发售,截至访谈时累计销量已超12万台,其中12月单月销量超5万台 [2] - 产品单日Token消耗量已超百亿,在火山引擎AI硬件榜单中位列第一,在硬件领域净退货率保持在10%以下 [2] - 产品定价为399元,旨在击穿市场、快速跑量,该定价策略被行业广泛跟随 [5][25] - 创始人认为该产品定义了一个新的“随身硬件品类”,而非单纯的“AI玩具”,其市场潜力在于成为中产家庭几乎人手一个的随身陪伴机器人,指向一个更大的“个人AI搭子”市场 [5][18][20] 产品开发与迭代策略 - 产品开发遵循“验证”与“迭代”思路,为抓住市场窗口期,团队选择在2025年618以“最不完整的产品”状态上线,后续通过软件OTA快速迭代 [23][24] - 第一代产品被创始人评为60分,硬件已较清晰,但软件初期仅为框架,计划在2026年进行硬件大优化 [16] - 即将在CES发布蜂窝网络版本,该版本涉及电器件重新选型、模具重开等重大改进 [27] - 产品采用“机器人思维”开发,旨在让AI通过传感器感知物理世界,实现“主动交互”,与过去基于规则或纯虚拟的陪伴产品有核心区别 [29] 用户画像与需求洞察 - 用户以女性为主,占比80%,主体用户是30岁上下的女性以及6-12岁儿童 [32] - 用户分层明显:包括满足陪伴需求的儿童、处于生活巨变期需要情感支持的20-25岁年轻人、以及压力大消费力强的30多岁人群 [33][34][35] - 从需求动机上,用户可分为科技尝鲜型、潮玩爱好者以及有明确情绪价值需求(将产品视为真正朋友)的三类人群,第三类用户可能长期使用更重度 [42][43][44] 核心功能与世界观构建 - 产品核心功能围绕“养成”和“社交”两大模块构建,类比人与宠物的非平等信赖关系 [46][47] - 社交功能初期较简单,计划在设备量超过10万台后,开放基于地理位置等更多玩法,并让“芙崽”具备自发社交行为逻辑 [50] - 团队构建了数万字的“毛毛星球”IP世界观,故事背景是星球生物以“吃掉坏情绪”为使命,角色按“金木水火土空”元素划分,旨在增强用户情感连接和沉浸感 [6][65][68] - IP运营是长期战略,计划通过更新世界观知识库、组织线下活动等方式,让IP“活着”并持续进化 [102] 商业模式与竞争壁垒 - 公司以C端市场为主,对类似华为的B端重度合作持谨慎态度,视为事件营销,一年最多承载一两个 [94] - 与华为合作定制“憨憨”产品后,“芙崽”的线上销量在一周内增长了50%,华为的背书显著提升了公司品牌影响力和渠道合作意愿 [92] - 公司认为构建壁垒的关键在于:快速达到百万级出货量以形成“数据飞轮”,以及打造独特的IP故事让用户产生情感 [98] - 创始人认为AI陪伴硬件市场并非赢家通吃,因为情绪价值需求多样,但需要综合团队解决技术、IP和产品交付的复合难度 [98][100] 运营数据与增长计划 - 产品人均对话时长从7月发布时平均超1小时,稀释至访谈时的30多分钟,日活跃设备占比为10%-20% [76] - 销售渠道方面,2025年销量主要来自自营网店,2026年将大力拓展线下渠道,已开始与九木杂物社合作 [99] - 2026年产品成长计划包括:多元化交友方式、喂养装扮体系、勋章背包体系等更多养成玩法 [103] - 海外拓展计划于2026年启动,首先聚焦泛亚洲地区,日本市场将作为重点,通过DTC、亚马逊、线下杂货铺、电器城等多渠道进入 [104]