Workflow
Founder Park
icon
搜索文档
对话 Befreed 创始人:从「个人学习」切入的 AI Agent,把学习变成一种生活方式
Founder Park· 2026-03-18 13:00
公司核心产品与定位 - 公司产品Befreed是一款以“强个性化学习Agent”为核心的音频学习产品,旨在解决现代人学习碎片化、难以坚持的困境,其核心不是内容分发,而是通过AI Agent持续理解用户的学习上下文,将零散学习行为累积成结构化的个人知识路径 [2][6] - 产品于2025年7月正式上线,截至报道时在App Store已积累超过2100条评分 [2] - 产品使命是“让每个人都能用最适合自己的方式去学习”,致力于为用户提供“被理解”的体验,其核心方法论是打造一个“非常了解你的朋友”般的AI,它能基于用户偏好和上下文,从全网搜索、筛选、整理内容,并以用户可吸收的方式交付 [6][8] - 产品内容主要来源于用户自己创建,从而规避了版权限制,同时AI会基于对用户的了解和学习偏好,从全网搜索相关内容并组织成可执行的学习计划 [7] - 公司的用户规模目标是至少积累100万(1M)用户量级,其Agent擅长通过持续累积上下文来帮助用户长期学习 [9] - 产品支持多语言内容生成,例如可将《Eat That Frog》这类书籍翻译并再创作为适合儿童的课程内容 [10] 商业模式与用户分析 - 公司目前采用订阅制商业模式,并已观察到大量的付费用户转化 [4] - 付费方案包括终身买断(Lifelong)和年费订阅,其中终身买断价格为一次性付款180美元,年费约为90美元 [16] - 一个有趣的现象是,很多用户会在圣诞节购买终身买断服务作为礼物送给他人,这改变了用户对一次性买断产品的感知,且“终身购买”模式在欧洲用户中尤为受欢迎 [16] - 当前用户主要集中在美国、加拿大、欧洲和澳大利亚,中文用户很少,产品也未上架中国区App Store,主要原因是涉及内容合规许可,专门处理合规的成本较高 [14] - 公司希望增加在中文社区的曝光,以吸引中国国内优秀的ToC领域人才 [14] - 社区运营方面,用户(年龄约30岁上下)主要在WhatsApp上活跃,但公司认为WhatsApp、Telegram和Discord等平台均存在不足,尚未找到最适合系统化运营社区的平台 [15] 增长策略与融资情况 - 在用户增长方面,LinkedIn成为了一个出乎意料的高效渠道,不仅带来了用户,甚至直接吸引了投资人主动联系 [4] - 社交媒体运营策略因平台而异:在X(原推特)上发布产品推文,整体播放量超过100万(1 million),并被许多新闻通讯转发,形成延伸传播链;在LinkedIn上则发布更生活化、更真实的内容,这有助于建立真实的人设并吸引关注、工作机会甚至投资 [20] - 一个具体案例是,一条圣诞相关的LinkedIn动态吸引了Phia公司的创始人Phoebe Gates(比尔·盖茨的女儿)主动联系并表达了投资意向 [20][21] - 另一案例显示,有投资人(包括Notion和Pinterest的早期投资人)因欣赏产品设计,在观看产品发布视频后迅速决定投资,流程极快,实现了周四聊、周五签、周五晚上资金到账 [20][21] - 公司融资节奏很快:在进入一个旧金山孵化器并于4月初结束后,很快在Demo Day后完成一轮融资,部分投资人在Demo Day前就已接触;随后在当年1月又完成一轮融资 [19] 竞争格局与行业洞察 - 公司创始人认为,大模型像太阳,应用公司需要找准自己的轨道位置——既不能离太阳太近(直接动摇巨头根基)而被烧焦,也不能离得太远而失去引力 [4][10] - 对于ToC产品,创业机会存在于大厂反应慢、对用户需求不够敏锐的缝隙中,创业公司可以利用更强的模型能力和更快的迭代速度切入 [4][10] - 观察到谷歌在2025年之后变得更像创业公司,虽然其内部风险控制意识依然很强,但一旦做出行动,影响巨大 [24] - 谷歌正将AI能力更深地嵌入其产品,如Drive的问答能力和Gmail的自动回复/草稿功能,实现了从自动补全到自动草稿的效率显著提升 [24] - 谷歌对创业公司和生态伙伴的对接变得更加积极和细致,例如谷歌云团队会积极跟进创业团队需求,Google Ventures也会主动接洽 [25] - 旧金山的创业生态正在回暖,表现为共享办公空间(如WeWork)供不应求、价格上涨,私人办公室等待期长,公寓租金上涨,以及大量创业公司和人才涌入硅谷 [26]
OpenClaw 背后核心框架 Pi:好的 Coding Agent 应该让用户来决定需要什么
Founder Park· 2026-03-17 21:29
核心观点 - 开源个人AI助手OpenClaw的核心是一个极简框架Pi-coding-agent,其设计哲学是做减法,通过不到1000 tokens的系统提示词和核心工具实现高效编码,在性能基准测试中进入前五 [1][2] - 框架创始人认为,经过大量强化学习训练的大模型已天然理解编码工作流,无需复杂预设,因此Pi框架坚持极简、可扩展、确定性和高可观测性,以对抗主流AI编程工具因频繁静默更新而破坏开发者工作流的问题 [2][5][7][9][36] - 在Pi框架下,不同用户发展出多样化的工作流,但其核心价值在于提供了一个可构建个性化智能体的基础,而非一个功能固化的产品 [20][21][22] - 框架创始人强烈反对在功能构建中使用并行子智能体模式,认为这会导致代码质量低下,并强调人类在开发循环中保持最终决策权的重要性 [23][24][25][26] - 对于AI编程工具的安全和长期记忆问题,创始人认为现有权限系统多为“安全剧场”,而代码库本身即为最佳真相源,无需额外的复杂记忆系统 [28][29][31] Pi框架的极简设计理念与实现 - 系统设计极简,系统提示词和工具定义总计不到1000 tokens,而Claude Code超过10000 tokens [10] - 核心工具只有read、write、edit、bash四个,没有内置计划模式、待办系统、MCP支持或权限弹窗 [2] - 将LLM视为“用自然语言编程的通用计算机”,提示词如同代码,状态序列化到磁盘文件,从而绕过上下文衰减问题 [11] - 主动选择不支持MCP,以避免大量未使用的工具定义消耗上下文窗口,替代方案是编写带README的CLI工具,按需调用 [12] - 不内置计划模式,通过让智能体读写`PLAN.md`文件来实现跨会话规划,且过程完全可观测 [12][13] - 不内置待办系统、后台bash功能和子智能体,以降低复杂性并保持完全的可观测性与控制权 [14][15] 对主流AI编程工具的批判与Pi的动机 - 创始人因受够了Claude Code等工具频繁变更的“工作流”而开发Pi,这些工具会静默更新系统提示词和工具定义,导致开发者工作流被破坏 [5][7][9] - 主流工具如Claude Code和Codex会在用户上下文中静默注入内容,且发布节奏极快,导致模型行为在短时间内发生不可预测的变化 [7][36] - 创始人开发了`cchistory`工具追踪Claude Code的变更,发现了大量用户不知情的“静默调整”,这些调整会微妙地改变模型行为 [35][36] - 当前AI工程实践被形容为“基于氛围的工程”,因为自然语言接口、MCP服务器、系统提示词等各层都在不断变化且缺乏能见度,导致开发者被“煤气灯效应” [36] 用户工作流与实践案例 - 用户Daniel的工作流:使用定制的头脑风暴技能生成激进、务实、豪华三种方案并讨论确定,产出Markdown计划和待办事项 然后使用侦察子智能体探索代码库,将结果传递给使用Sonnet 4.6的“工人”智能体实施 实施后使用Codex审查子智能体进行代码审查,并利用剩余上下文窗口进行高效的迭代修复 [21] - 用户Armen的工作流:替换了Pi内置的编辑工具为支持基于补丁的多文件编辑版本 开发了`answer`扩展,将模型问题提取并渲染为UI逐一回答,不消耗上下文 让智能体在验证改动时自动截图,并能在后续会话中重新查看 [22] - 创始人Mario的个人使用方式极为简约,仅使用两个针对特定项目的扩展,旨在为用户提供一个可自定义的“元工具”,而自己保持斯巴达式体验 [22] 对并行子智能体与权限系统的看法 - 创始人认为让多个子智能体并行开发不同功能是一种“反模式”,除非不介意代码库质量下降,他强调人类需要保持在开发循环中并做最终决策 [23][24][25] - 对于需要探索的任务,如优化方案探索,子智能体可能有效,但对于真正的功能构建,仍需人类监督和串行流程 [27] - 认为当前大部分编程智能体的权限系统是“安全剧场”,只要智能体具备写代码、执行代码和网络访问能力,就无法真正防止数据泄露 [28][29] - 权限弹窗会导致“权限疲劳”,用户最终会习惯性同意或跳过所有权限,使系统形同虚设 [28] - Pi框架因此不设权限系统,默认全开,建议对敏感数据使用Docker容器进行隔离 [29][30] 对长期记忆与代码上下文的看法 - 认为对于编程任务,不需要额外的长期记忆系统,代码库本身就是真相源 [31] - 高度评价Claude Code发明的“搜索”方式,即让智能体从零开始探索代码库当前状态,这比维护过时的文档更有效 [32] - 用户Daniel尝试过会话摘要续接的方法,但发现用处不大,最终采用本地`agents.md`文件记录需要智能体记住的信息 [32] - 用户Armen尝试将最近的Git变更推入上下文以帮助续接,但效果好坏参半,尚未被说服 [33] AI生成内容对开源社区的挑战与应对 - 开源项目面临大量完全由AI生成、无人监督的issue和PR涌入,一个PR可能修改30到100个文件,审查负担极重 [38] - AI在判断issue或PR是否与项目相关、质量是否达标、是否符合项目理念方面表现糟糕,仍需人类大脑判断 [38] - 创始人建立了一套防御系统:要求贡献者必须先以“人类的声音”开一个issue,经确认后其账号被加入白名单,才能提交PR,否则PR会被自动关闭 [38] - 此方案对PR有效,因为AI通常不会回去读自动关闭的评论,但对提交门槛更低的issue仍是一个难题 [38]
OpenClaw 之后,2026 年的 AI 硬件该怎么做?
Founder Park· 2026-03-16 19:00
行业现状与市场阶段 - AI硬件赛道在2025年已基本完成一轮市场筛选和“祛魅”,早期仅凭基础硬件(如一块屏幕、一个麦克风)就能融资的阶段已经结束 [2][3] - 当前AI硬件创业的核心逻辑已发生转变,重点不在于产品接入了何种大模型,而在于公司是否想清楚硬件在用户生活中扮演的角色 [4] OpenClaw的影响与行业新问题 - OpenClaw的出现将“主动式AI”从概念层面推进到工程层面,降低了开发门槛 [5] - OpenClaw给AI硬件创业者带来了新的核心问题:如何通过构建“主动服务场景”来实现产品的差异化 [5] - 行业正在探讨OpenClaw改变了什么、尚未改变什么,以及2026年AI硬件发展的窗口期所在 [5] 2026年AI硬件发展关键议题 - 行业面临范式重构,需从“功能设备”转向“主动智能体” [12] - 行业需进行实战复盘,验证2025年商业化路径的真相 [12] - 行业终局拷问在于谁将掌握AI硬件的“OS”(操作系统) [12] 行业活动与交流焦点 - 行业计划通过线下活动,邀请一线AI硬件创业者深度探讨OpenClaw之后2026年AI硬件的做法 [5] - 活动将包含已验证商业模式的嘉宾进行深度分享,旨在复盘实战经验 [12]
下周英伟达 GTC 大会,硅谷见!
Founder Park· 2026-03-13 21:04
行业与公司活动背景 - GTC大会对AI产业具有重要影响力,其主题演讲将重新校准未来半年的产业节奏[2] - GTC期间是中美AI圈物理距离最近、交流最密集的时段,汇聚了从中国飞赴及美国本地的创始人、工程师与研究员[2] 活动组织与目的 - Founder Park联合RTE & Agora和变量资本,在GTC期间于硅谷举办一场专注于交流的非正式活动[5] - 活动旨在为中美AI华人社群搭建一个无演讲、纯交流的场域,以促进真实对话与连接[4][5] - 这是Founder Park首次将连接创业者与科技人才的活动拓展至海外市场[5] 活动形式与设计 - 活动采用严格的筛选机制,确保参会者为“华人人才浓度100%”,聚焦有效社交[9] - 参会者需提前提交个人简介,包括所做工作、讨论意向及需求,组织方会提前汇编成册分发,使连接在会前即开始[6][7] - 活动形式为围坐畅谈,旨在还原最真实的同行对话场景[9] 目标参会人群 - 参会者主要包括硅谷本地AI公司(涉及大模型、Agent、基础设施等领域)的核心研发及产品负责人[9] - 同时涵盖正在探索全球化路径的中国AI创业公司创始人及C级别高管[9] 活动核心价值与亮点 - 活动话题聚焦AI核心赛道,包括Agent、出海、工具链、商业化等实际问题[9] - 活动地点紧邻GTC主会场,便于参与者带着最新的技术发布感悟进行技术与商业层面的碰撞交流[9]
Physical AI 系列活动硅谷站!
Founder Park· 2026-03-13 21:04
活动概览 - 活动主题为“Physical AI Meetup”,聚焦于多模态与端侧智能,探讨AI能力向物理世界延展的趋势[2] - 活动于3月19日在美国硅谷Sunnyvale举行,分为上午主题分享与圆桌讨论,以及下午的硬件工作坊[2][4] - 活动由RTE开发者社区发起,联合了基础芯片、大模型厂商、硬件初创、投资机构及基础设施企业等多方参与[2] 上午场:Physical AI Meetup主题分享与圆桌 - 上午场活动时间为09:30至12:30,主题为“Conversational AI, Visual Agent and Edge AI”[4] - 活动流程包括签到交流、开场、主题演讲“对话真实世界”以及圆桌讨论[10][11] - 主题演讲嘉宾来自MiniMax、RiseLink和Agora等公司[10] - 圆桌讨论主题为“从Always on到Proactive AI,全模态AI硬件的机会”,参与方包括同歌创投、EverMind、HumanTouch,由RTE开发者社区发起人主持[10] - 活动包含闪电演示和自由交流环节[12] 下午场:TEN + Agora R1套件语音AI工作坊 - 下午场活动时间为13:30至17:00,是一场在GTC期间举办的特别硬件工作坊[4][15] - 活动规模为50至70人,现场提供40套Agora R1硬件套件,参与者可单人成组或两人一组,成功跑通流程的队伍可将设备带回家[17] - 工作坊旨在让参与者深入了解如何在开发板上接通语音AI Agent并进行动手实操[15] - TEN Framework是专为构建对话式语音AI设计的开源工具集,支持低延迟、多模态语音交互,并兼容主流STT/TTS/LLM/RTC技术[17] - Agora R1是一款集成对话引擎的轻量级AI硬件套件,开箱即可操控语音交互,支持APP配网连接智能体,并提供全面的开发资料[21] - 活动流程包括技术分享和现场实操,参与者将亲手完成从硬件配置、编译、运行到自定义语音Agent的完整链路[22][23] - 建议参与者提前准备笔记本电脑、GitHub账号及终端命令行基础,以确保现场体验流畅[26] 参与机构与合作伙伴 - 活动主办方为RTE开发者社区与TEN Framework[24] - 合作伙伴包括Agora、RiseLink、MiniMax、HumanTouch、EverMind、Resonance Ventures、AI Camp、Founder Park、Atlas Cloud等公司[24] - 上午场圆桌讨论的参与机构涵盖了投资(同歌创投)、技术生态(EverMind)及硬件产品(HumanTouch)等多个领域[10]
提示词工程、上下文工程都过时了,现在是 Harness Engineering 的时代
Founder Park· 2026-03-13 21:04
Harness Engineering的兴起与定义 - 2026年开年,开发者社区最热关键词为Harness Engineering,由HashiCorp联合创始人Mitchell Hashimoto在2月5日命名[2] - 一个月内,该概念从一篇博客文章发展为开发者社区高频词[3] - 行业新共识:在AI Agent编码领域,决定结果好坏的最大变量是模型所处的环境,而非模型本身[4] - 核心观点:模型能力竞赛持续,但决定Agent工程产出质量的杠杆已转移到“环境”一侧,这个环境就是Harness[5][6] 从Prompt到Context再到Harness的认知演进 - **2023年:Prompt Engineering全盛期**,焦点是写好单条提示词,但处理复杂任务时局限性暴露[9] - **2025年中:Context Engineering兴起**,焦点从“写好一条指令”扩展到“设计动态系统来组装上下文”,包括RAG、对话历史等编排[9] - **2026年2月:Harness Engineering正式命名**,解决了Context Engineering的不足,即上下文无法阻止Agent“做不该做的事”[11][12] - 三阶段关系总结:Prompt Engineering管“说什么”,Context Engineering管“知道什么”,Harness Engineering管“在什么环境里做事”[13] OpenAI实验的核心发现与工程实践 - **实验设定**:5名工程师在五个月内,通过Codex Agent协作交付了超过100万行代码的生产级软件产品,无一行人类手写代码[4][15] - **效率数据**:平均每名工程师每日合并3.5个Pull Request,代码审查通过Agent对Agent循环实现大规模自动化[15] - **关键挑战**:最困难的挑战集中在设计环境、反馈回路和控制系统上[15] - **文档工程进化**:从将所有信息塞进庞大AGENTS.md文件的错误,演变为**渐进式披露模型**,AGENTS.md精简为约100行的“目录”,指向结构化docs/目录[16][17] - **超越文档**:将可观测性数据(日志、指标、追踪)直接暴露给Agent,使其能通过LogQL和PromQL查询验证运行时状态,甚至通过Chrome DevTools Protocol操作浏览器以重现Bug[18][19] - **机械化架构围栏**:通过确定性Linter(错误输出格式专为Agent设计)和基于LLM的审计Agent,严格拦截违反分层架构依赖流向的代码[21][22] Harness Engineering的三维框架(Böckeler解读) - **维度一:上下文工程**:确保Agent在正确时机获得正确信息,包括渐进式文档披露、动态可观测性数据接入[24] - **维度二:架构约束**:通过机械化手段(如专为Agent设计的Linter)强制执行架构边界,使“违规→检测→修复”循环可在Agent内部闭环完成[25] - **维度三:熵管理/垃圾回收**:部署专用清理Agent定期扫描文档漂移、模式违规和依赖问题,防止Harness自身随时间腐化[26] - 三者关系:上下文工程让Agent“知道该做什么”,架构约束确保“只在边界内行事”,熵管理保障“整个系统不随时间退化”[26] 行业实践与验证 - **Stripe的工业级实践**:其Minions体系每周合并超过1,300个由AI完全编写的Pull Request[28]。每个Agent任务在独立预热devbox中运行(约10秒启动),通过名为Toolshed的中心化MCP服务器访问近500个工具[28]。采用“蓝图”模式,混合确定性节点与Agent节点,将LLM限制在“可控盒子”里以提升可预测性[28] - **LangChain的对照实验**:其编码Agent在Terminal Bench 2.0基准测试上,仅通过优化Harness(不修改模型),得分从52.8%提升至66.5%,排名从第30跃升至第5[4][29]。这是“环境比模型更重要”的直接证据[30] - **行业采用**:Anthropic将Claude Code定位为“灵活的Agent线束”[31]。MCP(模型控制协议)月SDK下载量超过9,700万,获OpenAI、Google、Microsoft和AWS采用,正成为Agent工具访问的通用标准[31] - **行业数据**:LangChain报告显示,89%的受访者已为其Agent实施可观测性,但仅有52%实施了评估(Evals)[32] 工程师角色与组织结构的转变 - **工程师核心工作转变**:从写代码转向设计让Agent可靠运行的环境,具体包括构建文档与上下文体系、以机器可处理的方式定义业务意图、构建自动化的防呆验证机制[33] - **新工作模式**:工程师如软件架构师,只讨论高层架构和重大决策,不涉及具体代码实现[34]。系统理解的深度比写代码的速度更重要[35] - **组织结构变化**:OpenAI的3-7人团队完成了以前需数十人规模的工程输出[35]。Stripe让单名工程师可同时向多个Agent分配任务,团队结构向两三人甚至单人团队收敛[35] - **“学徒缺口”挑战**:初级开发者若过早进入Agent驱动循环,可能缺乏构建健壮Harness所需的深度系统直觉,需设计保留手动开发直觉的学习路径[35] 开发者行动建议与采用路径 - **起步**:把同一个任务做两遍(先手动,再让Agent做),以建立对Agent能力边界的直觉[36] - **养成习惯**:每天下班前30分钟启动Agent,处理深度调研、并行探索、Issue和PR分诊等任务[36] - **关键跃迁**:在项目中建立一份AGENTS.md文档,从最基本内容开始,每次Agent犯错就补充一条规则,使其逐渐长成Harness[36] - **心态建议**:关掉Agent的桌面通知,由人类控制中断时机[36] - **对技术负责人的建议**:选择新项目做试点,并建立Evals(评估体系)能力[37]
对话 VisionFlow 创始人刘夜:OpenClaw 这一波,关键是要找到合适的生态位
Founder Park· 2026-03-12 20:04
AI创业的核心观点与战略方向 - 当前行业普遍聚焦于开发执行单一任务的“数字员工”,但这只是工程师思维对业务的过度简化,技术壁垒低且易陷入内卷,无法构成持久的护城河 [5][6] - AI创业的终极形态和核心竞争力在于构建具备协同、汇报、反思机制的“数字组织”,而非单个数字员工,这将是未来商业竞争的关键 [2][10] - 年轻的AI创业者不应在现有业务流程上做简单的技能优化,关键在于跳出低维高竞争,找到像Notion、Slack那样合适的差异化生态位 [2][36] 对产业规律与AI发展阶段的洞察 - 产业互联网的规律是从信息撮合、标品、供应链到非标复杂服务,越往后毛利越高、难度越大,AI的发展也可能暗合此规律,即早期做工具、中期做业务、后期做咨询 [5] - 技术正变得越来越不重要,离产业近比离技术近更具优势,第一代互联网三大门户中跑得最好的是腾讯和阿里便是例证 [7] - 近十年的产业互联网将程序员驯化为不思考业务的“码农”,AI的到来淘汰了“码”的部分,导致他们对产业理解空白,这是当前“万A大战”仍停留在工具层泛滥的原因 [8] 数字组织的构建理念与竞争优势 - 数字组织模拟真实组织的运作,拥有协同关系、汇报关系、使命、目标和行动方式,其最小单元是“岗位”而非“员工”,核心在于岗位间的协作与管理 [10][33] - 未来企业的竞争将比拼AI组织的“人才密度”,即看谁的Agent体系里拆解出的“原子级能力”更强,这决定了解决复杂任务的胜算 [12] - 构建强大AI组织的核心方法是:为传统产业业务进行建模,将其抽象成具备系统能力且能够进行智能体编排的能力,即新一代的“AI组织发展”能力 [15] - 企业应借鉴如华为“五看三定”等方法论,避免应激反应,固化长推理过程,通过深度思考与规划来建立竞争优势 [13][14][15] AI组织的运作原理:分层与渐进式暴露 - 复杂任务必须像传统企业管理一样进行分层拆解,实现对AI的“渐进式暴露”,以避免上下文腐化和注意力混乱,这是Skills的核心价值 [16][17] - 所有工种可按“竞争程度”和“维度高低”划分象限,低维高竞争的任务(如代码优化、销售)将100%被AI替代,而高维高竞争任务(如创作优质短剧)目前AI尚无法完成 [19][20][21] - 越高维的任务,可用数据源越少,但训练所需数据量反而越大,这种矛盾需要通过Skills拆解任务来弥补,正如企业将高级岗位拆分为多个基础岗位 [19] 未来企业的核心竞争力与壁垒 - 当底层AI模型和算力趋于普及时,企业新的壁垒将是“审美”和“编排”能力,即识别优质事物并对其进行有效组织与调度的能力 [25] - 编排能力取决于业务复杂度,像“制片人”一样,需要设定种子规则和原则,无法完全依赖混沌中的“涌现”,这最终可能来源于创始人或核心团队 [28] - 核心能力如CEO的决策、产品经理的隐性知识目前无法被完全文本化和向量化,缺乏高维隐性知识数据是制约AI生成内容“鲜活”度的本质原因 [29][30] - 未来的竞争胜负点在于“提炼最佳实践并建模”的能力,即像麦肯锡、IBM那样萃取行业顶尖实践,形成标准化流程或Skill Set,并能在真实场景中持续评估优化 [21][30][31][35] 给新一代创业者的战略建议 - 新生代的最大机会在于“目标创新”,即识别时代涌现的新目标,结合优质Skill并构建新体系,而非在现有目标和流程上做效率优化 [36][37] - 应远离自身不具备优势的具体业务流程,聚焦通用技能,找到像Notion那样不涉及具体业务、只抽象通用功能的合适生态位 [36][39] - 需要保持组织的高人才密度和跨界属性,一端对接技术前沿,一端研究业务模式,并与行业顶尖客户共创,在真实场景中持续迭代 [36] - 任何领域的早期是技术竞争,技术成熟后即进入商业竞争,将由产业人、产品经理和业务从业者主导,年轻人需看清中局和自身优势 [39]
闭门小局:OpenClaw之后,有哪些创业机会真正值得去做?
Founder Park· 2026-03-12 15:19
文章核心观点 - OpenClaw的兴起带动了新一轮AI Agent创业热潮,但创业者不应仅关注基于其开发产品,而应聚焦于其背后正在形成的庞大新生态位,其中蕴藏着真正的创业机会[2][3][4] - 围绕AI Agent的支付、身份、权限、协议、运行时、网站、基础设施、入口等环节都需要重构,这将催生一系列新的商业机会[4][8] Agent生态新机会探讨 - **Agent时代的新支付**:探讨类似于支付宝的、服务于AI Agent交易的新支付体系将如何出现[7][8] - **协议标准化**:研究如何将网页从供人“读屏”转变为供Agent“读语言”的标准协议,以提升Agent对网络信息的理解和处理能力[7][8] - **运行时工程化**:探索如何将Agent运行过程从“黑盒”转变为可控、可观测、可调试的操作面板[7][8] - **AI原生办公**:构想类似于“飞书”的、为AI协作时代重新设计的原生办公套件形态[7][8] - **IP与Agent结合**:探索垂直领域(如二次元)将IP与AI Agent结合,提供陪伴式服务的可行性[9] - **Agent作为新流量入口**:研究企业官网等如何为适应AI Agent的访问和理解而进行重写,以抓住新的流量入口机会[9]
对话ACE Studio:做AI音乐、月收入200万美元,我们选了一条和Suno截然不同的路
Founder Park· 2026-03-11 19:53
文章核心观点 - AI音乐平台ACE Studio选择了一条与行业领导者Suno截然不同的发展路径,从专业音乐创作者(如制作人、电影配乐者)切入市场,旨在成为音乐人的AI集成开发环境,提供更可控、可编辑的创作工具,并已实现显著增长[5][6] - 公司认为AI音乐是当前最接近可直接消费的AI生成内容领域,其潜力可能远大于传统音乐产业本身,因为它能实现音乐创作的普惠化,让每个人都能表达自己的情绪[7][15] - ACE Studio通过构建一个开放的、由多个专家模型组成的AI音乐平台生态来建立竞争壁垒,并采用类似Flux的开源与闭源结合的商业模式,旨在长期挑战Suno的封闭生态模式[18][23][25] - AI音乐行业未来的核心竞争要素将是个性化,即帮助创作者建立并保持其独特的风格和IP,而非仅仅生成高质量但同质化的内容[32][36] - 公司经历了7年艰难创业,曾因不够聚焦而错失早期发展机会,但在2024年决定All in AI音乐后,通过追赶模型能力并聚焦开放生态战略,已进入快速增长轨道[29][30] --- 根据相关目录分别进行总结 01 ACE Studio,更像是音乐人的「Cursor」 - **市场定位与Suno的差异**:Suno是面向消费者的一键生成式产品,而ACE Studio定位为音乐人的AI集成开发环境,强调“human in the loop”和可控的创作工作流,从专业用户切入[5] - **技术优势**:公司的模型比Suno更轻、更快,可在单张NVIDIA 3090 GPU上几秒钟生成一首完整歌曲,在速度与质量的平衡上自称领先于所有开源和闭源的AI音乐模型[5] - **市场机会**:在重塑专业音乐创作工作流的AI工具领域,公司自称是首创者且目前保持领先,发布前几乎没有直接竞争对手[6] - **降低创作壁垒的案例**:国内有音乐教育机构使用其工具教学,一名三线城市的高中学生通过两个月的培训,创作出在QQ音乐连续数周排名第一的歌曲,获得近500万人民币的版权分成,展示了AI音乐赋能普通人创作并获利的潜力[7] 02 AI音乐,是最接近可直接消费的 AI 生成内容 - **内容消费的独特性**:与AI视频相比,AI生成的音乐是目前最接近能够被终端消费者直接消费的AI生成内容,普通用户已难以区分AI音乐与人类创作音乐的区别[15][16] - **行业阻力**:当前主要的音乐流媒体平台(如腾讯音乐、Spotify)对AI生成音乐存在歧视,会添加标签,但这股趋势已难以阻挡,AI已能批量产生播放量过亿的热门歌曲[15] - **市场潜力定性判断**:AI音乐可能是一个大于传统音乐本身的市场,因为它能让音乐创作普惠化,满足每个人用音乐表达自我情绪的潜在需求,这代表了一个更大的市场机会[7][14] 03 自建专家模型矩阵,不止一个模型 - **模型能力与工作流**:ACE Studio 2.0提供了包括旋律识别、乐器合成、端到端生成、音频分轨、音乐续写在内的多种专家模型,用户通过组合这些“原子能力”能涌现出复杂的工作流,例如从哼唱到生成好莱坞史诗级弦乐配乐的全流程创作[17][18] - **自建模型的必要性**:由于音乐领域第三方或开源模型稀缺,公司被迫自建模型,从而形成了独特的模型壁垒。训练这些专家模型需要专有数据和标注,是一个耗时且需要深厚音乐领域知识的过程[18][19] - **数据与训练**:公司使用多样化的专有数据集,例如歌声模型使用约1万小时的专业录音棚数据,而端到端生成模型的数据集通过购买授权和合成数据生成管线,达到了两三千万首、一两百万小时的规模[19] 04 Flux式商业模式:免费是漏斗,闭源是变现 - **用户画像的演变**:随着2.0版本引入更多端到端生成能力,“专业用户”的定义发生弥散,扩展至懂音乐但非传统制作人的“new professionals”,如音乐老师、乐器爱好者等,他们已能使用ACE Studio创作出专业作品[20][21] - **与Suno的竞争策略**:短期策略是开源和免费,提供可在本地(如3090或A100 GPU上)快速运行和训练的模型,以此作为差异化卖点吸引用户。长期战略是构建开放生态,整合全球各类音乐模型(包括开源和闭源API),以生态合力竞争[22][23] - **商业模式**:借鉴Flux在图片领域的模式,通过免费开源小模型吸引用户和开发者构建习惯,再通过半开源中模型和闭源大模型API实现变现。ACE Studio的年费为200美元和264美元两档,也销售两年期订阅[25] - **财务与市场天花板**:公司预测2025年全年收入可能达到3000万美元。毛利率很高,推理成本约占收入的5%-6%,营销成本约占20%。专业音乐创作软硬件市场年规模约150亿美元,其中软件部分约80亿美元,公司目标是占据该市场10%-20%的份额[25][26] 05 在创业最艰难时,看着 Suno 从 day one 做到了世界级水平 - **创业初心与愿景**:创始人的核心愿景是让音乐创作回归为每个人表达情绪的本能,打破由复杂技术堆砌带来的高门槛[28] - **至暗时刻与战略转折**:公司在2022年前后曾不够聚焦,涉足多个项目,错过了AI音乐早期的技术变量。目睹Suno从无到有成长为世界级产品,却因自身分散精力而未能专注,这个过程极为痛苦。2024年初,公司决定砍掉所有其他项目,All in AI音乐,此后进入增长轨道[29][30] - **关键建议**:创始人反思后的建议是:尽快出海,并尽快与全球最前沿的用户和技术领先者紧密接触[31] 06 对于 AI 音乐来说,个性化才是最重要的竞争要素 - **当前AI音乐的局限**:尽管AI生成的音乐在质量上已与专业人士作品无异,但尚未能打造出以创作者为中心的超级明星IP,因为AI生成具有随机性,难以保持独特、个性化的风格[10][32] - **个性化是未来方向**:未来的竞争将围绕个性化展开。公司计划在基模型上构建大量LoRA,让用户可以引入自己的个性。长期来看,AI音乐将走向个性化,而非生成统一、华丽的同质化内容[32][33] - **对传统渠道的颠覆**:AI音乐将颠覆传统音乐分发渠道。流媒体平台的核心成本——存量版权——可能被AI打破,例如通过AI Remix等方式重塑音乐消费和创作。传统平台因担心得罪现有版权方而难以转型[34] - **公司的未来布局**:公司计划涉足内容分发,将创作平台ACE Studio与消费社区ACE Music打通,认为未来的AI音乐创作与消费是一体化的[35] - **最重要的竞争要素**:长期来看,最重要的竞争要素是帮助用户建立并保有音乐中的个性化资产(如独特的声音、唱腔),从而构建长期的IP和粉丝忠诚度[36] - **地理位置选择**:公司将总部设在洛杉矶而非硅谷,是为了更靠近全球音乐制作的中心和核心用户(如格莱美获奖者),而非仅仅靠近资本[37] 07 2026年展望与行业未来 - **2026年关键任务**:公司将致力于打通ACE Music与ACE Studio,形成一个统一的开放AI音乐生产平台。重点方向包括:利用Agent辅助创作规划、支持用户微调并托管自己的模型、探索音乐与视频结合的多模态应用[38] - **十年行业愿景**:如果公司成功,AI将彻底重构音乐产业的方方面面,包括生产、分发、消费和线下互动。作为该生态中最重要的系统,其价值可能达到数千亿美元级别的基础设施规模[39]
光轮智能完成 10 亿元融资,全球首个具身数据独角兽诞生
Founder Park· 2026-03-11 18:53
文章核心观点 - AI发展正经历从数字世界向物理世界的深刻跃迁,其基础设施的核心正从算力转向数据与仿真能力 [2][3][6] - 光轮智能作为全球首个具身数据领域的独角兽,致力于构建物理AI时代的数据与仿真基础设施 [1][16][17] - 公司通过其三层架构产品体系,掌握了具身数据的主动权,并已在商业化、交付及生态建设方面取得领先地位 [7][10][11] 融资与公司里程碑 - 光轮智能完成10亿元A++及A+++轮融资,引入新希望集团、鼎邦投资、奥克斯等产业方及建投华科、国方创新等财务机构 [1] - 本轮融资后,公司成为全球首个具身数据领域的独角兽企业 [1] - 融资资金将重点投入物理仿真引擎研发、规模化模型评测体系升级与全球交付及本地部署能力建设 [1] 行业趋势:物理AI时代的新基础设施 - 过去十年,算力(GPU集群)定义了AI的基础设施 [2] - 当前AI正从数字世界走向物理世界,真正的瓶颈是数据规模化能力 [3][6] - 具身智能数据需求呈指数级增长,新的基础设施正在形成,即数据与仿真基础设施 [6][16] 公司产品与技术架构 - 公司建立了以世界(World)、行为(Behavior)、评测(Eval)三层架构为核心的具身规模化数据与仿真引擎 [7] - **世界层(World)**:自研求解器支持刚体、柔体、流体等多物理场高精度实时求解,并具备大规模非刚体资产生产能力,形成从物理真实到数据规模化的自研闭环 [7] - **行为层(Behavior)**:构建了全球最大规模的非本体数据引擎,覆盖仿真合成数据与人类视频数据(EgoSuite)两大路径,实现具身数据的规模化交付 [7] - **评测层(Eval)**:推出业内首个工业级仿真评测平台RoboFinals,确立了具身智能评测的行业标准 [7] - 三层架构构成自我强化的数据飞轮,使公司掌握了具身数据主动权,打造了从训练到评测的完整数据与仿真基础设施 [10] 商业化进展与市场地位 - 公司在三个关键领域实现全球交付冠军,是全球唯一同时覆盖三项能力并实现规模化交付的企业 [11] - 2025年全年营收实现10倍增长,2026年Q1单季预计收入超过2025年全年总和 [11] - 合作伙伴涵盖英伟达、谷歌、Figure AI、1X Technologies、字节、阿里、智元机器人、银河通用机器人、丰田、博世、比亚迪、吉利等头部团队 [11] - 全球前五的世界模型团队均已与公司展开合作 [11] - 国际主要具身智能团队中超过80%的仿真资产与仿真合成数据来自光轮智能 [11] 生态建设与行业影响 - 作为核心共建方与NVIDIA联合开源Isaac Lab-Arena基准框架 [15] - 联合World Labs共建从环境生成到规模化评测的通用流水线 [15] - 携手通义千问基于RoboFinals-100构建可复现、可诊断的工业级评测闭环 [15] - 公司自研的LeIsaac仿真工作流已被全球最大AI开源社区Hugging Face官方文档纳入,成为全球百万开发者的“仿真标配” [15] - 引入的产业场景方将公司的具身数据生产与物理测量能力延伸至更广泛的真实应用场景,拓展了数据与仿真资产的来源边界 [11]