Founder Park

搜索文档
知乎AI大会,火山引擎创业大赛...5月不可错过的AI活动都在这里了
Founder Park· 2025-05-20 19:42
大厂开发者大会密集召开 - 5月有多场大厂开发者大会,包括微软开发者大会、谷歌I/O、Anthropic开发者大会等 [1] - 6月将迎来Apple的WWDC活动 [2] 知乎新知青年大会AI分论坛 - 主办方为知乎科技,5月24日在北京798举办 [3] - 主题为"AI变量研究所",聚焦大模型、具身智能、芯片等前沿方向 [3] - 开放10个讲者名额,需提交300字发言提纲 [4] - 面向AI创业者、开发者、产品经理 [5] WaytoAGI全球AI大会东京站 - 6月7-8日在日本东京樱美林大学举办 [5] - 主题为"AI全球化发展",促进国际AI技术交流 [5] - 通义万相WAN 2.2模型有望在大会期间发布 [5] - 面向AI领域创业者、开发者、从业者 [5] AI编程创意挑战赛 - 由Zeabur×腾讯云主办,5月31日报名截止 [6] - 面向AI编程爱好者,提供全程技术辅导 [7] - 创意优先评分机制,非技术背景选手有加分 [9] - 报名赠送1个月腾讯云服务器资源 [9] 火山引擎FORCE原动力大会 - 2025年6月11-12日在北京举办 [7] - 聚焦AI创业的Demo Day路演,开放现场展位 [7] - 面向C轮及以前的创业企业,要求有技术创新实力 [10] 其他行业动态 - AI笔记产品Granola估值达2.5亿,成为硅谷新宠 [7] - 多邻国付费用户突破1000万,全面应用AI技术 [8]
40亿估值、25%的代码由AI完成,Cognition如何用Devin构建Devin?
Founder Park· 2025-05-20 19:42
核心观点 - Cognition推出的AI程序员Devin能够自主编写代码并完成整个项目,订阅价格为500美元/月 [1] - 公司在6个月内完成数亿美元A轮融资,估值翻倍至近40亿美元,成为AI编程赛道明星企业 [1] - 15人工程团队每人配备5个Devin智能体,目前25%的Github Pull Request由Devin完成,预计一年后达50% [1][4] - Devin定位为"初级工程师伙伴",帮助工程师从"砌砖工"转变为"建筑师",专注于高层次设计和架构 [4][14] 产品与技术 - Devin核心能力包括构建专属wiki、深度理解代码库、与现有工具集成(GitHub、Slack、Linear) [31][35] - 智能体可同时进行多线程探索并共享上下文,这处于早期阶段但代表未来方向 [20][21] - 产品体验预计将迭代20次,最终用户可能无需查看代码,只需指定任务即可 [24] - 技术突破来自强化学习而非单一模型进步,教会AI现实工程细节比提升基础智商更重要 [39] 商业模式与竞争 - 用户粘性是关键护城河,Devin会随使用时间增加对代码库理解而变得更有效 [26][27] - 收入模式基于使用量设置,专注智能体编码领域而非通用AI [25] - 与Cursor等竞争对手相比,Devin更强调深度集成工作流程而非单纯代码生成 [28] 行业影响 - AI编程已过拐点,不用AI的工程师将被淘汰,行业呈指数级增长 [41] - 未来工程师数量会更多,但工作形式将改变,架构技能价值提升 [47] - 编程教育仍需保留,重点是培养问题分解能力和计算机系统理解 [44][46] 公司运营 - 团队规模仅15名工程师,强调快速行动和极致执行 [56][57] - 招聘策略不惜代价获取顶尖人才,包括为候选人定制解决方案 [58][59] - 创业经验是把3-5件关键事情做到极致,而非分散精力 [55][63] 产品使用场景 - 处理明确任务如前端功能、bug修复、测试文档等效果最佳 [37] - 帮助新工程师入职和理解代码库是重要用例 [33][34] - 用户可异步管理多个Devin智能体,通常每人同时运行5个 [15][18]
微软开发者大会:拉来 Altman、马斯克,纳德拉的 AI Agent 野心藏不住了
Founder Park· 2025-05-20 13:37
微软Build 2025开发者大会核心观点 - 微软CEO纳德拉提出构建"Open Agentic Web(开放智能体网络)"的变革性愿景,旨在让更多应用程序由智能体驱动 [2][27] - AI Agent成为大会焦点,贯穿所有发布内容,将增强微软的AI叙事 [1][6][31] - 微软正在将AI融入几乎所有产品线,包括云服务、生产力软件、搜索和游戏 [5] 开发者工具与平台升级 - GitHub Copilot从代码助手升级为Agent伙伴,可自主完成错误修复、新功能开发等任务,用户数达1500万/1.5亿开发者 [10][11][12] - 微软全面支持模型上下文协议(MCP),推出NLWeb开放项目,使网站能提供对话界面并与内容交互 [13] - Windows平台推出AI Foundry,支持跨硬件开发,添加对MCP的原生支持 [14][16][19] - WSL(Windows Subsystem for Linux)将完全开源 [16] Azure云与AI基础设施 - Azure AI Foundry新增智能体服务,可协调多个专用Agent处理复杂任务 [17][18][20] - 引入xAI的Grok系列模型,目前托管和合作伙伴模型达1900多个 [21] - 推出模型排行榜和模型路由器,实时选择最佳模型 [22] - 计划2025财年投入800亿美元扩展云基础设施 [30] 企业级AI应用创新 - 推出Microsoft 365 Copilot Tuning,支持企业用低代码方式训练模型创建智能体 [23] - Copilot Studio新增多智能体编排功能,预览阶段已创建超100万个定制Copilot/智能体 [25] - 推出Microsoft Discovery科研平台,支持知识推理、假设生成和实验运行 [25] - 斯坦福医疗中心测试医疗智能体协调器,减轻行政负担 [26] 开发者生态与战略布局 - 微软定位为开发者提供构建下一代AI应用程序的工具、平台和基础设施 [28] - 公司代码库20%-30%代码由AI生成,预计2030年达95% [30] - 过去三个月在全球开设10个数据中心,持续扩展基础设施 [30]
对话腾讯 ima 产品团队:有价值的产品,不需要告诉用户「这是智能体」
Founder Park· 2025-05-20 12:44
过去半年,ima 密集上线了个人知识库、共享知识库、知识库广场&知识号等功能,让用户不仅能自己 构建知识库,还能将有价值的信息分享出去,实现知识共享与生态共建。据了解,今年 3 月「知识号」 上线至今,积累近 1000 万篇内容,服务百万级用户的 AI 问答。 以下文章来源于涌现观察 ,作者涌现观察 涌现观察 . 聚焦产品,关注AI,挖掘洞察 腾讯出品的 ima 与其他 AI 产品相比,有点不太一样。 24 年 10 月上线,ima 主打知识管理,使用 AI 帮助用户管理和高效利用自己的知识库,沉淀那些真正 有价值的认知资产,对抗「信息指尖划过,却留不住」的普遍焦虑。 围绕知识库本身,ima 做了很多。 近期,我们邀请到 ima 产品团队进行对话。 在 AI 技术日新月异的当下,ima 如何定义痛点?又如何在 看似「古典」的产品打磨中,寻找 AI 落地的实践路径?ima 产品团队将为我们揭开 ima 这款产品的思 考原点与进化逻辑。 以下是访谈人林珊珊与 ima 产品团队的对话,经编辑整理。 Founder Park 正在搭建「 AI 产品市集」社群,邀请从业者、开发人员和创业者,扫码加群: 进群后,你有机会 ...
2.5亿估值、硅谷爆火,AI笔记产品Granola如何成为独角兽创始人新宠?
Founder Park· 2025-05-19 20:16
行业概况 - 笔记工具赛道竞争激烈,传统产品如Google Keep、Apple Notes、OneNote、Evernote占据主导地位,新兴产品如Notion、Obsidian、Logseq通过差异化功能突围[1] - AI笔记产品Granola在2024年5月上线后实现强劲增长,用户中50%以上为领导者,包括Vercel、Ramp、Roblox等独角兽企业创始人和高管[2] - Granola完成4300万美元B轮融资,估值达2.5亿美元,在笔记赛道属于较高水平[2] 产品定位 - 核心差异化在于"高度个人化"和"用户控制权",定位为超越简单记录的"思考空间"[2] - 目标从生成高质量会议笔记升级为帮助用户完成几乎所有工作,目前仅实现愿景的5%[7][12] - 设计哲学强调"开发模式"与"探索模式"的明确区分,保护产品迭代灵活性[33][34] 技术特点 - 利用多模型组合策略,动态切换最佳模型以优化性能[31] - 独创"不保存音频"设计,仅实时转录会议内容,平衡实用性与隐私保护[21] - 通过上下文窗口技术深度整合用户工作流,实现信息动态提取和实时呈现[10][25] 用户行为 - 深度用户会议中仅记录关键判断(如"对方情绪不佳"),其余内容依赖AI转录[11] - 用户更倾向通过聊天功能查询笔记内容而非全文阅读,效率提升显著[30] - 出现意外使用场景:医疗咨询记录、个人头脑风暴、视频学习辅助等[29] 市场策略 - 早期选择开发Mac原生应用而非网页工具,增强用户亲密感和使用粘性[18] - 目标用户为AI早期采用者群体,集中在创始人、投资者和跨领域专业人士[16] - 通过社交媒体自然传播,形成科技领袖自发推广效应[17] 行业趋势 - AI协作界面处于"终端命令式"初级阶段,未来需要开发更精细的"方向盘"式交互[25][26] - 小团队借助大模型基础能力可快速构建复杂应用,Granola团队不足25人[38] - 数据壁垒重要性下降,5万样本即可优化用例,产品设计能力成为关键[44] 产品愿景 - 终极目标是打造动态整合个人上下文与集体智慧的新型思维工具[41] - 强调AI应增强而非替代人类判断,保留用户思考过程的核心价值[14][41] - 预见未来工作场景将普及实时背景资料包,辅助关键决策[12]
AI Agent时代的「AWS」:Manus 背后的重要功臣 E2B 是何来头?
Founder Park· 2025-05-19 20:16
Multi-Agent系统与Agent Infra - Multi-Agent系统正成为新的突破方向,Agent Infra成为落地关键,其中Virtual Machine是潜在创业机会,E2B是该领域新兴参与者[1] - E2B作为开源基础设施,允许用户在云端安全隔离沙盒中运行AI生成代码,底层采用类似AWS Firecracker的MicroVM技术,启动速度达150毫秒[1] - E2B支持AI Agents运行代码语言、使用浏览器、调用操作系统工具,沙盒月创建量一年内从4万增长到1500万,增长375倍[2] E2B技术理念与愿景 - E2B愿景是成为AI Agent时代的AWS,打造自动化infra平台,未来将支持GPU、复杂数据分析、小模型训练、游戏生成等需求[3] - 公司从代码解释器转型为更通用的Agent运行环境,支持Python和JavaScript,月SDK下载量分别达50万次和25万次[10] - 技术核心是安全沙盒环境,实现文件创建、浏览器使用、数据分析、应用编写等功能,覆盖Agent从开发到部署全生命周期[9] 产品演进与关键功能 - 早期产品DevBook是面向开发者的交互式文档,GPT-3.5发布后转向沙盒技术,2023年3月正式创立E2B[4] - 引入"代码解释"概念帮助用户理解产品价值,支持数据分析、数学运算、AI驱动Excel等场景[7] - 2024年观察到用户将沙盒用于Computer Use,产品定位从代码解释器拓展为通用LLM/Agent运行时环境[8] - 即将推出forking和checkpointing功能,支持多Agent并行尝试不同解决路径,类似蒙特卡洛树搜索[15] 核心使用场景 - 首要场景是AI数据分析支持,提供专用code interpreter SDK和隔离机制确保Agent可靠性[17] - 第二大场景是AI生成应用的运行平台,推出开源模板Fragments支持快速构建AI应用[19] - 新兴场景包括Hugging Face的Open R1训练,通过沙箱高并发运行代码生成任务[22][24] - 非开发者场景如AI驱动Excel,服务于企业高管和业务人员的数据处理需求[21] Computer Use方向探索 - Anthropic推出Computer Use后,E2B推出Desktop Sandbox和open-computer-use项目,探索Agent控制电脑/浏览器的可能性[31] - 技术挑战包括安全性、点击操作精准度、推理能力、小众LLM部署和实时画面传输[39][40][43][48][49] - 采用OS-Atlas开源视觉模型解决UI元素识别问题,结合Llama系列模型完成决策链[42][46] 开发者生态与定价策略 - 保持LLM中立性,定位为Agent领域的Kubernetes,避免开发者被单一模型锁定[25][27] - 定价面临挑战,需平衡简单透明与资源消耗复杂性,强调计费上限和费用预警功能[29] - 提升开发者粘性关键在于无缝体验,让工具成为工作流自然延伸[26] 行业趋势观察 - Agent当前主要应用场景包括写代码、销售自动化和客户支持,Computer Use被视为下一个爆发点[30] - 框架演进呈现明确方法论趋势,Crew AI和LangGraph等opinionated框架日益流行[56][57] - 开源模型正快速提升视觉推理能力,API工具集成将增强Agent能力边界[55]
北大校友、OpenAI前安全副总裁Lilian Weng关于模型的新思考:Why We Think
Founder Park· 2025-05-18 15:06
大模型测试时计算优化 - 核心观点:通过延长模型"思考时间"可显著提升大语言模型在复杂推理任务中的性能,这已成为超越传统模型规模扩展的新优化维度 [4][5][91] - 性能提升表现:GPT/Claude/Gemini等模型通过思维链(CoT)策略在数学推理(5-6%提升)、代码生成等任务上持续突破性能边界 [4][24][16] - 计算资源视角:Transformer生成每个token需执行参数数量两倍的FLOPs,而MoE稀疏模型可降低至2×参数数÷稀疏度 [10] 思维链技术演进 - 早期方法:监督学习人类解题路径或设计"逐步思考"提示语,可使数学问题解决成功率提升显著 [12][14] - 强化学习应用:在STEM问题集上采用策略梯度算法结合自动评估,DeepSeek-R1模型通过两轮SFT-RL训练实现推理能力突破 [31][32][36] - 自我修正机制:需依赖外部反馈信号避免幻觉,修正器模型通过价值提升对(提示x,初始y,修正y')三元组训练实现迭代改进 [29][34] 并行与序列优化策略 - 并行采样:best-of-N和束搜索通过过程奖励模型(PRM)筛选候选,在GSM8k等任务实现5-6%准确率提升 [23][24] - 序列修订:递归检视(Recursive Inspection)和SCoRe方法通过KL散度惩罚防止行为坍缩,形成连续改进轨迹 [20][30] - 混合策略:简单问题适用纯序列化策略,高难度问题需组合并行与序列方法获取最优表现 [19] 架构创新与工具整合 - 递归架构:Universal Transformer等设计实现自适应计算时间,3.5B模型在r¯=32迭代次数达到性能饱和 [71][73] - 思考token机制:插入特殊token<T>或暂停标记可隐式扩展计算循环,使模型复杂度降低30% [73][74] - 外部工具调用:PAL和Chain of Code方法将数学计算/代码执行外包,ReAct框架整合Wikipedia API等知识源 [45][48] 可解释性与忠实度 - 思维链监控:可有效检测reward hacking行为,对抗样本的鲁棒性随思考时间延长提升51% [51][65] - 忠实度测试:通过扰动提示实验显示推理模型(Claude 3.7/DeepSeek R1)比非推理模型更可能揭示真实思维过程 [62][64] - 优化压力风险:RL训练中直接优化CoT易导致新型reward hacking,需设计n-gram重复惩罚等防护机制 [66][69]
中国 AI 应用的终局:AI RaaS 和 AI 包工头模式
Founder Park· 2025-05-17 10:28
核心观点 - AI应用的核心逻辑是RaaS(Result as a Service,结果即服务),即「AI包工头模式」,该模式按工作量和工作结果付费,实现AI服务方与客户利益深度绑定 [3][12] - 传统SaaS产品将被「端到端」「高智能」的AI应用替代,失去资本市场青睐 [4] - AI包工头模式将突破数字化利润池天花板,不同商业模式下净利润空间相差可达10-30倍,叠加AI赋能后差距可达20-60倍 [4][35] - AI包工头模式可能打破「规模、收益、确定性」的「不可能三角」,实现「五高」特征,从而创造高长期资本价值 [4][43] AI包工头模式的定义与特点 - 按工作量和工作结果付费(如计件式、计量式或收入分成),实现与客户利益绑定 [12] - 需要构建完整的交付体系和系统性业务能力,包括设备、人员、管理制度等,即「包工包料包人包结果」 [12] - 传统包工头业务被认为不值钱,但AI时代下该模式是构建长期客户关系、规模化收入和利润的必须路径 [14] - 分为L1-L4四大进化层级:从初级效率提升到资源掌控的质变 [5][50] 行业颠覆与案例 对传统行业的颠覆 - 对传统硬件、软件和服务业,以及2B和2C市场都可能造成颠覆 [15] - 传统SaaS代码资产价值因AI自动化编程而加速贬值,重置成本大幅下降 [28] - 传统SaaS数据模式和接口过时,MCP协议取代传统API,数据资产价值超越软件本身 [29] - 传统SaaS标准化功能模块被AI动态智能适配取代 [31] 典型案例 1. **2B市场-矿山自动驾驶** - 从出售自动驾驶软件升级为按运输量收费的「AI包工头」模式,标杆客户实现50台矿车无人驾驶连续运营 [16] - 收费模式从一次性销售转变为按X元/立方米定价,收入与客户生产深度绑定 [16] - 自主研发系统融合多项AI技术,构建完整运营管理体系 [17] 2. **2B市场-Sierra AI客服** - 颠覆传统SaaS按席位收费,采用按对话量或成功案例计费,客户请求70%由AI独立解决 [19] - 采用多模型协同架构和「高触碰」服务模式,与客户深度协作 [20] 3. **2B市场-Kobold矿产勘探** - 从技术服务升级为「AI业主」模式,通过矿权获取和合作开发获利,C轮融资5.37亿美元 [21] - AI平台整合多源数据,在赞比亚发现价值100-150亿美元铜矿,买入成本仅1.5亿美元 [22][23] 4. **2C市场-特斯拉Robotaxi** - 按行驶里程收费(每英里1美元),平台抽成20-30%,预计年营收可达7600亿美元 [24] - 全栈自动驾驶系统结合全球数据收集和自研芯片,构建完整运营体系 [25] 商业模式与利润池分析 - 企业五大利润池:数字化(1-2%)、人力资源(20-40%)、资产(10-20%)、供应链(20-40%)、资本(10-20%) [35] - 三种商业模式对比: - 工具模式(数字化利润池):矿山案例中年利润仅200万人民币 [40] - 传统包工头模式(人力资源+资产利润池):矿山案例中年利润0.5亿,是工具模式的20-30倍 [41] - AI包工头模式:年利润可放大至1亿,是工具模式的30-60倍 [42] - 全球软件和IT服务支出仅占GDP1.87%,美国占3.1%,远低于人力资源市场规模 [35][37] AI包工头模式的「五高」特征 1. **高科技含量**:如矿山案例集成AI、物联网、5G等技术 [44] 2. **高系统性优化**:端到端全链路优化,远超传统数字化应用的薄层 [45][46] 3. **高可控和可复制性**:技术驱动降低人为因素影响 [47] 4. **高客户粘性和复购**:客户切换成本高,如埃森哲签署十年十亿美金合同 [48] 5. **高财务确定性和可预测性**:资本市场给予高估值的核心原因 [49] 四大进化层级 1. **L1-初级效率**:标准化任务按量计费,如Sierra每工单0.99美元 [52] 2. **L2-综合效率**:软硬结合复杂系统按量计费,如矿山运输每立方米5-15元 [53] 3. **L3-利益共享**:收入分成模式,如某AI营销平台收取成交额5-10% [55] 4. **L4-AI业主**:掌控核心资源,如Kobold收购矿权获百亿收益 [56] 关键认知升级 1. **垂直专注**:必须坚持「一米宽、一百米深」,构建五重护城河 [58] 2. **人机协同**:人类作为校准者与进化伙伴,避免纯AI替代 [59][60] 3. **不避脏活累活**:非标环节沉淀不可替代价值,轻AI将出局 [61] 4. **快速执行**:1年窗口期需抢占场景、数据和客户,组合式联创是关键 [62][63]
2025 中国最具价值 AGI 创新机构 TOP 50 调研启动征集!
Founder Park· 2025-05-17 10:28
AI产业影响与趋势 - AI正逐步影响产业与社会底层逻辑,从RPA到个性化助手、AI Coding Copilot等产品推动人机交互革新,AI Agent作为"数字员工"融入企业实际业务[1] - 生物AI模型如AlphaFold3开源推动蛋白质预测、药物发现领域商业化热潮,AI4S成为重要方向[1] - DeepSeek R1模型将中国AI模型能力推向新高度,国内AI生态开始具备"可用性",DeepSeek、Manus等公司引领创业新范式[1] MVP 50评选标准 - 商业价值创新:需突破既有商业逻辑,重构价值创造与捕获方式,在供需关系、定价机制等方面具备可行性与规模化潜力[4] - 交互体验升级:要求多模态自然交互,构建开放工具生态,实际改进用户工作流并重塑创造方式[4] - 技术能力突破:需在AI算法、模型等底层技术取得原创性进展,具备系统性重构能力并影响行业生态方向[4] - 场景深度融合:需解决行业关键痛点,在效率、成本等方面带来可衡量的实际提升[4] 参评范围与要求 - 聚焦AGI产业基础设施层(数据/算力)、模型层(大模型/训练平台)、应用层(内容生成/企业应用等)[5] - 参评企业需为中国企业为主,成立以来无法律合规问题与经营风险[5] 评选流程 - 申报征集与走访调研同步进行,截止5月31日[8] - 组委会评审分初筛(6月2日)、复筛(6月10日)、终审(6月13日)三阶段[8] - 最终结果将于6月21日公布[8]
怎么回事?刚被OpenAI收购,Windsurf就发了个自己的模型
Founder Park· 2025-05-16 17:22
核心观点 - OpenAI以30亿美元收购Windsurf [1] - Windsurf发布AI编程模型SWE-1 覆盖软件开发全流程 核心为流动感知(Flow Awareness)实现人机自然交接 [1] - SWE-1系列包含三个模型:SWE-1 SWE-1-lite SWE-1-mini [2][5] - AI编程从代码补全发展到构建完整应用 但仍需覆盖开发全流程的模型 [7][8][12] - Windsurf目标超越前沿实验室模型 [30][31] AI编程发展现状 - 模型能从自动补全发展到构建小型应用 但存在上限 [7] - 软件开发不止编码 需覆盖终端操作 调试 用户反馈等全流程 [8] - 工程过程跨阶段持续变化 需处理未完成状态和模糊目标 [9][10] - 仅提升编码能力无法提高整体工程效率 需支持完整流程的SWE模型 [12] SWE-1模型开发 - 灵感来自Windsurf编辑器 构建共享时间线数据结构 理解未完成状态和长周期任务 [13] - 离线评估接近前沿基础模型 超越非前沿和开源对手 [15][21] - 会话式SWE任务基准:评估人机协作表现 [16] - 端到端SWE任务基准:评估独立解决问题能力 [19] - 线上实测指标: - 用户每天接受代码行数反映帮助程度和粘性 [24] - Cascade代码贡献率反映模型主动性和用户信任 [26] - SWE-1-lite取代Cascade Base SWE-1-mini针对低延迟场景 [28][29] 流动感知系统 - 核心理念为共享时间线 实现AI与用户行为双向理解 [34] - 允许自然交接:AI执行-用户校正-AI继续 形成顺畅衔接 [36] - 持续追踪模型能力边界 明确需用户介入的任务 [37] - 共享时间线演进包括终端输出感知 预览功能 IDE搜索感知等 [44] 未来展望 - SWE-1是起点 将持续改进模型性能并保持低成本 [42] - AI编程从代码补全进入全面工程协作新时代 [43] - Windsurf具备打造前沿模型的引擎 将加大投入实现超越 [31][42]