Founder Park
搜索文档
Karpathy:我不是要造新词,是「上下文工程」对 Agent 来说太重要了
Founder Park· 2025-07-04 21:10
上下文工程概念 - 决定AI应用效果的关键在于提供完整且恰当的上下文而非单纯优化提示词[3] - 上下文工程是一门精妙的艺术与科学需精准填充信息包括任务描述示例RAG多模态数据工具等[7] - 上下文窗口需平衡信息量与相关性过量或不足均影响性能[7] 与提示词工程的区别 - 提示词仅为用户输入的文本指令如让ChatGPT总结文本[16] - 提示词工程是系统化设计测试优化提示词的方法论类似软件工程[17] - 上下文工程是动态系统设计在正确时间以正确格式提供信息与工具[19] - 三者关系:提示词是输入文本提示词工程优化过程上下文工程构建动态系统[20] 重要性体现 - AI Agent效能核心取决于上下文质量而非代码复杂度[24] - 案例对比:普通Agent仅处理简单请求而优质Agent整合日历历史邮件等上下文实现高效响应[25] 落地策略分类 写入上下文 - 草稿板机制持久化保存任务计划避免token截断[31] - 长期记忆跨会话存储如ChatGPT的生成式记忆[32][35] 筛选上下文 - 从草稿板或记忆中提取相关片段如少样本示例或指令[37][38] - 工具选择采用RAG技术提升3倍准确率[41] - RAG挑战包括代码索引与语义分块需结合知识图谱检索[42] 压缩上下文 - 自动摘要技术处理长交互如Claude Code的95%窗口压缩[43] - 修剪策略包括硬编码规则或训练专用裁剪模型[46] 隔离上下文 - 多Agent架构分配独立上下文窗口专注子任务[48][50] - 沙盒环境隔离消耗性资源如HuggingFace的CodeAgent[53][54] - 运行时状态对象选择性暴露字段实现隔离[55] 行业动态 - Andrej Karpathy强调工业级LLM应用中上下文组件复杂性被低估[10] - LangChain与DeepMind工程师推动上下文工程方法论标准化[3][56]
PH最佳产品周榜(6.23-6.29),3款华人AI产品上榜
Founder Park· 2025-07-04 21:10
Product Hunt 一周最佳AI产品Top10盘点 - 近一周(6.23-6.29)Product Hunt平台Top10产品中,3款由华人团队开发的AI产品入选,包括AI编程辅助工具Dyad、AI业务管理平台HeyBoss AI Boss Mode和无编码智能AI助手Runbear [3] 核心产品分析 TOP1: Pally (AI关系管理工具) - 整合多社交平台联系人信息,通过AI自动搜集分析联系人在线动态,提升人脉管理效率 [6][7] - 目标用户为需要频繁维护职业关系的职场人士和销售人员 [8] - 数据表现:获得1017个Upvote和173条评论 [9] TOP2: Twenty (开源CRM) - 定位为Salesforce的可定制替代方案,提供完全开源、无供应商锁定的CRM平台 [13] - 支持高度可定制数据模型和强大自动化功能,通过API实现无缝集成 [13] - 数据表现:获得983个Upvote和127条评论 [13] TOP3: mysite.ai (AI网站构建平台) - 通过对话式AI在2分钟内完成网站搭建、内容生成和潜在客户捕获 [16] - 目标用户为缺乏技术背景的小企业主和独立创作者 [16] - 数据表现:获得758个Upvote和91条评论 [17] TOP4: Pythagora (AI全栈开发平台) - 通过自然语言对话实现从需求分析到部署的全流程自动化,将开发周期从数月缩短到数小时 [20][21] - 目标用户为中小型开发团队和创业公司 [21] - 数据表现:获得707个Upvote和54条评论 [22] TOP5: FlashDocs API (幻灯片生成工具) - 通过API调用将Markdown/JSON内容自动转换为品牌一致的演示文稿 [26] - 目标用户为数据分析师、销售团队和技术开发者 [26] - 数据表现:获得677个Upvote和70条评论 [27] TOP6: HeyBoss AI Boss Mode (华人团队) - 全自动AI业务管理平台,整合AI CEO、设计师、开发者等多角色,数分钟内完成网站设计和业务运营 [31] - 创始人Xiaoyin Qu曾创办Run The World并成功出售,有Facebook和Instagram产品管理经验 [32] - 数据表现:获得639个Upvote和87条评论 [33] TOP7: Ops AI by Middleware (AI观测平台) - 通过AI自动检测、诊断和修复生产环境问题,整合基础设施监控、APM、日志等多源数据 [35][36] - 目标用户为开发团队和SRE [36] - 数据表现:获得608个Upvote和140条评论 [38] TOP8: NativeMind (本地AI助手) - 完全在用户设备上运行的浏览器AI助手,确保数据隐私和高速响应 [40] - 目标用户为注重隐私保护的个人用户和开发者 [40] - 数据表现:获得607个Upvote和52条评论 [42] TOP9: Runbear (华人团队) - 无代码AI助手构建平台,集成于Slack等工具,通过自然语言聊天创建定制化AI团队成员 [45] - 创始人Snow Lee曾成功创办并出售两家初创公司 [46] - 数据表现:获得599个Upvote和69条评论 [48] TOP10: Dyad (华人团队) - 免费开源且本地运行的AI编程辅助工具,支持多种AI模型,无需订阅费用 [49] - 创始人Will Chen曾任谷歌高级软件工程师 [50] - 数据表现:获得569个Upvote和43条评论 [51]
120页深度报告,搞懂今年大模型和应用的现状与未来
Founder Park· 2025-07-03 19:07
模型篇 - 基础模型训练成本五年内增长近两个数量级 从2020年GPT-3的450万美元增至2025年Llama 4的3亿美元[3][6] - 模型生命周期急剧缩短 闭源前沿模型的领先地位可能在6-12个月内被颠覆 如GPT-4在一年后被成本低10倍的开源模型DeepSeek-VL超越[6] - 开源模型性能快速收敛闭源模型 新模型在排行榜前五保持领先的中位数时间仅3周[8] - 行业从追求参数规模转向计算效率 新一代顶尖模型如Claude 3.5 Sonnet参数规模反而下降[12] - 推理计算成为新前沿 30亿参数模型通过深度思考可超越700亿参数大模型的数学能力[16] - 混合专家模型(MoE)架构普及 通过部分参数激活降低单次推理成本[22] 技术突破 - 自监督学习突破数据规模化瓶颈 允许模型从海量未标注数据学习[24] - 注意力架构(Transformer)实现计算效率革命 完美契合GPU并行计算特性[25] - 模型规模达到临界点后出现"涌现"能力 性能从随机猜测跃升至高度准确[26] - 参数量三年增长15,500倍 远超摩尔定律的两年翻一番[27] - 上下文窗口扩展100-500倍 从数千token增至百万级[28][34] - 多模态能力持续进步 但全能模型(Omni-modal)仍处早期阶段[28] 应用篇 - AI代码生成工具形成20亿美元市场 Cursor创SaaS最快增长记录 年收入近10亿美元[42] - YC创业公司中25%的代码库95%由LLM生成 标志"氛围编程"时代到来[44] - 软件工程全生命周期被重塑 从代码审查到测试QA各环节都出现AI工具[45] - 专业Copilot矩阵快速扩张 覆盖硬件/创意/工程/金融等领域[47][48] - AI个人生活整合加速 核心用例从"生成想法"转向"治疗/陪伴"和"生活管理"[52] 市场动态 - 2024年全球风险投资10.5%流向基础模型公司 总额330亿美元[112] - OpenAI收入结构分化 73%来自ChatGPT订阅 Anthropic 85%来自API[119] - AI原生应用ARR超12亿美元 Midjourney/Cursor/ElevenLabs等突破1亿美元[130][133] - 物理世界AI公司获巨额融资 Figure AI获6.75亿美元 OpenAI/微软等参投[127][128] - GPU生态系统重塑 英伟达AI推理token生成量一年增长十倍[139] 未来趋势 - 软件开发范式迁移 CI/CD/Git等传统流程面临AI适配挑战[152] - 数据即服务(DaaS)复兴 LLM使数据收集/结构化成本降低1000倍[156] - 创意工具护城河转向网络效应/运行环境/工作流特异性[158] - AI与科学结合催生"生成+验证"闭环系统 如AI科学家[161] - 智能体基础设施需求爆发 需专用浏览器/支付系统/身份认证[161]
奖金 30 万!征集 AI 硬件的下一个爆款
Founder Park· 2025-07-03 19:07
AI+硬件行业趋势 - 具身智能尚未成熟但AI+硬件已进入商业化落地阶段,市场涌现LOOI、Oura Ring、PLAUD、Ropet等热门产品 [1] - 2025年多模态模型技术实现突破,图片、语音、视频生成能力显著提升 [1] - 行业正推动AI硬件渗透厨房、卧室、客厅等生活场景以重构用户体验 [2] AI硬件产品定义 - 需聚焦真实生活痛点,通过AI算法+物理交互硬件解决需求 [3][5] - 核心特征包括:融合感知/识别/预测等AI能力、实现自然人机交互、面向消费级生活场景 [6] - 创新重点在于AI驱动的交互体验提升或痛点解决,不局限于大模型终端 [5][6] AI硬件开发大赛 **参赛要求** - 团队规模≤10人,个人或团队均可报名,产品需聚焦实际问题解决 [10] - 接受从0到1的创新构想及已有验证项目,开发工具需符合数据合规要求 [10] - 报名截止8月4日20:00,期间可调整团队信息 [8][10] **赛程安排** - 初赛方案提交截止8月4日,8月8日公布30强 [9] - 复赛Demo开发期8月8日-25日,8月28日决出10强 [9] - 决赛路演定于9月11日,线上投票8月8日启动选TOP5人气奖 [9] **奖励机制** - 总奖金28.5万元:一等奖10万元、二等奖5万元×2、三等奖2万元×3、人气奖5000元×5 [9] - 展示资源包括外滩大会舞台、投资人对接及科技集市曝光 [9] - 学生获企业HR直通卡,创业者享办公免租、经营免税等政策支持 [9]
Chatbot,是一种懒惰的产物
Founder Park· 2025-07-02 20:24
聊天界面的局限性 - 聊天界面本质上是懒惰的产物,是AI产品最低成本上线的解决方案[1][4][5] - 当前主流AI产品界面高度同质化,底部消息框、聊天气泡、侧边栏历史记录成为标配[7] - 聊天界面要求用户适应系统,而非系统适应用户,违背UX设计原则[5][8][12] 聊天界面的效率问题 - 用户11%-27%的计算时间耗费在与AI的低效交互上,26%的问题最终未解决[11] - 基于聊天的AI工具将50%潜在用户拒之门外,存在根深蒂固的可用性问题[12] - 80%企业AI项目因用户接受度低而停滞,聊天界面成为业务"终结者"[12] 成功AI产品的设计案例 - GitHub Copilot通过内联建议实现56%生产力提升,无缝融入开发者工作环境[16] - Microsoft 365 Copilot被70%财富500强采用,AI能力直接嵌入工作场景[16] - 成功案例证明AI应赋能现有工作流,而非取代为劣质交互模式[16][23] AI产品设计新框架 - 提出"混合工作空间"模型,包含工作环境和智能层两个核心组件[17][18] - 智能层应具备上下文感知、渐进式呈现、融入工作流、降低认知负荷等特性[27] - 设计切入点包括内联建议、上下文面板、UI元素增强和环境智能[20] 行业未来发展趋势 - 到2025年,"聊天优先"模式公司将难以与工作流原生AI体验公司竞争[5][28] - 生成式UI将成为趋势,为特定场景动态生成定制化界面[25] - 技术壁垒将形成护城河,工作流集成能力成为核心竞争力[28] 设计思维转变 - 需从交互设计师转变为工作流架构师,系统性思考人机协作[23][26] - Google设计团队强调通过"上下文集成"而非"对话式交互"平衡人机关系[24] - 未来AI设计应让用户感觉"AI懂工作方式",而非取代原有方法[29]
Notion 最近怎么用 AI:模块化很有用!
Founder Park· 2025-07-02 20:24
Notion AI的核心架构与设计理念 - Notion AI的核心能力在于深度理解工作空间内的信息结构与内在关联,而非简单关键词搜索[1] - 公司基于模块化「块」架构构建AI系统,每个块(文本/任务/数据库)都是包含元数据和关联关系的小容器,类似乐高积木[1][8] - 这种架构带来深度结构化的上下文信息,有效降低AI幻觉并增强逻辑理解能力[1][8] 产品功能创新 - 2023年5月推出AI Meeting Notes功能,能将会议笔记无缝融入现有工作流程[1] - 正在向All-In-One AI平台转型,AI深度集成至产品核心架构而非附加功能层[1][4] - 模块化设计使产品具备快速迭代能力,通过LLM裁判系统实现持续性能评估[6] 技术实现路径 - 采用多模型匹配策略,根据任务类型(推理深度/速度/成本)分派最优模型[5][10] - 长文生成调用高级推理模型[10] - 历史查询使用长上下文窗口模型[10] - 高频低复杂度任务采用微调的高性价比模型,延迟降低50%[10] - 建立复合型AI专家团队,结合QA/提示词工程/产品思维优化模型表现[6] 结构化数据优势 - 结构化知识图谱使AI能执行复杂操作:构建项目跟踪器/跨团队汇总进展/基于真实数据推理路线图[11] - 日期等数据在Notion中具有任务关联属性,支持「逾期任务分配部门」等语义化查询[8] - 模块化架构催生全新工作流,实现模型智能分配与产品深度集成[11] 行业社群建设 - 运营超8000人的AI产品市集社群,面向从业者/开发者/创业者提供新品资讯和资源[4] - 社群提供精准曝光渠道及新品邀请码等福利[4]
跟着Google出海:教你怎么落地Gemini
Founder Park· 2025-07-01 23:07
活动核心内容 - AI模型能力已非瓶颈,关键在于如何将模型落地转化为商业价值 [1] - 联合Google推出「从模型到行动」系列AI工作坊,覆盖深圳、上海、北京三地线下专场 [1] - 目标行业包括泛娱乐、游戏、电商、智能制造等领域的开发者与创业者 [1] 活动提供内容 - 呈现Gemini模型系列及其先进推理能力,分享Google开放模型Gemma最新动态 [3] - 沉浸式动手实操环节:调用Gemini多模态能力处理图像、视频、音频及跨语言场景 [4] - 提供分层挑战项目、Google工程师设计的实操模板与代码资源,经验可复用至业务场景 [4] 活动日程安排 - 线下工作坊为期半天(约3小时),后续推出线上延展活动 [5] - 深圳站:7月12日 Google深圳办公室 [11] - 上海站:7月20日 Google上海办公室 [11] - 北京站:7月26日 Google北京办公室 [11] 目标参与人群 - 已有出海计划或服务海外市场的技术团队与创业者 [12] - 开发AI产品、Bot工具、AI视频/内容应用的开发者 [12] - 泛娱乐、电商、游戏等领域的技术决策者与工程师 [12] - 需快速理解Gemini多模态融合技术的工程师 [12] 活动附加价值 - 与其他优秀出海团队建立联系的机会 [10] - 获得Google团队一手技术反馈通道 [10] - 在工作坊中构建商业原型雏形 [10]
AGI落地观察:这款工具产品,如何进化为10亿人的AI学习助手?
Founder Park· 2025-07-01 16:27
AI浪潮下的学习工具变革 - AI技术正通过日常工具如词典类App悄然改变用户学习方式[1] - 网易有道词典入选「中国最具价值AGI创新机构TOP50」 与DeepSeek 腾讯元宝 字节扣子等共同代表AGI场景化落地可能性[2] 有道词典技术升级 - 2025年3月公司基于自研「子曰」翻译大模型2 0实现翻译精准度 专业性 表达自然度三重升级 稳居行业领先[4] - 通过垂直领域训练 算法创新及海量数据资源库 显著降低翻译幻觉率 解决通用大模型信息偏差问题[4] - 翻译功能支持PDF EPUB Excel等复杂格式处理 提升多场景适用性[6] 产品功能突破 - 学术论文 行业术语等专业领域翻译准确率显著提升 术语匹配与上下文理解能力增强[5] - 实现20余项AI功能集成 包括AI同传 拍照翻译 文档翻译解读等 覆盖学习 职场 留学高频场景[6] - 翻译结果符合母语者习惯 减少翻译腔 支持多语种环境[6] 市场表现与行业地位 - 连续六年(2019-2025)蝉联QuestMobile「中国互联网APP TOP50赛道用户规模NO 1」[6] - 从查词工具转型为10亿用户规模的AI学习助手 重塑语言学习方式[6]
Meta 宣布正式成立「超级智能实验室」,11人豪华团队中华人占大半
Founder Park· 2025-07-01 10:44
Meta成立超级智能实验室(MSL) - Meta宣布正式成立超级智能实验室(Meta Superintelligence Labs, MSL),整合公司现有的基础AI研究(FAIR)、大语言模型开发及AI产品团队,并组建专门研发下一代AI模型的新实验室 [1] - 该实验室将成为Meta人工智能战略的核心 [2] - Meta计划在未来几年投入数千亿美元于AI基础设施、模型训练、可穿戴终端与人才储备 [8] 重量级人物加盟 - Scale AI前CEO Alexandr Wang出任Meta首席AI官(Chief AI Officer),全面领导MSL [3] - 前GitHub CEO Nat Friedman加入,负责Meta在AI产品和应用研究领域的推进 [5] - Alexandr Wang是Scale AI联合创始人兼CEO,曾参与业内几乎所有领先模型的开发工作 [10] - Nat Friedman曾在微软领导GitHub,最近负责一家领先的AI投资公司,并担任Meta顾问委员会成员 [11][12] 人才招募情况 - Meta从OpenAI、Anthropic和Google等竞争对手处招募了11位AI顶尖人才 [5] - 包括多位GPT-4o和GPT-4.1核心成员、Anthropic高级工程师、DeepMind的Gemini模型负责人等 [5] - 部分顶尖研究人员获得价值数千万美元的股票激励,传闻签约奖金高达1亿美元 [8] - AI人才市场价格达到惊人水平,是20年科技职业生涯中前所未见的 [8] 下一代AI模型研发 - 新团队将启动Llama系列之后的下一代模型研发,目标是在一年内实现行业领先 [8] - 对Llama 4.1和4.2模型的规划进展感到兴奋,这些模型支持Meta AI核心功能,拥有超过10亿月活用户 [16] - 将同时继续深入开发现有模型,并着手下一代模型研究 [17] 公司优势与愿景 - Meta具备独特优势:强大业务基础、覆盖数十亿用户的产品经验、引领AI眼镜与可穿戴设备市场 [17] - 公司结构赋予更大决心和行动力,有望实现"人人拥有个人超级智能"的承诺 [17] - 目标是实现为每个人打造"个人超级智能"的愿景 [10]
2025 ToC AI产品:仅有3%用户愿意付费,29%的父母每天使用
Founder Park· 2025-06-30 19:47
消费级AI市场现状 - 消费级AI已融入大众日常生活 61%美国成年人在过去半年使用过AI 其中19%为每日用户 全球用户规模达17-18亿人[5][6] - 市场规模快速扩张 两年半内形成120亿美元产业 但付费转化率仅3% 与4320亿美元潜在市场规模存在巨大鸿沟[10][13] - 通用AI工具占据主导地位 91%用户默认使用通用助手 81%行业收入集中于通用平台 ChatGPT在付费用户中占比达70%[33][41] 用户画像与行为特征 - 千禧一代(29-44岁)成为重度用户 使用频率超过Z世代 婴儿潮一代(61-79岁)中45%尝试过AI 11%为每日用户[16][19] - 父母群体使用率显著更高 79%父母使用AI 是非父母群体(54%)的1.5倍 29%父母每日使用 频率达非父母1.9倍[26][29] - 使用强度与生活复杂度正相关 子女年龄越大 父母AI使用率越高 13岁以上子女父母使用率达45%[30][32] 核心应用场景分析 - 常规任务渗透率最高 19%用户用AI写邮件 18%用于待办事项管理 但整体采用深度不足20%[50][51] - 创意表达领域付费意愿最强 51%创作者使用AI辅助写作 专业工具收入占比达45% Midjourney等工具快速崛起[59][63] - 健康管理存在巨大空白 71%人群查询健康问题但仅20%使用AI 心理健康领域AI渗透率仅9%[71][72] 市场机遇与发展趋势 - 高频率高摩擦场景蕴含机会 82%人群管理财务但仅16%用AI 家庭维修需求中AI使用率仅13%[80][82] - 专业工具将迎爆发期 60%用户已组合使用通用与专业工具 医疗健康等信任敏感领域潜力显著[81][86] - 交互方式持续进化 语音AI与实体机器人将成新增长点 收入模式从订阅制向多元化发展[86]