Workflow
Founder Park
icon
搜索文档
一文读懂 Deep Research:竞争核心、技术难题与演进方向
Founder Park· 2025-06-26 19:03
深度研究系统生态现状 - 2025年AI Agent探索浪潮中,"深度研究"类产品成为最早成功落地的领域之一,谷歌、OpenAI、Anthropic等巨头已推出商业竞品,开源社区涌现80+团队参与[1] - 当前生态呈现显著差异化,竞争焦点转向系统架构、工程优化与应用场景适配度的综合比拼[1] - 评估体系从通用基准转向高度专业化测评,"适合与否"取代"好坏"判断[2] 技术实现与核心能力 核心技术差异 - 基础模型与推理效率:OpenAI/DeepResearch等商业系统依托专有大模型在上下文长度和复杂推理占优,Perplexity/DeepResearch通过优化开源模型实现竞争力[4] - 工具集成适应性:AutoGLM等构建全能平台,Nanobrowser专注网页交互,n8n擅长API集成与工作流自动化[5] - 任务规划稳定性:OpenAI/AgentsSDK长于层级化任务分解,Agent-RL/ReSearch利用强化学习提升鲁棒性,smolagents通过多智能体协作提升并行效率[5] 架构选型趋势 - 单体式架构(如OpenAI/DeepResearch)保证推理连贯性但扩展性受限[12] - 多智能体架构(如smolagents)实现功能专业化与并行处理,需解决协调一致性挑战[13] - 混合架构(如Perplexity/DeepResearch)结合多智能体并行搜集与中央推理核心,灵活性最高但实现复杂[13] 应用场景适配 - 学术研究:OpenAI/DeepResearch和Perplexity/DeepResearch在引用严谨性、方法论分析上表现突出[8] - 企业决策:Gemini/DeepResearch和Manus凭借数据整合与分析框架优势明显[8] - 个人知识管理:Open-Manus等开源方案在隐私保护、本地部署方面占优[8] 评估体系演进 - 专业化基准涌现:AAAR-1.0(150项多领域任务)、DSBench(20项数据科学任务)、TPBench(理论物理推理)等[9][11] - 多模态评估兴起:MMSci(研究生级多模态科学问答)、GMAI-MMBench(医学多模态)[10] - 功能评估三维度:任务完成能力(WebArena基准)、信息检索质量(F1分数)、知识综合准确性(TruthfulQA基准)[17][18] 未来技术方向 推理架构突破 - 上下文窗口限制:通过信息压缩(OpenAI分层处理)和外部记忆架构(Camel-AI的OWL系统)解决[23][24] - 混合推理模式:神经网络-符号集成架构实现创造性联想与形式化验证切换[25] - 动态知识图谱:HKUDS/Auto-Deep-Research系统实现知识双向演化[26] 因果与不确定性 - 因果推理三层能力:因果图构建、效应量化、结构化分析框架[28] - 干预建模技术:Agent-RL/ReSearch展示反事实推理潜力[28][29] - 多维不确定性建模:Perplexity/DeepResearch区分源不确定性与集成不确定性[30]
2025 AI Cloud 100 China榜单发布:6个赛道,34家新上榜,DeepSeek、Manus上榜
Founder Park· 2025-06-25 19:23
2025 AI Cloud 100 China榜单核心观点 - 榜单聚焦GenAI商业落地企业,要求GenAI收入占比至少10%,其中38家企业GenAI收入占比超50% [5][9] - 新上榜企业34家,DeepSeek和百图生科首次上榜即进入前10名 [9] - 过去三届榜单累计10家企业成功上市,2024年有4家(合合信息、太美医疗、七牛云、多点Mall) [9] 榜单结构及赛道分布 - 赛道类别从10个精简为6个:AI基础设施、AI for Insight、AI for Productivity、AI for Real World、AI for Services、AI for Content [12] - AI基础设施赛道头部企业为DeepSeek(第1)、MiniMax(第2)、智谱AI(第3) [12][14] - AI for Productivity赛道新增企业最多(31家),AI基础设施赛道平均估值最高 [10][63] 融资与市场动态 - 全球AI融资额同比增长79.6%,占总融资额比例从21%升至37%,超大项目(>1亿美元)占比达69.2% [22] - 中国AI融资额同比下降14.2%,资金集中流向AIGC、自动驾驶、AI行业应用赛道 [24] - 中美云厂商加大投入:美国三大巨头2025年资本支出2500亿美元(+33%),阿里计划三年投资3800亿元(80%投向AI) [26] 技术发展趋势 - 大模型向"慢思考"演进,多模态成标配,AI应用从Copilot向Autopilot升级 [34][40] - AI for Content赛道中,多模态内容编辑/生成类产品占比47.8% [40] - 具身智能领域融资火热,但行业仍处基础模型竞赛初期 [44] 地域与企业特征 - 北京企业占榜单49家,其次为上海(17家)、杭州(12家)、深圳(7家) [59] - 独角兽企业33家,平均估值125亿元(低于2024年的139亿元) [10][61] - 头部企业Palantir(AI for Insight赛道)股价一年上涨4.5倍,市值达3240亿美元 [43] 未来五大趋势预测 1 从Copilot到Autopilot进化(如Cursor两年内完成转型) [48][49] 2 环境智能(Ambient)通过GenAI+硬件规模化商用 [51] 3 RaaS(Result as a Service)在效果广告等可量化场景率先落地 [53] 4 端侧AI随AI手机/AIPC普及加速发展 [55] 5 高质量数据推动具身智能从L0.5迈向L1应用 [57]
TRAE 如何思考 AI Coding :未来的 AI IDE,是构建真正的「AI 工程师」
Founder Park· 2025-06-25 18:19
AI Coding赛道发展 - 越来越多的玩家涌入AI Coding赛道,覆盖从低代码平台到专业IDE的全场景[1][2] - 编程语言发展史是不断抽象和求简的过程,从汇编语言到Python代码行数减少95%(2000行→100行),全球开发者数量从百万级增长至GitHub破亿规模[9][10] - AI Coding将推动下一次飞跃,通过自然语言生成代码、智能调试等方式降低编程门槛,重塑开发者边界[10] TRAE产品理念 - 定位为国内首个AI Native IDE,核心是构建「AI+工具」模式,推出以AI对话为核心的Solo模式[3][31] - 目标是打造The Real AI Engineer(TRAE),具备自主理解、思考、优化和协作能力,解放开发者重复性工作[11][12] - 产品设计三要素:模型能力(大脑)、工程能力(手和脚)、产品能力(语言),三者有机结合[13][16] 核心功能与数据 - 代码补全功能「cue」支持预测补全位置和连续补全,帮助开发者进入心流状态[17][18] - 自然语言编程功能允许开发者通过对话完成需求分析、技术预研和代码生成,支持多Agent协作[19][20] - 月活用户突破100万,累计生成60亿行被采纳代码,日均处理150万次查询[24] 未来发展方向 - 从代码生成扩展到软件全流程生成,案例显示非技术背景产品经理可独立完成APP开发[25][27] - 提出「统一工作空间」概念,将工具模块化并由统一AI调度,推出Solo模式实现端到端开发[31][32] - 未来产品形态分为AI交互区(左)和工具集区(右),集成文档、Terminal和预览工具,计划开放第三方生态[32]
多模态内容生成的机会,为什么属于中国公司?
Founder Park· 2025-06-24 19:53
多模态技术发展现状 - 中国企业在视频生成、3D创作等多模态细分领域已跻身全球第一梯队,与美国在大语言模型领域的领先形成差异化竞争[1] - Pixverse的视频生成产品用户规模超过许多美国知名产品,VAST在3D技术上实现核心突破,Feeling AI探索多模态融合创新路径[1] - 中国团队在场景理解、数据积累和工程落地方面具备综合优势,抖音、快手等产品背后的视觉技术为视频生成奠定基础[7] 中国团队的核心优势 - 视频技术领域有多年积累,组织架构灵活性助力创新,全球用户量最大的视频生成产品多数来自国内团队[7] - 多模态领域技术路径尚未定型,中国丰富的应用场景和人才储备为创新提供沃土[7] - 差异化技术策略实现突破,3D领域从核心技术攻坚转向产品化落地,专注画质而非功能丰富性[8] 竞争格局与战略应对 - 面对阿里、腾讯等巨头的开源攻势,创业公司通过保持战略定力、聚焦细分需求寻找突破口[9] - 大厂竞争是创业公司的"成人礼",战略节奏领先是关键,先聚拢顶尖科学家实现技术突破,再转向产品化和商业化[9][10] - 开源是创业公司可以借力的东风,但难以满足特定场景需求,需要在开源基础上进行深度定制[12] 技术发展趋势 - 实时生成成为重点方向,Pixverse线上模型5秒生成5秒视频,目标实现真正实时生成[17] - 多模态融合趋势显著,GPT-4o强调的原生多模态实现训练时共享同一语义空间[14] - 3D生成转向自回归路线,生成模型面数低且拓扑结构类似人工建模,方便二次编辑[18] 产品与用户策略 - Pixverse采取双轨策略:网页版服务专业用户,移动端"拍我"App面向大众,模板化生成降低创作门槛[21][22] - VAST调整用户定位,从游戏玩家转向专业用户,打造完整3D创作工作流而非简单模型生成[25] - Feeling AI面向海外14-24岁年轻群体,结合游戏、创作和虚拟陪伴体验,模糊创作者与消费者界限[27][28] 未来目标与挑战 - Pixverse目标实现高质量实时视频生成,用户规模达3亿-5亿[37] - VAST希望降低3D创作门槛,探索可交互内容新生态,可能出现"3D版抖音"[37] - 行业共识是技术进步将让更多普通用户参与多模态创作,AI加速动态3D内容发展进程[33]
聊过 200 个团队后的暴论:不要拿 AI 造工具,要建设「新关系」
Founder Park· 2025-06-24 16:31
AI Native 产品的新目标 - AI Native 产品的核心是构建 AI 能力与人之间的新关系,而非单纯创造新工具 [13] - 系统提示词(System Prompt)成为定义 AI 与用户关系的关键,例如 NotebookLM、Manus、Cursor 等产品通过提示词设定人设和交互逻辑 [15] - AI 的「超语言能力」使其具备主体性,与人类形成「互为主体」的关系,这是高阶关系的核心 [18] 新关系带来的挑战 - 情商成为产品价值交付的一部分,例如 Cursor 通过系统提示词管理用户负反馈并提升交互体验 [21] - 生命感是增强 AI 产品主体性的关键,类宠物智能硬件通过传感器和简单反应创造情绪价值 [24] - 生命感的设计需多样化,涵盖顾问、朋友、宠物等关系类型,以低智能交付高情绪价值已被验证有效 [27] 新关系带来的机遇 - 跨次元混合价值交付:硬件与软件结合突破传统价值天花板,例如情绪管理可穿戴设备 [35] 和 Fuzzi 气囊支架 [36] - 新关系形成服务分发新通路,突破传统 ARPU 和 LTV 天花板,例如 Agent 产品按用量付费模式 [46] - 建设性关系需解放而非纵容人性,产品需避免隐藏议程以维持长期信任 [50][52] AI Native 产品的新管线 - 产品工程的核心是在不确定性中增强确定性,Broad Input(宽输入)和 Liquid Outputting(柔输出)是关键 [56][58] - 宽输入需多模态实时感知和高分辨率生活流捕捉,例如 Dia 浏览器通过主动获取标签页信息提升用户体验 [65][68] - 柔输出需分步交付并与用户协行,例如 Devin 追问需求、Deep Research 确认方案、YouWare 提供模板起点 [74][75] AI Native 的新价值模型 - 创业者需同时服务用户和 AI,通过产品工程释放 AI 能力 [82][84] - 价值模型从二维平面变为三维立体,AI 能力高度决定总体积 [85] - 传统产品经济学和管理学被颠覆,收费模式、组织形态等需重新思考 [95][97] 行业趋势与未来展望 - AI 推动生产力与生产关系的变革,3 年看生产力,10 年看生产关系 [95] - 极客公园通过社区支持技术创业者,探索新时代产品创新 [81] - 开放性问题如智能合约付费、价值创造新循环等预示行业未来方向 [95]
纳米 AI 梁志辉:超级搜索智能体是 AI 时代的真正入口
Founder Park· 2025-06-23 20:00
AI搜索的演进与重构 - AI正在重构搜索体验,从早期的AI Summary发展到Deep Research,拓展了搜索的广度和深度 [1][2] - Agent时代赋予搜索能力升维,可解决复杂问题如研究任务、投资决策、内容创作(生成视频/PPT)等 [3][4] - 纳米AI推出的「超级搜索智能体」结合多Agent协作、多模型协作、MCP和AI浏览器能力,尝试提供AI搜索新解决方案 [5] 传统搜索痛点与AI搜索变革 - 传统搜索依赖关键词(5-10字),超过20字时答案质量显著下降,40%需求为找网址,60%为提问 [10] - AI搜索改变用户习惯,提问长度普遍超过20字,最长可达数千字,90%需求转为提问,10%为创作/改写 [10][11] - 360月度AI搜索使用量达1.5亿次,超第二名十倍 [16] AI搜索的三阶段发展 - 1.0时代:AI总结问题答案置于搜索结果前,但体验提升有限 [15] - 2.0时代:大模型做意图识别实现多意图全网搜索,与DeepSeek体验接近 [15] - 3.0时代:重构底层架构,AI自动判断需求复杂度,分解规划并交付专家级结果(如研究任务) [15] 超级搜索智能体的技术架构 - 采用多Agent结构:任务分解智能体、调度智能体、多模态生成智能体协作完成复杂任务 [22] - 组合80+模型形成智能底座,包括高级推理模型(DeepSeek R1/Qwen 3)、工具调用模型(豆包/通义千问)、专业小模型(快速搜索/翻译) [26][27] - 支持长调用链,可调度50个工具分析500份文档,通过AI专用浏览器、搜索和代码生成工具扩展能力 [26][28] AI浏览器的关键能力 - 抓取国内外超1,000亿内容,覆盖PDF、视频、音频、社交/电商网站 [30][33] - 重做浏览器底层,模拟人类操作(点击/关弹窗/购物车操作),解决登录信任和网页嵌套难题 [32] - 打破信息孤岛,利用网站内部深度检索获取传统搜索引擎无法抓取的内容 [33] 应用场景与效率提升 - 购物智能体并行搜索小红书/淘宝/京东,整合优惠信息和用户反馈生成报告 [35] - 生成PPT消耗100万token(成本8-10元),逻辑设计和视觉效果超人工制作 [37] - 多模态知识库可批量分析500份简历,筛选符合条件候选人并以表格呈现 [29]
硬件黑客松、创业比赛、AdventureX 三城联动,6 月不可错过的活动!
Founder Park· 2025-06-23 20:00
6月活动概览 - 整理了6月份值得参与的线上、线下活动,涵盖开发者活动、硬件黑客松及快闪聚会 [1] - 未能参加AGI Playground 2025的参与者可关注后续活动沉淀稿件 [2] AI创客活动 - **Tensor Studio启动**:面向AI创业者,提供90天从想法到融资的支持,活动时间为7月15日至10月15日,报名截止6月25日 [3] - **2025极客营**:深圳科创学院主办,首次硬件黑客松活动,为期5天(7月31日-8月4日),强调技术实现与产品开发,报名截止7月20日 [3] 创造者聚会 - **AdventureX三城联动**:重庆、合肥、杭州三地同步举办,每场限30人,聚焦动手创造者,提供3个月免费食宿、办公场地及融资机会(预计50万投资) [4][5] - 报名链接分别对应三地活动 [5] NVIDIA创业企业展示 - 杭州站活动聚焦AI智能体与物理AI,包括技术分享、RTX™ 5880 Ada展示及企业路演,提供训推算力试用、AI课程等福利 [6] - 报名面向中国地区创业公司,需应用深度学习、NVIDIA技术或GPU/DPU/CPU运算基础 [7] AI Agents课程 - Hugging Face主办线上课程,教授AI Agents底层原理及开发,使用smolagents、LlamaIndex等工具,面向AI工程师、创业者及产品经理 [8] - 课程长期开放,报名链接提供详细信息 [8] 其他阅读推荐 - 包含罗永浩播客、a16z观点、11Labs营销建议及YC AI创业营相关内容 [8]
星海图高继扬:具身智能下半场,应用为王
Founder Park· 2025-06-23 19:44
具身智能行业发展趋势 - 2026年将是具身智能的下半场,核心是应用,供需两侧正在走向成熟[1][34] - 行业已度过全民探索可用场景阶段,市场预期回归理性,应用场景逐渐清晰[1][33] - 当前阶段最有商业价值的是实现对象泛化和动作泛化,而非本体泛化[3][26][27] 具身智能技术发展瓶颈 - 发展缓慢的根本原因是高质量数据缺失,而数据缺失源于缺乏合适的标准本体[4][10] - 需要从电机、整机、遥操作、数据管线到模型五个层面全面成熟[10] - 具身智能是"没有短板的游戏",需要软硬件深度结合,从电机到模型的完整整合[4][5] 数据采集与模型训练 - 将数据采集视为生产活动,已部署几十台机器人在真实场景采集数据[17] - 到第三季度将累计获得1万小时交互数据,覆盖1000+操作对象和300+任务[18] - 预训练解决"本体与物理世界交互的基本法则",需要几千到上万小时交互数据[21][23] - 采用"快慢结合"模型结构,快执行模型参数量约10亿,慢思考模型达百亿级[22] 产品形态与商业化路径 - 核心产品形态是"整机+预训练模型+后训练工具"组合[6][9] - 商业闭环核心在于开发者群体,应用繁荣才能创造价值[28][29] - 计划在2023年8月WRC和9月CoRL开源基础模型和数据集[30] - 当前操作精度达厘米级,速度为人类70-80%,新任务学习需约100条样本[32] 技术指标与泛化能力 - 定义四个泛化维度:对象、动作、场景和本体泛化[24] - 对象泛化指对不同物品执行相同动作,动作泛化指对同一物品执行不同操作[26] - 工站式场景降低了对场景泛化的需求,本体泛化在现阶段商业重要性较低[26][27]
2025「中国最具价值 AGI 创新机构 TOP 50」发布
Founder Park· 2025-06-22 13:16
中国AI行业发展现状 - 2025年中国AI行业处于类似2000年互联网早期的爆发阶段 新应用新产品不断涌现[1] - AGI时代创业者需重构产品构建逻辑 从"旧世界做新产品"转向"新世界建新管线"[2] - 大模型降低软件边际成本 推动AI应用大爆发 市场呈现多样化生态位和交互玩法[2] 商业价值创新案例 - 阿里淘天生意管家通过AI降低商家素材制作成本90% 经营人力节省30% 客服效率提升30%[4] - 字节OKKI外贸AI工具实现商家客均新增120个机会 AI采纳率75% 营销信打开率提升150%[36] - 美图Wink视频工具全球月活突破3000万 推动公司付费用户达1261万同比增长38.4%[51] 交互体验升级代表 - ACE Studio音乐大模型15秒生成完整歌曲 支持19种语言歌词 硬件门槛降低50%[6] - CapWords语言学习应用获苹果设计奖 通过拍照识词生成10种语言单词贴纸[8] - 荣耀YOYO智能体覆盖900项任务自主执行 语言模型功耗降80%加载速度提升77%[62] 技术能力突破亮点 - 百度沧舟OS构建全球首个内容领域操作系统 集成数百Agent服务数亿用户[7] - 幻方量化DeepSeek模型在数学代码领域对标OpenAI o1 成为全球领军[13] - 能量奇点AI核聚变控制系统将等离子体约束时间提升至行业3倍水平[35] 场景深度融合典范 - 灵心巧手机器人完成毫米级精度任务 构建全球最大操作数据集DexSkill-Net[26] - 深度原理AI化学平台缩短抗肿瘤药物研发周期90% 催化剂转化率提升5%[43] - 英矽智能生成式AI发现全球首款肺纤维化候选药物Rentosertib[55] 基础设施与平台创新 - 无问芯穹构建M×N异构算力范式 实现大模型在多元芯片高效协同[50] - DifyAI低代码平台推动AI应用从代码驱动转向意图驱动[14] - 硅基流动与华为云联合推出昇腾云服务 显著降低企业算力成本[16] 垂直领域领先产品 - 商汤小浣熊家族日处理Token超35亿 服务300+B端客户[42] - 纳米AI搜索PC端月活超2亿 配置100+MCP Server覆盖多场景[33] - 腾讯元宝接入DeepSeek模型 实现微信生态多模态能力升级[59]
罗永浩:梁文锋建议我「靠嘴吃饭」,我想做个播客帮助科技创业者
Founder Park· 2025-06-21 21:32
核心观点 - 罗永浩透露其新公司正在研发AI效率工具集 纯软件方案预计两三个月内上线[11][14][35] - 创业者探讨AI时代产品创新方向 包括AI陪伴、效率工具及人机交互新形态[5][57][61] - 大公司反应迟缓为创业公司创造时间窗口 需抓住垂直领域机会[25][42][87] - 产品经理价值在AI时代重新被评估 过度超前可能面临技术不匹配风险[50][98] 产品方向 罗永浩新产品 - 聚焦AI效率工具集 包含邮件处理等垂直场景组件 目标节省用户2/3邮件处理时间[31][32][35][42] - 放弃AR硬件路线 因判断十年内难以商业化 转向纯软件方案[11] - 采用"干得瑟"预热策略 避免提前泄露产品细节[14] AI陪伴产品 - 独响探索非聊天式交互 如"共同睡眠"功能提升用户健康作息 20%用户形成使用习惯[65][66] - 通过生理数据建立用户粘性 提高迁移成本[67] - 避免直接聊天交互以规避大模型能力不足暴露风险[77][79] AI效率工具 - Fellou聚焦生产力提升 60%用例集中在数据查询与爬取场景[58] - 观察到用户"隐藏好工具"现象 需平衡产品传播与用户竞争优势[36][38] - 采用邀请制控制成本与打磨产品 免费额度可满足日常需求[82][83] 行业洞察 竞争格局 - 大公司组织僵化导致创新滞后 创始人离世后反应速度明显下降[25] - 创业公司优势在于人效比、组织敏捷性和认知领先[85] - 垂直领域产品不易被大公司快速覆盖 存在收购退出机会[32] 产品方法论 - GUI不会消失 但需设计新的交互系统适应AI时代[52][56] - 需引导用户正确认知AI能力边界 避免高估或低估[70][71] - 产品美学重要性提升 用户对视觉体验要求更高[56] 创业环境 - 国内面临付费习惯差与大公司快速模仿双重挑战[25] - AI提效使小型团队具备开发复杂产品能力 催生"个人独角兽"模式[94][96] - 早期出海是合理选择 尤其面向发达国家市场[25] 创业者动态 - 罗永浩计划推出科技播客 深度访谈行业领袖[23] - 筹备重启"科技春晚" 为AI创业者提供展示平台[101][104] - 反思TNT案例 超前产品理念因技术不匹配导致失败但吸引收购方[4][50]