锦秋集 - 财报，业绩电话会，研报，新闻

锦秋集

搜索文档

从IPO神话到AI标杆：Snowflake如何让90%员工用上AI，每周省下418小时｜Jinqiu Select

锦秋集· 2025-10-25 15:04

文章核心观点 - Snowflake通过构建AI委员会、开发专有代理模型等系统性方法，实现了AI在营销和销售团队中90%的高采用率，并显著提升了运营效率与投资回报率[1][3][5] - 公司强调AI成功的关键在于将自上而下的战略重点与自下而上的创新文化相结合，并以坚实的数据战略和安全治理为基础[8][34][41] - AI的价值被定位为高效的任务自动化工具，其部署必须与可衡量的商业成果（如成本节约、收入增长）紧密挂钩，而非仅仅追求技术的新颖性[9][40][44] AI成功实施的关键要素 - 成功公司具备好奇心文化并得到高管指令的支持，仅鼓励员工尝试AI会导致混乱和重复工作[8] - Snowflake成立了由约30名成员组成的AI委员会，成员投入约20%的工作时间进行测试和学习，并每季度向整个组织分享成果[8][18][20] - 需要首席执行官将AI列为首要战略重点，并结合自上而下的领导与自下而上的创新[8][41] AI作为任务自动化工具的价值 - AI应被视为高效的任务自动化工具，而非魔法，Snowflake的全球支持团队使用AI工具每周节省418小时[9][33] - 450人的营销团队在起草视频脚本、准备面试等特定任务上节省了90%的时间[9][25] - AI部署需明确商业理由，衡量标准是能否赚更多钱或省更多钱，时间的节约需转化为成本节约或收入产生[40][44] 专有代理模型的颠覆性成果 - Snowflake构建了两个专有代理模型：活动代理提供每个活动的实时投资回报率数据，并自动优化数字广告支出和渠道分配[10][21] - 竞争情报代理为销售团队提供针对特定竞争对手、用例和行业的即时定制化谈话要点，解决了B2B领域手动分析几乎不可能完成的问题[10][22] - 基于实时性能数据在渠道间动态转移支出的能力显著提高了投资回报率[26] 数据安全与治理的基石作用 - 大型企业担忧将个人身份信息和敏感数据发送给随机AI工具，Snowflake专注于可信、受管控、集中化的数据存储[11][14] - 客户可使用任何大型语言模型，但只有经批准的模型才能访问其数据，不符合要求的模型会被自动锁定[11] - 治理是不可协商的基础，任何新技术的广泛部署前必须通过安全审查并满足治理法规[20][34] 营销AI用例与高采用率 - Snowflake的450人营销团队中90%的成员每天都在使用AI，这通过AI委员会的结构化方法实现，而非简单的自上而下命令[16][18] - AI应用包括潜在客户评分、内容创作与本地化（节省90%时间）、数字广告优化等，带来了巨大的成本效率和执行速度提升[25][26] - 营销部门负责整个公司的本地化工作，AI在此过程中带来了显著的成本节约[25] 销售AI用例与组织演变 - Snowflake认证了每一位解决方案工程师直至第四线领导，建立了技术售前组织，为AI工具（如Cursor AI）的快速部署（六周内）奠定了基础[28] - 内部AI工具Raven为销售代表和高管提供客户360度视角，查询结构化、半结构化和非结构化数据，实现了对客户理解的定性改进[29][30] - 首席执行官每周至少会见10位客户，并在会前使用Raven获取账户信息，体现了高管层对AI工具的采用[30] 组织结构与团队整合 - Snowflake将以前分散的数据和商业智能团队从销售、营销等部门整合到一个由首席数据官领导的共享智能团队中，消除了数据孤岛[27][39] - 该团队包括数据科学家、分析师和产品人员，他们集中报告以消除重复，同时保持密切的职能伙伴关系[27][39] - 这种整合加速了Raven和竞选/竞争情报代理等内部工具的发展[27] AI时代的招聘与文化 - 招聘理念转变为更看重能力（如适应性、好奇心、终身学习）而非当前技能，因为技能可以学习而适应性是超能力[35] - 为AI相关公司招聘人才变得更容易，尤其是年轻人才渴望在推动AI前沿发展的公司工作[12][35] - 公司在AI领域的正确定位和可展示的投资回报率有助于吸引人才[12][35] 内部创新驱动产品机会 - Snowflake坚持作为自身产品的“零客户”，其内部AI工具（如情报工具）正作为外部产品发布，任何客户都可部署类似代理[14][36] - 这种零客户方法带来了飞轮效应：内部创新驱动产品开发，产品吸引顾客，顾客为更多创新提供资金[37][38] - 内部团队真实使用和改进工具，确保了产品路线图与实际业务价值的一致性[38] 应避免的常见错误 - 避免告诉团队中每个人都去测试AI，这会造成混乱和重复工作，应通过专门小组进行结构化的探索[43] - 避免用“酷因素”而非投资回报率衡量AI，部署必须有明确的业务指标，如节省的时间或优化的支出[44] - 避免孤立的数据团队和碎片化的工具，整合数据基础设施和AI工具对于实现跨职能洞察和规模化至关重要[45] - 不可跳过治理基础，在没有适当安全审查和治理框架的情况下快速推进AI实施会带来风险[46] - 技术角色需要真实的技术深度，例如对销售工程师进行强制性认证，为AI工具的有效部署奠定基础[47]

锦秋基金持续加码星尘智能，拆解人形机器人遥操作关键技术与发展前景

锦秋集· 2025-10-24 21:14

文章核心观点 - 锦秋基金作为长期主义的AI基金，在2024年和2025年连续投资星尘智能，看好其绳驱AI机器人技术及商业化前景[1][2][3] - 遥操作是人形机器人部署的关键支撑技术，其技术演进正从演示阶段迈向试点部署阶段，在人工智能整合、低延迟硬件等方面取得快速进展[5][8][16] - 星尘智能是业界首个量产绳驱AI机器人的公司，其产品Astribot S1已在科研、商业服务、文娱演出及工业等多个领域落地应用[3] 遥操作系统的关键组件 - 典型的人形机器人遥操作架构包含四个核心环节：人类输入设备、重定向与控制模块、反馈接口以及通信信道和机器人端控制[8][10][14] - 人类输入设备技术多样，包括惯性测量单元（IMU）、虚拟现实控制器、外骨骼及生理传感器（如肌电图EMG）用于意图预测[10] - 重定向与控制模块的核心功能包括运动学重定向、运动规划、稳定控制（如基于零力矩点ZMP）和全身控制器采用二次规划（QP）等优化技术[10] - 反馈接口主要为操作者提供遥在感，类型包括视觉反馈（VR/AR）、触觉反馈（力、震动）以及听觉与平衡反馈[14] 历史演进及进展 - 遥操作概念起源于20世纪60年代，早期研究聚焦于远程操作中的时间延迟问题；20世纪80-90年代随着"远程存在"理念提出而进一步发展[13] - 2010年前核心研究方向为操纵器的双向控制，并进行了仿人机器人在太空领域的早期实验（如METERON项目）[13] - 到2020年代中期，动作捕捉与基于学习的方法降低了对人工关节控制的依赖，使人机交互接口更直观[15] - 2024-2025年，遥操作技术在人工智能整合、低延迟硬件研发与高韧性设计方面取得快速进展，已从演示阶段迈向试点部署阶段[16] 遥操作系统的分类与比较 - 常见的遥操作系统可分为五大类：机械式同构映射、VR/外骨骼辅助、数据手套/动作捕捉跟踪、人类动作迁移及仿真生成[17] - 机械式同构映射系统通过物理同构结构实现1:1动作映射，操作直观，适用于初级数据采集场景，但硬件体积大、数据类型单一[18][23] - VR/外骨骼跟踪系统采用低成本VR设备替代主臂，降低硬件门槛，但存在信息损失严重、逆运动学（IK）奇点问题及采集效率低等缺点[25][26] - 数据手套与触觉反馈系统专注于手部精细动作采集，支持多模态数据记录，适用于高精度操作场景，但设备成本高且受环境干扰[33][35] - 动作捕捉跟踪系统可实现全身动作捕捉，是仿人机器人数据采集的最优选择，支持毫米级精度与低延迟数据传输，如Open X-Embodiment数据集含100万条轨迹[36][38] - 人类动作迁移方案无需依赖机器人硬件，直接采集人类全身动作并通过重定向算法映射至机器人，采集效率高但存在跨形态差异问题[41][42] - 仿真器生成数据方案成本最低，通过虚拟环境生成动作轨迹，但仿真到现实（Sim2Real）差距大，目前仅适用于刚体操作任务[46][51]

让AI来邀请AI科学家田渊栋博士加入锦秋基金，这事儿靠谱吗？｜Jinqiu Scan

锦秋集· 2025-10-23 23:12

文章核心观点 - 文章通过一个具体场景（使用AI模型为顶尖AI科学家田渊栋博士起草邀请信），评测了五款主流大语言模型在正式商务沟通中的表现，旨在探索AI是否能在理解人类情感、价值判断和沟通分寸感方面达到实用水平 [1][2][6][7][8] - 测评结果表明，不同模型在"正式得体"与"人情温度"的平衡上展现出显著差异，其中ChatGPT 5在整体均衡性和专业度上表现最佳，几乎可直接用于实际商务场景 [16][17][18] - 该实验超越了简单的文本生成能力测试，其深层目的在于验证AI在真实、复杂的人类沟通场景中，对目的、语气、逻辑和行动号召的综合理解能力 [42][43] 测评方法 - 测评选取了五款主流大模型：ChatGPT 5、Claude Sonnet 4.5、Gemini 2.5 Pro、通义千问Qwen 3-Max和文心一言4.5 Turbo，以确保在语言风格、逻辑表达与文化语境理解上具备多元对比价值 [10][11] - 测评采用统一的Prompt模板（中英文双语），为模型设定了相同的系统角色（经验丰富的沟通策略专家）和任务目标（起草一封给田渊栋博士的正式邀请信） [11][12][13] - 评估体系包含六个核心维度：个性化程度、价值主张清晰度、建立连接的能力、语气风格、结构完整度以及创造性与自然度 [11][16] 模型测评结果对比 - **ChatGPT 5**：综合表现最佳，在六个维度上得分最均衡（个性化8、价值主张9、连接感8、语气9、结构9、自然度8），其最大优势在于精准拿捏正式邀请所需的语气分寸，结构完整逻辑清晰，生成结果几乎可直接作为正式邀请函使用 [17][18] - **Claude Sonnet 4.5**：在"情感理解"上表现突出，连接感维度得分最高（9分），文字自然流畅、人文感强，对合作路径的阐述更为详实有说服力，但价值主张陈述略保守（7分） [11][17][27] - **Gemini 2.5 Pro**：结构与逻辑链条优秀（结构9分），但连接感与亲和力略弱（7分），行文偏"理工式"，在表达情感时显得谨慎保守，使得文本缺乏温度 [17][38] - **通义千问Qwen 3-Max**：中文场景优势明显，语言得体，在各项维度上表现稳定（得分在7-8分之间），但英文版在细节精准度上稍逊 [17] - **文心一言4.5 Turbo**：中文正式公函风格稳定，但模板化明显，个性化与情感驱动较弱（相关维度得分均为7分），英文版本的节奏感和流畅度有待提升 [17][44] 公司战略与定位 - 公司（锦秋基金）是一家专注于推动人工智能通用智能（AGI）发展的双币种早期风险投资机构，其核心战略是将"算力"（核心资源）分配在与顶尖技术研究者、产品人和创业者的深度对话与连接上 [2][15][45] - 公司已建立起广泛的AGI领域投资组合，自2024年7月以来已投资约70家人工智能创新企业，覆盖机器人、多模态基础模型、AI基础设施等多个前沿方向 [42][46][47] - 公司通过"锦秋小饭桌"等常态化闭门活动构建创业者社群，并设立"Soil种子专项计划"，旨在持续支持勇于探索边界、定义未来的创造者 [49][55]

AI们给锦秋基金的写稿建议，我们要不要听？ | Jinqiu Scan

锦秋集· 2025-10-23 16:40

测评背景与目的 - 锦秋AI实验室使用其公众号"锦秋集"2025年1-9月的真实运营数据，对14款AI数据分析工具进行测评，旨在评估AI工具在实际业务场景中的应用效果[1] - 测评核心关注AI生成的分析报告是否达到交付标准、洞察是否深刻、以及生成速度、易用性、可视化效果等用户体验[2] - 测评设计了两轮提问，模拟真实工作场景中的两种典型需求：简易Prompt测试AI的自主发现能力，详细Prompt测试其专业深度和指令遵循能力[5][7] 测评工具范围 - 测评覆盖14款具有数据分析能力的AI工具，包括Claude Sonnet 4.5、ChatGPT-5、Gemini 2.5 Pro、智谱清言GLM-4.6、Coze、天工超级智能体、腾讯混元、阶跃AI、MiniMax、通义千问、Julius AI、WPS AI、办公小浣熊、Rows AI等[4] 简易Prompt测试结果 - 在简易Prompt测试中，Claude Sonnet 4.5整体逻辑与报告结构最接近人类分析师，能主动提出"品牌背书效应"、"热点关联"等关键因素[12] - WPS AI在中文语境与图表表达上最自然，能识别"人物故事类内容"的高互动与"白皮书素材"的高传播率[12] - MiniMax报告完整、图表丰富，会自动生成月度趋势线，是"慢工出细活"代表[12] - 办公小浣熊排版优雅、表达流畅，可量化涨粉率（研究报告类≈4%），实用且直观[12] 详细Prompt测试结果 - 在详细Prompt测试中，Claude Sonnet 4.5严格按8模块输出，分析精细到标题长度、发布时间段、涨粉来源，并基于相关性得出策略，几乎媲美人工专业报告[17] - MiniMax输出内容同样全面、图表丰富，策略层分析到位，是"分析型研究员"代表[17] - 阶跃AI紧跟结构要求，分析细致，稳定可靠[17] - WPS AI和办公小浣熊能按模块执行到位，但预测分析与模型层实现不足[17] AI工具能力差异与局限性 - 数据质检能力差异显著，部分工具如Claude、Julius、阶跃AI能主动发现数据问题并修复，而Rows AI仅能读取数据结构，无分析能力[19][10] - 中文情感分析能力极不稳定，各工具对同一份评论数据的情感判断结果天差地别，例如WPS AI判断正面评论占比5.10%，而智谱GLM-4判断为68.00%，运营者绝不能依赖单一工具的情感分析做决策[20] - 可视化能力分化，部分工具如MiniMax、WPS AI、办公小浣熊能直接生成图表，而Claude、ChatGPT等则提供代码生成[21] - 用户体验存在差异，Coze和MiniMax生成速度明显偏慢，腾讯混元需要特定Python库增加了使用门槛，国内工具如WPS AI、办公小浣熊在中文界面和图表显示上更友好[21] 对公众号运营的具体建议 - 内容策略应聚焦于"投资动态"（尤其是独家或重磅项目）、"深度研究/资源型内容"以及"内部动态/人物故事"这三类涨粉效果最好的内容[22] - 发布节奏建议采用"周日深度+周中热点/动态"的模式，数据显示周末（尤其是周日）发布深度内容的涨粉效果更佳[23] - 分享裂变是涨粉的核心驱动力，高分享文章的"每次分享带来阅读数"远高于平均水平，建议增加"可截图金句卡片"、"文末分享话题引导"等机制提升内容的社交货币价值[24] - 可通过优化标题（如加入具体数字、强价值承诺）和测试不同推送时间段来提升推送打开率[25] - 用户评论分析显示用户对活动报名、资源获取、内容深度有强烈需求，建议优化活动报名流程、建立资料库，并持续产出高质量深度内容[26]

Artificial Intelligence

Artificial Intelligence

OpenAI Atlas 深度测评：饼画得很大，但…...｜Jinqiu Scan

锦秋集· 2025-10-22 22:21

文章核心观点 - ChatGPT Atlas是OpenAI推出的首款桌面浏览器，标志着公司战略从提供底层AI模型延伸至直接控制用户工作流与Web入口[1] - 该产品旨在成为"真正的超级助理"，通过将ChatGPT深度融入浏览体验来实现"理解你的世界并帮助你实现目标"的效果[3] - 当前版本在产品成熟度方面存在明显差距，战略雄心与现实能力之间有不小距离，尤其是在基础体验的打磨上仍处于非常早期阶段[4][5][36][37] 三大核心能力测评总结即时上下文感知（侧边栏对话） - 官方承诺ChatGPT能够伴随用户 anywhere across the web，并理解用户正在查看的内容[9][10] - 学术论文研读场景测试失败，无法成功读取和理解长篇英文学术论文网页内容，PDF文件同样无法直接交互，需要手动上传文件[12][13] - 信息流网站汇总场景中，仅提取五条概括性内容，覆盖面与深度严重不足，暴露信息抓取和关键点提炼的局限性[15][16] - 跨语言邮件润色场景表现出色，能够准确获取选定文本并完美执行翻译润色指令，生成专业商务英文邮件[17][18] - 页面级广域上下文感知能力初级不可靠，而文本级精确上下文感知能力出色，体现为"作用于选区"的工具而非"理解整个页面"的助理[23] 个性化浏览器记忆 - 官方宣称浏览器记忆功能能让ChatGPT记住用户访问网站的上下文，支持基于长期记忆的复杂指令[19][20] - 求职面试准备场景中生成的大纲内容高度同质化，缺乏对浏览过的具体公司和岗位的深度见解，未能体现浏览历史有效利用[22] - 节日礼品挑选场景能识别"美妆护肤品"大类兴趣，但推荐止步于品类层面，无法给出基于浏览记录的具体品牌或产品建议[25][26] - 记忆功能存在明显"颗粒度"问题，仅能进行关键词级别索引分类，缺乏对内容深层语义和用户潜在意图的理解推理能力[27] - 用户可随时开关记忆、按站点控制权限、清除历史记录，体现设计上的审慎态度[28] 自主智能体模式（Agent Mode） - 该模式面向ChatGPT Plus、Pro和Business订阅用户，旨在将浏览器从被动工具转变为能自主执行多步骤任务的智能助手[29] - 官方描述其强大能力可完成"计划晚宴找到杂货店添加所有食材到购物车并配送到家"等复杂任务[30] - 工作流程包括意图输入、规划与确认、自主执行、用户监督与控制四个标准化步骤[32] - 代表浏览器未来演进方向，即将浏览器从信息呈现工具转变为任务执行平台，是构建核心竞争壁垒的关键[33] - 成功需要三个核心前提：精确的环境感知、深刻的意图理解、稳健的任务规划与执行，但基于前两部分测试，当前实用性存疑[34][39] - 目前更像建立在尚不稳固地基上的宏伟蓝图，成功取决于未来版本对基础感知和理解能力的迭代速度[35]

OpenAI发布AI浏览器Atlas，我们要开启AI版“上网冲浪”时代了吗？｜Jinqiu Select

锦秋集· 2025-10-22 12:30

AI浏览器行业动态 - Perplexity AI推出基于Chromium架构的AI浏览器Comet，默认集成其搜索引擎，已于2025年7月上线[1] - Atlassian以约6.1亿美元收购AI浏览器产品Dia的公司The Browser Company，强化AI浏览器领域布局[1] - OpenAI正式发布以ChatGPT为核心构建的智能浏览器ChatGPT Atlas，主打"网页陪伴"功能，用户可在任何网页唤出侧边栏获取上下文感知协助[1] ChatGPT Atlas核心功能 - 引入"浏览器记忆"功能，可记住用户访问的网页内容与任务进度，未来自动调取相关信息提升工作效率[3] - 支持"Agent模式"，使ChatGPT能在网页上自动执行检索资料、规划会议等复杂任务，该模式面向Plus、Pro与Business用户开放预览[3] - 实现浏览器从被动工具向主动伙伴的转变，支持在当前窗口直接处理任务[1] 浏览器行业发展历程 - 1993年Mosaic浏览器通过图文混排能力首次让普通人直观浏览互联网，点燃公众热情[9] - 1994年网景通信公司推出Netscape Navigator，引入JavaScript和SSL安全协议，一度占据近九成市场份额[10] - 微软通过Windows操作系统深度捆绑Internet Explorer，执行"拥抱、扩展、消灭"策略，最终导致网景被AOL收购[11][13] - 2004年Mozilla基金会发布Firefox 1.0，以开放、标准、安全和可定制性为旗帜，推动Web标准回归[17] - 2008年Google推出Chrome浏览器，以惊人速度、简洁界面和沙箱安全架构迅速征服用户，市场份额长期稳定在六成以上[18] 当前浏览器市场格局 - Google Chrome全球市场份额达66.6%，覆盖超过36.9亿用户，在桌面端占65.67%，移动端占67.67%[30][33] - Safari以18.01%的全球份额位居第二，拥有约10亿用户，其成功高度依赖苹果硬件生态系统[34] - Edge全球份额5.23%，拥有约2.92亿用户，桌面端表现亮眼达13.77%，自2020年以来从1.45%持续增长至5.23%[36] - Firefox全球份额仅剩2.57%，约1.42亿用户，较2009年高峰期的32%大幅下滑，移动端份额仅0.53%[37] 区域市场特征 - 中国市场Chrome份额45.12%，未形成绝对统治，UC Browser和360安全浏览器分别占据7.42%和5.67%份额[51] - 印度市场Chrome份额高达89.34%，其他浏览器份额可忽略不计[51] - 美国市场Chrome占52.91%，Safari占31.22%，展现苹果在美国市场的强大号召力[51] AI浏览器的战略意义 - AI正扮演类似图形界面、V8引擎的革命性角色，使浏览器从信息检索通道转变为具备行动能力的通用执行平台[55][60] - 美国司法部提出"让Google出售Chrome"为行业带来变数，OpenAI公开表态有意接盘，认为这是展示"AI优先浏览器"的机会[61] - 掌控AI浏览器意味着抢夺下一代互联网入口控制权，可构建生态闭环战略支点，开辟智能广告投放、付费订阅等创新商业模式[65][68][69] 浏览器行业成功要素 - 技术创新是市场格局变化突破口，从Mosaic的内联图片到Chrome的V8引擎，每次技术质变都带来市场机会[47][48] - 分销渠道决定用户规模，IE借助Windows捆绑、Chrome依托Google生态、Safari凭借iOS默认安装都证明渠道控制力的重要性[49][50] - 用户体验是成功核心，无论技术多先进，用户选择最终由浏览器是否直观易用、界面简洁高效决定[52][53]

锦秋小饭桌x地瓜精酿馆第二弹｜“技术的胜负，不在实验室，而在用户手里”

锦秋集· 2025-10-21 21:13

活动概况 - 锦秋小饭桌与地瓜精酿馆在深圳联合举办机器人主题派对，集结了40余位硬件资深玩家[1] - 活动参与方包括地瓜机器人多位副总裁、锦秋基金合伙人及投资副总裁、深圳模力营AI生态社区运营负责人以及40余位硬件创业者和技术专家[3][6][8] - 活动形式包括开麦环节展示项目背景与需求，以及烧烤露营局下的实战经验交流[8][11] 关于场景与产品 - 通用机器人适用于泛化通用场景，用于高度专用工厂将面临逻辑冲突与性价比低的问题，硬件可专用但软件智能必须坚持通用与泛化[15] - 场景选择应务实切入当下可验证的刚性痛点，而非追逐热门但泛化复杂的场景[16] - 情感型产品可围绕人类被倾听、被理解、持续连接的社交需求展开，结合游戏化机制提升留存[16] - 产品胜负关键在于是谁先创造净价值，用户需要最合适的产品而非最强技术[16] - 陪伴是达成沟通与信息获取的手段，不能作为结果型目标[17] - 产品需有清晰价值锚点，即明确的用户痛点和解决方案，才是产生依赖与付费意愿的基础[18] - 交互设计分为弱交互强治愈（通过体感触感等物理互动）和强认知交互（通过聊天深度理解用户）两类价值[18] - 模型人设需稳定且有边界，保持角色一致性并设定最小可行的文化与伦理边界[19] - 产品粘性源于有效帮助与低成本，记忆功能、IP形象、低使用门槛和可见进步比单纯陪聊更能提升留存[20] 关于创业经验 - 硬件创业应先判定真实需求与约束，再选择技术与方案，避免自嗨式研发[21] - 需要在性能、成本、稳定性之间面向场景做恰到好处的取舍和平衡[22] - 应让用户先使用产品，基于真实数据持续优化，比闭门造车更有效[23] - 发展应分阶段推进：短期抓可落地与情绪价值，中期聚焦刚需子场景，长期走向通用[24] - 供应链应采用国产MCU/驱动/AI模组建立备份方案，防范地缘与短缺风险[25] 关于量产与出海 - 量产之路应拥抱复杂性，通过降低系统复杂度来减少风险[26] - 需从必须解决什么这一单一核心痛点与可量化收益出发，否则后续环节会失控[27] - 应用最小可卖版本验证场景与付费意愿，POC阶段就把样机推向用户，设数据闸门及时调整[28] - 团队搭建要软硬一体，组建跨界团队，明确创始人边界[29] - 避免过度定制导致不可规模化，用模块化/软配置降低SKU复杂度[29] - 坚持市场数据优先，用事实而非情绪决策，在工程化前彻底解决前端问题[29] - 采用阶梯式投资，越往后越要敢否决，每个阶段保留否决权，用小钱买真相[29] - 把合规、关键器件、核心KPI等致命风险前置暴露，设立严格放行条件[30] - 众筹是消费电子出海热启动的高杠杆入口，需在三个月内聚合投放、内容、社群、口碑与公关[31] - 出海要和用户玩在一起，通过KOL与核心爱好者深度共创内容，让真实使用场景反哺营销[31] - 众筹是信任决定转化的期货生意，需用透明沟通、工程师背书与可验证信息建立强信任[32] - 众筹后应通过全球社群活动与UGC挑战，将初期热度转化为长期品牌资产，实现持续销售[32] 参与机构背景 - 锦秋基金是一家12年期的AI Fund，以长期主义为核心投资理念，寻找具有突破性技术和创新商业模式的通用人工智能初创企业[35] - 锦秋小饭桌是锦秋基金为创业者打造的常态化闭门社交活动，每周五晚在多地举办，聚集优秀创业者、技术大牛和产品创新者进行干货分享[36] - 地瓜机器人是业界领先的机器人软硬件通用底座提供商，提供5~128 TOPs多层级的智能计算平台，覆盖多种机器人场景，拥有超过200家中小创客、200+头部高校、近100,000名个人开发者[37] - 地心引力计划是地瓜机器人为创业公司打造的全球生态创新项目，采用免费会员制，已联合近40家机构，赋能200余家机器人创业公司[38]

锦秋基金领投企业Manifold AI流形空间连获两轮共亿元融资，打造下一代具身智能世界模型｜Jinqiu Spotlight

锦秋集· 2025-10-20 20:18

投资事件 - 锦秋基金已完成对Manifold AI（流形空间）的投资 [2] - 锦秋基金是一家12年期的AI Fund，以长期主义为核心投资理念，专注于寻找具有突破性技术和创新商业模式的通用人工智能初创企业 [3] - Manifold AI近期的天使轮融资由锦秋基金领投，同创伟业、英诺天使基金跟投，种子轮由英诺天使基金领投、水木清华校友种子基金跟投，两轮融资共亿元，资金将用于下一代具身世界模型的训练与场景落地 [4] 公司技术与定位 - Manifold AI聚焦世界模型与具身智能，原创的具身世界模型技术旨在推动机器人大脑的规模化落地 [6] - 公司提出WorldScape具身基座世界模型方案，具备Reasoning-Dreaming-Acting三位一体能力，利用海量第一人称视角视频数据进行预训练，有望实现物理空间智能涌现 [10] - 预训练模型能力的提升使得绑定本体的动作映射只需极少量In Context Learning数据即可实现，大幅降低部署成本 [10] - 其技术孵化自清华大学电子系未来智能实验室，是世界范围内首个全域布局室外、室内、空域具身世界模型的团队，相关工作DriveScape、RoboScape、AirScape已发表于CVPR2025、NeurIPS2025、ACM MM2025等顶级会议 [10] - Manifold AI已率先接入NVIDIA Jetson Thor开发者套件用于具身世界模型的本体部署 [12] 行业背景与趋势 - 通用机器人面临本体多、数据少、应用分散的落地困局，基于视觉-语言-动作模型的方案存在预训练精度低、需大量本体数据进行模仿学习的问题 [6] - 海外如Tesla Optimus、Figure AI团队已转向使用海量第一人称视角视频数据的技术路线，从第一性原理出发模拟人类学习过程 [6] - 世界模型技术被视为本质解法，可使互联网上所有第一人称视角视频数据成为机器人学习素材，达到类GPT预训练范式所需规模 [7] - 近期行业进展包括OpenAI发布Sora2视频生成模型周活跃用户达8亿，Google发布Genie3世界模型将物理一致上下文视频窗口拉长至分钟级别，李飞飞World Labs发布RTFM世界模型实现单图实时生成可持久化交互3D空间，NVIDIA Cosmos和Meta V-JEPA2世界模型也在具身场景取得突破 [7] - 世界模型路线能撬动更多网络视频和人类训练数据，具有更大规模化潜力，其时空预测能力驱动交互更符合人类物理直觉 [16] 团队背景 - 创始人兼CEO武伟博士为前商汤科技高管，2015年加入商汤初创，有数百人团队管理经验，曾主导商汤开悟世界模型的研发和落地 [13] - 联合发起人包括清华大学教授、教育部长江学者，在AI模拟和世界模型方向早期整体布局，发表过包括十余篇Nature子刊在内的数百篇学术论文 [15] - 另一位联合发起人为清华大学信息学院助理教授，15岁考入清华，多次入选全球前2%顶尖科学家 [15] - 核心团队成员毕业于清华、北大、上交、港中大、UCLA等高校，曾在快手、Momenta、商汤等企业构建过超千万级用户的AI产品，具备机器人与大模型双重背景 [12] - 团队融合智驾产业落地经验和清华前沿实验室技术资源，是国内探索世界模型方向的先锋 [16]

具身智能

世界模型

Artificial Intelligence

Artificial Intelligence

Sora2

Genie3

RTFM

锦秋基金被投企业宇树科技发布第四款人形机器人H2，机器人“天命觉醒”

锦秋集· 2025-10-20 17:26

投资动态 - 锦秋基金已完成对宇树科技的投资[3] - 锦秋基金作为12年期的AI Fund，以长期主义为核心投资理念，专注于寻找具有突破性技术和创新商业模式的通用人工智能初创企业[4] 产品发布与性能参数 - 宇树科技发布第四款人形机器人H2，身高180厘米，重量70公斤[5][8] - H2与前代H1相比在运动流畅性和仿生特征方面有显著升级[5][8] - H2关节总数达到31个，较今年7月发布的R1（26个关节）提升约19%[10] - 关节分布：双臂各6个关节共12个，双腿各7个关节共14个，躯干3个关节，另有2个未公开用途功能关节[12] - H1重量约47公斤，H2重量约70公斤，BMI为21.6[8][9] - H1最大速度3.3米/秒，H2动作更流畅灵活但未明确具体速度[9] - H2配备仿生人脸，动作细节更丰富，能完成舞蹈和功夫等复杂动作[9][15][16] 技术突破与应用前景 - H2的关节控制与平衡算法经过优化，能承载70公斤重量并实现多样化动作[25] - 应用场景扩展至工业自动化巡检、仓储搬运，以及娱乐演示和陪伴服务[27] - 机器人可替代人类在危险或封闭空间完成任务，提供更人性化的无障碍服务[27] - 中国智能机器人相关企业平均增长率达50%-100%[27] - 宇树科技产品线包括2023年8月发售的H1（全尺寸人形）、去年5月发售的G1、今年7月发布的R1（入门消费级）[23]

Andrej Karpathy ：AI 智能体的十年战争、强化学习的困境与“数字幽灵”的觉醒

锦秋集· 2025-10-20 15:00

智能体发展时间框架 - 当前业界普遍认为今年是"智能体元年"，但Andrej Karpathy判断这是"智能体的十年"，意味着智能体的成熟将是一个长达十年的渐进过程，而非短期内突然爆发[6][7] - 智能体要成为真正的"数字同事"尚需约十年时间，因其核心能力模块尚未整合完备[8][9] 智能体缺失的关键能力模块 - 实现真正可用的智能体还缺失四个关键模块：多模态感知、记忆系统、持续学习与行动接口[1] - 具体缺失的能力包括：多模态能力（理解图片、视频、操作界面）、计算机使用能力（用鼠标、键盘或API操作数字世界）、持续学习（记住历史信息而非每次从零开始）、更强的认知能力（规划、上下文管理、长期目标追踪）[15] AI发展史上的关键转折点 - AI领域过去十五年经历了三次范式转折：深度学习崛起（AlexNet时代代表的感知革命）、强化学习与游戏兴起（行动革命）、大语言模型出现（表征革命）[11][12][13][14] - 真正的技术"实用化"总是比"概念提出"晚五到十年，智能体的演化不会例外[11] 强化学习的根本缺陷与改进方向 - 强化学习在实践中存在信息稀疏问题，其本质是把监督信号吸进一根吸管里，从长行为序列中只获取最后一点反馈，导致高噪声、低效率、极难稳定[20] - 人类基本不用强化学习，而是依赖反思与推理过程，形成过程监督而非仅看最终结果[21] - 未来强化学习的改进方向包括：细粒度奖励（每个阶段提供反馈）、多维度打分（评估效率、优雅度、可解释性）、自我评估循环（模型能自己复盘、修正、再训练）[47][48][49] 从模仿学习到反思学习的演进 - AI学习模式的演进路径为：从模仿学习（模型模仿人类对话风格）到强化学习（RLHF，结合模仿与奖励），下一步是让模型学会自我反思[23][24] - 模型需要具备"反思与回顾"结构，甚至类似"睡眠"的机制，将临时经验蒸馏进权重，但目前这些还停留在论文级别实验，尚未在真正的大模型规模上跑通[24][25] AI编程的现状与瓶颈 - AI辅助编程工具（如Copilot或GPT）目前作用有限，在独创系统或研究型代码编写上几乎帮不上忙，其最实用模式是半自动补全（程序员控制结构，模型辅助局部实现）[31][35][36][39] - 模型在创新结构上几乎无能，它擅长复刻常见模板，但理解不了新结构，容易自以为懂并建议不必要的API，导致代码臃肿复杂[38] - 编程的进化可视为一个"自主滑杆"的缓慢推进，AI持续压缩低价值劳动空间，但真正的架构与理解仍靠人类，未来编程可能演化为一种"思维交互"[41][42][43] 人类学习与AI训练的根本差异 - 人类学习是开放系统，具备多层次学习机制（内置硬件、社会化学习、反思梦境和创造再训练），而AI模型是一次性训练形成的封闭系统，不会真正持续更新认知[51] - 人类通过遗忘保持创造力优势，而AI记忆力太好反而妨碍泛化，未来可能需要让模型"学会遗忘"[28] AI的未来角色与社会影响 - AI的角色是"认知合作者"，未来最现实的是一种共生关系：AI负责探索空间庞大、重复性高的任务，人类负责定义目标、做价值判断[52] - 未来社会分工会越来越像"混合认知体"，每个个体由一个人加一组AI代理组成，像拥有个人操作系统一样协同工作[53] - 下一个十年是从"召唤幽灵"到"驯化幽灵"的阶段，需要建立社会层面的规则、价值观、使用边界，确保AI安全、可靠、合作、可信[54][55]

Artificial Intelligence

Artificial Intelligence

Gemini

Previous Next