Workflow
锦秋集
icon
搜索文档
锦秋基金被投公司「生数科技」完成新一轮数亿元A轮融资 | Jinqiu Spotlight
锦秋集· 2025-09-19 10:17
融资与投资背景 - 生数科技于近日完成新一轮数亿元人民币规模的A轮融资,由博华资本领投,并获得百度战投、北京市人工智能产业投资基金、启明创投等老股东持续跟投及产业合作方加码[2][5] - 锦秋基金作为一家12年期的AI Fund,于2023年年中投资了生数科技,是其早期机构投资人[1][2] - 锦秋基金设有"Soil种子专项计划",专为早期AI创业者提供资金支持,以帮助创新想法转化为实际应用[12] 公司概况与技术产品 - 生数科技成立于2023年3月,核心团队由来自清华大学、北京大学、帝国理工学院等全球顶尖高校及产业界的技术和产品人才组成[5] - 公司专注于多模态大模型及应用的自主研发,其核心产品Vidu具备AI图像生成、视频生成与音频生成等多项能力[5] - Vidu产品于2024年7月全球上线,全球首创「参考生」图片/视频概念,并在多主体一致性方面持续保持全球领先[5][8] 市场表现与用户数据 - Vidu产品已快速覆盖全球200多个国家和地区,拥有超3000万用户和6000家开发者及企业[5] - 通过Vidu累计生成的视频数量超过4亿,其核心功能参考生视频和参考生图的生成数量已超过1亿[5] - 在生成的内容中,商业内容素材生成量占比超过50%[5] 行业前景与战略规划 - 多模态生成技术在数字内容产业中的商业化进程正在加速,预计在未来三年内将重塑全球数字内容的生产方式,并全面渗透到各行各业[6] - 该技术领域展现出巨大的市场空间与全球性增长潜力[6] - 新一轮融资将用于模型研发和技术创新,探索多模态大模型的智能上限和应用广度,同时加强产品拓展、用户服务、产业合作和全球商业布局[6]
地瓜机器人X锦秋基金:一杯精酿,聊透机器人未来 | Jinqiu Spotlight
锦秋集· 2025-09-18 20:33
文章核心观点 - 锦秋基金已完成对地瓜机器人的投资 该基金作为12年期的AI Fund 以长期主义为核心投资理念 专注于寻找具有突破性技术和创新商业模式的通用人工智能初创企业 [1] - 地瓜机器人是业界领先的机器人软硬件通用底座提供商 构建了从芯片 算法到软件的完善产品体系 旨在让更智能的机器人开发更简单 [9] - 公司联合举办“地瓜精酿馆”线下交流活动 旨在为创业者 投资人和产业伙伴打造高质量 深度对话的闭门场 限定30席 仅面向优质报名者开放 [1][3][5] 公司业务与产品 - 地瓜机器人以旭日智能计算芯片和RDK机器人开发者套件为核心 形成了覆盖5到500 TOPS各算力段的完整产品布局 可满足人形 四足狗 家庭服务 陪伴 物流AMR等多种机器人计算需求 [9] - 旭日系列芯片出货量已超过500万片 超过200家中小创客 200多家头部高校以及来自全球20多个国家的近100,000名个人开发者在该平台上创造了数百种形态的智能机器人产品 [9] - 公司启动了地心引力计划 这是一个为机器人创业公司打造的全球生态创新项目 采用免费会员制 计划在未来五年内赋能千家企业 影响千万机器人消费者 [9] - 目前地心引力计划联合近40家国内外知名的创业孵化器 加速器 高校实验室 投资机构 行业合作伙伴与科技媒体 赋能200余家机器人创业公司 [9] 行业活动与生态建设 - “地瓜精酿馆”活动包括现场机器人互动秀 限定高质量交流 项目展示以及由顶级机器人公司创始人担任主持的深度对话环节 [5] - 活动流程设计强调高效对接 包括一分钟开场秀 云端复盘局 微醺里遇见和自由碰撞接站等环节 旨在打破边界 激发合作与灵感 [6] - 活动目标受众为具身智能 机器人 AI交互领域的创业者 寻找机器人赛道机会的投资人以及对机器人落地与商业化充满兴趣的产业合作方 [7] - 锦秋基金设有“Soil种子专项计划” 专为早期AI创业者提供资金支持 帮助团队将创新想法转化为实际应用 [18]
从 ChatGPT 到 Marble,李飞飞押注的下一个爆发点是 3D 世界生成?
锦秋集· 2025-09-18 15:33
文章核心观点 - 李飞飞创立的World Labs推出空间智能模型Marble 其核心突破在于通过一张图片或文本提示生成持久存在且可自由导航的3D世界 在几何一致性、风格多样性、世界规模和跨设备支持上显著优于同类产品[1][2] - Marble并非孤立产品 而是李飞飞"世界模型-空间智能-三维表征"思路的集中落地 代表从语言理解到世界理解再到AGI的演进路径[3][6] - 世界模型被视为AI发展的第三阶段范式 其核心在于三维表征与时空一致性 而不仅是多模态拼接 这将推动内容生产、机器人和AR/VR领域的变革[6][21][29] 大语言模型边界与空间智能必要性 - 大语言模型在写作、推理等任务中展现强大能力 但其基于一维序列的结构无法原生理解三维世界 语言作为有损编码方式难以传递几何、物理和时序因果信息[5][9][10] - 二维像素和视频输入不会自动生成三维结构 关键在模型内部表征需原生支持三维表达 满足可微渲染、视角一致性和物理一致性要求[11][14] - 空间智能是AGI的必要条件 因为世界本质是三维的 二维观测是不完备投影 且语言训练信号是纯生成的 无法替代对三维结构的直接建模[16] 世界模型的技术实现路径 - 数据策略采用混合路径:真实采集+重建生成+仿真合成 以解决三维数据匮乏问题 同时强调数据质量与一致性约束的重要性[20][26] - 算法层面注重"重建与生成合流" 同一套三维表示既能重建真实场景 也能生成虚拟世界 NeRF等方法让小规模算力也能实现原创突破[20][24] - 算力资源配置体现学术与产业分工:工业界侧重系统工程与产品化 学术界专注表示方法和跨模态原理研究[25] 产业发展与落地节奏 - 内容生产为首要落地场景 目标将3D内容生成成本从AAA游戏级降至创作者可及水平 应用覆盖游戏、虚拟摄影、工业设计和教育领域[6][29] - 机器人被视为天然应用场景 空间智能连接数字脑与物理界面 但需先打磨三维表示与交互能力 再承接高风险实体操作[30] - AR/VR作为后续发展阶段 需实现从静态场景到动态要素、可交互性和场景语义的逐步演进[29] 范式演进与投资逻辑 - AI发展遵循三要素共振规律:数据×算力×算法 ImageNet时代是二维标注数据驱动 世界模型时代是三维表示驱动[18][21][23] - 范式演进分为三阶段:监督学习(ImageNet)→生成式建模(扩散/GAN)→三维世界模型(重建×生成)[21][24] - 投资逻辑围绕"找到时代最被低估的数据形态" 三维表示被视为当前最具潜力的数据形态[21][23]
谁在用、用来做什么、在哪儿增长?——OpenAI 与 Anthropic 的两份“用户地图”对比
锦秋集· 2025-09-17 08:44
AI普及速度与采用率 - AI在美国员工中的使用率从20%上升至40%仅用一年 远超电力、个人电脑和互联网的普及速度[1] - AI扩散既覆盖消费端也涵盖企业端部署和系统集成 呈现广泛且快速的特点[1] - OpenAI和Anthropic在2025年9月15日同步发布用户研究报告 分别聚焦消费端行为和企业端经济地图[1] 消费端与企业端使用差异 - ChatGPT非工作用途占比从53%升至73% 三大主要用途(实用建议、信息检索、写作)合计占77%[6][7] - Claude的计算机与数学任务占比达36% 企业API中该比例接近50% 凸显专业化倾向[6][8] - ChatGPT用户更年轻且新兴市场增长快 Claude高强度用户集中于高收入高数字化地区[12][14] 交互模式分化 - ChatGPT以协作式交互为主:52%为询问 35%为执行 14%为表达[9][12] - Claude自动化交互占比高:消费端一次性会话从27%升至39% 企业端达77%[10][12] - 用户行为从逐步指导转向赋予AI自主权 体现从协作助手向自动代理的角色转换[10] 技术路线与商业模式 - OpenAI坚持通用性战略 通过GPT系列吸引7亿普通用户 需求集中在写作和信息检索[16][17] - Anthropic差异化聚焦长上下文和编码能力 Claude Sonnet 3.5在编程自动化形成优势[18] - OpenAI部分转向企业端自动化编程 同时探索C端广告和分成模式[18] 关键应用场景趋势 - C端从"帮我写"转向"帮我理解" 询问类交互超50% 执行型请求降至30%[23][30] - B端从修复转向创造:新代码生成占比八个月翻倍 调试纠错下降近3个百分点[24][32] - 教育科研任务快速增长 教案生成和多媒体研究资料制作潜力显著[24] 地理分布与市场策略 - Claude的AUI指数与人均收入正相关 以色列为全球平均7倍 新加坡4.57倍 美国3.62倍[26] - 高AUI地区(如华盛顿特区、犹他州)扩展至科研教育运营 低AUI地区停留编程工具阶段[26] - 出海企业需优先攻略高AUI市场 低AUI市场从开发工具切入再外溢[26] 成本与上下文瓶颈 - 价格弹性仅-0.29 降价10%仅增加3%使用量 价格非企业采用主要障碍[27][31] - 输入增加1%输出仅增0.38% 上下文供给和系统集成成为真实生产瓶颈[27][35] - 竞争力取决于嵌入CRM、ERP、研发流程等系统的能力[31][35] 创业方向与产品定位 - C端需陪伴式知识助手(如协作学习) B端需端到端自动化引擎(如任务委派)[33][36] - 避免半自动工具定位 明确选择陪伴型或自动化型产品路径[25][36] - 刚需场景需持续演化 如写作转向知识验证 代码从辅助工具转向生产引擎[21][34]
别押错赛道: OpenAI 的25 亿条消息揭示 AI 的真实需求 | Jinqiu Select
锦秋集· 2025-09-17 08:17
AI 的真实需求到底在哪里? 过去两年,几乎所有讨论都在围绕"AI 如何提升工作生产力"展开。但 OpenAI 最新公布的 覆盖 7 亿用户、25 亿条日均消息的内部数据,却给出了一个颠覆性的答案 ——ChatGPT 的使用重心,并不在办公室,而是在生活里。非工作用途的消息比例在一年间从 53% 飙升到 73%,实用指导、信息查询和写作三大类合计接近八成, 而编程、陪伴等被行业热议的场景却出奇冷清。 这固然与 OpenAI 与 Anthropic 等竞争对手在产品定位与功能设计上的差异有关,但更直接的意义在于:ChatGPT 的数据揭示了用户当下真实的需求与痛点。数亿人 愿意反复在这里询问、查找和改写信息,本身就是一种强有力的信号。 当然,这并不等同于未来趋势。用户行为并不是天然的"未来轨迹",而是被产品形态所塑造。OpenAI 把 ChatGPT做成了"数字日用品",于是生活化需求被放大; Anthropic 强调任务自动化闭环,于是企业用例更突出。不同厂商在功能设计和叙事导向上的选择,会深刻影响需求曲线的走向。 基于OpenAI用户的使用习惯,我们发现: 锦秋基金(公众号:锦秋集;ID:jqcapital ...
别走弯路!Anthropic 官方揭秘:大模型哪里有用,哪里有钱 | Jinqiu Select
锦秋集· 2025-09-16 22:32
全球AI采用模式与地理分布 - AI采用速度前所未有 美国员工使用AI比例从2023年20%升至2025年40% [8] - 高收入国家人均AI使用显著领先 新加坡使用率为劳动年龄人口预期的4.5倍 以色列达7倍 [27][33] - 使用高度集中于技术先进经济体 北美、欧洲和大洋洲处于领先地位 非洲、拉美及亚洲部分地区使用率低于预期 [29][33] 任务类型演变趋势 - 代码生成占据主导地位 全球平均占比约三分之一 印度超过50%使用集中于编程任务 [3][21][52] - 创作类任务快速增长 新代码生成任务占比增加4.5个百分点(4.1%→8.6%) 教育材料开发增幅超6倍(0.2%→1.5%) [14] - 调试纠错任务占比下降2.8个百分点(16.1%→13.3%) 净效应向创作转移7.4个百分点 [14] 企业级部署特征 - 企业API调用中77%属于整体委派式自动化 增强协作型任务仅占12% [5][77] - 企业更关注能力与经济价值而非成本 某些任务调用成本高出50%仍被优先采用 [1][88] - API使用高度集中 Top15使用集群占全部流量一半 其中6%为调试Web应用 5%专注于AI系统开发 [69] 区域化应用差异 - 低收入国家聚焦单一场景 高收入国家发展多元应用 新加坡、以色列扩散至科研教育行政等领域 [2][3] - 美国各州应用呈现地域特色 加州偏重IT与数字营销(3.7倍基础数值任务) 佛罗里达侧重商业建议与健身(1.35倍) [53][54] - 巴西侧重翻译(6.4倍)和法律服务(5.0倍) 越南集中开发与教育 印度专注软件开发(2.4倍UI优化) [49][51] 人机交互模式演变 - 指令式自动化占比八个月内从27%升至39% 主要挤占任务迭代与学习份额 [15] - 高采用率地区偏好增强式使用 低采用率地区倾向自动化委派 控制任务结构后仍成立 [58] - 复杂任务依赖上下文整合 输入每增加1%输出仅增0.38% 呈现递减收益特征 [84][87] 经济影响与行业渗透 - AI使用与人均GDP呈正相关 人均GDP每增1% Claude使用增加约0.7% [34] - 企业AI采用率两年内从3.7%升至9.7% 信息行业达25% 住宿餐饮业仅2.5% [66] - 华盛顿特区人均使用全美最高 求职申请相关帮助占比为全美1.84倍 [37][56]
锦秋基金被投公司Sandwich Lab 获千万美元新融资 | Jinqiu Spotlight
锦秋集· 2025-09-16 22:16
投资动态 - 锦秋基金于2024年完成对Sandwich Lab的投资 [1] - 戈壁创投管理的AEF GBA基金及五源资本共同投资Sandwich Lab新一轮融资 累计金额超千万美金 [3][6] 公司概况 - Sandwich Lab成立于2024年 2025年3月推出首款产品AI广告投放Agent Lexi [3][7] - 公司愿景是通过AI帮助企业增长营收 计划推出Email Marketing Agent及财务/税务/法务/供应链/人力资源等多领域Agent [16] 产品与服务 - Lexi定位Meta生态广告投放服务 订阅费每月200美金起 面向全球中小企业主提供全自动广告投放解决方案 [9][10] - 产品采用"影子模式"帮助客户投放广告 用户仅需提供预算和目标范围即可自动完成分析/做图/文案/投放/优化全流程 [10][15] 运营数据 - Lexi上线三个月后付费用户覆盖94个国家 月环比营收增长达150%以上 [3][13] - 目标客群为从未投过广告的海外中小企业主 典型客户年营收约100万美金 [10][12] 战略定位 - 公司采用高价策略验证市场需求 明确"首先要贵"的定价思路 [15] - 聚焦长期经营场景 帮助具备基础营收能力的中小企业突破增长瓶颈 [12][16]
锦秋基金投资的宇树机器人开源世界模型-动作架构 UnifoLM-WMA-0|Jinqiu Spotlight
锦秋集· 2025-09-16 21:56
投资动态 - 锦秋基金已完成对宇树科技的投资 [1] - 基金为12年期AI Fund 以长期主义为核心投资理念 专注于突破性技术和创新商业模式的通用人工智能初创企业 [2] - 设立"Soil种子专项计划" 为早期AI创业者提供资金支持 助力创新想法转化为实际应用 [9] 技术突破 - 宇树科技开源UnifoLM系列世界模型-动作架构UnifoLM-WMA-0 专为通用机器人学习设计 [2][3] - 架构内置理解机器人与环境交互物理规律的世界模型 具备仿真引擎和策略增强两大核心功能 [3][6] - 仿真引擎作为交互式仿真器运行 为机器人学习提供合成数据 [6] - 策略增强功能可通过预测物理世界交互过程优化决策性能 [6] 应用展示 - 模型真机部署实现将木块按红黄绿顺序叠落 右上角小窗口显示未来动作视频预测 [4] - 完成整理橡皮和笔任务 同步展示世界模型对未来动作的预测 [4] - 实现将黑色相机放入包装盒操作 并实时呈现未来动作预测视频 [5]
大模型之后看机器人?Sergey Levine谈通用机器人规模化落地的真实瓶颈与破局方案
锦秋集· 2025-09-15 20:37
核心观点 - 机器人技术将在2030年实现家庭全自主管理 核心驱动力是"机器人数据飞轮"机制 即通过真实任务反馈实现持续迭代和自我强化 [1] - 机器人落地速度可能超越自动驾驶和大型语言模型 因物理世界反馈明确、容错率高且数据获取更容易 [2] - 技术路径基于"视觉-语言-动作"一体化基础模型 依托现有AI底座(如Gemma语言模型)快速开发应用 [3][15] - 硬件成本从数十万美元降至数千美元 降低创业门槛并加速市场验证 [7][33] - 通用机器人实现需突破"三难困境":毫秒级反应速度、长上下文记忆和大模型规模 解决方案依赖云端与本地智能结合 [6][27][28][29] 技术架构与能力 - Physical Intelligence的π0模型采用端到端Transformer架构 整合视觉编码器、语言推理和动作专家 实现感知-思考-行动闭环 [16][17] - 动作控制采用流匹配和扩散技术 生成连续高频指令驱动关节运动 精度远超离散文本符号 [17] - 模型展现"组合泛化"能力:例如自主清理障碍物、扶正容器、翻正衣物等未训练过的行为 [23][24] - 预训练语言模型提供先验知识(如物体识别、空间关系) 加速物理技能学习过程 [17][18] 发展路径与时间线 - 优先小范围真实场景应用 而非大规模模拟 通过精准数据反馈提高资源效率 [4] - 垂直领域机器人服务预计1-2年内落地 通用家庭管家级机器人需约5年 [10][11] - 模拟环境需结合真实世界数据基础 仅作为"排练厅"用于技能排演和反事实思考 [30][31][32] - 数据飞轮启动后 机器人能力将呈指数级提升 从单一任务跃迁至通用家务处理 [1][5][10] 行业比较优势 - 对比语言模型:机器人错误结果明确(如叠坏衣服) 易获得有效负反馈 而语言模型错误难以察觉 [12] - 对比自动驾驶:机器人容错空间大(如打碎盘子可接受) 且受益于现代感知系统和常识推理能力 [13][14] - 具身智能赋予目标导向的视觉过滤能力 从海量视频数据中高效提取关键特征 避免信息过载 [19][20][21] 硬件与经济影响 - 硬件成本十年内从40万美元(PR2机器人)降至3000美元 AI闭环控制降低对机械精度的依赖 [33] - 机器人将放大体力劳动者生产力 类似编程助手对软件工程师的增效作用 [11][34] - 地缘政治挑战在于关键硬件供应链集中 但机器人产业具备"自举"特性:用机器人制造机器人可形成正反馈循环 [35] 生态与竞争维度 - 竞争焦点从纯技术转向产业链、生态链和人才链综合布局 [7] - 教育体系需培养持续学习能力 以适应自动化转型带来的社会变革 [34]
Claude 的秘密:AI 聪不聪明,取决于你给它什么工具 | Jinqiu Select
锦秋集· 2025-09-12 16:48
公司产品与战略 - Claude近期推出可直接创建和编辑Excel、文档、PPT及PDF等主流办公文件的新功能,拓展了AI在实际任务中的应用场景[1] - 公司目标是将AI从"聊天机器人"转变为能解决实际问题的强大伙伴,并曾推出artifact等小而美的客户端工具[1] - 公司分享了其在开发和优化智能体工具方面的经验与方法论[2] 智能体工具设计核心原则 - 转变思维:为不确定的、会推理的AI设计直观易用的工具,而非像传统编程那样只考虑输入输出[3] - 评估驱动:使用真实且复杂的任务进行系统性评估以验证工具效能,评估场景需接近真实世界才能发现真正问题[4] - 少即是多:构建能处理多步骤任务的整合工作流工具,而非提供零散API功能,以减轻AI推理负担[5] - 精心设计描述:工具的名称、描述和参数定义是AI理解其用途的唯一途径,清晰准确的描述能显著提升工具调用成功率[6] 工具开发与优化流程 - 开发流程包括构建原型、运行全面评估、与Claude Code协作自动提升工具性能[11] - 快速搭建工具原型并在本地测试,可借助Claude Code编写工具并连接本地MCP服务器或桌面扩展进行测试[17][18] - 生成大量基于现实世界用途的评估任务,避免过于简单的"沙盒"环境,优秀任务可能需要多达数十次工具调用[24] - 通过程序化方式运行评估,建议收集准确率、总运行时间、工具调用次数、总Token消耗量及工具错误等指标[29] - 分析评估结果时需观察智能体在何处遇到困难,通读推理和反馈以识别不顺手之处,并分析工具调用指标[31] 高效工具的具体设计策略 - 构建少数精心设计的工具针对特定高影响力工作流程,而非简单封装现有API功能[36][37] - 通过命名空间将相关工具按共同前缀分组,帮助在大量工具间划定界限并影响工具使用评估[41] - 工具响应应优先返回高信息量信号,避免低级别技术标识符,将任意UUID解析为更具语义意义的语言可显著提高检索任务精确度[42] - 对可能占用大量上下文的工具响应实施分页、范围选择、过滤或截断组合,并设置合理默认参数值,如Claude Code默认将工具响应限制在25,000个Token[48] - 对工具描述和规范进行提示工程是最有效的改进方法之一,即使微小改进也能带来显著性能提升,例如Claude Sonnet 3.5在SWE-bench Verified评估中取得最先进性能[52]