锦秋集

搜索文档
Google推出Gemini Robotics 1.5,如何让机器人更聪明、更安全、更通用?
锦秋集· 2025-09-26 17:22
核心技术架构 - Google DeepMind推出Gemini Robotics 1.5与Gemini Robotics-ER 1.5两款模型,形成"推理大脑+执行中枢"的黄金组合[1] - ER 1.5作为性能最优的VLM模型,在15项实体推理学术基准测试中斩获综合第一,能通过自然语言理解复杂需求并制定多步骤计划[1] - Robotics 1.5作为顶尖VLA模型,具备"行动前思考"能力,可实现技能在不同机型间的无缝迁移,大幅降低适配成本[1] 核心能力突破 - 模型构建"感知-推理-规划-执行"全闭环,使机器人能完成家庭叠衣、仓储拣选(准确率提升至92%)、医疗创口缝合(成功率89%)等多元任务[2] - ER 1.5具备原生调用谷歌搜索获取外部信息的能力,支持"思考预算"自定义以平衡延迟与精度[1] - Robotics 1.5的跨实体学习特性实现技能在ALOHA 2、Apptronik机器人等不同机型间的无缝迁移[1] 技术性能表现 - Gemini Robotics-ER 1.5在15项学术基准测试中评估,包括实体推理问答和Point-Bench等,测试内容涵盖指向能力、图像问答及视频问答[9] - 模型展现出在高危环境检修、太空作业等延伸场景的潜力[2] - 在ASIMOV基准测试的安全评估中,Gemini Robotics-ER 1.5表现出最先进的性能[16] 开发者生态与应用 - ER 1.5已通过Gemini API开放给全球开发者,Robotics 1.5向选定合作伙伴赋能,加速技术规模化应用[2] - 模型支持灵活的思考预算,开发者可直接控制"延迟与准确性"的权衡[23] - 增强的安全过滤功能让开发更具信心,模型能更好地识别并拒绝生成违反物理约束的计划[23] 行业影响与定位 - 这两款模型是理解下一代Physical Agents发展路径的关键技术,披露了"双模型协同"的架构创新与核心能力参数[2] - 技术覆盖技术底层、场景适配、生态构建核心维度,推动实体智能体时代的发展[3] - 模型帮助开发者打造功能更强大、用途更广泛的机器人,能够主动理解周围环境,以通用方式完成复杂的多步骤任务[3]
锦秋基金被投公司「生数科技」发布Vidu Q2 | Jinqiu Spotlight
锦秋集· 2025-09-25 18:48
投资背景与公司概况 - 锦秋基金于2023年年中投资生数科技,是其早期机构投资人 [1] - 锦秋基金为12年期的AI Fund,以长期主义为核心投资理念,专注于寻找具有突破性技术和创新商业模式的通用人工智能初创企业 [1] - 锦秋基金设有"Soil种子专项计划",专为早期AI创业者提供资金支持,旨在帮助团队将创新想法转化为实际应用 [14] Vidu Q2模型核心能力与突破 - 生数科技于9月25日正式发布新一代图生视频大模型Vidu Q2,主题为"Vidu Q2 看AI演戏",核心提升场景为细微表情生成 [4] - 模型在极致表情变化、推拉运镜、生成速度及语义理解方面取得突破性进展,实现从"生成视频"到"生成演技",从"动态流畅"到"情感表达"的跨越 [4] - Vidu Q2能够理解并生成极其细腻的面部微表情,如嘴角抽动、眼神犹豫、眉头微蹙,攻克了生成真实情感的关键技术瓶颈 [5] - 技术突破得益于多模态理解与生成技术的深度融合,结合情感文本理解、图文解析及对人体面部动作单元的精细解构与物理模拟 [9] - 首席执行官骆怡航表示,此次突破在于首次让AI角色拥有了'有趣的灵魂',教会了AI'演戏',是技术里程碑 [8] 产品功能与性能特点 - Vidu Q2支持图生视频、首尾帧视频、时长可选(2-8秒)、电影大片及闪电出片两种模式 [4] - 模型在复杂表情变化的文戏、多人打斗场景的武戏及炫酷特效中表现出彩 [4] - 产品矩阵包括网页版、App版及API同步上线,兼顾出片质量与效率,适配从高端影视制作到快速社交媒体内容生产的不同需求 [10] 行业影响与应用前景 - Vidu Q2的发布标志着AI视频生成技术从追求"形似"进入追求"神似"的新阶段 [4] - 该技术将为内容创作、影视产业、广告营销等领域带来全新升级 [4] - 模型推动内容创作范式从"人执行"转向"人指导",创意生产核心模式转变,创作者可专注于创意与审美 [11] - 技术开启"人机共创"新纪元,AI负责精准表演,人类扮演"总导演",将推动AI深入电影预演、虚拟人交互等复杂工业流程 [11] - 这种深度协作将释放生产力,催生新创意形式,释放更大商业价值 [11]
锦秋基金跟大家聊一聊新一代 AI 创始人 |Jinqiu Spotlight
锦秋集· 2025-09-25 17:53
追踪锦秋基金与被投企业的每一个光点与动态, 为创业者传递一线行业风向。 9 月 20 日,由硅星人组织的AI Creators Carnival——AI 创造者嘉年华上,AI 开发者及创业者、不 断迭代创新的AI产品公司、 活跃在一线的投资人聚集在一起,共同分享 AI 新浪潮中的观察和体 验。 锦秋基金合伙人臧天宇 应邀参加圆桌论坛 "聊聊新一代的 AI 创始人" ,同场的还有 主持人播客 《乱翻书》主理人潘乱,嘉宾真格基金合伙人刘元、蓝驰创投合伙人曹巍、峰瑞资本投资合伙人陈 石。 创新不是个例,而是日常;不是凑个热闹,而是持续耕耘。 「Jinqiu Spotlight」 如果你想与我们交流,可以直接与我们联系,或是参与锦秋为为创业者打造的常态化闭门社交活动 —— 「锦秋小饭桌」 。 以下是近期饭桌上新菜单,欢迎找我们一起品鉴! AI Agent@深圳 09.26 具身智能@北京 10.10 机器人派对@深圳 10.17 关于 AI 原生创业的探讨,锦秋还在持续。 我们希望在这场新浪潮中,与更多的创业者、技术产品专家、 投资人、 创新观察家共同对话,来构 建我们同频的学习场域。 | Jinqiu | 美国 T ...
Demo 能博眼球,生产才赢生存:64页AI Agent 创业者落地指南 | Jinqiu Select
锦秋集· 2025-09-25 13:54
过去两年,几乎每一位 AI 创业者都能在 Demo 上收获掌声:一个对话原型,一个多工具的展示,就能轻松让投资人眼前一亮。但现实很快泼来冷水——用户不会 为炫酷的 Demo 买单,企业也不会把关键流程交给一个"不确定的模型玩具"。从 Demo 到生产,隔着的往往不是模型差距,而是工程化、可靠性和商业化的深渊。 谷歌最近发布了一份关于AI Agent开发的深度技术指南,系统性地展示了其对于如何将一个Agent从初期原型,打造为生产级应用的完整思考和方法论。 指南重点介绍了以下几个核心技巧与重点: 锦秋基金(公众号:锦秋集;ID:jqcapital)认为,这篇文章不仅系统地梳理了构建高级AI Agent所需的技术知识,更提供了一套可落地的工程实践和自动化工具, 为拥抱Agent系统潜力的初创公司和开发者提供了一张清晰的、以运维为驱动的路线图。 基于Google的这篇报告,你将会观察到: AI Agent的核心概念 :深入理解构成一个Agent的关键组件,包括其"大脑"(模型)、"双手"(工具)、执行功能(编排)以及实现信息准确性的"知识注 入"(Grounding)机制。 代码优先的构建方法 :学习如何使用谷歌的 ...
继OpenAI千亿豪赌后,阿里3800亿入局:全球算力之战,谁能给出终极答案?
锦秋集· 2025-09-24 18:17
全球算力投资格局 - 英伟达与OpenAI宣布千亿美元级别AI算力集群合作[1] - 阿里巴巴宣布投入3800亿人民币加强AI基础设施并持续追加投资[2] - OpenAI、谷歌、Meta、xAI及阿里巴巴等全球科技巨头均加入算力竞争[3][4] 算力竞争战略核心 - 算力基础设施成为AGI和ASI竞赛的战略基石[5] - 构建算力壁垒需具备未来预判、工程执行、系统架构颠覆和开发者生态构建能力[6][7] - 英伟达作为核心硬件供应商提供行业参考标准[8] 英伟达与英特尔合作 - 英伟达向英特尔投资50亿美元联合开发定制数据中心和PC产品[10] - 合作使英伟达投资增值30%获利10亿美元[10] - 双方合作开发chiplet封装PC产品显著提升笔记本电脑市场竞争力[10] 市场竞争影响 - 英伟达与英特尔合作对AMD构成重大威胁[11] - ARM架构因英伟达获得英特尔技术支持面临竞争压力[11] GPU市场动态 - GPU市场经历从产能紧缺到价格战再回归产能为王的周期变化[12] - 初创公司获取少量GPU容易但大规模部署困难[12] 云服务商战略 - 甲骨文凭借强大资产负债表为OpenAI等客户提供3000亿美元超长期计算订单[13] - 采用灵活硬件策略兼容英伟达Infiniband和Arista以太网技术[13] - 通过精密数据中心模型预测算力增长和收入[13] AWS复苏策略 - AWS通过为Anthropic等客户提供海量GPU和自研Trainium芯片推动收入增长超20%[14] - 升级传统数据中心成本相比GPU价格微不足道[14] - Trainium芯片在特定大规模场景下展现效率优势尽管通用性较差[15] Blackwell架构性能 - GB200部署成本为H100的1.6倍但性能提升高度依赖工作负载[17] - 预训练任务性能提升约2倍属边际提升[20] - 特定推理任务性能提升达6-7倍每美元性能提升3-4倍[20] 系统可靠性挑战 - GB200 NVL72将72个GPU互联形成单一故障域[18] - 故障爆炸半径问题导致单GPU故障可能使整个机柜下线[20] - 采用64+8工作负载管理策略应对可靠性挑战[20] 硬件架构演进 - AI推理分为预填充(计算密集型)和解码(内存带宽密集型)两个阶段[28] - 业界采用分离式部署策略优化不同任务[21] - 英伟达推出专用CPX芯片剥离HBM降低制造成本[21] 英伟达核心竞争力 - 创始人黄仁勋采用YOLO式大胆决策策略如提前投资Xbox芯片产能[23] - 通过锁定供应链产能策略主导市场[23] - 管理风格依赖商业直觉而非数据报表[24] 技术执行力 - 芯片设计实现一次成功能力避免多次修订延迟[26] - Volta芯片在最后时刻增加Tensor Cores奠定AI硬件霸主地位[26] - 强大执行文化确保产品准时交付[25] 未来资金部署 - 英伟达年产生数千亿美元自由现金流面临巨额资金部署挑战[27] - 反垄断监管限制大型并购选项[27] - 可能投资数据中心、能源基础设施或机器人和AI工厂[27]
美国 Top 15的AI 天使投资人都投了哪些公司? | Jinqiu Select
锦秋集· 2025-09-24 17:02
当中国创业者走向海外,他们最该争取哪些海外的 AI 天使投资人?当中国早期投资人寻找参照,他们又该向谁学习? CB Insights 近日发布了全球 Top 15 AI 天使投资人榜单。 锦秋基金(公众号:锦秋集;ID:jqcapital)认为某种程度上,对创业者;这是一份融资Pitch List,对投资人,这是一份值得榜样名单。 因此, 锦秋基金(公众号:锦秋集;ID:jqcapital)基于这个名单 ,继续搜集整理了Top15的投资人在AI领域的代表性投资案例。希望能给关注AI的读者朋友提供 有价值的参考。 基于我们的观察和整理,Top15的天使投资人押注的项目,并非散点式的"随缘下注",而是呈现出高度一致的共性和清晰的趋势。 1 在赛道选择上,他们集中在两大方向:基础设施与高价值垂直场景。 基础设施层的投资覆盖了 AI Agent 平台、世界模型、自动化开发工具以及算力、数据管理、AI 安全等核心领域,例如 Anysphere(AI Coding)、Resolve AI(自动 化)、Yupp(评测平台)、Roboflow(计算机视觉工具)。 与此同时,他们也倾向于投向法律、医疗、金融、制造等高门槛、强需 ...
寻找你的AI同频搭子|「锦秋小饭桌」活动上新
锦秋集· 2025-09-23 17:44
活动信息 - 锦秋小饭桌是为创业者打造的常态化闭门社交活动,每周五晚在北京、深圳、上海、杭州等地举办 [22] - 活动形式为非正式会谈和产品技术人社交饭局,围绕技术、投资、硅谷和国内进展等话题进行真诚交流 [23] - 2025年9月至10月将举办三场活动:9月26日深圳AI Agent专场、10月10日北京具身智能专场、10月17日深圳机器人派对 [3][5][50] 大模型在决策任务中的应用局限 - 现阶段大模型不适合直接用于严肃的长序列决策任务(如游戏AI),其表现不如传统的小型强化学习模型 [25] - 决策任务具有一步错满盘皆输的特性,而大模型擅长的感知/生成任务容错率较高 [25] - 大模型训练数据中缺乏高质量的决策过程知识和数据,例如在斗地主游戏中性能仅能勉强战胜随机出牌的智能体 [26] 信息检索范式演进 - 传统RAG通过外部的Embedding、Ranking、Retrieval等工程化手段进行信息召回 [32] - 新一代模型(如Claude)具备原生上下文感知能力,能自主决定使用何种工具进行语义和场景强相关的信息检索 [33] - 模型原生能力效果好但成本高,适合模型开发者,应用层公司为控制成本仍需采用外部工程方案或混合使用 [35] Agent架构与发展趋势 - 目前主流应用基于React的单智能体模式,通过思考-行动循环完成任务 [36] - 多智能体系统正在兴起,通过规划、解题、验证等多个角色智能体协同工作,可取得超越单智能体的效果 [36] - 让AI Agent交付预期结果的关键在于前期生成清晰明确的需求文档、软件架构图和任务列表 [38] AI Agent基础设施技术流派 - Sandbox模式以Manus为代表,为每个Agent启动一个独立的完整Linux系统沙箱,功能强大但资源消耗大 [39] - 模块化组件模式以AWS Agent Core为代表 [40] AI硬件与交互方式演进 - 通用Agent的机会在于交互方式变革,如从打字到语音输入,未来可能出现新硬件设备利用AI服务时间 [42] - 主动式AI硬件是下一代产品,但面临技术挑战,预计还需2-3年才能被工程化验证 [43] - Meta发布的Rayban Display是中间产品,备货量仅1-2万台,性能表现不佳且演示出现故障 [44] 大模型记忆管理与数据源 - Memory管理是大模型能力提升的下一个赛点,需找到模型自发压缩状态的方案以突破transformer架构的上下文限制 [45] - 拥有多样化数据源的Agent在理解用户语境方面表现更好,例如谷歌通过浏览器、云盘、邮箱等服务覆盖用户生活场景 [46] - 开发专有浏览器是为AI功能提供最高权限的技术路径,可避免频繁权限提示,提供更流畅体验 [46] 创业支持 - 锦秋基金设立Soil种子专项计划,专为早期AI创业者提供资金支持,帮助将创新想法转化为实际应用 [57]
Nvidia砸千亿美元助力OpenAI,马斯克狂飙造全球最大AI集群 | Jinqiu Select
锦秋集· 2025-09-23 12:44
当基础能力持续进步时,创业的关键在于找到新的应用场景和差异化路径。也许是某个高频的行业环节,也许是某种全新的交互方式,也可能是模型与硬件、人与人 的结合。初创公司同样需要在自己的条件下,找到独特而极致的打法。 今天,AI领域迎来一桩惊天动地的消息:Nvidia 宣布将向 OpenAI 投入高达 1000 亿美元 的战略投资,携手打造至少 10 吉瓦(gigawatts)的数据中心基础设施,用于 支撑下一代模型的训练与部署。 这一动作,标志着模型层玩家的AI 战争从算法、产品层面,真正迈入了"基础设施+算力"的硬核较量阶段。 与此同时,另一边的 Elon Musk 正以一种近乎"超现实"的速度布局算力版图:xAI 正在孟菲斯、密西西比等地加速建设 Colossus 系列 AI 集群,目标是在最短时间内实 现数百兆瓦甚至接近吉瓦级别的集群能力。电站、涡轮机、跨州供电 ──这些支撑算力的根基,都在高强度投入中被快速铺设。 模型层大玩家依然在坚定地押注模型,资本、算力、速度也成为顶级玩家已经形成了难以撼动的护城河。 对大量非模型层的AI创业者来说,这无疑都是好消息。 无论是OpenAI的超大规模训练,还是xAI的集群 ...
119页报告揭示AI 2030 关键信号:千倍算力,万亿美元价值 | Jinqiu Select
锦秋集· 2025-09-22 20:53
如果未来五年没有"神来一笔"的算法突破,只把今天这条趋势线按原样拉长,会发生什么? 答案可能是几串足以改写行业版图的数字:10^29 FLOP 的单次训练量、≈1000× 的算力放大、≈2000 亿美元的硬件投入、2%+ 的全球用电占比,最前沿训练的峰值 功率直逼吉瓦级。 这是Google DeepMind委托Epoch AI 完成的百余页量化研究《AI in 2030》给出的答案。 这些数据共同定义了 2030 年的 AI——一条保守基线;也回答了行业关注的诸多问 题——算力如何涨、电力要到什么级别、钱花在哪儿、哪些能力会先兑现。 本周,OpenAI 与 Anthropic 也发布了自己的用户数据报告,回答了另一半问题:沿途该怎么管着走。 锦秋基金也做了相关的编译, 感兴趣的朋友可以点击链接查 看。 别走弯路!Anthropic 官方揭秘:大模型哪里有用,哪里有钱 | Jinqiu Select 别押错赛道: OpenAI 的25 亿条消息揭示 AI 的真实需求 | Jinqiu Select 谁在用、用来做什么、在哪儿增长?——OpenAI 与 Anthropic 的两份"用户地图"对比 把这三篇报告叠在 ...
锦秋基金被投公司地瓜机器人提出纯视觉机器人操作方法VO-DP | Jinqiu Spotlight
锦秋集· 2025-09-22 15:15
2025年,锦秋基金已完成对地瓜机器人的投资。 锦秋基金,作为12 年期的 AI Fund,始终以长期主义为核心投资理念,积极寻找那些具有突破性技术和创新商业模式的通用人工智能初创企业。 地瓜机器人是业界领先的机器人软硬件通用底座提供商, 起步于2015年诞生的地平线机器人。 为了让更智能的机器人开发更简单,地瓜机器人构建了从芯片、算法到软件的完善产品体系,并以旭日智能计算芯片和RDK机器人开发者套件为核心,形成了 覆盖5~500 TOPS*各算力段的完整产品布局,可满足人形、四足狗、家庭服务、陪伴、物流AMR等多种机器人计算需求。 迄今,旭日系列芯片出货量已超过500万片,超过200家中小创客、200+头部高校以及来自全球20多个国家的近100,000名个人开发者在地瓜机器人平台上, 创造了数百种形态的智能机器人产品,为全球数百万用户带来了智能化体验。 近期, 地瓜机器人团队与同济大学联合推出了全新的视觉机器人操作方法——VO-DP 。该方法采用纯视觉方案,通过融合先进的视觉基础模型,突破了传统 点云模型的局限,为机器人在复杂操作任务中的表现带来了质的飞跃。VO-DP不仅提升了机器人的操作精度,还展现了纯视 ...