Workflow
锦秋集
icon
搜索文档
三万字解读:数据采集革命,决定机器人走向大规模落地|假期充电
锦秋集· 2025-10-03 12:03
⚡️ 假期充电系列继续 今天为大家整理 2025 年 CoRL 期间举办的首届 "Making Sense of Data in Robotics" Workshop,一起探究: 在机器人技术飞速发展的今天,人 们常常把目光聚焦在算法与模型上,是否忽视了真正决定"能否走出实验室、实现大规模落地"的底层变量——数据。 数据不仅是训练基础模型的燃料,更是 支撑策略泛化、稳定运行与安全可控 的地基。没有高质量、场景匹配的数据,再先进的模型也只能停留在论文 与Demo里。 此次Workshop正是一次针对这一"被低估的核心要素"的集体深思。会议聚焦于数据构成、数据筛选与数据可解释性三大命题,试图回答机器人行业最 迫切的问题: 1. 机器人真正需要什么样的数据? 2. 如何从海量原始信息中提炼出能提升策略表现的数据? 3. 又该如何理解数据对机器人决策与行为的实际影响? 锦秋基金(公众号:锦秋集,ID:jqcapital)认为, 这场 Workshop 的价值不只是学术交流,而是揭示了实体智能走向产业化过程中的"关键一 环"。 无论是 Joseph Lim 团队提出的"任务拆解 + 模块复用"式数据高效利用,还是 Ke ...
AI+ Tech Week来袭,听Meta,Character.ai, Pokee, Wanderboat等分享Agent前沿
锦秋集· 2025-10-02 16:38
峰会概览 - 2025年AI+ Multimodal Day & Agent Everywhere峰会将于10月10日至11日在旧金山举办,聚焦多模态AI与智能体两大前沿方向,汇聚技术、资本与产业力量推动AI技术落地与生态共建[2] - 峰会预计汇聚超过2000名行业精英,其中创始人占比40%、投资人占比30%、研究员占比30%[2][18] - 锦秋基金作为合作伙伴参与,其被投企业Pokee AI创始人朱哲清和Wanderboat.ai CEO You Wu将在现场交流[2] 核心亮点 - 活动采用双主题并行模式,首日聚焦“AI+ Multimodal Day”探讨视觉、语音与跨模态数据处理,次日围绕“Agent Everywhere”深入智能体架构与工作流重构[16] - 超过20家AI团队将进行现场产品首秀,涵盖多模态数据库、智能体基础设施及AI原生应用领域,包括Genspark、Browserbase、OpusClip等知名公司[17] - 活动设置四个主题论坛,分别讨论智能体操作系统、多模态数据库、AI原生娱乐及物理AI智能革命,并包含产品展示和 networking 环节[9][14] 参与企业及业绩 - Character.ai 是全球排名第一的AI社交平台,其多模态负责人将参与论坛[23] - Genspark.ai 的通用智能体产品在45天内达成3600万美元年度收入[23] - Browserbase 已完成4700万美元融资,提供基于云的无头浏览器服务[23][24] - Tinyfish 成功融资4700万美元,打造了部署量最大的企业级网页智能体[24] - LanceDB 作为多模态数据库先锋融资3000万美元,打造下一代非结构化数据存储引擎[26] - GMI Cloud 作为GPU云基础设施领军者融资8200万美元,反映市场对算力底层技术的强烈需求[26] - OpusClip 成立18个月积累1000万用户,年经常性收入达八位数,被软银视为下一代AI视频编辑工具标杆[31] - Creatify.ai A轮融资1550万美元,18个月实现900万美元ARR,团队来自Meta、Snap等大厂[31] - Higgsfield.ai 在5个月内实现5000万美元ARR,用户超1100万,展现AI产品规模化落地的极致效率[31] - Plaud.ai 产品Plaud Note是全球领先的AI录音笔,年化收入超过1亿美元,设备全球出货量近70万台,并实现连续两年10倍增长[35] - Composio 平台已集成超500种工具,成功融资2900万美元,致力于构建AI智能体无缝调用外部能力的核心骨干网[36] - E2B 完成2100万美元A轮融资,定位为企业级AI智能体云基础设施的定义者[37] 论坛议题聚焦 - 智能体操作系统论坛将探讨下一代AI智能体需超越文本处理,具备看、说、做能力,通过视觉、语音和交互捕获人类情境[21] - 多模态数据库论坛强调数据库需从静态仓库转变为能主动理解内容、连接语义的智能引擎,以支持自动驾驶、医疗影像等应用[24] - AI原生娱乐论坛关注AI如何通过处理文字、图像、声音能力发明全新文化玩法,重塑内容生产流程[29] - 物理AI论坛深入探讨硬件与AI交叉点,包括传感器、交互界面到具身智能体,探索汽车、机器人等行业变革机遇[33] 被投企业介绍 - Pokee AI 利用强化学习开发前沿AI Agent,具备高级规划、推理能力,并能灵活调用多样化数字工具,其技术可扩展至数千种工具与复杂工作流[10] - Wanderboat.ai 是旅行垂类AI应用黑马,拥有500万用户,通过智能规划与社交互动重塑旅行体验[11][13]
国庆长假充电指南:Ilya Sutskever's Top 30 论文阅读清单
锦秋集· 2025-10-01 21:25
文章核心观点 - 文章推荐了一份由Ilya Sutskever精选的30篇AI领域前沿论文合集,该合集覆盖了近15年AI发展的里程碑成果,以"技术底层-能力突破-场景落地"为主线,串联了AI从感知智能到认知智能的关键跃迁 [4] - 该论文合集旨在帮助投资者、从业者与研究者系统梳理AI技术演进脉络,深刻理解当前AI产业落地的机遇与挑战,实现专业能力的高效提升 [1][5] - 合集内容不仅清晰拆解了残差映射、动态指针网络等专业术语的技术逻辑,还通过论文中的实验数据和架构设计,为从业者提供从理论到落地的参考路径 [5] 论文合集技术框架 - 合集涵盖奠定深度学习基础的CNN、RNN,重构自然语言处理领域的Transformer与自注意力机制,以及推动RAG、多步推理等前沿方向的核心研究 [4] - 每篇论文都是对应技术领域的奠基之作,直接关联当前AI产业落地的核心能力底座,包括《GPipe》中的并行训练方案如何降低大模型算力成本,《Retrieval-Augmented Generation》如何解决AI幻觉问题以适配金融、医疗等高精度场景 [4][5] 代表性论文技术要点 深度学习基础架构 - ImageNet Classification with Deep Convolutional Neural Networks论文提出的CNN架构包含5个卷积层和3个全连接层,在ILSVRC-2010数据集上top-5错误率为17.0%,显著优于此前方法 [48][52] - Deep Residual Learning for Image Recognition提出的残差网络通过残差块简化了深层网络训练,152层ResNets在ImageNet等数据集上性能优于VGG nets [73][77] - Recurrent Neural Network Regularization提出将dropout技术应用于LSTM的新方法,在Penn Tree Bank数据集上词级困惑度显著降低 [21][24] 注意力机制与Transformer - Attention is All You Need完全依赖自注意力机制提出Transformer架构,在WMT 2014 English-to-German翻译任务中BLEU分数达到28.4,比当时最先进模型高出2个多BLEU点 [105][117] - Neural Machine Translation by Jointly Learning to Align and Translate引入注意力机制解决固定长度向量瓶颈问题,在WMT '14 English-to-French翻译任务上BLEU分数显著提升 [119][126] 模型扩展与优化技术 - GPipe通过微批量流水线并行技术实现大型神经网络高效训练,支持训练包含60亿参数、128层的Transformer模型,在ImageNet-2012数据集上top-1准确率达到84.4% [62][72] - Scaling Laws for Neural Language Models发现模型性能与参数规模遵循幂律关系,更大规模模型具有更高样本效率,在固定计算预算下训练极大型模型是最优策略 [212][218] 特定应用领域突破 - Neural Message Passing for Quantum Chemistry提出的MPNNs框架在QM9数据集上13种性质中有11种达到化学精度,为分子性质预测提供强大工具 [94][101] - Deep Speech 2端到端语音识别模型在英语和普通话上均实现高准确率,在WSJ、LibriSpeech等基准测试中性能超过人类转录员 [203][209] - Pointer Networks提出新型神经架构解决输出词典大小可变问题,在计算平面凸包、德劳内三角剖分等几何问题上性能显著优于传统序列到序列模型 [37][45] 技术演进趋势 - 从传统神经网络到残差网络、注意力机制的演进表明,通过架构创新可有效解决梯度消失、长期依赖关系等核心挑战 [73][105] - 模型规模与性能关系研究为大规模神经网络训练提供理论指导,计算效率最优策略推动行业向极大型模型方向发展 [212][224] - 多令牌预测等新型训练方法重新定义LLMs处理文本方式,通过并行预测多个未来令牌提升模型效率和速度 [259][264]
2025年前三季度荣誉墙上新:锦秋AI之旅的阶段性总结|Jinqiu Spotlight
锦秋集· 2025-09-30 21:06
公司投资理念与定位 - 公司专注于AI投资领域已有12年历史,致力于推动算法和代码在真实世界中的落地应用[1] - 公司坚持长期主义投资策略,支持敢于定义AI问题的优秀创始人,在产业变革中共同前进[1] - 公司获得来自创业者群体、媒体机构和合作方的广泛好评,体现了行业对公司专业能力的认可[1] 行业荣誉与排名表现 - 公司入选36氪"2025中国人工智能产业投资机构"榜单,与红杉中国、IDG资本等头部机构并列[2][5][6] - 公司入选36氪"2025中国具身智能产业投资机构"榜单,在具身智能领域表现突出[2][8][9] - 公司创始合伙人杨洁入选36氪"2025中国人工智能产业投资人"榜单[2][11][12] - 公司入选甲子光年"2024-2025年度人工智能最佳投资机构TOP30"[16] - 公司入选钛媒体"投资先锋榜TOP10"和"投后管理先锋榜"[18][20][22][23] - 公司入选钛媒体"AI Agent领域榜单TOP20",在垂直应用领域获得认可[18][26][27] - 公司入选来觅"2025年中人工智能投资机构TOP20"和"2025年中机器人投资机构TOP20"[29][30] - 公司合伙人臧天宇入选第一新声"2025中国AI产业创新榜单先锋投资人TOP30"[32][33][34][35] - 公司位列第一新声"2025年具身智能最活跃投资机构TOP10"第4名,仅次于红杉中国、北京国管和深创投[36] - 公司入选Win.d全球企业库"AI投资机构TOP30"榜单[39][40] - 公司入选犀牛数据"2025年中国生成式AI投资机构"榜单[42] - 公司入选最科技"中国先锋科技投资机构50强"[44] 行业发展趋势 - 公司持续关注AI创投领域发展趋势,2025年AI创投趋势值得关注[50]
硬件不是问题,理解才是门槛:为什么机器人还没走进你家
锦秋集· 2025-09-29 21:40
文章核心观点 - 机器人技术发展的核心瓶颈并非硬件性能,而在于机器人缺乏对人类物理世界的直观理解和预测能力 [1][2] - 基于学习的动力学模型通过从感知数据中直接学习物理交互规则,为解决机器人操作中的物理预测难题提供了新路径 [2][8] - 该方法已显著提升机器人处理可变形物体、颗粒物质及多物体交互等复杂任务的能力,有望推动机器人从实验室演示走向日常应用 [5][6][20] 基于学习的动力学模型概述 - 与传统基于物理原理的模型不同,基于学习的模型直接从原始感官数据推导状态转移函数,无需完整状态信息即可捕捉复杂物理因素 [8][20][24] - 学习模型能够补偿状态估计误差并绕过显式状态估计步骤,有效弥补传统解析模型的"仿真到现实差距" [20][33] - 习得模型具有端到端可微性,支持基于梯度的规划与控制,且在非刚性系统中计算效率高于解析求解器 [20][35] 状态表示方法及权衡 - 原始像素表示直接使用RGB-D等二维特征图,无需显式状态估计但计算开销大,且存在物体恒存性和时间一致性问题 [36][40] - 潜在表示将高维观测压缩为低维隐向量,提升学习效率与泛化能力,但可能丢失任务相关信息 [36][42][46] - 三维粒子表示显式编码几何结构,精确捕捉可变形物体形状,但需要精确感知和状态估计,对遮挡敏感 [36][47][50] - 关键点表示聚焦任务相关特征,提供高效计算方式,支持实时控制,但对遮挡敏感且需保持跨时间检测一致性 [10][52][56] - 物体中心表示将场景建模为离散实体,支持组合泛化,适用于多物体操作,但难以处理流体等连续材料 [11][57][62] 与机器人控制的集成 - 运动规划方法利用习得动力学模型进行轨迹优化和路径搜索,在缺乏精确解析模型的环境中实现可行路径规划 [12][70][71] - 策略学习通过从模型生成的仿真数据中学习状态-动作映射,或结合强化学习优化策略,减少对真实环境交互的依赖 [12][14][72][74] - 集成应用已覆盖物体重定位、可变形物体操作、多物体交互和工具使用等复杂任务场景 [75][76][77][78][84] 未来研究方向 - 感知领域需开发应对部分可观测性和多模态信号融合的新方法,以提升状态估计的稳健性 [15][87][89][90] - 动力学学习需重点提升模型在未探索状态-动作空间的稳健性,并探索利用基础模型提供物理先验 [15][91][92][93] - 控制领域机遇包括分层动力学建模与规划、学习规划算法以及结合不确定性量化的性能保证技术 [15][97][98][99] - 新兴表示方法如3D高斯泼溅技术可能为动态场景建模提供更灵活的解决方案 [95]
地瓜精酿馆开张大吉:碰杯VLA观点,互诉机器人信仰|地瓜机器人x锦秋基金
锦秋集· 2025-09-29 21:14
9月24日晚,地瓜机器人与锦秋基金联手邀请来30 余位 「机器人头号玩家」 ,在杭州举办了一场机器人精酿Party。 来自 地瓜机器人 生态负责人胡春旭、云平台负责人秦玉森、算法负责人隋伟、锦秋基金合伙人臧天宇、锦秋基金投资副总裁Cindy、阿里云生态负责人 陈博 、 X-Man科沃斯蒲公英加速器总经理赵文景 空降现场,一起和科技大厂产品达人、技术专家、创业先锋们微醺开聊 "机器人的新一代故事" 。 现场机器人玩家们硬核开麦, 开发者们灵感捧杯 到我的客 杯精酿互诉机器 会 门对小对物 # # 地瓜机器人 醫 锦秋基金 ir ans and 12 12 statis 杯精酿互诉机器人信 杯里有精酿,哪里有 H El B 精蛋TE 地瓜机器人 鲨 锦桃基金 杯精酿互诉机器人信仰 I 力校准液制作中 # # 地瓜机器人 器 锦秋基金 同时,锦秋基金就现场大家对 VLA 不同观点的讨论,做了以下记录 挑战派 两条腿走路:上层大模型负责理解/任务分解,底层RL/规控负责约束满足与实时稳定;协同进化。 自主数据生成与仿真增强:用RL+物理仿真(动力学/碰撞/库伦摩擦)造数据、学策略,提高泛化;像"孩子学走路"靠自我试错 ...
「锦秋基金」领投「首形科技」新一轮融资|Jinqiu Spotlight
锦秋集· 2025-09-29 15:11
融资信息 - 首形科技于2025年9月29日完成本年度第三轮融资 [2][7] - 本轮融资由蚂蚁集团与锦秋基金联合领投,厚雪资本、弘晖基金、银杏谷资本共同投资,老股东顺为资本、招商局创投超额加注,Taihill追投 [2][7] - 深蓝资本担任此轮融资的独家财务顾问 [7] 公司定位与业务 - 首形科技是超高仿生情感交互机器人领域的领军企业 [3][7] - 公司具备机器人硬件与仿生运动算法的研发优势,致力于在细分市场形成差异化领先地位 [8] - 公司正推动一场范式转变,目标是让虚拟数字生命跨越屏幕,成为可感知、可交流、自主的实体 [8] 资金用途与核心技术 - 本轮融资资金将主要用于情绪基座模型的迭代和多场景应用的落地 [3][7] - 公司研发的情绪基座模型旨在为现有对话类大模型提供更直观的情绪表达能力 [8] - 公司计划提供沉浸式、长期可持续的角色实体交互体验 [8] 产品战略与市场定位 - 精灵计划强调外观美学与角色气质,旨在将人形机器人打造为具备艺术收藏价值的科技品类 [10] - 最新产品精灵·璇拥有超仿生面孔和高辨识度设计,具备拟人化与艺术品的双重身份 [10] - 公司的长期愿景是创造能与人共情、传递真实温度的亲密伙伴,而非仅仅是工具 [12] - 公司计划用十年时间实现让机器人不再机器的目标 [12] 创始人背景 - 创始人胡宇航在学术与创业一线深耕,并通过自媒体账号【U航】分享故事 [14] - 其自媒体账号目前在全网拥有超过200万粉丝关注 [14]
「锦秋基金」领投的「乐享科技」完成2亿元新融资|Jinqiu Spotlight
锦秋集· 2025-09-28 12:10
「Jinqiu Spotlight」 追踪锦秋基金与被投企业的每一个光点与动态,为创业者传递一线行业风向。 锦秋基金已于2025年5月完成对乐享科技的领投投资。 锦秋基金(公众号:锦秋集,ID:jqcapital)是一家双币早期投资机构,致力于推动通用人工智能的发展,积极寻找那些具有 突破性技术和创新商业模式的通用人工智能初创企业。 9月28日, 消费级具身智能机器人企业 ---苏州乐享智能科技有限公司(以下简称 "乐享科技")正式宣布完成 2亿 元"天使++"轮融资 。本轮融资由钟鼎资本领投,老股东 IDG 资本持续加投,资金将主要用于自研核心零部件攻 关、机器人本体与运动控制技术开发及意识仿生模型迭代等,目标加速消费级具身智能产品规模化落地。 这是乐享科技自成立以来 9个月内完成的第三轮融资 。截至目前,公司天使轮融资总金额已接近 5亿元 。 团队中,两位消费级机器人二十年经验的产品线总裁、CTO,与具身智能行业的顶尖人才配合,构建了丰富的技术研发经验 与学术创新的融合,为公司在具身智能领域的技术突破及后续量产化开发保证了坚实基础。 产品落地赋能多场景,多场景验证商业化潜力 以下为此次融资的相关新闻。 乐 ...
锦秋基金被投星尘智能ControlVLA入选顶会CoRL | Jinqiu Spotlight
锦秋集· 2025-09-28 12:08
2024年锦秋基金领投星尘智能A轮融资,2025年锦秋基金继续追投星尘智能A+轮融资。锦秋基 金,作为12 年期的 AI Fund,始终以长期主义为核心投资理念,积极寻找那些具有突破性技术和创 新商业模式的通用人工智能初创企业。 摘要 学习真实世界中的机器人操作具有挑战性,尤其是在可用演示样本有限的情况下。现有的少样本操 作方法通常依赖于仿真增强数据或预构建模块(如抓取和姿态估计),这些方法难以解决仿真到真 实的差距问题,且可扩展性较差。尽管大规模模仿预训练展现出潜力,但在数据稀缺场景下,如何 将这些通用策略适配到特定任务中仍有待探索。 星尘智能 是绳驱AI机器人的定义者,是业界首个量产绳驱AI机器人的公司。其 独特的绳驱传动设 计,模仿人类肌腱的运动与力控方式 ,让机器人能实现传统刚性机器人难以兼顾的高表现力与高安 全力,尤其适合复杂灵巧操作和与人紧密交互的场景。目前,其Astribot S1机器人已在科研、商业 服务、文娱演出及工业等多个领域落地应用,结合AI大模型与具体场景探索,推动机器人行业应用 加速与商业化落地。 近期, 星尘智能与 北京通用人工智能研究院 提出的 ControlVLA 框架 入选顶 ...
ChatGPT Pulse上线,OpenAI官方解读如何推动LLM迈向主动智能
锦秋集· 2025-09-26 19:31
文章核心观点 - OpenAI推出ChatGPT Pulse功能,标志着AI从被动响应工具向主动日常助手转型,为LLM进入主动智能时代奠定基础 [1][2] - OpenAI未来核心研究目标是构建“自动化研究员”,旨在实现新知识发现全过程自动化,并将有效推理时间跨度从当前的1-5小时系统性地延长 [2][4][6] - 行业评估体系正经历范式转变,从传统基准测试转向IMO等高难度竞赛,并最终以模型在具有实际经济价值的开放问题上做出原创科学发现为前沿标尺 [4][8][9] - 主动智能成为未来AI应用核心竞争力,技术突破体现在从被动问答转向具备长时程规划、记忆保持和多步骤任务执行能力的主动推理 [2][3][4] 构建自动化研究员 - OpenAI未来一至五年明确目标为创造“自动化研究员”,实现机器学习、物理、数学等科学领域新知发现的全流程自动化 [4][6] - 衡量该目标进展的有效方法是看模型能在多长“时间跨度”内进行有效推理,当前模型在高中水平编程数学竞赛中接近精通,对应时间跨度约为1到5小时 [6] - 实现“自动化研究员”需攻克两大核心技术挑战:长时程规划能力与记忆保持能力 [7][10] 评估的新方向:从竞赛走向科研前沿 - 传统评估基准迅速接近饱和,模型表现从96%提升至98%已非最重要目标,模型训练范式从追求泛化转向打造“领域专家” [4][8] - 行业正处于优质评估方法相对匮乏阶段,OpenAI关注能标志模型发现新事物的“真实进展”,IMO等竞赛成为极佳真实世界指标 [8][9] - 随着竞赛本身趋于饱和,下一阶段评估将直接衡量模型在具有实际经济价值的问题上能否做出真正探索和发现 [4][9] 推理:统一深度与稳定的关键 - 模型智能体演进中存在的“稳定性”与“深度”矛盾被重新定义,二者本质是内在统一的问题,均依赖于模型在长时程中保持行为一致性的能力 [4][12] - 推理是实现能力统一的根本机制,是模型在长时间内反复执行“试错-反思-调整”自我修正循环的核心能力,赋予智能体长期鲁棒性 [4][13][14] - 最新推理模型证明,随着底层推理能力增强,模型长时程代理能力和每一步执行质量是同步提升的,而非相互牺牲 [12] 可验证与开放性:一条模糊的界线 - “可验证”与“开放性”界限随问题时间跨度和规模变得模糊,当“千禧年大奖难题”等问题的求解时间线拉长至数年,其过程即变为开放性探索 [4][15][16][18] - OpenAI将这种思考应用于自身研究,真正进展要求不断自问“当前提出的研究问题本身是否正确”,使研究成为一场“开放性的探索” [4][19] - 小尺度约束性问题(如一小时内完成的编程竞赛)与大规模定义明确问题(如证明千禧年难题)在探索路径上存在本质差异 [16][18] OpenAI的人才观与组织文化 - 公司致力于为基础研究提供免受短期竞争压力干扰的“保护区”,保护研究员进行长期、有信念的探索 [4][20] - 招聘倾向于寻找在任何领域解决过难题的实干者,看重强大技术基础和挑战难题意愿,而非社交媒体知名度 [4][21] - 关键组织文化是在“长期信念”与“对事实诚实”之间取得平衡,打造能容纳不同风格研究员的多元化团队 [4][20][21]