锦秋集
搜索文档
从ChatGPT3年8亿周活到Higgsfield5个月1亿美元ARR:学术和资本看见了“大模型的摩尔定律 ”|DeepTalk
锦秋集· 2025-12-01 18:00
从Scaling Law到Densing Law:大模型发展范式的转变 - 行业观点认为,单纯扩大模型参数和数据的“Scaling Law”正面临瓶颈,数据接近极限,模型规模的百倍扩张难以带来真正的能力跃迁 [2] - 研究提出新的发展范式,即从“做大模型”转向“做高效模型”,核心是提升“能力密度” [3] - 该观点基于对51个主流开源大语言模型演进轨迹的分析,发现最大能力密度呈指数提升,约每3.5个月翻一番 [3] 能力密度(Capability Density)的定义与计算 - 为定量评估不同规模与架构模型的质量,研究引入了“有效参数大小”的概念,即一个标准参考模型达到目标模型同等性能所需的参数量 [10][11][12] - 能力密度被定义为有效参数大小与实际参数大小的比值(ρ = N(S_M) / N_M),该指标可用于公平比较不同架构和精度的模型 [13] - 若ρ > 1,表明模型比参考模型更“致密”,即用更少的参数实现了更强的能力 [15] Densing Law的核心发现与驱动力 - 对51个主流开源基础模型的评估显示,大语言模型的最大能力密度随时间呈指数级增长,规律被命名为Densing Law [16][17] - 具体数据为:ln(ρ_max) = At + B,增长系数A≈0.007/天,最大能力密度约每3.5个月(105天)翻一番 [18] - 密度提升的核心驱动力是预训练数据规模的爆炸式增长(从T级到15T+)以及数据质量的显著提升 [19] - 研究指出,超大模型(如Llama-3.1-405B)受限于巨大的训练成本,往往训练不足,导致其“性价比”或密度略低于同期的中等规模模型 [19] Densing Law的主要推论与行业影响 - **推论1:参数量指数级减少**:为实现相同性能,模型所需实际参数量随时间呈指数下降,大约每3.5个月减半 [21] - **推论2:推理成本指数级降低**:在同等性能下,模型参数减少直接降低了推理计算成本,粗略计算推理成本约每2.6个月减半 [22][27] - **推论3:端侧智能潜力巨大**:Densing Law(算法效率)与摩尔定律(硬件算力)结合,使得固定价格硬件上可运行的最大有效参数规模约每88天翻一番,预示高性能LLM将加速在消费级终端普及 [24] - **推论4:ChatGPT发布后密度增长加速**:ChatGPT发布后,模型密度的增长速度提升了50%(斜率从0.0048增至0.0073),主要因投资激增、开源生态繁荣及小模型普及 [25][28] - **API价格暴跌案例**:从2022年12月到2024年8月,性能相当的模型API价格从每百万token 20美元降至0.075美元,降幅达266.7倍 [27] 对模型压缩技术的警示 - 实验发现,大多数压缩模型(通过剪枝、蒸馏、量化)的能力密度实际上低于其原始模型 [30] - 原因在于压缩后的小模型往往面临训练不足的问题,而量化则会损害模型性能 [30] - 行业建议,高效压缩需确保压缩后的模型经过充分训练,以在减小规模的同时保持或提升能力密度 [30] 未来发展方向:密度最优训练 - 未来训练范式将从追求参数规模的“大”,转向追求单位参数效率的“密”,即“密度最优训练” [32] - 提升密度的关键路径包括:1) 探索更高效的非标准Transformer架构;2) 采用复杂的数据预处理与合成技术提升数据质量;3) 构建大模型与小模型协同进化的生态系统 [33][34][35] 核心技术细节与评估挑战 - 有效参数的计算采用两步估计法:首先用Scaling Law拟合参数量与预训练损失的关系,再用Sigmoid函数拟合损失与下游任务性能的关系 [37][40][45] - 为统一衡量不同架构,密度定义可扩展为参考模型与目标模型推理成本的比值,并针对稠密模型、MoE模型和量化模型给出了具体计算公式 [45][46][47] - 当前能力密度评估是一种相对测量,其准确性高度依赖于评测基准的质量,行业需要建立更全面、无偏见的评估体系 [31][38]
CB Insights 2025 未来科技新星:45 家高潜力初创公司名单与技术趋势解读|Jinqiu Select
锦秋集· 2025-11-28 16:38
文章核心观点 - CB Insights报告从全球遴选出45家最具潜力的科技初创公司,覆盖六大领域,累计融资超28亿美元,平均Mosaic评分达791(远超平均值370),其中超70%已进入商业化部署阶段[3] - 技术趋势显示AI基础设施进入“去通用化”时代,价值向为特定任务深度优化的基础设施迁移[6] - AI正从“能回答”演化为“能执行”,Agentic Workflow全面起势,智能体可靠性评估成为硬需求[7] - AI加速进入物理世界,开始重塑能源、制造与空间计算[8] - 数学、法律、医疗等高风险行业推动“零幻觉”技术体系,护城河在于专有数据与形式化验证能力[9] - 监管与数据主权从“成本”变成“壁垒”,合规先行成为大规模AI部署的前置条件[10] 企业科技行业 - 企业科技领域有22家公司,数量最多,聚焦AI基础设施与开发者工具,平均融资规模最大[3] - Cartesia基于状态空间模型开发超低延迟语音AI,语音合成延迟低于100毫秒,两年内融资9100万美元,Mosaic评分849[11] - Coval将自动驾驶仿真测试方法应用于AI智能体评估,解决“PoC地狱”问题,2025年内实现两个月10倍营收增长[12] - Exa提供AI原生搜索API,神经网络架构预测“下一个链接”而非“下一个词”,估值在7个月内从6450万美元飙升至7亿美元,涨幅达985%[17][18] - Harmonic开发用于形式化数学推理的AI,利用Lean证明助手实现零幻觉,13个月内融资1.75亿美元,估值从3.25亿美元跃升至8.75亿美元[20] - Maven AGI构建企业客服AI智能体,自主解决率达93%,客户续约率100%,2024财年营收700万美元,团队规模同比增长182%[26] - SCINTIL Photonics开发集成激光器的硅光子集成电路,其LEAF Light™技术功耗仅为传统方案的六分之一,Series B融资5800万美元并由NVentures参投[32] - WitnessAI提供AI安全与治理平台,专注于检测影子AI和防止LLM越狱,团队规模增长261%至65人,Series A融资2750万美元,估值1亿美元[37] 金融服务行业 - 金融服务领域有7家公司,AI原生金融成为主线,监管合规是核心壁垒[4] - Bastion为金融机构提供受监管的稳定币基础设施与白标服务,持有纽约州有限目的信托公司牌照,完成1460万美元Series A融资[39][40] - Catena Labs构建AI原生金融基础设施,专为自主AI智能体设计受监管的即时稳定币支付,由Andreessen Horowitz领投1800万美元种子轮[41][42] - FairPlay为金融服务公司提供AI公平性与偏见检测工具,符合SR 11-7等监管框架,2024年业务增长3倍,获摩根大通1000万美元Series B投资[44] - Vontive为投资性房产提供嵌入式房贷平台,其LLM在40多种文档类型上实现95%生产环境准确率,已处理6845笔贷款,总金额17.13亿美元[46] - Worth是AI驱动的承保自动化平台,拥有2.42亿家小企业数据库,为PatientFi等客户实现入驻时间缩短50%,成立两年融资3750万美元[47][48] 医疗健康行业 - 医疗健康领域有6家公司,语音AI与临床工作流自动化主导,HIPAA合规是入场券[4] - Assort Health构建AI语音智能体自动化医疗机构患者呼叫中心,实现90%解决率,年处理患者互动超1000万次,估值7.5亿美元对应ARR仅300万美元[49] - Ellipsis Health通过分析语音模式检测焦虑、抑郁等心理健康状况,推出Sage AI护理管理师,语音管线延迟低于500毫秒,Series A-II融资1900万美元[51] - Inductive Bio开发AI工具预测药物ADMET特性,建立竞争前数据联盟,Beacon-1模型在Polaris竞赛中击败39个对手位列第一,Series A融资2500万美元[52] - Keragon是HIPAA合规的无代码自动化平台,预置300多个医疗专用集成,发布六个月内获100多个付费客户,执行超200万次工作流自动化[53] - Layer Health利用LLM自动化病历图表审查,与美国癌症协会合作实现注册报告时间缩短65%、数据提取准确率95%-100%,融资2500万美元[54] 工业领域 - 工业领域有6家公司,机器人与地理空间AI崛起,硬科技属性最强、验证周期最长[4] - Persona AI开发工业级人形机器人,核心技术源自NASA机械手,与韩国HD现代船厂签订部署协议,成立即获2700万美元Pre-Seed融资,团队一年内增长1300%[59] - Skild AI开发通用机器人基础模型“Skild Brain”,使机器人在严重损坏后8秒内恢复功能,两年内融资8.145亿美元,估值达45亿美元[60] - SkyFi通过卫星网络聚合平台提供按需卫星影像与地理空间数据分析,整合ICEYE、Pixxel等数据源,Series A融资2860万美元,IPO概率为平均值3倍[61] - AMESA开发无代码平台用于构建工业多智能体AI系统,为制造客户实现6%流程效率提升,年化价值150万美元,Mosaic评分735(前3%)[56] - Felt是云原生GIS平台,AI驱动技术号称比传统方案部署时间缩短75%,超半数客户来自能源与气候领域,团队增长32%[57][58] 法律科技领域 - 法律领域有2家公司,AI进入司法推理与合同审查,专有数据是关键护城河[4] - Bench IQ是AI驱动的司法智能平台,利用专有数据集覆盖100%司法裁决(传统工具仅3%),提供法官推理洞察,AmLaw 200前五大律所中四家使用该平台[62] - Wordsmith自动化法律文档分析与合同审查,通过智能体AI工作流实现深度自动化,种子轮后一年即以超1亿美元估值完成2500万美元Series A,团队增长370%[63][65] 零售与供应链领域 - 零售与供应链领域有2家公司,消费级AI应用与物流决策优化,离C端最近[4] - Alta是AI驱动的个人造型应用,与美国时装设计师协会战略合作,提供个性化造型与衣橱管理,获1100万美元种子轮,团队一年内从2人增至35人[66] - Optimal Dynamics为运输物流公司提供AI驱动的决策自动化工具,实现高维AI综合货运规划,完成4000万美元Series C融资,总融资9540万美元,IPO概率为平均值3倍[67]
房间里的大象:Ilya挑明AI的“高分低能”,呼吁要从研究到scale到再重回研究时代|Jinqiu Select
锦秋集· 2025-11-26 15:01
文章核心观点 - 当前AI模型在评估中表现优异但经济影响滞后,揭示了过度拟合评估而非真实世界需求的根本问题[14][17][18] - 行业需要从依赖确定性的“规模扩展”范式,转向以解决泛化能力为核心的新“研究时代”[6][14][57] - 真正的超级智能形态应是一个具备强大持续学习能力的系统,而非一个预训练的“成品”[96][97][98] 对AI范式的批判 - 模型存在行为波动性,上一秒能完成复杂任务,下一秒却连续犯低级错误[2][19][20] - 矛盾在于模型评估得分高但现实经济效果完全跟不上,评估表现与实际世界表现脱节[14][17][18] - 问题的核心可能在于强化学习训练使模型变得“过于专注和狭隘”,导致基础任务表现迟钝[21][22] - 真正的“奖励黑客”是过于关注评估指标的研究人员,而非模型本身[14][24] 从规模时代重返研究时代 - AI发展可分为两个阶段:2012-2020年为研究时代,2020-2025年为规模扩展时代,现在需重返研究时代[14][57] - 规模扩展配方(将计算力和数据塞进大型神经网络)提供了确定性收益,但改变了世界的是创新研究而非更大模型[6][14] - 公司偏好规模扩展因其资源投入风险低,而研究则充满不确定性[55][56] - 当前计算力已非常充足,行业再次回到“研究时代”,但此次拥有更大的计算资源[57][59] 人类实践中的经验启示 - 人类在15岁时所见数据量极少,但理解更深且不会犯AI那样的错误,表明人类学习样本效率极高[40][66] - 人类学习不依赖明确奖励体系,而是通过讨论、展示等互动方式自然习得[66] - 情感可能是一种被忽视的“价值函数”,能帮助人类快速判断行为好坏,对决策至关重要[43][45][51] - 进化赋予人类强大的先验能力(如视觉、运动),但人类在现代技能(语言、编程)上的快速学习能力表明其学习系统本身非常强大[69][70][72] 超级智能的形态与路径 - 超级智能不应是预训练完成的“全能大脑”,而应是一个可以学会做经济中每项工作的优秀学习算法[14][97][98] - 超智能系统更可能以“持续学习智能体”的形式被部署到经济中,通过实践学习积累技能[96][97][98] - 广泛部署可能引发快速经济增长,但具体速度受各国规则差异影响,存在不确定性[98][99][100] - 对超智能发展的时间预测在5到20年之间[113] 研究的方法与审美 - 研究需要“自上而下的信念”,即在实验与预期矛盾时支撑研究者的核心判断[14][123] - 优秀的研究品味源于对AI应有状态的美学判断,追求简洁、优雅且正确受大脑启发的理念[122][123] - 想法本身并不廉价,研究的瓶颈包括算力、工程能力以及将想法成功执行的困难[79][80]
让AI分析这波大模型公司宣传战:原来每家都有自己的鲜明人设 | Jinqiu Scan
锦秋集· 2025-11-25 19:41
文章核心观点 - 使用AI工具(MiniMax Agent和Gemini 3 Pro)深度分析8家头部大模型公司的品牌传播策略,揭示其品牌人设定位和传播规律 [4][6][16] - AI公司的品牌传播核心在于实现技术实力与情感温度的平衡,并通过精心打造的“人设”来体现 [56][57] - 不同AI分析工具因训练数据和分析框架差异,对同一公司的分析会呈现不同视角,如技术工程师视角与人文社科视角 [54][55] 8家大模型公司品牌人设与传播策略 - **OpenAI**:技术权威型,品牌形象为硅谷首席架构师,技术产品内容占比68.6%,叙事结构为“从实验室到基础设施”,风格理性务实、简洁直接 [19] - **Anthropic**:AI安全卫士型,品牌形象理性严谨,技术内容占42%,愿景表达占35%,核心语汇为“Responsible AI”和“Human”,强调安全与伦理责任 [22] - **Google Gemini**:创意技术专家/导师型,采用双轨叙事,用户导向词汇占比45.3%,话术以鼓励语建立情绪连接,营销策略通过高频教程内容降低使用门槛 [25] - **DeepSeek**:去营销化的极客型,技术导向内容占比85%,语言极简生猛,传播策略依靠开源与激进API定价在开发者社区形成病毒式扩散 [29] - **Kimi**:细分领域的冷静专家型,技术导向内容占37.6%,专注长文本处理能力,采用“开源+集成”策略并引用ARR等商业数据证明可行性 [33] - **MiniMax**:技术实用主义的生态构建者,技术导向内容占65%,核心心智为“Minimize Effort”,营销通过“5-Day Launch Week”等活动制造期待感,广泛开展生态合作 [36] - **通义千问**:开源卷王型,技术导向内容近七成(69.2%),定位为全模态开源领军者,营销坚持周更式高频发布,采用Cookbook体系和“全家桶”产品策略 [43] - **豆包**:温暖陪伴的全能助手型,产品功能玩法内容占比65%,话术亲和力高,使用“玩出圈”等平民化表达,营销通过P图影像化功能打造爆款体验,并与国家博物馆等机构联动破圈 [49][53] AI分析工具的视角差异 - **MiniMax Agent**:侧重技术工程师视角,关注数据指标、工具性、效果量化,评价标准为功能完备度、技术领先性和ROI效果,语言风格为工程师术语和数据驱动 [55] - **Gemini 3 Pro**:侧重人文社科融合视角,关注情感价值、愿景叙事和社会责任,评价标准为品牌调性、用户连接度和长期价值,语言风格为学术化表达和哲学思辨,视觉输出已跳脱行业常见的紫色同质化 [55] AI公司传播策略的核心启示与建议 - 传播策略分为三层境界:功能竞争(技术指标、产品功能)、情感连接(品牌故事、用户共鸣)和社会价值(AI伦理、技术普惠) [60] - 给初创团队的实用建议包括确保技术实力过硬并构建清晰价值主张、品牌人格保持一致但勿过度、用具体成果和数据建立人设可信度、在细分领域形成独特定位 [60] - 技术开源比闭源更具传播力,能建立开发者信任并使专业人设更立体,最重要的是将技术改变世界的信念转化为用户能感受到的人设温度 [61][62]
锦秋基金被投企业NemoVideo获千万美元融资,离开TikTok做爆款仿剪Agent|Jinqiu Spotlight
锦秋集· 2025-11-25 10:20
融资情况 - 锦秋基金已完成对NemoVideo的投资[4] - NemoVideo近期完成近千万美元的Pre-A轮和天使轮融资,Pre-A轮由IDG资本独家投资,天使轮投资人包括锦秋基金、钛动科技和微火创投等机构投资人,以及前零一万物联创谷雪梅作为个人投资方,棕榈资本担任Pre-A轮独家财务顾问[5] 公司定位与愿景 - NemoVideo从"爆款仿剪Agent工具"切入,聚焦视频创作者用户,长期目标是打造视频制作Agent平台,完成从工具到生产力社区的转变,未来愿景是成为视频领域的Canva,核心在于专注生产力领域[7][10][13] - 长期规划是构建视频制作Agent社区,创作者可在社区沉淀和交易自己的视频制作agent,通过Agent自动化生成内容,Agent作为创作者的数字分身沉淀创作knowhow,形成商业正循环和数据飞轮[10] 产品与服务 - 当前产品是面向海外带货达人和自由职业剪辑师的"爆款仿剪"Agent工具,目标用户特点是重灵感、重粗剪、轻后期,需大量产出内容但预算有限,有用户使用后从日均3条视频提升至10条以上[12] - 产品坚持AI native理念,AI作为创作者"副驾"解决高重复性工作,将控制权和创意还给创作者,与剪映差异在于更强调社区生态和创作者盈利模式[13] - 未来计划支持更多非线性创作路径,加强灵感和粗剪阶段AI能力,实现"Anything In,Video Out"功能,如参考视频生成类似结构或混合多视频元素生成新视频[16] 商业模式 - 现阶段采用订阅+token计费模式,未来社区成熟后转向结果导向定价,平台上的Agent创作者可自由定价,例如高质量视频Agent标价3美元/条,快速粗糙Agent标价50美分/条[17] 市场机遇与竞争 - 视频Agent领域比图文复杂度高,工具层面需更多准备,公司较早进入具备时间优势,选择niche市场对大厂非战略重点,获得一定发展空间[21] - 单纯工具难有强想象力和护城河,围绕创作和交易的社区更具机会,类似Canva模式让创作者靠作品赚钱[13] 团队背景 - 创始团队由前TikTok创意业务线核心成员李政锦、刘婧妍及前源码资本董事总经理张星辰组成,TikTok履历带来三大优势:对创作者和商家痛点的洞察、全球市场GTM的know-how、视频剪辑工具设计逻辑理解[7][8] - 创始人李政锦大一探索创业,大三在云南创办教育NGO,后加入字节跳动担任TikTok Creative部门产品Leader,主导视频创作者工具设计与落地,刘婧妍拥有北大和剑桥背景,曾参与摩拜海外从0到1业务运营[7] 运营现状 - 公司目前团队规模十余人,均为全职,正在扩张重点招聘senior技术人才和海外增长方向人才[23][25] - 招聘策略注重创业者精神而非经验优先,为吸引人才愿意报销机票安排线下见面[24] - 融资过程顺利,首轮锦秋基金2天内给出TS,第二轮IDG资本当天口头确认,投资机构认可团队"拿结果"能力[18]
锦秋基金被投企业深度原理完成超亿元A轮融资,AI for Science持续突破|Jinqiu Spotlight
锦秋集· 2025-11-24 15:05
融资动态 - 锦秋基金于2025年初参与AI for Science赛道明星企业深度原理的亿元级Pre-A轮战略融资[3] - 深度原理完成超亿元人民币A轮融资,由戈壁创投管理的阿里巴巴创业者基金大湾区基金与蚂蚁集团共同领投,现有股东联想创投、Taihill Venture超额加注,BV百度风投继续加注,多家机构参与[4] 融资资金用途 - 资金将用于加速材料发现智能体Agent Mira™的研发与升级[5] - 推进L4高通量自主实验室AI Materials Factory™与其研发管线的建设与布局[5] - 深化与国际和国内头部客户的合作,巩固技术落地领先优势[5] 技术实力与突破 - 公司创始团队拥有麻省理工学院背景,在AI for Science交叉领域拥有深厚积淀[7] - 公司首创的扩散生成模型先后在《Nature Computational Science》和《Nature Machine Intelligence》两家Nature子刊发表封面论文[7] - 2023年推出首个3D化学反应扩散生成模型OA-ReactDiff,首次实现在单个GPU上6秒内完成过渡态结构预测[7] - 2025年初发布迭代升级模型React-OT,将预测时间提升至0.4秒,误差降低超25%[7] - 今年在LLM for Science方向取得进展,主导开发LLM-EO工作流程,相关成果以封面论文形式发表于《Journal of the American Chemical Society》[8] - 公司形成"Diffusion + LLM"并进的生成式AI架构,为智能体化交付奠定基础[8] 核心产品演进 - 公司研发ReactGen、Reactify、ReactControl、ReactBO、ReactNet、ReactHTE六大算法模块,并集成于ReactiveAI平台[10] - 平台近期升级为材料发现智能体Agent Mira,能够基于自然语言指令智能调度全流程任务,具备分子结构设计、化学反应预测、材料配方优化等能力[10] 商业化进展 - 公司成立一年来已获得超千万元人民币的商业订单[12] - 在超分子材料领域,与杉海创新共建AI超分子材料平台"超屿 Synthrix™ 1.0",通过AI计算筛选百万级候选结构[12] - 在日化领域,与欧莱雅合作,利用ReactiveAI平台从化学反应机理层面预测并解释各成分对配方性能的影响[12] - 与战略股东晶泰科技持续共创,聚焦化学材料领域智能化自动化研发[12] - 在新能源、精细化工等领域推进多个重点项目[12] 未来战略布局 - 公司已启动打造L4高通量自主实验室AI Materials Factory,由自研智能体Agent Mira统筹资源调度[14] - AI Materials Factory将覆盖从分子结构设计、化学反应预测、材料配方优化到高通量验证与数据回流的全链路,形成"AI模型预测—计算支撑—实验验证"闭环[14] - 该工厂将推动技术及产品在新材料、营养日化、新能源等重要战略领域落地,并推进内部自研管线开发[15]
锦秋基金被投企业首形科技:非主流人形机器人创业,从做好一张脸开始|Jinqiu Spotlight
锦秋集· 2025-11-21 14:11
公司概况与市场定位 - 首形科技是专注于超高仿生情感交互机器人的领军企业,其产品核心在于人脸的拟真化与情绪交互[6] - 公司与市场上比拼硬核技能的人形机器人公司不同,将主要精力放在“人脸”这一模块的开发上,认为人脸是情绪表达和人机沟通中最直接的部分[9] - 公司采用软硬件全栈自研的方式,整合多模态情绪识别系统与表情控制算法,以减轻“恐怖谷”效应[9] - 公司创始人通过社交媒体成功进行产品推广,一段机器人对视视频在全网获得超过200万点赞和破亿播放量[7][8][9] 技术路径与核心优势 - 公司通过引入仿照“照镜子”训练的自监督学习机制,使机器人在神态和动态表现上更加自然[9] - 技术团队注重每个环节的极致打磨,从结构设计、运动控制、算法到训练数据均坚持自研,以确保最终产品体验不落入“恐怖谷”[18][19] - 在动态表情优化上,公司采用AI学习人类在视频中的表情使用方式,旨在获得一个连续的“动态动作空间”,使动作生成更加逼真自然[20] - 公司认为,实现真正共情的关键在于更丰富的交互模式,并引用心理学“55/38/7定律”,强调面部表情(55%)和声音(38%)在情绪传递中的重要性[21] 商业化战略与市场判断 - 公司判断人形机器人未来五年内更适合作为情绪产品而非生产力工具,其商业化机会在于表演、服务等行业的情绪价值[12][25] - 产品的定价逻辑将参考情绪价值消费品(如泡泡玛特手办),而非工具型产品的ROI计算模式,并计划通过规模化降低成本[32] - 目标用户定位为注重感受的“F人”(MBTI理论),公司认为人类的情感需求市场非常庞大[32] - 公司目前正通过参加展会、音乐节等活动进行线下商业化探索,让公众确认产品的真实存在,并与AI公司、游戏公司等探索合作[28][35] 行业竞争与融资进展 - 公司的技术路线和市场热度已获得资本市场认可,今年以来已完成三轮融资,吸引蚂蚁、顺为等顶级机构入场[11][31] - 创始人认为,早期投资人的疑虑源于对跨越“恐怖谷”难度的刻板印象,而当前融资进展得益于公司用产品效果证明了技术的可行性[31] - 面对竞争,公司选择有节奏地释放产品能力,将核心交互能力视为需要保留的竞争优势[27][28] - 公司现阶段的核心目标是与行业伙伴合作,探索具体应用场景,并根据场景反推技术需求,做好产品定义的取舍[51][53] 产品哲学与未来愿景 - 公司致力于模糊人与机器的界限,认为人形机器人能带来比其他形态更强烈的情感体验,其情感连接的上限更高[40] - 在产品设计中,计划加入“保持真实度”的参数,引入适当的冲突与矛盾,避免机器人陷入“永远取悦人”的虚假关系,并探索其作为人际关系“协调者”的角色[41][42][43] - 公司高度重视用户数据隐私与安全,计划为用户提供数据授权或本地部署等多种选择方案[48][50] - 未来训练数据的获取将结合公开数据、自创数据以及可能与演员合作模拟的戏剧性场景数据,以提升情感交互的深度[44][45]
锦秋基金被投企业灵启万物4个月获3轮融资,要在3-5年将人形机器人送进家庭 |Jinqiu Spotlight
锦秋集· 2025-11-20 22:38
公司概况与融资历程 - 灵启万物是一家具身智能算法公司,由前腾讯Robotics X实验室研究员"95后"朱庆旭于2025年6月创立 [5] - 公司成立4个月内完成3轮融资,总融资额近亿元,投资方包括元禾原点、和玉资本、英诺天使、元生创投、锦秋基金、梅花创投、卓源亚洲等机构 [5] - 锦秋基金作为12年期的AI Fund,已完成多轮对灵启万物的投资,其投资理念是寻找具有突破性技术和创新商业模式的通用人工智能初创企业 [4] 核心技术:数据采集与算法架构 - 公司技术路线的核心是放弃业内主流的"遥操作"数据采集方案,采用"光学动捕+UMI"方案,以获取更高质量和规模化的训练数据 [17][24] - "光学动捕"通过操作员穿戴设备在实验室空间真实做出动作,由多机位摄像头记录,能精准复现人类流畅、本能的行为模式 [17][25] - "UMI"是一种手持夹爪设备,由操作员实际操作物体,可大规模采集手与物体的真实交互数据,与动捕数据结合形成高质量训练数据集 [17][25] - 公司算法采用"小脑"+"大脑"的分层架构,"小脑"负责运动控制,通过构建"人类动作库"让机器人学会基础动作;"大脑"负责任务规划与泛化,两者耦合迭代 [15][28][33] - 该数据方案被视为数据金字塔的中间层,比视频数据质量好,比遥操作数据量多,在质量和规模上取得平衡 [26] 技术优势与行业观点 - 公司创始人认为主流"遥操作"方案存在原理性缺陷,其本质是使用人脑的"慢系统"控制机器人,导致数据缓慢、卡顿,锁死了机器人性能上限 [12][22] - 双足人形机器人构型被认为是适应家庭环境的最终形态,因为人类世界是为人体结构设计的,人形能最好地复用人类数据并适应复杂环境 [11][36] - 公司预测双足人形机器人进入家庭的时间将缩短至3-5年,而非业界普遍认为的5-10年,其技术是加速这一进程的关键 [11][19] - 在商业化路径上,双足人形机器人预计在1-2年内先落地零售、快餐等无人商店场景,因任务固定、环境可控,能快速验证商业价值 [20][29] 商业化应用与效率 - 在无人店场景(如肯德基)中,机器人学会所有岗位动作仅需2到3天,得益于高质量动捕数据带来的高学习效率 [29] - 具体实施时,基础动作可在实验室动捕环境中全部采集,再到实际场景中补充UMI动作及环境数据,无需在真实操作现场搭建动捕设备 [30] - 实现家庭场景泛化需攻克三大挑战:物体泛化(不同形状、材质、大小的物体)、位置泛化(任何角落、高度的物体)、场景泛化(不同家庭布局、光照等) [31] 公司壁垒与行业判断 - 公司核心壁垒并非技术方案本身,而是团队的技术判断力与持续迭代能力,即在众人看好遥操作时能判断其缺陷并找到新路 [18][39] - 真正的壁垒被总结为"在混沌中看清方向、并把一个不成熟的想法一步步做成现实的能力",类似于OpenAI早期坚信GPT道路的执行力 [39] - 行业未来将经历大浪淘沙,能留下的公司是在"健身"而非"化妆",即不断深耕技术、构建底层能力、累积长期竞争力的公司 [40]
我们给六个 AI 同一段市场数据,它们生成了六种完全不同的交易策略 | Jinqiu Scan
锦秋集· 2025-11-19 15:34
实验概述 - 锦秋AI实验室进行了一项实验,旨在观察六个主流大模型在统一环境下生成交易策略的能力[1] - 实验使用XAU/USD(黄金兑美元)的小时级行情数据,因其具备波动丰富、结构清晰、数据连续的特性,常被用作量化研究的基准[2][3] - 初始资金设定为10,000美元,模型需自主判断趋势、规划仓位并决定交易时机[1] - 实验结果显示,六个AI模型在相同数据面前生成了六种截然不同的交易策略,展现出从谨慎克制到激进满仓等多种“性格”[4] 模型策略与表现对比 - **Grok模型**表现最佳,累计收益为-0.04%,当前权益为9,995.50美元,在所有模型中回撤最小[6][39] - **ChatGPT模型**累计收益为-0.21%,当前权益为9,979.29美元,策略核心为顺势做多,仅在日线50日均线上穿200日均线且价格站稳时分批建仓,体现出较强的纪律性和风险厌恶[9][12][13][14] - **DeepSeek模型**累计收益为-0.23%,当前权益为9,977.38美元,策略强调只做多、不加杠杆,关键信号是均线金叉,呈现机械化趋势交易风格[25][27][29][30] - **Claude模型**累计收益为-0.31%,当前权益为9,968.62美元,策略基于中期趋势跟踪,结合美元指数与宏观事件判断,风格偏向快进快出与顺势止盈[15][18][19][20] - **Gemini模型**累计收益为-0.62%,当前权益为9,938.49美元,策略规则为只在牛市中顺势而为,以200日均线判断长期趋势,在上涨阶段积极加仓,高位反转时果断卖出,属于进攻性较强、回撤较大的代表[21][24] - **Qwen模型**表现相对落后,累计收益为-0.88%,当前权益为9,912.15美元,策略规则简洁,只在金价站上200日均线且均线向上时全仓建仓,跌破10日均线则平仓,全仓进出的风格导致收益和风险放大[31][34] 最新交易决策分析 - 在2025-11-12 12:00:00的决策点,价格均为4,112.22美元/盎司,各模型行动分化:Claude选择买入,Qwen选择卖出,其余四个模型(ChatGPT、DeepSeek、Gemini、Grok)均选择观望[7] - 决策理由反映了不同的风险偏好:Claude认为价格回落至支撑位附近存在技术性反弹机会,而Qwen则认为价格跌破支撑且短期趋势转弱[7] - 这种分化凸显了不同AI模型在相同市场条件下的独特决策逻辑和风险判断[5][40]
Physical Intelligence最新发布的VLA模型,为什么是机器人通往规模化部署的拐点?|Jinqiu Select
锦秋集· 2025-11-18 19:13
核心技术框架:Recap - Physical Intelligence公司发布名为Recap的结构化强化学习框架,旨在解决机器人从“能做”到“能稳定做”的挑战 [2] - Recap框架构建一个前所未有的三段式训练管线:演示(demonstration)+ 纠正(correction)+ 机器人自主rollouts(RL on robot),三类数据在统一的强化学习体系中协同工作 [2] - 该框架首次展示如何利用纠正数据结合价值函数和优势来系统性地抵消机器人策略中最顽固的难题——误差累积 [3] 模型性能与突破 - 应用Recap训练出的π*0.6模型是一款拥有50亿参数的视觉语言动作模型,能够处理异构提示并吸收执行质量评价 [3] - 在最具挑战性的任务上,模型处理能力提升了一倍以上,失败率降低到二分之一甚至更低,达到可向商业部署过渡的性能门槛 [3][10] - 在真实场景中,π*0.6模型可实现连续一整天制作浓缩咖啡、数小时不间断折叠未见过的衣物、以及在工厂中稳定组装真实包装盒子的稳健水平 [10] - 在上述复杂任务上,π*0.6模型实现了超过90%的成功率 [25] 行业痛点与解决方案 - 当前机器人基础模型主要依赖人力收集的演示数据,存在人力成本高、策略水平限于人类、无法自我提升等局限性 [2][27] - 仅靠模仿学习的视觉语言动作模型在物理世界中会因细小失误累积形成复合错误,导致任务失败,这是实现高可靠性系统的关键障碍 [11] - Recap通过两种方式从不良经验数据中获取训练信号:一是由专家提供纠正指导,二是让机器人通过强化学习根据任务结果自行判断行为好坏 [13] - 强化学习中的核心挑战是信用分配问题,Recap通过引入价值函数作为“好坏评分器”,并利用优势来为动作打标签,从而解决此问题 [16] 训练方法与数据应用 - Recap的第一阶段是使用离线强化学习对模型进行预训练,不同于基础模型所采用的纯监督学习方案 [19] - 训练流程包括先通过任务相关示范对模型进行微调,再利用真实机器人上收集的额外数据继续做强化学习训练,结合修正指导和奖励反馈 [19] - 不同数据源服务于不同目的:专家演示用于定义新行为,辅导用于完善策略,自主经验则可能成为最大数据源用于完善行为直至超越人类表现 [27][28] 具体应用场景挑战 - 盒子组装任务的挑战在于完成复杂的物理操作流程并高频重复,同时需处理如纸箱黏连等边缘情况 [24] - 洗衣任务主要难在变化性和泛化能力,机器人需适应不同的初始状态和种类繁多的衣物,以及不同的折叠策略与材质特性 [24] - 制作浓缩咖啡饮品的难点在于长流程且环环相扣,要求模型具备高层语言策略以控制等待设备工作及后续清洁等时序性动作 [24]