锦秋集
搜索文档
锦秋基金被投企业流形空间3个月融资亿元,证明世界模型也需要预训练 |Jinqiu Spotlight
锦秋集· 2025-11-12 20:44
公司概况与融资动态 - 锦秋基金是一家12年期的AI Fund,以长期主义为核心投资理念,专注于投资具有突破性技术和创新商业模式的通用人工智能初创企业[5] - 锦秋基金已完成对Manifold AI(流形空间)的投资[4] - 流形空间成立3个月便连获种子轮和天使轮两轮共亿元融资,成为世界模型领域的一匹黑马[6] 世界模型技术理念与优势 - 世界模型旨在打造一个能理解并预测物理世界的大脑,其核心是找到一种既简单又通用的方案[7] - 斯坦福大学教授李飞飞提出世界模型应具备三项核心能力:生成式、多模态、交互性[7] - 世界模型与VLA模型是具身智能领域的两种不同技术路径,世界模型通过将语言升维到视觉域,模拟所有场景,具备Dreaming想象能力[18] - 世界模型作为Agent Model可通过在线模拟和推演获得更优决策,作为Environment Model可通过离线强化学习使物理智能体获得更好泛化能力[20] - 世界模型让AI首次具备心智推演能力,能在脑中模拟因果、预判后果、优化行动,理论上能以更经济方式实现跨本体、跨场景的泛化[22] 世界模型技术路径与竞争格局 - 世界模型技术脉络可归纳为两大派系:显式物理建模和隐空间交互[25] - 显式物理建模代表包括Google Genie系列和斯坦福李飞飞创办的WorldLabs,后者采用Geometry Forcing方式引入显式物理信息[26][29] - 隐空间交互代表包括Google Dreamer系列和Meta的V-JEPA系列,后者通过采样与能量函数评估方式搜索最优执行状态[30][31] - 流形空间是全球唯一布局全域世界模型的团队,其技术路径为自下而上,先做领域模型并通过场景反馈数据不断完善模型能力[33] 流形空间技术策略与创新 - 流形空间选择从预训练开始做起,让模型真正学习物理世界的先验知识,理解因果规律,以降低后期部署成本和数据需求[35][37] - 在数据方面,流形空间采用70%互联网数据和30%真机采集,更倾向于使用第一人称视角数据和带有失败状态恢复的数据[39] - 在模型架构上,流形空间提出具身基座模型需具备推理、想象、执行三位一体的能力,并创新地在视频生成质量和动作质量间建立正相关[40] - 流形空间采用Auto-regressive+DiT混合建模的LongScape架构,其领域模型能方便地用MoE方式混合成更通用的基座模型[35] 商业化战略与市场选择 - 公司发展战略总结为“攀登高峰,沿途下蛋”,即瞄准通用具身世界模型基座的同时,将领域模型提前产品化和商业化以产生营收[42] - 在落地场景上,优先考虑机器人和无人机领域,但不考虑自动驾驶,因机器人市场更加碎片化,能容纳更多玩家[43][44] - 具体聚焦于让硬件本体拥有自主推理能力,推动机器人和无人机从人类控制阶段向智能化、自主推理方向发展[46][47] - 长期来看,世界模型产品化需轻量化,公司已将模型量化蒸馏部署到边缘端推理系统,并选择英伟达芯片,未来考虑国产芯片[47] 团队管理与未来规划 - 团队由工业界资深人士和天才00后组成,注重人才密度而非数量,管理上采用数据驱动的强化学习方式激励团队[49][51] - 计划在2025年底至2026年初正式发布第一代基于WMA路线的基座模型,融资节奏与产品研发节奏匹配[51] - 长期目标是推动Physical AI Agent向前一大步,并实现自研加上赋能的机器人数量超过市场总量的10%[51]
锦秋基金被投企业深度原理获欧莱雅 2025 BIG BANG 中国大陆赛区AWARD|Jinqiu Spotlight
锦秋集· 2025-11-12 14:36
公司融资与行业认可 - 锦秋基金于2025年初对AI for Science赛道企业深度原理进行亿元级Pre-A轮战略融资[3] - 深度原理在欧莱雅2025年北亚BIG BANG美妆科技共创计划中从700多家参赛企业中胜出,成为中国大陆地区"预见新产研"赛道3家优胜企业之一[3] - 深度原理创始人兼CEO贾皓钧博士受邀参加进博会期间举办的BIG BANG峰会圆桌论坛[3][5] 技术优势与商业模式 - 深度原理采用AI预测与实验验证协同的研发流程,减少无效尝试,使判断更有依据、结果更易迁移[6] - 依托自研ReactiveAI平台,从化学反应机理层面预测并解释各成分对配方性能的影响,指导配方优化[6] - 该技术带来可量化收益,包括研发周期缩短、预测命中率提升以及研发投入降低[6] 行业影响与未来展望 - 人工智能正推动材料研发从"发现"走向"理性设计",有望打破美妆配方研发中的科学性、效率与成本"三难困境"[6] - 欧莱雅集团高管强调开放式创新是核心战略,BIG BANG项目是连接集团与全球初创企业、加速颠覆性解决方案诞生的桥梁[8] - AI能在不断实验中自我优化,最终实现研发深度、速度及预算三者的平衡[6]
更挑剔的投资人和更大规模的手笔:2025年Q3 AI风投市场全解析 | Jinqiu Select
锦秋集· 2025-11-11 20:18
文章核心观点 - 全球AI风投市场呈现“冰火两重天”特征,融资总额维持高位但交易数量下滑,资本高度集中于少数头部项目[2][3][4] - 市场进入“赢家通吃”新阶段,投资者变得更为挑剔,倾向于对认定的“AI赢家”进行大规模集中押注[3][4][9] - 理解资金流向及背后逻辑对AI创业公司至关重要,新格局下找准自身生态位是生存关键[4][9][46] 资金趋势与市场分化 - 2025年第三季度全球AI融资总额达478亿美元,连续四个季度维持在450亿美元以上高位[10] - 同期交易数量仅为1,295笔,环比下降22%,出现“钱多项目少”现象[11] - 2025年迄今平均交易规模达4930万美元,较2024年的2650万美元激增86%,显示资本集中度提升[9][12][37] 并购与退出活动 - 2025年第三季度AI领域并购活动达172笔,保持在接近历史最高点的水平[9][16][32] - AI Agent成为并购热点,本季度估值最高的5笔收购中有3笔流向该领域,如Sana、Cognigy和The Browser Company[17] - IPO市场显著回暖,第三季度有13家AI公司上市,为自2021年第二季度以来最高纪录[32] 估值新指标与团队偏好 - “每员工估值”成为衡量AI初创公司的新风向标,反映市场对顶级人才的高度溢价[9][19][20] - Figure公司以每员工估值1.043亿美元高居榜首,基于390亿美元估值和374名员工[9][21][23] - Cognition和Anthropic的每员工估值分别为9810万美元和8210万美元,凸显精干团队受追捧[9][21][23] 新兴赛道与投资热点 - 生成式引擎优化(GEO)本季度闯入最活跃科技市场之列,录得7笔交易[9][24][25] - 工业人形机器人开发商以15笔交易成为最活跃市场,编码AI智能体与副驾驶赛道录得13笔交易[27] - AI Agent开发平台和端到端软件开发AI智能体分别录得11笔和12笔交易[27] 资本集中度与巨头主导 - 2025年第三季度,1亿美元以上的“巨型交易”吸纳了市场总融资额的77%[29] - 头部融资案例包括Anthropic的130亿美元F轮融资、OpenAI的83亿美元私募股权融资和Mistral AI的15亿美元C轮融资[30][31][33] - 平均交易规模(4930万美元)与中位数规模(470万美元)的巨大差距,印证市场由少数巨额交易主导[36][37][38] 企业风投与地域分布 - 2025年第三季度最活跃的企业风险投资(CVC)由美国科技巨头主导,NVentures以11笔投资位居榜首[41][42][44] - Salesforce Ventures和Google Ventures分别以10笔和9笔投资位列第二、三位[42][44] - 全球CVC积极参与,荷兰的Prosus Ventures(6笔)和日本的Nissay Capital(5笔)进入前五[43][44]
我们用21款AI修图工具修了100张图:谁才是真正的“修图神器”?|Jinqiu Scan
锦秋集· 2025-11-10 19:38
文章核心观点 - 文章对21款AI修图工具进行了六轮严格测评,旨在评估其在真实场景下的图像编辑能力,核心观点是当前AI修图工具能力差距悬殊,尚无产品能完美应对所有需求,但用户可根据特定任务选择合适工具以提升效率[4][141][149] 测评工具与思路 - 测评涵盖21款主流AI修图工具,包括Nano banana(Gemini 2.5 Flash)、即梦4.0、Kling、腾讯元宝(混元模型)、美图秀秀、文心一言、Sora、Qwen Image edit、Runway等[8][9][10] - 测评采用六轮测试,每轮使用相同提示词,模型均采用最新版默认配置,不调整任何参数[11] - 通用测评维度包括视觉一致性、局部质量和内容一致性,每项评分0-5分[12][13][14][15] 局部擦除/修补测评结果 - 腾讯元宝、美图秀秀和Qwen Image edit获得15分满分,完美满足提示词要求且图片更清晰无违和感[18][23] - Nano banana、Sora、Lovart、Manus和Runway获得14分,主要扣分点为未完全消除干净人物[18][28][29] - 即梦4.0、醒图、像素蛋糕和Genspark得分在10-11分,能较好完成需求但出现明显错误如格局改动或图片模糊[18][30][31][32] - Kling、文心一言、Grok、智谱清言和天工得分在5-7分,存在未按原图修改或人物面貌改动等问题[18][32][33] - CanvaAI、Pixlr和SenseMirage未完成需求,出现严重错误如图片卡通化或随机生成[18][34] 图片抠图测评结果 - Qwen Image edit与Genspark获得15分满分,后者是唯一完全使用抠图技术保持原图格局与元素的产品[41][42] - Nano banana、即梦4.0、腾讯元宝、美图秀秀、Lovart、Manus、天工和Runway为第二梯队,多数产品存在少提取或多提取机器人问题[47][48][49] - Kling、CanvaAI、Grok、文心一言、SenseMirage和智谱清言得分在4-7分,普遍问题为生成动漫图而非抠图,或元素处理错误[50][51][52][53][54][55][56] - 醒图和像素蛋糕无此功能未参与测评,Pixlr完全随机生成图片[57] 图片替换测评结果 - 即梦4.0、腾讯元宝、Qwen Image edit、Manus和Runway获得15分满分,完美完成服饰更换和细节重建[62][65] - Nano banana和美图秀秀得分14分,前者因绳子未清除扣分,后者因人物面部特征改变扣分[62][70][71] - Kling、文心一言、Sora、Grok、Genspark和智谱清言得分在4-7分,普遍问题为未按原图修改或人物面貌改变[62][72][73] - CanvaAI、Pixlr和SenseMirage产生严重错误,如完全不符合要求或图片卡通化[62][74] 图片合成测评结果 - 本轮无满分产品,Sora和Runway表现最佳,得分14分,仅存在轻微面部变形或违和感[78][81][82][83] - Nano banana、即梦4.0和Manus得分13分,存在违和感或人物面貌改变问题[78][84][85] - Qwen Image edit、Lovart、智谱清言和天工得分10分,出现元素遗漏或人物生成错误[78][86][87][88][89][90] - Kling和Genspark得分较低,分别为7分和6分,存在未按要求生成或割裂感高问题[78][91][92][93] - CanvaAI、文心一言和Grok表现最差,生成图片不符合要求或元素错误[78][94][95][96][97] 图上文字修改测评结果 - 本轮所有产品均不达预期,无高分产品,第一梯队得分11-12.5分,包括Nano banana、即梦4.0、美图秀秀、Qwen Image edit、Manus、天工和Runway[106][107] - 产品普遍存在英文未改变、时间未修改、地点乱码或排版错误等问题[108][109][110][111][112][113] - 第二梯队得分7-10分,包括Lovart、Genspark和智谱清言,问题包括文字乱码或重新生成图片[114][115][116][117] - 文心一言和Grok得分5分左右,细节修改部分几乎全军覆没[118][119][120][121] - Kling、CanvaAI、Pixlr和SenseMirage表现最差,细节处理基本错误且改变原格局[122][123] 画质增强/修复测评结果 - 美图秀秀、Sora、Qwen Image edit、Lovart、Genspark和Manus获得10分满分,完美实现图片清晰化和彩色化[127][133] - Nano banana、即梦4.0、腾讯元宝、醒图、像素蛋糕和Runway得分8-9分,问题包括分辨率不足或无法自动上色[127][136][137][138][139] - CanvaAI、文心一言、智谱清言和SenseMirage重新生成图片,人物面貌或格局发生改变[127][140] 行业洞察与挑战 - 专业工具与通用模型对比明显,美图秀秀等传统软件在核心功能上保持优势,而Qwen等通用模型展现后发优势[141][147] - AI修图最大挑战是“修图”与“生图”的混淆,部分模型如文心一言、智谱清言倾向于重新生成图片而非修改原图[141][148] - 文字处理能力是行业短板,所有产品在文字修改测试中均未高分,显示精细化编辑能力不足[141][148] - 复杂合成能力不足,多元素理解力欠缺,导致结果违和或元素遗漏[141][148]
群星闪耀时:黄仁勋、李飞飞、杨立昆、G.Hinton、Y.Bengio、B.Dally深度对话|Jinqiu Select
锦秋集· 2025-11-10 15:44
AI发展的核心驱动力 - AI飞跃的关键并非算法突破,而是数据规模与算力基础设施的长期积累[6][9] - 数据匮乏曾是核心瓶颈,ImageNet数据集的创建(1500万张图片)成为深度学习黄金时代的起点[7][8] - 算力等待期长达40年,早期理论(如1984年的微型语言模型)因缺乏算力与数据而无法实现[9][10][32] AI技术范式的现状与分歧 - 当前AI热潮与互联网泡沫存在本质区别,几乎所有GPU都处于全负载运行状态,需求真实且持续增长[16][49] - 算力繁荣具备坚实基础,但大语言模型范式能否通向人类级智能存在显著分歧,需要全新科学突破而非简单扩展[17][18] - 模型能力持续进化,已从记忆概括向推理分析及智能体特征演进,技术演化速度惊人[49][53] 下一代AI的发展方向 - 大语言模型主要处理语言而非世界,下一次飞跃将源于机器对物理世界的理解与互动能力[20][22] - 空间智能(连接感知与行动的能力)是当前模型的核心短板,也是未来机器人与具身智能的关键突破点[21][56] - 自监督学习重新成为重要方向,将从语言数据扩展至视频、传感器等非语言数据领域[44][48] AI的产业影响与基础设施需求 - AI正在从工具向"智能工厂"演进,GPU集群成为生产智能的基础设施,需要上万亿美元投资支撑数万亿美元产业[50] - AI应用仅开发了1%潜力,几乎人类生活的每个方面都将因AI提升效率,使用量呈指数增长[55][52] - 传统软件是预编译的,而AI必须实时计算生成智能,这种生产方式本身创造了庞大的算力需求[50] 对智能本质的重新定义 - AI的目标不是超越或取代人类,而是增强人类能力,让机器承担人类不擅长的任务(如识别上万种物体)[12][13] - 机器智能与人类智能是两种并行、互补的存在,如同飞机与鸟类的飞行方式差异[14][60] - 行业应关注AI如何增强人类在创造力、共情力等独特领域的优势,而非单纯追求"人类级智能"指标[13][15]
Leonis AI 100:2025 年最具影响力AI初创企业基准报告|Jinqiu Select
锦秋集· 2025-11-08 13:40
报告核心观点 - 报告基于对2022-2025年全球10,000余家AI初创企业的数据分析,筛选并剖析了100家增长最快的原生AI企业,并对未来三年AI创业的结构性趋势做出预测 [4] - AI初创企业正重塑传统创业模式,资本投入更倾向于算力与数据而非人力,垂直领域的可靠性提升、基础模型功能整合带来的竞争压力,以及企业级应用落地效率成为行业发展的关键变量 [5] - 过去三年AI领域发展迅速,初创企业经历了从炒作到质疑再到实际增长的阶段,将整个市场周期压缩到了上一个技术时代所需时间的一小部分 [7][8] 创始人结构与团队特征 - 头部AI初创企业绝大多数由拥有顶尖技术和研究背景的创始人领导,82%的企业由技术型CEO领导,86%的创始人具备技术背景 [9][10] - 研究者创始人崛起,58%的初创企业至少有一位联合创始人具备研究背景,该群体中40%的创始人拥有研究经验,而2013年独角兽企业俱乐部中这一比例仅为12% [20] - 数据集中超过60%的创始人拥有精英教育背景,顶尖AI创始人的平均年龄中位数为29岁,比SaaS时代的34岁更年轻 [25][28] - 团队呈现"小而精"特征,88%的企业拥有多位联合创始人,但仅有40%的联合创始人有过往合作经历,新团队围绕技术机遇组建 [26] 业绩表现与增长模式 - 2024年成为营收爆发拐点,多家企业成立18个月内年度经常性收入突破1000万美元,增速远超SaaS时代企业 [6] - Cursor在12个月内达到1亿美元年度经常性收入,ElevenLabs在22个月内达到1亿美元年度经常性收入,而SaaS时代的Slack花了约12个月达到1000万美元年度经常性收入,36个月达到1亿美元年度经常性收入 [34] - 增长模式以产品主导增长为核心,销售环节后置,由用户自传播带动扩张,超过80%的企业以自助式入职流程启动 [6][51] 团队效率与组织架构 - AI企业人均营收达到SaaS企业的3-10倍,多家企业以极精简团队实现高营收,如Midjourney以40名员工实现约2亿美元年度经常性收入(人均500万美元),Lovable以45名员工实现约1亿美元年度经常性收入(人均220万美元) [39][40] - 组织架构呈现扁平化特征,压缩了传统SaaS企业的多个专业化层级,早期阶段通常只有2-3个层级,所有职能都围绕技术核心展开 [41][46] - 资本更少投向人力,更多投向基础设施(GPU、推理成本和数据授权),AI企业将资金转化为计算和数据,而非像SaaS企业那样转化为人力 [49] 竞争格局与市场动态 - 竞争格局呈现"多赢家共存"态势,垂直领域专业化与workflow深度成为核心壁垒,同一领域的众多AI初创企业能够同时蓬勃发展 [6][58] - 在编程、创意内容生成、AI语音等多个领域均出现多家成功企业并行的局面,巨大的市场规模和专业化需求支持多个参与者增长 [61][62][64] - 企业pivot速度显著加快,技术创始人主导的转型平均仅需12个月,AI 100榜单中66%的初创企业至少进行过一次转型 [6][68] 技术演进与市场爆发路径 - 市场爆发遵循能力阈值递进规律,从简单辅助工具向多模态、垂直行业应用及多智能体系统演进 [6] - 写作和编程等早期爆发领域率先解锁,随着模型成熟,医疗、法律和金融等复杂垂直领域开始解锁,产品从横向向垂直领域拓展时竞争壁垒会加深 [77][79][81] - 创始人时机与执行力同等重要,最佳时机介于技术成熟度之间,足够接近拐点以交付实际价值,但又足够早在市场拥挤前积累优势 [80] 投资格局与地域分布 - AI热潮吸引了多元化资本,在种子前轮和种子轮阶段,Y Combinator投资了21家企业,占AI 100榜单的20%以上 [83] - 当企业发展到A轮和B轮阶段,投资者格局大幅集中,a16z以16笔投资位居榜首,Kleiner Perkins和红杉资本各为13笔投资 [88] - 在地理分布上,硅谷吸引力强劲,AI 100榜单中63%的企业总部位于旧金山湾区,欧洲和亚洲的明星企业到A轮时也多转向硅谷的风险投资机构 [94][95]
锦秋基金被投企业星尘智能亮相进博会,机器人乐队奏出中国风未来|Jinqiu Spotlight
锦秋集· 2025-11-07 15:15
公司技术与产品 - 星尘智能采用独特的绳驱传动与仿人设计,是业界首个实现绳驱量产的企业,使机器人在动作自由度、速度、加速度、精度上达到类人水准 [9] - 绳驱传动技术具备刚柔并济的特点,能完成高精度复杂操作(如生物化学医药实验)并模仿人类情感表达,兼具功能与情绪价值 [4][10] - 公司自主研发高效遥操作示教系统,人类乐手通过VR头显与操纵杆实时采集运动轨迹与力控数据,经数小时采集训练后机器人可自主复现演奏动作 [11] - 技术体系包括轻量高扭矩绳驱执行器(低惯量、快响应)、柔顺力控体系(精准控制击打力度)和具身学习模型(通过模仿学习优化动作) [12] 产品性能与展示 - 在进博会表演中,机器人指挥动作精准丝滑,木琴与指挥机器人实现毫秒级响应,钟琴机器人击打位姿精度达毫米级,展现高动态响应与精准位置控制 [7] - 机器人乐队通过同步控制与人类乐手完成三重奏,验证了系统在高动态、高负载任务下的稳定性与可靠性,并可全天多场次表演 [3][6] - 小央机器人乐队已能在深圳机场、保利剧院等大型活动中演奏《射雕英雄传》主题曲、《茉莉花》等多首乐曲,并可更新曲目持续学习 [8][13] - 在默沙东展区,S1机器人动态演示生物化学医药实验等长序列任务,并开放“人人可上手”的遥操作体验,体现硬件表现力与交互安全性 [4] 商业进展与战略 - 星尘智能于2024年获锦秋基金领投A轮融资,2025年继续获其追投A+轮融资,锦秋基金作为12年期AI Fund以长期主义为核心投资理念 [3] - 公司基于“本体—数据—模型”三位一体的Astribot Suite平台,在2025年完成上千台订单,并于第四季度陆续出货 [14] - 公司愿景是让机器人成为数十亿人的“AI机器人助理”,应用于家务劳动、精细分拣、服务交互等场景,正构建“本体优化—数据沉淀—算法进化—产业落地”的正循环体系 [14][16] - 与央视网合作的小央机器人乐队是其在文娱领域落地的重要举措,乐队成员将在全国开展主持访谈、乐队表演等工作,拓展“智能传播”与“人机共创”的想象空间 [8] 行业影响与定位 - 星尘智能成立于2022年底,是绳驱AI机器人的定义者,其技术路线推动机器人行业应用加速与商业化落地 [16][17] - 公司技术突破传统刚性机器人桎梏,尤其适合复杂灵巧操作和与人紧密交互的场景,已在科研、商业服务、文娱演出及工业领域实现应用 [9][17] - 具身智能模型通过模仿学习与力控反馈,使机器人快速掌握复杂技能,标志着AI操作世界的“Windows时刻”可能临近 [3][12]
我们是如何把中国最会搞AI的一群人,做成手办礼物送给他们的|Jinqiu Scan
锦秋集· 2025-11-07 12:04
文章核心观点 - 公司通过AI技术为CEO大会定制个性化手办,将AI从技术工具转变为具有温度和创造力的协作者,实现从虚拟形象到实体产品的全流程转化 [3][4][44] AI手办定制流程 - 收集每位参与者1-2张照片及个人领域、爱好等信息,使用Seedream 4.0、造好物等工具生成多种风格设计方案,最终选定Q版风格 [8] - 采用基础prompt生成1/7比例商业模型,并根据个人外形、气质特点及参考图清晰度补充描述细节 [9][10] - 针对半身照补充下半身设计,根据人物气质用语言绘制完整服装并调整神态 [11][13] - 通过多图参考和prompt将人物与产品、兴趣爱好结合,并关注眼镜、胡子、发型等标志性细节 [18][24] - 对区分度较小形象在衣服上印制公司名称以增强个性化 [29] AI生成技术能力评估 - 生成模型能稳定产出可直接使用结果,在风格转换、多图参考与局部修改方面展现成熟能力,可准确将真实照片转为Q版形象并捕捉人物神态 [33] - 细节问题如遗漏眼镜、下装缺失或短发变形可通过精细prompt描述解决,带文字元素画面易出现模糊或乱码 [34][37] - 多图参考时模型主体融合能力强,但需明确主体交互、位置和尺寸以避免比例失衡 [35] - 局部修改可实现高精度,如替换服饰细节或调整动作,AI正从工具转变为创作协作者 [35] 制造链协同与生产 - 合作伙伴数美万物基于自研大模型Hitem3D进行辅助建模,将三维模型分辨率从行业常见的1024³提升至1536³,实现高效个性化定制 [39] - 采用AI→建模→修模→打印→质检链路,通过人机协同修模校正AI模型结构,达到可生产标准 [39][41] - 使用全彩3D打印一体成型节省人工与周期,后处理包括打磨抛光、关键部位上光油及商品级质检 [42] - 包装采用吊卡手办形式,左侧实物与右侧原图对比,强化AI×制造转化趣味,并定制背板设计增强收藏属性 [41]
AI能帮我变成炒币大聪明吗?我们做了个低配版Alpha Arena,让6个模型上场PK炒币|Jinqiu Scan
锦秋集· 2025-11-06 20:26
文章核心观点 - 锦秋AI实验室组织了一场AI炒币大赛,使用六款免费大模型的API进行BTC/USDT现货模拟交易,以评估其作为大众理财助手的实际表现[3][4] - 测试结果显示,在下跌行情中,采取全程观望策略的DeepSeek和Qwen(累计收益0.00%)表现最佳,成功保住了初始本金10,000 USDT[8][9][25] - 其余进行交易的AI模型均出现亏损,其中ChatGPT亏损最大(累计收益-2.55%,最终权益9,744.73 USDT),Gemini亏损最小(累计收益-0.25%,最终权益9,975.35 USDT)[9][14][19] - 实验表明当前免费AI模型在实盘交易中表现出明显的保守倾向和执行力不足,虽能制定逻辑完整的策略,但缺乏动态调整和风险偏好的能力[28][30][31] 测评过程 - 测试对象为六款免费大模型API:ChatGPT(openai/gpt-4o-mini)、Claude(anthropic/claude-3.5-sonnet)、Qwen(qwen/qwen-2.5-72b-instruct)、Grok(x-ai/grok-4-fast)、Gemini(google/gemini-2.5-flash)、DeepSeek(deepseek/deepseek-chat)[6][12] - 测试方法为手写程序让AI每30分钟根据实时K线图做出交易决策,可选操作包括BUY(买入)、SELL(卖出)、HOLD(观望)[6] - 要求AI在测试开始时输出核心交易策略,并在每次决策时说明理由,以便分析其思路和决策逻辑[7] 测试结果 - **DeepSeek和Qwen表现最佳**:两者均采取全程观望策略,累计收益率为0.00%,最终权益保持10,000 USDT初始本金不变[9][18][25] - **ChatGPT表现最差**:累计收益-2.55%,最终权益9,744.73 USDT,其问题在于一次性全仓买入后不肯减仓,既不敢动作也不敢纠错[9][14] - **Claude策略相对稳妥**:累计收益-0.84%,最终权益9,915.51 USDT,采用动量策略但未能及时止损,亏损幅度较小[9][16] - **Gemini亏损控制最好**:在出手的模型中损失最小,累计收益-0.25%,最终权益9,975.35 USDT,主要采取跟趋势、看支撑阻力的少操作策略[9][19] - **Grok交易频繁但效果不佳**:累计收益-1.30%,最终权益9,870.20 USDT,出现来回折腾的情况,容易把小亏变成实亏[9][22] 各AI模型交易策略分析 - **ChatGPT策略**:基于市场趋势和技术指标,规则包括价格突破50日均线且成交量放大时买入,跌破时卖出,波动小于5%时观望[13] - **Claude策略**:采用动量策略,规则包括日线MACD金叉且成交量放大时分3次买入,价格突破前高后量能萎缩时减仓30%,单笔亏损不超过总资金3%[15] - **DeepSeek策略**:结合趋势跟踪与动量突破,规则包括价格突破20日均线且RSI(14)>50时买入,跌破20日均线或RSI(14)<40时卖出[17] - **Gemini策略**:专注于识别并跟随市场主要趋势,利用价格行为和关键支撑阻力位进行交易,避免频繁交易[19] - **Grok策略**:采用趋势跟踪策略,使用50日EMA和200日EMA作为信号线,当50日EMA上穿200日EMA时买入,下穿时卖出[20][21] - **Qwen策略**:基于长期趋势分析结合短期动量指标,规则包括价格突破200日均线时逐步建仓,14日RSI连续3天超过70时准备减仓[23] 实验总结与行业启示 - 实验定位为面向大众理财者的AI模拟测评而非专业量化系统较量,旨在评估常见AI作为理财助手的实际表现[28] - AI模型展现出强大的推理能力和自洽性,能够在极短时间内制定完整交易逻辑并保持决策一致性,各自呈现不同的"性格"与思维框架[29] - 当前免费AI在实盘交易中存在明显局限:缺乏实时反馈闭环、不懂风险偏好、无法动态调整策略、不具备面对亏损时的情绪弹性[30] - AI在真实市场中表现出类似人性的交易特征:犹豫、保守、怕错、想赢,这种表现为人类投资者提供了清晰的借鉴参考[31] - 实验将继续深入,未来计划使用付费模型和更复杂信号源,测试AI在更多交易品类中的表现[32]
锦秋基金合伙人臧天宇:锦秋基金 2025 AI 创投全景分享,从算力到场景的投资逻辑与未来预判|「锦秋会」分享
锦秋集· 2025-11-06 16:08
锦秋基金投资策略与定位 - 专注于AI核心产业链进行投资 [10] - 基金周期为12年,具备长期支持创业者的耐心 [10] - 过去一年投资超过50个AI项目,行业活跃度位居前二 [10] AI领域投资分布 - 应用层项目占比最高,达到56% [11] - 具身智能领域投资占比25%,被视为迈向AGI的重要路径 [11] - 算力基础领域投资占比10%,旨在支持长期模型降本 [11] - 投资版图覆盖从算力、模型、中间层到上层应用的完整产业链 [18][19][20] 行业趋势对比与差异化 - 与国内20家活跃VC及CVC相比,整体投资领域注意力分布相似但结构有差异 [14] - 锦秋基金更重仓应用方向 [16] - 对算力基础层有更长期乐观的判断,关注能弯道超车的新算力架构 [22] - 在硬件投资上更具选择性,看重清晰用户需求及与AI技术的结合 [22] 智能范式迁移与能力演进 - 行业焦点从预训练的Scaling Law转向用高质量数据集进行后训练 [26][27] - 进入以强化学习进行后训练的时代,代表智能范式的迁移 [28] - 模型能力从成熟对话演进至Agentic Reasoning、工具使用和编码,催生Agent创业热潮 [28] - Physical AI被视为未来智能迭代的重要方向,通过具身实体实现开放世界探索学习 [28][29] 智能成本下降与商品化趋势 - 模型每token成本持续大幅下降,获取特定能力以上智能的成本也在降低 [32][33] - 模型商品化颗粒度将更细,应用层公司可像逛超市一样挑选高性价比模型 [34] - 类比1996-2001年美国电信业投入2.2万亿美元使宽带价格下降96%,AI智能带宽将出现相同趋势 [34][35] - 算力架构创新是推动智能商品化的关键因素,关注近存计算、存算一体、光计算等新架构 [37] AI应用层机会分析框架 - 核心变量是信息、知识、内容生产的边际成本显著下降,趋于零,带来内容供给爆炸 [51] - 机会一:创作进一步平权,增强个体创作能力,案例如即梦、Hogi、Romangic [51] - 机会二:AI可创造个性化供给,依据需求定制内容,案例如Sora2 APP、Wakana [51] - 机会三:缔造前所未有的新体验,如开放互动式体验,案例如C.ai、造梦次元、独响 [52] 信息分发与服务模式变革 - AI可以Copilot模式与用户共享信息窗,进行场景感知并主动推送服务,催生AI原生OS或浏览器等产品机会 [53] - AI时代可在语义token层面进行用户建模,可能诞生新一代推荐引擎及产品载体 [53] - Agent使可分发的不再仅是信息,还包括服务结果,能对非标服务进行标准化执行和分发,案例如Head.ai、Pokee.ai [54] 具身智能发展观点 - 具身智能核心是构建物理世界的Agent应用,但基础模型尚未达到GPT时刻,应用未全面爆发 [56] - 数据是提升智能的关键,需将硬件布设到用户身边和真实场景中以获取数据 [56][58] - 不应低估硬件难度和价值,早期软硬件协同迭代至关重要,好的硬件本体基础对算法开发落地帮助巨大 [58] - 跑通第一人称视频数据预训练是Physical AI scaling的重要路径,需建立真实场景数据闭环 [61]