Workflow
锦秋集
icon
搜索文档
锦秋被投企业 atoms.dev :推动 Vibe Coding 走向 Vibe Business|Jinqiu Spotlight
锦秋集· 2026-01-14 18:51
公司融资与产品发布 - 人工智能公司atoms.dev(隶属于DeepWisdom)近期连续完成A轮与A+轮融资,总额3100万美元[4] - A轮由蚂蚁集团领投,A+轮由凯辉基金领投,锦秋基金、概念资本、BV百度风投等机构跟投[4] - 融资资金将用于多智能体系统的持续研发、产品规模化落地及全球市场拓展[4] - DeepWisdom公司累计已完成2.2亿元人民币融资[6] - 公司于北京时间昨晚9点正式上线其核心产品Atoms[5][6] 产品理念与定位 - Atoms的核心定位是让用户通过输入文字,即可完成从想法到生意的全过程[6] - 产品背后调用的是一个由研究员、产品经理、架构师、工程师、SEO专员、数据分析师等角色组成的AI组织(多智能体团队)[6] - 创始人认为,AI的价值正从“个人效率提升”转向“直接交付结果”[5] - 未来的基本单位将不再是公司,而是一个个多智能体组织,人人可随时调动一支高效AI团队[8] - 产品旨在为用户配备一个“AI版字节跳动”,其设计参考了字节跳动的组织文化[21][23] - 公司的目标是解决“智力供给”,在智力溢出的时代,直接供给智力[37][38] 产品功能与工作流程 - Atoms围绕真实生意展开,第一步是进行商业调研与竞争分析[13] - 在商业调研基准测试中,Atoms模块表现超过了Gemini和OpenAI的同类模型[13] - 第二步是交付完整系统,直接搭建包括支付(Stripe)、权限管理、部署在内的真实生意所需基础设施[13] - 第三步允许并行推进,多个AI团队围绕同一想法同时工作,提供不同实现路径供用户选择最优方案[14] - 产品允许用户一键将创意(如小说中的物品、UP主周边)转化为可售卖的商品[23] 技术优势与性能数据 - 在效果相近甚至更好的前提下,Atoms的整体成本可比主流闭源方案低约80%[14] - 公司使用开源模型组合,在自有的Benchmark上得分达到0.8 – 0.9+,而欧美竞品平均分为0.4+[32] - 其效果已显著超过Claude系列在同类任务上的表现[33] - 公司可以用1/10的成本超过市面上所有竞品[34] - 公司的多智能体+全栈能力,使其具备竞品完全不具备的应用深度[35] 技术挑战与解决方案 - 当前面临的主要技术挑战包括语言模型的记忆能力、奖励机制、多模态理解能力和意图识别[26][28][29] - 语言模型学习新概念需要看1000次,且缺乏类似人类的内在奖励系统(如多巴胺)进行自我校准[26][27] - 模型的多模态理解能力不强,无法像人一样完成世界建模[28] - 意图识别存在模糊性问题,例如无法区分“苹果”指代的是手机、电脑还是水果[29] - 解决方案包括放弃传统向量检索,改用小模型“扫上下文”自动切片以找到关键信息[30] - 开发“主动记忆管理”系统,让智能体主动选择何时写入或删除信息,优化记忆结构[31] 公司发展历程与产品演进 - DeepWisdom创始人吴承霖于2019年创业,曾在腾讯、华为从事机器学习工作[17] - 公司早期(2019-2022)主要挣扎于ToB的AI服务[17] - 2023年大模型爆发后,创始人得出结论:AI会以团队、群体、组织的形式出现,并决定从智能体切入[17][18] - 公司产品演进逻辑链为:MetaGPT(解决AI按SOP协作的组织问题)→ MGX(2025年2月推出,Atoms前身,ARR达100万美元)→ Atoms(直接解决帮用户开启一门生意)[15][16] - MGX产品曾是Product Hunt周榜单第一[15] 市场定位与用户案例 - Atoms的目标用户是“一人公司”或小型组织,典型用例包括美国的书店店长、马来西亚的珠宝商、做玩具电商的小卖铺老板,其共性需求是业务数字化和赚钱[24][25] - 创始人认为,在AI时代之前,没有类似的公司出现,公司解决的是智力供给问题[36][37] - 创始人相信,随着硅基生产力在速度与规模上全面超过碳基劳动力,人的价值将体现在判断、审美和选择上[5][8] 行业观点与未来展望 - 创始人预测,到2026年,智能体(Agent)的价值将从“个人效率的提高”转变到“直接交付结果”[8] - 创始人激进观点认为:Agent模块(如记忆、情绪、环境感知)会继续演进;两年内,手机上的GUI Agent会被突破;六年内,具身机器人的局部场景也会被打穿[39] - 字节跳动的组织文化(上下文透明、原子化贡献、机制优先、快速反馈、批判性思维)被认为是人类组织中最接近高效多智能体协作模型的典范[21][22]
锦秋被投企业Manifold AI流形空间完成超亿元天使+轮融资,国产世界模型让机器人大脑超进化|Jinqiu Spotlight
锦秋集· 2026-01-10 14:13
公司融资与资金用途 - Manifold AI(流形空间)完成超亿元天使+轮融资,由君联资本领投,梅花创投、华为哈勃跟投,老股东英诺基金、锦秋基金、同创伟业持续加注 [4] - 公司在半年内累计已获得数亿元融资 [4] - 所募资金将用于世界模型的迭代和具身大脑的应用落地 [4] 核心技术:世界模型 - 公司自研通用空间世界模型WorldScape,具备单图生成可交互空间的能力 [6] - WorldScape在生成质量、时空一致性、实时性等方面全面对标国外一线世界模型,如Google Genie3、李飞飞World Labs RTFM等 [6] - 公司依托海量物理视频数据预训练,使WorldScape具备强大的通用空间操作交互能力,补齐了世界模型落地到物理AI的最后一块拼图 [8] - 公司坚持World Model Action技术路线,利用自研世界模型作为基础模型替换通用VLM模型,使机器人大脑获得“超进化” [10] 技术性能与成果 - 实测表明,其模型在落地性能上显著超过了pi0.5等经典VLA模型,zero-shot泛化能力大幅领先当前具身模型 [10] - 相关模型即将在社区发布 [10] - 公司是世界范围内首个全域布局室外、室内、空域具身世界模型后训练的团队 [9] - 相关成果DriveScape、RoboScape、AirScape已分别发表在国际顶级会议CVPR2025、NeurIPS2025、ACM MM2025上 [9] - 多个场景的后训练基于同一个世界基座模型WorldScape迭代,提升了数据闭环效率和模型性能上限 [9] 产业合作与部署 - 公司已率先接入NVIDIA Jetson Thor用于具身世界模型的本体部署 [14] - 产业投资人华为哈勃的加入,将有利于提前布局国产化芯片和机器人大脑的集成,奠定规模化落地的基础 [14]
在锦秋,训练你的人生模型 | 加入锦秋第②弹
锦秋集· 2026-01-09 17:12
文章核心观点 - 在AGI时代,传统的“劳动力式”勤奋已无法创造竞争优势,个人的成长必须遵循Scaling Law,实现认知的复利增长[2][4] - 公司发布的是一系列非典型的工作邀请,旨在寻找敢于像经营初创公司一样经营自己的人才,公司承诺提供平台助其实现“认知涌现”[5][6] - 公司将个人比作一个正在训练的模型,而公司平台能提供“超级算力集群”,包括非公开的行业认知、撬动资本的影响力以及通过实战调优个人“参数”的环境[11][12][13] 招聘岗位概述 - 公司正在为2026年招募正式岗位与实习生岗位,涵盖投资研究、媒体关系、产品测评、数据设计、视频剪辑、视觉设计及新媒体运营等多个职能[15][17][19][22][23][26][27][28] AI投资研究员岗位 - 使命是成为“首席AI研究官”,在信息熵极高的AI行业中将海量噪音压缩成可反复使用的“第一性原理”和商业框架[15] - 具体职责包括每月输出至少一篇行业穿透力的深度研究报告、建立研究母题库、支持重要对外内容[20] - 要求候选人是真正的长期主义者,具备极致结构化思维,是深度使用过至少5款AI产品的“AI原住民”,并有行研、咨询、科技媒体或VC相关经验[20] 媒体关系负责人岗位 - 使命是成为公司与被投企业的“认知放大器”,负责品牌声量与投后传播策略赋能[17] - 具体职责包括拓展媒体关系网络、策划执行“影响力矩阵”式传播、协助被投公司从0到1制定媒体策略[21] - 要求候选人拥有2年以上媒体公关经验,深谙科技创投媒体逻辑,具备优秀文字能力和战略视角[21] AI产品测评实习生岗位 - 使命是作为“首席体验官”,通过测评体验与数据分析评判AI产品价值[19] - 具体工作包括深度体验并暴力测试全球最新AI产品、真人出镜录制测评视频、撰写结构化报告[25] - 要求候选人表达逻辑稳、极度好奇并深度使用过至少5款AI工具,有内容创作背景者加分[25] AI产品图文测评实习生岗位 - 使命是作为“首席测评师”,将前沿AI工具转化为高价值的图文报告[22] - 具体工作包括系统性拆解产品、制作适合小红书和公众号的图文内容、建立竞品评测坐标系[25] - 要求候选人是深度使用过至少5款AI工具的“AI原住民”,兼具逻辑、审美与投资视角[25] 数据图表设计师岗位 - 使命是将硬核的财经数据与新闻“翻译”成视觉逻辑,实现“视觉涌现”[23] - 具体工作包括将数据转化为高审美信息图表、制作动态交互图表、实现复杂信息的视觉解构[25] - 要求候选人具备财经数据敏感度,熟练使用Flourish等可视化工具,数字新媒体专业优先[25] 视频剪辑实习生岗位 - 使命是把“深度谈话”剪成“认知钩子”,是懂AI与传播的内容创作者[26] - 具体工作包括生产横竖版短视频、负责后期包装与节奏控制、追踪数据并优化视频开头逻辑[29] - 要求候选人能听懂AI与商业逻辑对话并提取精华,熟练使用PR/剪映等工具,有访谈类视频剪辑经验优先[29] 社交媒体物料设计师岗位 - 使命是释放团队审美上限,将AI洞察转化为视觉符号,并可能负责建立品牌视觉体系[27] - 具体工作包括设计公众号及社交媒体封面与信息图、开发活动海报与栏目视觉模板、将硬核数据转化为美观图表[29] - 要求候选人审美佳且能平衡科技感与信息逻辑,熟练使用Figma/PS/Canva及AI绘图工具,视觉传达等相关背景加分[29] 新媒体运营实习生岗位 - 使命是作为公司社交资产的“管家”,负责各平台内容的体面与精准呈现[28] - 具体工作包括公众号与小红书的内容排版与日常运营、协助图文资料搜集与活动策划、完成基础配图与模板套用[29] - 要求候选人细心且有审美,熟悉社交媒体排版,懂基础AI名词,具备基础视频制作与图片审美能力[29] 公司平台与理念 - 公司将自己定位为人才进入AI核心战场的“超级算力集群”,提供非公开的行业真知与顶级创始人的深度洞察作为稀缺数据[12] - 平台能提供杠杆效应,同样的努力在公司能撬动资本流向,仅2025年一年公司就完成了对超过50家AI公司的投资[12] - 公司通过高频实战帮助员工“调优底层参数”,学习如何定义和影响未来,而不仅仅是做研究或内容[13] - 公司强调个人成长的“认知复利”,认为若认知能保持每周5%的复利增长,一年后将完成约12.6倍的维度跨越[9][10]
亲身体验后,我们总结了全网首份AI语音输入法红黑榜|锦秋AI实验室
锦秋集· 2026-01-08 22:57
文章核心观点 - 语音输入法的核心价值在于能否将口语准确、忠实地转换为可供信息接收者理解的书面文本,而不仅仅是省事 [1] - 当前AI语音输入法在基础听写准确率上普遍达标,但在会议纪要、中英混输、数字单位、专有名词等复杂场景下表现分化显著,分水岭在于能否“忠实转写”而非“自作聪明”地改写 [36] - 经过5轮7款产品的测评,typeless在综合表现上断层领先,豆包输入法为全能省心型选择,而部分产品在关键场景存在语义级错误的高风险 [37][38] 横评工具与测评方法 - 测评涵盖7款产品:搜狗输入法、智谱输入法、Whisper flow、闪电说、讯飞输入法、豆包输入法、typeless [6] - 测评采用5个真实场景的统一题库,包括日常聊天、会议纪要、中英混输、数字与单位、专有名词 [2] - 测评维度包括文本一致性、局部质量和整体体验,评分标尺为0-5分 [7][11] - 所有工具均采用最新版默认配置,不调参数,不手动修正结果 [11] 各场景测评结果 日常聊天转写(基础准确率) - 第一梯队(几乎可直接发)包括搜狗、讯飞、豆包、typeless、智谱,关键信息转写稳定 [10] - 搜狗、讯飞、豆包更忠实保留“哈/那个/哦对了”等口语词,聊天味浓 [12] - 智谱会轻微“去口语化”,使文本读起来更干净 [13] - typeless在忠实转写基础上会主动进行自动分段和补全标点,提升可读性 [14] 会议纪要(长句与结构化) - 此场景考验长句、多层结构、专有名词和分工列表的准确转写与结构化能力 [16] - 第一梯队为typeless和豆包输入法 [17] - typeless能在忠实转写的基础上,自动将内容整理成编号清晰的会议纪要模板 [19] - 豆包输入法则近乎逐字忠实转写,标点断句自然 [19] - 搜狗、讯飞、闪电说出现明显翻车,如将“不再加了”误转为“不在家了”,导致语义事故 [18][25] 中英混输(技术口述) - 此场景对英文术语、数字状态码、URL、邮箱等硬字段的准确率要求极高,一处错误即可导致指令失效 [21] - 第一梯队为豆包输入法和typeless,核心术语与指令逻辑保持准确 [26] - typeless还能将信息自动结构化成清单,便于技术沟通 [26] - 搜狗输入法出现致命误转,如将“login callback”转写为“logan comeback”,导致整段内容不可用 [26] - 智谱输入法在关键指令顺序上翻车,如将“fix”和“test”的先后顺序转反 [26] 数字、单位与时间 - 此场景对数字、金额、时间、比例等数据的准确性要求极为严格,错误可能导致执行事故 [28] - 第一梯队包括豆包、搜狗、智谱、typeless,关键数字和单位几乎全对 [31] - 搜狗和豆包将“35到45分钟”转写为“35~45”,更符合书面表达 [31] - typeless自动将预算、流程等拆分成清单,适合直接作为通知发布 [31] - 闪电说出现预算级事故,如将“4200”误转为“3200” [31] 专有名词(人名、机构名、品牌名) - 此场景是语音输入法的“照妖镜”,专有名词错误会严重影响文本可信度且难以自动纠正 [33] - typeless表现最佳,RL、Agent、Meta、斯坦福、Pokee AI、朱哲清等专有名词几乎全部准确,标点段落舒适,可直接作为引用稿 [37] - 智谱输入法整体准确,主要瑕疵为公司名拼写(如Pokee→poke) [37] - 豆包输入法出现人名同音错字(朱哲清→朱泽清)和品牌名漂移(Pokee→Poky) [37] - 搜狗、闪电说、Whisper flow、讯飞错误较多,如将RL听成url、概念听成数字(“期望回报”→“7万回报”),导致专业感丧失 [37] 产品总结与定位 - **typeless**:被定位为“纪要型天花板”,结构化、排版和长句稳定性强,会议纪要、通知等场景几乎可直接使用,但对链接、邮箱等硬字段偶尔会进行智能补全,需核对 [40] - **豆包输入法**:被视作“全能型助手”,整体最忠实于原话,会议纪要、数字、技术口述等场景稳定,断句自然,是省心的全场景选择 [38][40] - **智谱输入法**:在聊天场景会轻微优化口语,使文本更干净,多数轮次稳定,但技术口述中可能出现指令顺序错误,适合表达整理而非严格记录 [40] - **讯飞输入法**:基础听写可靠,但格式感一般,在会议纪要和中英混输场景下编号、大小写、字段格式容易混乱,适合随手记 [40] - **Whisper flow**:排版和结构化能力突出,但专有名词和技术词汇错误密集,甚至出现语义级误听,属于格式满分但内容需严格校对的类型 [40] - **搜狗输入法**:日常聊天和数字场景表现优秀,口语保留自然,但专业场景易出现语义事故级错误,适合聊天而非记录 [40] - **闪电说**:多轮出现关键否定句翻转、预算数字错误、技术字段乱码,不推荐用于任何高风险场景 [40]
锦秋被投企业OiiOii创始人闹闹:亲历微信与字节后,如何抓住下一波机会?|Jinqiu Spotlight
锦秋集· 2026-01-07 19:03
文章核心观点 - 2026年将是AI视频应用爆发的关键年份,预计将催生大量新的独角兽公司 [6] - AI视频生成领域的创业公司,特别是采用Agent架构的产品,不仅不会被Sora等大模型“端到端”吃掉,反而会迎来最好的发展时代,与大模型形成互补共生的繁荣生态 [9][11][57] - OiiOii作为AI动画视频生成Agent,其核心价值在于通过“厨师调味”般的深度工作,将底层模型能力转化为面向特定人群和场景的成品,满足从专业创作者到普通用户的广泛需求 [16][57][59] 快问快答 (公司基本情况) - 创始人闹闹毕业于中山大学,MBTI为INTJ,星座是狮子座 [19][20] - 公司核心业务是用AI制作动画 [22] - 公司处于Pre-A轮融资尾声,产品内测发布约一个月,目前需要邀请码 [23][26] - 公司成立约4个月,尚无收入和利润,团队全职规模为18-19人 [25][27] - 创始人创业前拥有丰富的产品经理经验,曾任职于腾讯微信事业群(QQ邮箱)、字节跳动(剪映、抖音特效)以及B站动画业务 [28][29] AI视频的Agent时刻:为什么是现在? - 创始人在2022年DALL-E 2发布时便萌生用AI做动画的想法,但真正的切入时机在2024年上半年,源于观察到多模态模型开始激烈竞争,势头类似语言模型爆发期 [40][43] - Agent架构被确定为最佳产品形态,原因有三:1) 可灵活调用多种模型;2) 动画制作本身是流式、多角色协作的流水线,与Agent工作方式高度契合;3) Agent交互提供高自由度,避免传统GUI工具的功能臃肿 [44][45] - 产品初期采用“首尾帧”生成路线以保证单镜头稳定性,并创新设计Task Agent为不同分镜自动匹配最优模型 [46][47] - Sora 2发布后,其出色的分镜和镜头语言能力促使公司果断放弃原有路线,全面转向接入Sora,首个测试视频(小螃蟹和小猩猩打篮球)一句prompt直出,效果令人兴奋 [47][48][52] 为什么不怕Sora?大模型与Agent的共生关系 - 核心观点:视频模型不可能“大一统”,因各家训练数据、标注标准不同,输出结果各有特色,这为Agent的“组合式创新”留下了巨大空间 [53][166] - 提出“超市与餐馆”理论:大模型如同提供原材料的大型超市,而Agent则是川菜馆、粤菜馆等特色餐馆,为用户提供符合特定口味和场景的成品,两者共存共荣 [16][54][57] - Agent公司约60%-70%的工作是“后厨调味”,即通过建立垂直知识库、优化prompt、调整模型参数等细微工作,将生硬的模型输出转化为符合目标用户需求的佳肴,这是其核心护城河 [16][57][59] - 即使未来Sora发展到4.0/5.0版本,开始提供一些“熟食”(垂直功能),Agent产品也不会消亡,反而会更加繁荣,因为垂直领域的需求深度和专业性是无法穷尽的 [11][63] 目标用户与市场定位 - 初始目标用户定位为“自媒体人”,主要包括三类:1) 围绕IP创作动画的小型工作室(可将内容更新效率从一周一集提升至一天一两集);2) ACG领域的MV创作者;3) 讲历史、科普等非动画领域的自媒体人 [71][72][73] - 内测中发现了三类意料之外的用户:1) 漫剧团队(利用其高效分镜生成能力);2) 从未做过视频但想用动画表达想法的人;3) 为维系社交关系而创作的用户(如家长为孩子、学生为老师、情侣之间制作动画视频) [18][76][77] - 公司未来将采用类似抖音做垂类的策略,针对科普、MV等不同内容类型,深入研究其结构并构建专属知识库,逐个垂直领域进行深度服务 [78][79] - AI视频Agent不会取代剪映等传统工具,而是带来增量市场,两者效率叠加为最优解,用户可在OiiOii生成内容后,再导入剪映进行轻量剪辑等后期处理 [16][87][94][95] 产品设计与技术架构 - 选择Agent架构的重要原因之一是避免传统创作工具(如PS、PR、剪映)从简单走向功能臃肿的必然循环,Agent的能力更多隐藏在后台,而非通过GUI堆叠 [82] - Agent产品具有用户与产品共建的魅力,用户能探索出开发者意想不到的用法,不断拓展产品边界 [83][84] - 为平衡工作流的“稳定性”与用户修改的“自由度”,公司在两个月内重构了四次系统架构,最终采用在严格workflow中嵌入“信号”机制的方案,允许Agent在特定环节跳出接受用户指令后再跳回,技术挑战大且仍在优化稳定性 [85][86] - 产品设计赋予每个Agent(如剧本Agent、角色设计Agent)角色感,模拟“团队服务于导演”的体验,但多Agent交互中的上下文记忆管理是架构难点 [96][97] - 产品的“秘方”在于将影视学的专业知识(如用特定色调、场景表达“孤独”情绪)打包成可调用的元素,使普通用户仅用情绪词也能生成有“感觉”的片子 [98][100] 创始人的产品方法论与行业洞察 - 在微信的工作经历培养了深刻的产品价值观和“被训练出来的直觉”,强调通过大量阅读用户反馈(每天数百上千条)来识别真伪需求,洞察人性 [108][111] - 在字节的工作经历强化了数据驱动和理性策略思维,学会了通过用户行为数据计算概率来指导产品决策(如“造风”),将产品sense与数据科学结合 [112][115][117] - 微信与字节的共同点在于都将自身基因优势发挥到极致:微信将“体验”和“感性”发挥到极致,字节则将“效率”和“数据”发挥到极致 [120][121] - 成为一名优秀产品经理的三个关键能力:1) 移情能力,能迅速切换为用户视角;2) 50%自信与50%自省结合,避免盲区;3) 对技术敏感,理解技术可实现性的边界 [131][132] - 动画行业是商业世界中少数会奖励“纯粹”与“热爱”的领域,创始人长期的动画梦想与AI技术机遇、团队能力实现了完美匹配 [9][128][129][137] 对2026年AI视频领域的预测 - 技术发展将延续质量提升、可编辑性增强的趋势,实时性和互动性也可能提高,但更高的编辑自由度和互动性可能使产品更小众,因为大众已习惯被动接收信息 [158][159][160] - 一些在现有媒介基础上的“小改动”(如Sora 2带来的更自然切镜)可能比巨大的技术革新更能吸引广泛受众 [161] - 视频模型厂商将朝两个方向发展:一是强化自身擅长领域,二是补足短板,同时会继续追求通用性,实时性和可编辑性将是重点增强方向 [168][169] - 视频模型难以大一统,不同模型有先天差异(数据与标注)和后天差异(公司战略),且即使模型相同,调用手法和输入内容的不同也会导致输出结果迥异 [164][165][166]
锦秋被投企业铭芯启睿完成超亿元Pre-A轮融资|Jinqiu Spotlight
锦秋集· 2026-01-05 12:03
融资事件 - 铭芯启睿于近日完成超亿元人民币Pre-A轮融资[2] - 本轮融资由国开科创、联想创投领投,中芯聚源、顺禧基金、恒裕投资跟投,老股东中科创星、小米战投持续加码[2] - 公司此前于2025年3月完成近亿元天使轮融资,由锦秋基金领投,联想创投、小米战投等共同出资[3] 资金用途与公司战略 - 募集资金将用于RRAM核心技术研究和人才团队扩充[2] - 资金将助力推动RRAM技术产品规模化量产,加速存算技术的落地应用[2] - 公司致力于以先进工艺节点阻变存储器(RRAM)为基础,结合存算融合及先进封装技术,解决“内存墙”瓶颈[5] - 公司面向服务消费、工业与数据中心领域,提供AI高性能“感-存-算”一体化解决方案及定制化存储IP/芯片产品[5] 技术进展与商业合作 - 经过一年多的快速发展,公司在探索高密度存储商业化落地的过程中成果显著[5] - 公司已与多家上下游企业建立合作,围绕存储工艺制造技术展开联合攻关[5] - 公司深度绑定多家龙头企业客户,共同定义更符合市场需求的优质产品[5] - 公司已顺利完成产品工程批验证流片[5] - 公司将加快存算技术产品的研发,为客户提供更高价值的人工智能存算方案[5] 行业与市场前景 - 此次融资汇聚国家产业资本、战略资本与头部市场化基金,是对新型存储与存算产业发展潜力的充分看好[5] - 公司将持续深耕新型存储与存算技术赛道[5]
当一家VC想要带创业者们好好吃饭|新年快乐!
锦秋集· 2025-12-31 20:52
公司活动与社群建设 - 公司自2025年2月底起,每周五晚定期举办名为“锦秋小饭桌”的线下交流活动,旨在为AI创业者提供非正式交流场域 [1][3] - 该活动不设舞台与路演,参与者可暂时放下商业计划书与估值,专注于交流尚未成熟的想法 [5] - 活动形式最初被视为松散的社交实验,旨在为投资团队创造结识创业者的机会 [5] - 截至发稿时,该活动已在北京、上海、深圳、杭州、硅谷等地举办共计42场 [2] - 该活动已成为AI创业者社群中的一个重要连接符号,参与者的报名信息共同构成了中国AI圈的行业地图 [5] - 公司计划在2026年继续每周准时举办“锦秋小饭桌”活动 [8] - 公司将于美西时间2026年1月8日周四19:00,在CES展会附近举办一场特别策划的“深夜食堂”活动 [12][13][15] 行业洞察与交流价值 - 通过持续的饭局交流,公司发现最具生命力的行业洞见往往产生于非正式的讨论与争鸣中,而非正式的演示文稿里 [6] - 活动中的讨论话题广泛覆盖行业前沿,包括具身智能、AI硬件、多模态进化、Agent趋势、端侧爆发、芯片架构、中国创新、产品出海、中美差异及硅谷声音等 [7] - 公司认为创新是持续耕耘的日常,而非个例或凑热闹 [9] - 公司坚持通过面对面的深度交流来发现真正推动变革的创业者,而非仅从商业计划书中寻找线索 [10] - 公司旨在通过与更多AI构建者的持续对话,共同构建一个同频学习与交流的场域 [11]
锦秋被投企业Pokee AI 创始人朱哲清:一个强化学习信仰者的十年|Jinqiu Spotlight
锦秋集· 2025-12-30 18:29
文章核心观点 - 强化学习技术路线正在回归,其价值在于让AI智能体具备在未知工作流中“边做边学”的主动探索能力,而非简单为大模型增加一层能力[5][6] - Pokee AI创始人朱哲清作为“非共识”创业者,押注强化学习这条“慢但正确”的路径,致力于构建具备卓越推理、规划与工具调用能力的新一代AI智能体[6][8][9] - 强化学习与大模型正形成结构性互补关系,是解决模型在偏离训练数据分布时决策能力的关键,指向通用人工智能的终极理想[13][24][36] 公司背景与融资情况 - Pokee AI于2025年7月完成1200万美元种子轮融资[6][14] - 锦秋基金于2024年参与了Pokee AI的融资,并在两周内完成了投资决策[6] - 公司创始人朱哲清为斯坦福大学博士,曾任Meta AI应用强化学习团队负责人,于2024年10月离开Meta创办Pokee AI[8][12] 强化学习的价值与挑战 - 强化学习的真正瓶颈在于环境:真实世界试错成本高、不可控,缺乏既复杂又允许反复失败的安全练兵场[10] - 强化学习是主动学习,通过与环境的交互和奖惩机制形成决策,类似于婴儿目标驱动的探索过程[16] - 2025年3月,强化学习奠基者理查德·萨顿获得图灵奖,被视为对该领域的正名[13] - 以DeepSeek-R1为代表的新一代推理模型,在技术报告中强调了强化学习在“复杂推理”和“长程规划”中的关键作用[13] 技术路径与行业洞察 - 大模型预训练存在能力上限,无法应对偏离原始数据分布的新组合,强化学习是提升模型“适应能力”的核心路径[22][24] - 行业主流曾认为模型足够大即可自动解决推理能力,但Pokee AI主张通过工具调用主动缩减模型处理复杂度,是更现实和高效的路径[25] - 随着模型长上下文能力爆发,RAG(检索增强生成)因造成20%到30%的信息损耗而被视为临时妥协,一体化模型效果更好[26] - 当前大多数工具是为人类设计,对AI不友好,导致调用时出现幻觉,缺乏AI原生工具是Agent落地的根源问题[29] - Pokee AI采用“混合路线”,保留Transformer架构作为基础,在后训练阶段通过强化学习构建决策与环境适应能力[34] 公司实践与商业案例 - 在Meta期间,朱哲清通过精简项目、聚焦核心落地,带领团队开发生产级强化学习平台Pearl,成功应用于广告预算调控,用业务指标为强化学习赢得认可[20][21] - 该方案未激进替换传统的PID控制器,而是引入元策略框架,让强化学习训练关键参数,在模拟环境验证后,于真实测试中带来转化指标明显提升[20] - Pokee AI在创业过程中踩过诸多技术坑,例如发现开源社区中99%的MCP工具接口不可用,仅为赚吆喝而缺乏维护[29] - 公司正尝试对现有工具进行二次封装,使其对模型更友好,并结合强化学习让智能体在任务中端到端探索最优工具组合[29] 创始人理念与愿景 - 创始人朱哲清在过去十年专注于“如何让机器更聪明地学习”,其选择是缓慢而坚定的策略更新,不追逐短期回报,逼近“第一性原理”[8] - 其坚信强化学习是通向通用人工智能的道路,并以此作为公司的核心信仰[34][36] - 公司不仅是追求商业成功,更是验证“智能终极理想”的实验室[35]
CB Insights:从“副驾驶”到“主司机”,2026年AI Agent的关键信号|Jinqiu Select
锦秋集· 2025-12-29 19:09
AI智能体核心范式转移 - 行业正经历从“Copilot(副驾驶)”向“完全自主智能体”的范式转移,智能体将演变为具备决策、执行、支付与反馈闭环的“超级工具”,能够主动完成任务并可能重塑企业组织与工作方式 [4] - 范式转移的核心变量不在于模型能力,而在于“是否放权”,即赋予智能体更高的自主性 [4] - 随着推理模型驱动智能体进行多步思考,Token消耗量激增,正在挤压初创公司利润并引导SaaS行业从“按席位付费”向“按结果计费”的商业模式重构 [4] 2026年关键预测与趋势 - **预测一:语音AI领跑冲刺**:在所有生成式AI初创公司中,语音AI开发类公司的员工人数增长最快,标志着交互方式从文本界面转向对话式界面,语音智能体将能独立处理客户服务、销售等领域的复杂对话 [14][15] - **预测二:AI并购潮来袭**:大型企业正通过收购构建全面智能体解决方案,2025年初AI智能体领域退出事件显著增加,销售与营销智能体是SaaS巨头的首选收购目标,AI编程市场也因估值飙升面临整合压力 [18] - **预测三:利润率挤压蔓延**:推理模型的兴起导致输出Token数量膨胀约20倍,推高计算成本,迫使公司从“按席位付费”转向“混合使用量”或基于结果的计费模式,成本压力可能导致初创公司被收购 [22] - **预测四:智能体商业基础设施日益稳固**:全自动购物的主要障碍是缺乏安全实时交易机制,新一代初创公司正在构建AI原生支付轨道和数字钱包,Visa和Mastercard等传统支付网络也开始投资布局该领域 [22] - **预测五:智能体监控与可观测性成为刚需**:智能体的幻觉、故障等行为带来运营风险,催生了AI智能体可观测性、评估与治理市场,未来网络安全专家可能演变为管理“AI智能体军队”的角色 [22] AI智能体生态系统与市场格局 - 生态系统庞大且碎片化,报告调研了超过500家创新公司,涵盖基础设施和应用两大阵营 [5][22] - **关键技术栈**包括:身份验证、网络搜索与工具使用、记忆、评估与可观测性、支付基础设施,这些是构建全功能智能体的核心“积木” [26][29] - **营收竞赛**:SaaS巨头与AI原生初创公司展开博弈,巨头将智能体功能嵌入现有产品,初创公司则专注于特定垂直领域试图颠覆传统软件,报告预测该市场规模将达到50亿美元以上 [30][32] - 部分代表性公司营收数据:Anysphere年收入约5亿美元,Replit年收入1.5亿美元,Harvey和Lovable年收入均为1亿美元 [33] 编程智能体赛道趋势 - 软件开发是AI智能体渗透率最高、竞争最激烈的领域,正经历从“GitHub Copilot”向“AI软件工程师”的转变 [36] - 该领域融资活跃,如Poolside、Cognition、Magic等初创公司估值飙升,吸纳了数十亿美元资金 [36] - 推理模型带来强大能力的同时也导致运行成本极高,未来的编码智能体必须在成本和速度上都具有竞争力 [37] - 云巨头争夺AI智能体“基础设施”控制权:Microsoft Azure打造无缝开发者体验,Google Vertex AI主打多模态与办公集成,AWS Bedrock采取模型中立策略致力于成为智能体“操作系统” [38][40] - Y Combinator的最新批次项目中,绝大多数B2B初创公司与“智能体”有关,预示未来1-2年将有大量垂直领域智能体涌入市场 [39] 垂直行业应用爆发 - **商业领域**:经历从“人找货”到“AI代买”的转变,由生成式引擎优化、零售AI智能体、智能体支付三个新兴市场驱动 [45][46] - 生成式引擎优化正取代传统SEO,品牌需确保产品能被AI模型推荐,代表公司如Profound [47] - 零售AI从客服聊天机器人进化为能处理退款、更改地址等复杂售后问题的全能助手,代表公司如Decagon、Big Sur AI [47] - 智能体支付领域,Stripe推出了智能体支付API,Visa和Mastercard与PayOS、Nekuda等初创公司合作,Skyfire和Payman等则构建底层支付轨道 [47][49] - **工业领域**:报告绘制了包含60多家公司的工业AI地图,涵盖制造、物流、国防和建筑 [48] - 目前工业界90%仍是“副驾驶”模式,AI辅助人类工人,原因在于工业环境容错率低、安全至上 [49] - 未来趋势是从“辅助”走向“自主”,智能体将能直接控制设备、独立采购、执行无人监视任务,关键玩家包括巨头Palantir、Siemens以及初创公司Composabl、Didero [49]
万物皆可分割,Meta SAM 3D 能帮 AI 理解这个复杂又混乱的世界吗?|锦秋AI实验室
锦秋集· 2025-12-26 18:23
文章核心观点 - Meta发布的SAM 3D模型在官方演示中表现出色,但在更复杂混乱的真实世界测试中,其“常识性3D理解”能力存在显著局限性[3][4][7] - 该模型的核心目标并非生成高保真3D资产,而是为了实现对物理世界的语义理解和空间分割,服务于增强现实(AR)眼镜、具身机器人及自动驾驶等长远应用[60][62][64] 人体结构推理测试 - 在复杂遮挡场景(如名画《雅典学院》)中,模型展现出超越像素的推断能力,能自动补全被遮挡的肢体并还原为完整三维骨架,证明了其“常识性3D理解”[10][11][12] - 在肢体强接触场景(如掰手腕)中,模型因二维分割歧义而失败,无法理清紧密交错的不同个体边界,导致三维生成出现粘连[16] - 面对非标准体型(婴儿)时,模型内置的标准成人骨架模板导致比例错误和结构崩坏,且无法理解镜像反射,将镜中人误判为具有完整骨架的真实实体[19][21][23][26][29] 物体的同质堆叠测试 - 对多层堆叠的快递盒,模型在物体边缘清晰、材质一致时分割效果尚可,但遇到塑料包装、反光或材质变化时,分割能力迅速下降[37][38] - 对水果拼盘,模型频繁出现语义类别混淆,例如将火龙果识别为西瓜,或将哈密瓜误判为容器,暴露其过度依赖颜色和二维轮廓,缺乏对材质、纹理和三维结构的深层理解[37][40][41][42] 建筑空间逻辑测试 - 对于结构简单的建筑,模型能完成基本的三维复原,但生成结果表面粗糙,仅为大致轮廓的体素云团,达不到工业可用的网格资产标准[44] - 对于建筑工程图纸,模型无法按图纸逻辑“拼装”三维建筑,而是基于可见部分进行猜测,导致不可见区域(如背面)的生成结果不一致且不可靠[47] - 对于密集建筑群(如北京国贸),模型能清晰切分独立楼宇并理解前后遮挡与空间分布,但对结构复杂的异形建筑(如CCTV“大裤衩”大楼),仅能理解其存在镂空拓扑特征,无法准确复原三维结构[50][53] - 总结而言,模型在建筑场景中扮演“布景师”角色,具备基础的空间分割与相对位置判断能力,但不真正理解建筑结构本身,其输出适用于VR预览或机器人避障等对精度要求不高的场景[55][56] 技术路线与市场定位 - SAM 3D生成的三维可视化本质是语义信息的空间表达,其侧重点在于点云、体素语义和空间分割,目标是让机器“看懂”世界,服务于机器人、自动驾驶和AR眼镜[60][64] - 这与Meshy、Tripo、混元等主流图生3D模型形成鲜明对比,后者侧重于纹理映射、PBR材质和拓扑优化,以生成“好看”的资产为目标,服务于游戏、影视和3D打印行业[58][64]