锦秋集
搜索文档
Jinqiu Spotlight | 用户破1000万,造梦次元沈洽金:AI应用创业是踏浪而行,必须站上大模型的每一波浪潮
锦秋集· 2025-07-23 23:39
公司概况 - 深圳想法流科技有限公司(造梦次元)成立于2023年,专注于AI互动内容平台开发,核心产品"造梦次元"于2024年2月上线 [2] - 截至2025年6月,平台累计用户超1000万,日均活跃互动时间超100分钟,用户粘性居行业前列 [2] - 平台日均tokens消耗量突破千亿,峰值达1600-1800亿,成为大模型厂商的重要测试场景 [2][3] 技术驱动与产品定位 - 大模型技术突破使互动内容平台成为可能,解决传统UGC内容门槛高、供给不足的问题 [6] - 平台定位为AI原生应用,不自主研发模型,而是与字节、阿里等头部厂商合作共创角色模型、记忆方案等 [16] - 模型推理能力和多模态进化是核心驱动力,推动AI从Assistant向Agent甚至Multi-Agent转变 [7][16] 产品特点与增长策略 - 提供互动故事、剧本杀、换装游戏等多元玩法,聚合图文/音频/视频内容,形成差异化体验 [9] - 用户裂变效应显著,相关UGC内容在快手累计播放量达6.3亿次 [12] - 创作者生态活跃,拥有23万创作者,日均新增3000作品,通过"IdeaFlow Studio"降低创作门槛 [13] 商业化与IP运营 - 主要变现方式包括虚拟道具、付费短剧、角色打赏,如热门道具"读心术"可解锁角色内心OS [15] - 强调IP长期价值,创作者通过运营粉丝群体和商业化玩法获得激励,未来计划拓展虚拟装扮、联名等IP衍生形态 [15][16] - 创作Agent即将上线,可自动完成意图识别、任务规划及多模态内容生成,提升效率50%以上 [13][19] 行业趋势与战略方向 - 2025年重点布局多模态和Agent:多模态模型生成速度提升(如Veo 3模型10秒生成高质量视频),实时性增强将催化AI直播类内容 [17] - Agent能力突破支持复杂场景交互(如自动调用定位/时间服务)和智能化创作辅助(自动关联意象、生成动态分镜) [18][19] - 内容形态边界模糊,交互体验重要性超越格式,用户行为兼具消费与创作属性 [7][8] 企业文化与愿景 - 以"真实有效,坚韧极致"为文化内核,强调执行力与技术创新转化能力 [21][22] - 目标从单一内容类型进化为真正的AI Native平台,持续占据技术转化先发优势 [3][22]
6场饭局锦秋小饭桌一线观察:AI创业者的焦虑与突围
锦秋集· 2025-07-23 23:39
锦秋小饭桌活动概览 - 锦秋小饭桌是锦秋基金每周五晚在多地举办的AI创业者闭门社交活动,已连续举办21场,聚焦前沿创业者和技术大牛的干货分享[3] - 活动形式为围桌聚餐交流,强调无PPT和商业互吹的真诚对话,涵盖创业艰难时刻和投资决策逻辑等深度话题[3] - 近期活动预告包括7月25日北京场的AI应用趋势讨论和7月26日上海场的具身智能机会探讨[4][5] AI情感陪伴硬件 - 情感连接技术需动态调用记忆并优化存储结构,当前RAG方法过于冰冷无法实现真正情感连接[16] - 端侧模型突破是离线运行关键,面临功耗高、散热难等问题,非Transformer架构可能更具潜力[17] - 产品设计需做减法,明确最高优先级功能,避免因追求技术炫酷而损害核心用户体验[18][19][20] - IP打造本质是"做人",需持续注入资源和价值,国内外IP打法差异显著[21][22] 多模态技术创业 - Agent产品差异化需解决三个核心问题:盈利模式、大厂竞争和用户定位[33] - 视频创作者金字塔分层明显,中段创作者(3-5亿人)是付费主力,需要高效工具[35] - AI播客机会显著,罪案类内容付费表现最佳(B站UP主月充电达500万),情感类有流量无付费[36] - 语音交互是重要入口,语音房商业模式成熟(抖音听潮阁工会年净利3000万)[41] AI娱乐营销应用 - 数字分身可帮助明星IP变现,但需避免欺骗观众,未来或实现演员"复活"[51] - AI视频生成面临情绪表达和多人互动难题,未来2-3年有望实现以假乱真[52] - SEO领域AI可提升效率但质量把控是关键,B端内容需专业模板支持[58] - 成功冷启动策略包括向KOL免费提供账号、建立私域社群和结合热门话题[59] AI医疗商业化 - 基层医院是AI医疗核心场景,AI客服等接地气应用反而最易落地[65][66] - 电子病历AI化是破局方向,北京上海已探索AI相关收费项目[67] - 医疗数据复杂需分领域处理,通用模型难在医药领域真正应用[69] 具身智能与Agent生态 - Multi-Agent协同难度指数级增长,当前技术难解决沟通僵局和目标对齐[80] - Agent PaaS层是下一代应用生态关键,需集成模型能力、云计算等多方面[81] - MCP生态真正机会在垂直领域,如金融医疗等高价值行业工具集[82] - AI陪伴产品分化为互动式内容消费和深度情感关系两个方向[87]
Jinqiu Select | Physical Intelligence 联创:AI训练的真实数据不可替代
锦秋集· 2025-07-22 23:04
核心观点 - 过度依赖替代数据源会严重限制AI模型的最终能力 真正的技术突破必须建立在真实数据基础之上 [1] - 当前AI研究面临"勺叉困境":试图用模拟器 人类视频或手持设备等廉价替代方案训练机器人 结果导致模型在真实场景中表现不佳 [1][3] - 机器学习的铁律是训练数据必须与测试条件相匹配 替代数据无法完全替代真实数据在物理世界中的实践 [10] 权宜之计的替代方案 - **模拟训练**:通过sim-to-real方法在模拟环境中训练机器人 但最佳模拟往往不是精确复现现实 而是编码机器人需要应对的各种变化 [3] - **人类视频学习**:需定义人机对应关系 但需弥合人类动作与机器人动作在动力学和外观上的差异 [3] - **手持夹爪设备**:让人们使用模仿机器人夹爪的设备收集数据 但仍受限于设备的工作空间和运动学差异 [3] 替代方案的局限性 - 替代数据将模型限制在三个条件的交集中:系统有效行为 能用替代方法实现的行为 不会暴露领域差异的行为 [4] - 模型越强大 越能区分替代数据与真实数据 导致交集缩小 任何扩大交集的尝试都会削弱模型能力 [6] - 替代数据优化针对特定场景 无法保证在新场景下的匹配度 模型的泛化能力反而成为推广到新场景时的累赘 [7] 真实数据的重要性 - 构建机器人基础模型必须依赖真实数据 才能实现像LLM和VLM在虚拟世界中的广泛泛化能力 [11] - 替代数据应作为辅助知识源 用于了解"世界可能发生什么" 而非"智能体该怎么做"的直接指令 [12] - 在大量真实机器人经验基础上 加入人类数据或模拟数据等多样化来源 比完全回避真实数据更有效 [11] 勺叉现象的普遍性 - "勺叉"现象不仅存在于数据替代方案 还包括混合系统 手工约束学习系统等方法 都试图用人工设计应对训练不充分问题 [13] - 手工设计的归纳偏置会成为性能瓶颈 违背机器学习通过数据驱动获取能力的核心优势 [13]
Jinqiu Spotlight | 锦秋基金被投星尘智能机器人国家大剧院首秀
锦秋集· 2025-07-22 23:04
投资动态 - 锦秋基金于2024年领投星尘智能A轮融资 该基金为12年期AI Fund 以长期主义为核心投资理念 专注于突破性技术和创新商业模式的通用人工智能初创企业[1] 技术合作与创新 - 星尘智能与央视网联合打造全球首个主流媒体组建的具身智能机器人乐队"小央机器人乐队"[2][3] - 乐队首位乐手及指挥将于7月23日在国家大剧院《时光之旅》民族管弦音乐会上与北京民族乐团进行人机联合演出[2][3] 行业里程碑事件 - 国家大剧院将首次迎来机器人表演 标志着人工智能与民族管弦乐的艺术融合[4] - 此次演出被定位为"融合人工智能与民族管弦乐的视听盛宴" 预示人机交互艺术新纪元的开启[4]
Jinqiu Spotlight | 锦秋基金被投光本位研发全球首颗存算一体光芯片
锦秋集· 2025-07-22 23:04
公司背景与融资情况 - 光本位科技由两位年轻创始人熊胤江和程唐盛于2022年创立,分别具备大模型算法工程化和相变材料光计算研发背景[4] - 2024年12月完成锦秋基金领投的战略轮融资,老股东慕石资本、小苗朗程、中赢创投超额跟投[2] - 2025年6月再获敦鸿资产领投,浦东科技天使母基金、苏州未来天使产业基金等国资跟投,中赢创投继续加注[19] - 2024年累计完成三轮融资,包括3月天使+轮和12月锦秋基金领投轮[20] 技术突破与产品进展 - 实现全球首颗128*128矩阵规模光计算芯片流片,集成16000+完全可调节点,突破商用标准[4][12] - 采用硅光+相变材料(PCM)异质集成技术,单元尺寸缩小至传统方案1/10-1/20,算力密度提升10-20倍[13][14] - 通过相变材料实现存算一体,计算单元功耗接近0,相比电芯片算力提升潜力超1000倍[8][14][15] - 2025年计划完成128*128芯片与电芯片合封测试,推出第一代光电融合计算卡[19] 市场需求与商业化路径 - 瞄准云侧两类客户:互联网大厂(追求能效比/算力密度)和智算中心(注重经济效益)[16] - 光电融合计算卡支持PCIe接口即插即用,适配大模型分拆经济规模(128*128矩阵)[12][16] - 规划端侧场景验证,车规级应用需应对极端环境稳定性要求[17] - 已与一线互联网大厂、GPU厂商、高校等建立合作,同步推进256*256矩阵芯片研发[19] 行业背景与发展机遇 - 全球数据中心2024年耗电415太瓦时(占全球1.5%),2030年预计增至945太瓦时[7] - 电芯片3nm工艺接近物理极限,光计算被视为突破摩尔定律的关键路径[7][8] - 2017年牛津/MIT研究引发关注,但产业链成熟度延迟商业化至2022年[8][9] - 公司抓住AI算力需求爆发窗口,2023年完成64x64矩阵流片,2024年突破128x128规模[10][12]
梳理了1400篇研究论文,整理了一份全面的上下文工程指南 | Jinqiu Select
锦秋集· 2025-07-21 22:03
文章核心观点 - 上下文工程已成为优化大语言模型性能的关键技术领域 通过系统化框架整合信息获取 处理和管理三大组件 可显著提升模型在复杂任务中的表现 [1][2] - 当前技术面临模型理解与生成能力不对等 长序列处理效率低下以及多模态整合不足等核心挑战 需要突破传统Transformer架构限制 [135][136] - 模块化RAG系统 内存增强型智能体和工具集成推理等实现范式正在推动AI从被动文本生成器向主动世界交互器进化 [68][91][109] Context Engineering技术体系 信息获取与生成 - Prompt Engineering通过Zero-Shot Few-Shot及Chain-of-Thought等高级推理框架激发模型潜力 其中Tree-of-Thoughts在24点游戏中将成功率提升至70%以上 [4][5] - Self-Refinement机制实现模型自我迭代 N-CRITICS采用集成学习思路 而Agent-R通过蒙特卡洛树搜索实时纠正推理路径 [9][10][11] - RAG架构突破模型知识边界 进阶方案如Self-RAG引入自适应检索 HippoRAG模仿人类记忆机制补充关联信息 [14][15] 信息处理 - 长上下文处理依赖架构革新 Mamba等状态空间模型将计算复杂度降至线性 LongNet的Dilated Attention理论支持十亿级token处理 [29][30] - 位置插值技术无需微调即可扩展上下文窗口 YaRN和LongRoPE实现数千到数百万token的跨越 配合FlashAttention-2带来近2倍速度提升 [31][32] - 多模态融合面临模态偏见挑战 先进方法采用交叉注意力机制或统一预训练 结构化数据处理中代码表示效果优于自然语言描述 [41][43] 信息管理 - 内存架构借鉴操作系统概念 MemGPT实现虚拟内存式换页 MemoryBank基于艾宾浩斯曲线动态调整记忆强度 [49][51] - 上下文压缩技术显著降低计算负担 ICAE实现数倍压缩率 ACRE双层KV缓存系统兼顾全局视野与局部细节 [58][60] - 应用场景覆盖法律合同分析 多季度财报推导等长程依赖任务 以及具备持续学习能力的对话式AI [63][66] 系统级实现 RAG系统演进 - 模块化RAG实现乐高式灵活组合 FlashRAG提供5核心模块16子组件 ComposeRAG支持原子化问题分解与自我反思优化 [72][73] - Agentic RAG赋予自主智能体能力 如调查员般执行动态检索 Self-RAG通过反思token形成闭环自优化系统 [74][75] - 图增强RAG转向结构化知识表示 GraphRAG采用社区发现算法分层索引 HippoRAG利用PageRank提升多跳问答性能 [76] 内存增强型智能体 - 记忆系统分类涵盖短期工作内存与长期持久化存储 后者通过外部存储解决上下文窗口限制 [82][83] - REMEMBERER框架实现经验记忆 LangGraph等工具集成RAG与向量数据库 Mem0结合图数据库提升检索效率 [84][85] - 评估框架LongMemEval揭示商业AI助手在长时间交互后准确率显著下降 反映记忆持久性不足的行业痛点 [87] 工具集成推理 - Function Calling技术路径分化 微调方法稳定性高但资源密集 提示工程方案如Reverse Chain更轻量灵活 [95][96] - 训练数据生成策略成熟 APIGen分层验证流程支持数千API覆盖 Hammer框架通过函数掩码增加训练难度 [97] - 多智能体协作框架展现集体智慧 DyLAN实现精密任务拆解 MetaGPT增强专业化分工 MAD优化并行处理能力 [109] 评估与挑战 - 组件级评估需针对性设计 如"大海捞针"测试长上下文处理 结构化数据集成需关注序列与结构信息冲突场景 [124][125] - 系统级评估暴露协同问题 Agentic RAG需测试任务分解准确性 工具集成系统需覆盖完整交互轨迹 [126][127] - 新兴基准如GTA显示GPT-4完成率远低于人类 反映真实场景性能差距 为创业者指明改进方向 [128][129]
Manus季逸超:构建Manus的经验教训 | Jinqiu Select
锦秋集· 2025-07-19 13:00
通用型AI Agent技术路线 - 业界形成两条技术路线:端到端训练和上下文工程 模型厂商倾向端到端训练以发挥自有闭源模型优势 而通用Agent创业公司多选择上下文工程路径[1] - Manus团队作为上下文工程代表 其技术负责人季逸超因GPT-3导致自研模型失效经历 选择成为"涨潮中的船"而非"固定支柱"的技术哲学[4] - 上下文工程通过四次系统重构和服务数百万用户验证 将产品迭代周期从数周缩短至数小时[2][5] KV-Cache优化实践 - KV-cache命中率是生产阶段AI代理最关键指标 直接影响延迟和成本 Claude Sonnet缓存/未缓存token成本相差10倍(0.3 vs 3美元/MTok)[7] - 优化方法包括:保持提示前缀稳定 使用仅追加上下文 确保序列化确定性 手动标记缓存断点 分布式节点路由技术[9][10][11] - Manus平均输入与输出token比率达100:1 通过缓存优化实现10倍成本降低[7] 工具管理策略 - 动态修改工具定义会导致KV-cache失效和模型混淆 Manus采用token logits屏蔽技术替代动态修改[12][13] - 设计工具命名一致性(如browser_/shell_前缀) 结合三种函数调用模式(Auto/Required/Specified)实现上下文感知约束[16] 上下文扩展技术 - 突破128K token限制:将文件系统作为外部化内存 保留可恢复压缩策略(如仅存URL) 实现无限上下文存储[18][22] - 创建并持续更新todo.md文件 通过自然语言复述将任务目标保持在模型注意力焦点 解决50次工具调用中的目标偏离问题[23][26] 错误处理与多样性 - 保留错误内容可让模型从失败动作中学习 错误恢复能力是真实代理行为的关键指标[27][30] - 避免few-shot陷阱 通过引入动作/观察的结构化变化打破重复模式 防止模型陷入固定行为路径[31][32][33] 行业发展趋势 - 上下文工程成为代理系统必备能力 模型进步需结合内存/环境/反馈设计 未来代理将基于上下文迭代构建[35] - 创业团队通过轻量级技术路径验证 锦秋基金关注AI Agent赛道早期创新项目[3][36]
OpenAI 对齐研究负责人:把“意图规范”当成真正的源代码 | Jinqiu Select
锦秋集· 2025-07-18 23:29
核心观点 - AI时代编程的瓶颈在于沟通而非代码实现 澄清意图的系统化工程化比提升模型能力更具价值 [2][4][6] - 程序员80-90%价值在于结构化沟通 代码仅体现10-20%价值 [4] - 规范是真正的源代码 具有可执行 可测试 可生成多形态产物的特性 [5][7][9] 程序员价值重构 - 程序员核心价值是结构化沟通流程 包括需求理解 方案设计 计划传达 效果验证 [4] - 验证重点在于"代码对世界的影响"而非代码本身 [4] - 未来最有价值的是擅长沟通意图的开发者 [6] 规范的本质特性 - 规范是代码的"无损版本" 保留原始设计意图和注释 [5][7] - 单份规范可生成代码 文档 教程 播客等多样化产物 [5][7] - 规范具备唯一ID标识 对应测试用例形成闭环验证 [9][13] OpenAI实践案例 - Model Spec采用Markdown格式 实现跨部门对齐 非技术人员可参与贡献 [9] - 规范作为"信任锚" 快速定位GPT-4o谄媚行为问题并修复 [10] - 审议式对齐技术将规范内化为模型权重 实现自动化评估 [11][12] 行业变革方向 - 编程工具链向规范管理演进 出现规范类型检查 单元测试等新工具 [13] - IDE可能进化为"集成思想澄清器" 消除表达歧义 [14] - 立法与编程界限模糊 规范成为跨物种对齐工具 [8] 商业模式启示 - 帮助用户明确意图的产品设计将创造新商业机会 [2] - 规范编写能力成为未来稀缺技能 [14] - 早期项目应优先构建规范体系而非直接编码 [14]
4.6万亿美元的Services-as-Software机遇
锦秋集· 2025-07-17 19:50
进入2025下半年,随着越来越多创业者加入AI应用的探索,从最初的文本生成、智能问答,到如今覆盖法 律、财务、销售、客服等各个垂直场景,用户需求和产品功能的挖掘已逐渐充分,早期那种"每周都能看到令 人眼前一亮的新功能"的情景越来越少了。 销售模式的根本性改变 传统的"演示→试用→购买"流程在AI时代失 但是,即便在这样的环境下,仍有一些公司展现出强劲的增长势头,获得投资人的青睐和客户的认可。这些公 司的产品功能谈不上有多么革命性的创新,但他们确实在市场上建立了领先地位。 那么, 在产品功能创新空间日益有限的情况下,这些公司的竞争优势从何而来?是否在功能之外,还有其他 维度的能力在发挥关键作用? 硅谷知名风投机构Foundation Capital最近发布了一篇题为《4.6万亿美元的Services-as-Software机遇:第一年的 经验教训》的深度分析。作为AI领域的活跃投资者,他们在过去18个月里投资并深度参与了数十家AI创业公 司的发展历程。 这篇文章的核心观点令人深思: 在AI时代,真正的竞争已经从"谁的产品功能更强"转变为"谁能更深入地将 AI能力转化为客户的实际业务成果"。 他们将这种新模式称为 ...
思维链开创者Jason Wei最新文章:大模型将攻克哪些领域? | Jinqiu Select
锦秋集· 2025-07-16 15:58
大模型能力演进与验证者定律 核心观点 - 大模型能力每3-6个月迭代一次,从文本生成、多模态理解扩展到复杂推理和工具调用,"模型即产品"趋势明显,模型能力边界决定产品边界 [1] - 验证者定律提出:AI解决任务的难易度与任务可验证性成正比,具备客观真实性、快速验证、可扩展验证、低噪声、连续奖励五大特征的任务将被优先攻克 [2][8][10] - 验证不对称性普遍存在(如数独验证易/解决难、数学问题验证对称、事实核查验证难),通过预研可改善不对称性 [4][6][7] 技术发展路径 - AlphaEvolve案例显示,符合验证者定律五大特性的问题(如几何优化)已被高效解决,未来所有满足条件的问题均可能被AI攻克 [13] - 可验证任务将形成"参差不齐的智能前沿",AI在该领域表现显著优于人类,因梯度信号密集且迭代速度快 [12][14] 行业影响 - 创业者需紧密跟踪模型技术进步方向,技术敏锐度关乎生存,验证者定律为预判大模型发展提供框架 [1][2] - 科学创新领域出现范式转变:单个高价值问题的解决(train=test)优先级超过传统机器学习泛化能力 [13]