锦秋集

搜索文档
Sam Altman:最具杠杆效应的仍然是重大的算法突破 | Jinqiu Select
锦秋集· 2025-05-13 12:07
在AI的浪潮中,OpenAI无疑是聚光灯下的焦点。Sam Altman的分享,也往往能为焦虑的AI行业提供最佳实践者的前沿视角。 大模型商业化路径不明,创业者生存空间到底有多少,AI的未来究竟是"赢家通吃"还是百花齐放? 在2025年的AI Ascent 2025峰会上,Sam Altman做了主题演讲 , 解 读了OpenAI 的生态定位、API 未来发展、语音与编程的战略核心,以及如何最终实现个性化的愿 景,并给出了他对未来几年价值创造热点的阶段性预测,试图用这些来回应这些困扰着整个行业的深层焦虑。 他认为: 我们认为,这次演讲提供了一个系统性审视这家顶尖AI公司战略意图与未来布局的难得窗口,因此锦秋基金( 微信公号锦秋集ID:jqcapital)对这个演讲做了梳 理: 01 OpenAI的起源与早期探索 市场与平台定位: OpenAI 的目标是将自己打造成为用户首选的 AI 订阅服务和主要交互入口。他们希望构建一个平台生态系统,这个生态系统不仅能激发巨大 的财富创造,赋能开发者构建各种应用,还能让 OpenAI 掌握关键的用户界面,例如未来的智能设备或操作系统。 API未来演进 : OpenAI 的核心 ...
当AI遇上数学:大语言模型如何掀起一场形式化数学的革命? | Deep Talk
锦秋集· 2025-05-12 17:13
核心观点 - 大语言模型(LLM)与形式化数学结合正推动数学领域的范式变革,解决传统人工验证的瓶颈问题 [1][4] - 形式化数学通过严格逻辑和计算机辅助验证提升数学证明的可靠性和效率 [4][7] - 从Theorem Prover向Proof Engineering Agent转型是形式化数学的未来趋势 [11][17] - APE-Bench作为自动化证明工程基准,支持形式化数学的长期动态演进 [12][16] - LLM与形式化方法的结合将催生Certified AI,提升知识生产的可信度和效率 [17] 形式化数学的背景与挑战 - 现代数学证明规模庞大(如300页的开普勒猜想证明),传统人工验证效率低且易出错 [6] - 形式化数学通过公理系统和逻辑语言表达数学内容,借助计算机工具实现自动化验证 [8] - LLM的"幻觉"问题在数学领域尤为突出,需结合形式化方法确保生成内容的逻辑严密性 [6] 形式化定理证明的应用 - 典型案例包括Flyspeck项目(验证开普勒猜想)、液体张量实验(验证凝聚态数学引理)、PFR猜想众包验证 [13] - 形式化方法适用于数学理论证明和软件工程验证,确保逻辑一致性 [9] LLM驱动的最新进展 - AlphaProof在国际数学奥林匹克题目证明中达到银牌水平,DeepSeek-Prover V2在miniF2F基准成功率近90% [10] - LEGO-Prover项目利用LLM构建可复用的数学知识库,推动形式化数学向库级理论构建转型 [10] - 前沿研究探索LLM主动提出数学猜想和发现抽象结构的潜力 [10] Proof Engineering Agent转型 - 当前形式化工具面临人工成本高、协作效率低等问题(如Flyspeck项目耗费数十人年) [11] - 下一代工具需具备自我规划、修复和知识积累能力,支持大规模跨模块协作 [11] APE-Bench的设计与实施 - 分为三个阶段:单文件局部修改(APE-Bench I)、跨文件一致性维护(APE-Bench II)、完全自主Agent模式(APE-Bench III) [19] - 基于真实数学库(如Mathlib4)的历史修改记录,模拟实际Proof Engineering场景 [12] 未来影响与展望 - 数学领域:提升验证效率,推动理论创新和概念探索 [17] - 工业领域:应用于高安全系统(如操作系统内核、智能合约),提升安全性与可靠性 [17] - Certified AI将结合形式化验证与动态学习,成为可信的知识生产伙伴 [17]
给AI创业者的出海指南:45家美国孵化器详细介绍
锦秋集· 2025-05-08 22:35
美国孵化器生态体系 - 美国孵化器类型多样,包括VC-backed型、企业附属型、学术附属型、垂直行业型和混合模型等,具备完善的孵化流程和商业模式,能为创业公司提供资金支持、导师支持、市场资源对接和融资对接等全方位资源支持 [2] - VC-backed型孵化器由风险投资公司主导运营,通过投资入股为早期团队注入资金,凭借VC的投资网络帮助创业企业触达资本市场,但可能导致股权稀释和创始团队自主权让渡 [3] - 企业附属型孵化器由大型科技公司发起,以自身核心资源绑定创新企业构建技术护城河,提供强大技术资源支持但通常不提供现金投资且存在隐性绑定条件 [4][5] - 学术附属型孵化器依托高校或研究机构,提供实验室资源和前沿科研成果,但资金支持有限且商业化周期较长 [6] - 垂直行业型孵化器专注于特定领域如生物科技、清洁能源等,提供专业导师资源和人际网络,但市场空间可能受限 [7] - 混合模型孵化器结合资金、资源共享、市场对接等多种支持形式,资源覆盖面广但行业深度支持可能不足 [8][9] 活跃孵化器筛选标准 - 筛选标准包括成立时间(2000年及之后创立)、地域(硅谷、西雅图和纽约等主要创业生态中心)和投资阶段(专注于种子期或早期阶段风险投资) [10][11] - 最终确定排名前10的机构作为研究对象,深入分析其孵化模式、资源优势及投资策略 [11] 知名孵化器代表 - Y Combinator(YC)是全球最知名的孵化器之一,提供12.5万美元换取7%股权,额外投资37.5万美元基于无估值上限SAFE [17] - Techstars拥有全球加速器项目网络,提供8-12万美金换取6-9.3%股份,录取率仅3% [20] - MassChallenge是全球性非营利加速器,采用零股权模式,提供无股权附加条件的现金奖励 [22][25] - 500 Global以其全球化投资组合和增长营销专长闻名,提供结构化的课程和Workshops [28][30] - SOSV运营多个高度专业化的垂直领域加速器项目,如HAX(硬科技)、IndieBio(生命科学)等 [34][37] 差异化特色孵化器 - AngelPad由前Google高管创建,提供12万美元投资换取7%股权,并为每家初创企业额外提供超过30万美元资源支持 [70][75] - Antler采用"从零开始"模式,帮助有潜力个人寻找联合创始人、验证想法,在全球多个城市提供本地化支持 [73][76] - Neo由Facebook早期投资人创立,提供60万美元无上限SAFE投资,录取率不到2% [77][81] - South Park Commons关注创业者从"-1到0阶段"的过渡,提供40万美元启动资金换取7%股权 [83][86] - HF0 Residency专注于技术型连续创业者,采用12周全日制驻留模式,高强度专注开发 [89][91] 高校与企业孵化器 - Berkeley-SkyDeck为创业公司提供六个月加速计划,标准条款20万美金占7.5% [156][158] - Harvard Innovation Labs设有多个孵化项目,通过竞赛提供高达7.5万美元启动资金 [159][164] - MIT-delta v面向学生企业家,提供高达2万美元无股权资金和每月2000美元生活费 [163][169] - Google for Startups Accelerator提供技术辅导和最高35万美元Google Cloud资源 [183][185] - Microsoft for Startups Founders Hub提供Azure云资源、GitHub和Visual Studio访问,免股权 [189][191] 行业趋势与特点 - 美国孵化器生态呈现多样化类型和成熟孵化模式,能够提供全方位资源支持 [226] - 近年来硅谷VC机构开始设立自己的孵化器,目的是吸引顶尖创始人和团队,反制YC的市场垄断地位 [226] - 行业竞争激烈,孵化器需要有差异化特色和核心竞争力,同时入选孵化器的竞争也非常激烈 [226] - 大多数孵化器专注于创新技术领域如人工智能、SaaS、区块链等,高度重视PMF(产品市场契合度) [228] - 美国孵化器通常拥有全球化资源和网络,能为创业者提供国际市场拓展和全球投资者对接机会 [228]
AI视频生成的Vidu样本:攻坚视频生成核心难题,引领内容生产力变革
锦秋集· 2025-05-06 22:36
多模态 AI 技术正以前所未有的速度重塑内容创作领域。 从2024年 OpenAI Sora 点燃全球想象,到近期,吉卜力风图片席卷全网。这个一度被视为 AI 终极想象力边界 的领域,正以前所未有的速度冲破技术壁垒。 视频生成作为技术难度与应用潜力并存的关键环节,也吸引了全球范围内的广泛关注和投入。 在追求更长时长、更高分辨率、更惊艳视觉效果的同时,内容一致性难以保证、生成过程可控性不足、以及高 昂的计算成本等核心挑战,依然限制了其在专业领域、大众娱乐领域的规模化应用。 在此背景下,由生数科技研发的视频生成模型 Vidu,展现出一条差异化的发展路径。在多模态视频生成技术 的早期发展阶段,通过集中资源解决专业用户的核心痛点,如一致性、可控性、效率,建立起差异化优势和用 户基础,尤其是在动画等特定领域形成壁垒。 根据生数科技廖谦在近期访谈中的阐述,Vidu 的核心定位是"全球领先的AI内容生产平台 ",这也意味着 ,除 了追求基础生成能力的提升,也需要优先解决实际工作流中的关键痛点。 比如,生数科技敏锐的发现,纯粹的文生视频因为难以控制一致性,应用者并不多 。而 Vidu 推出的"参考 生"(Reference ...
AI的下一个风口?听前DeepSeek成员辛华剑解读数学推理 | Deep Talk
锦秋集· 2025-05-03 16:51
DeepSeek-Prover-V2-671B模型发布 - 公司发布专注于形式化数学推理的开源大型语言模型DeepSeek-Prover-V2-671B,参数量达6710亿 [1] - 该模型结合LLM泛化能力与形式化工具(如Lean),首次实现自然语言描述到机器可验证证明的大规模端到端转化 [2] - 形式化数学被视为AI"终极挑战",突破可能将数学研究效率提升数倍,并打开金融建模、芯片验证、密码学等高价值商业场景 [2] 大模型开发者活动 - DeepSeek前成员辛华剑将参与"大模型开发者与AI基金合伙人跨洋对谈",分享《大语言模型时代的形式化数学革命》 [2] - 辛华剑为DeepSeek-Prover系列模型开发主导者,现任爱丁堡大学AI博士生及字节跳动研究实习生,专注大模型在数学定理证明的创新应用 [2][4] - 锦秋基金合伙人臧天宇将同期分享2025年AI创投趋势 [3][4] 活动主办方背景 - 锦秋基金专注AI领域投资,在管基金为12年长期基金,59%项目为首次投资,采取多轮追加策略,已投资北美活跃AI基金 [6] - 剑桥中国人工智能协会(CCAIA)致力于链接中国AI产业与海外学界,采用轻量化社群模式促进中英资源流动 [7] - 清华大学学生通用人工智能研究会(THUAGI)以培养下一代通用AI人才为目标,依托清华AI研究院资源 [9] - 清华大学学生创业协会成立于1997年,为全国最早高校创业协会之一,28年来聚焦创业生态培育 [10] 活动流程 - 英国时间15:00/中国时间22:00开始辛华剑主题演讲,随后臧天宇分享AI创投趋势 [8] - 活动含圆桌对谈及观众提问环节,国内通过腾讯会议直播,需通过锦秋基金公众号报名 [5][6][8]
锦秋小饭桌开饭啦!吃饱了,咱们一起改变世界!
锦秋集· 2025-05-01 19:23
锦秋小饭桌活动概述 - 锦秋基金自2月26日起每周五在北京、深圳、上海三地组织创业者闭门饭局 已举办9场 旨在搭建高质量社交场域 [2] - 活动形式摒弃传统PPT演示 强调真诚对话 部分参与创始人后续获得锦秋投资 [3] - 5月9日推出AI Infra限定套餐 包含前沿趋势拆解、实践真知分享及生态资源对接 [5][6] AI应用开发洞察 - 当前AI产品护城河在于品牌心智 数据飞轮闭环尚未形成 [12] - 后训练技术需在PMF验证后实施 垂直领域更易构建差异化壁垒 [12] - 用户行为数据使用趋向端到端 中间过程需结构化处理 [13] AI Coding创业机会 - 创业公司应对大厂竞争策略:聚焦细分市场/快速迭代/打造垂直品牌 [18] - 模型能力面临瓶颈:复杂任务可靠性差 需理论突破而非数据堆砌 [19] - 国内2B市场存在特殊机会 军工/金融等领域基础功能即具价值 [23] Agent领域发展 - Protocol被视为Agent生态关键 需建立标准化互信机制 [30][32] - 垂直Agent更易构建数据闭环 通用Agent需明确任务边界 [36][37] - 硬件创新聚焦交互体验 眼镜品类预计1-2年内达千万量级 [44] 行业落地实践 - 某猎头公司AI系统使人岗匹配效率超越人类专家10% [26] - 餐饮供应链企业通过自研系统实现业务量10倍增长 人员零增加 [26] - 航天企业利用数字化技术大幅缩短发动机研发周期 [26] 硬件创新趋势 - 端侧AI芯片算力非主要瓶颈 200MHZ即可支持基础语音交互 [46] - 儿童AI玩具/情感陪伴硬件/3D打印机呈现显著增长 [45] - 7B模型可部署于消费设备 高阶AI仍需云端支持 [46] 资本市场观察 - 港股科技板块受AI落地预期推动 美股面临政策不确定性 [56] - 大厂加速囤积算力设备 2025年CAPEX预计保持20%+增速 [57] - 保险业被视为AI+金融优先落地场景 [58] 产品策略分析 - 30岁以下用户构成AI聊天产品核心人群 [66] - 模型调性决定用户粘性 训练数据差异化塑造产品特质 [69] - 开源策略有效扩大用户基础 DeepSeek案例显示免费模式优势 [62]
OpenAI揭秘Deep Research实现始末
锦秋集· 2025-04-30 15:09
Deep Research的起源与目标 - OpenAI团队放弃交易型赛道如订汉堡、订花 转而攻克知识整合 认为这是AGI必备前置技能 且"纯读取"比"直接下单"更安全 [3] - 产品愿景是打造"Slack同事式"统一智能体 能自主判断工具调用 保持状态与记忆贯穿始终 [3] - 选择研究型任务而非交易型任务因三方面考量:知识工作需求大 符合AGI科学发现目标 只读任务安全性更可控 [5][6] 开发方法论与数据策略 - 数据质量优先于数量 采用"小而准"策略 邀请专家手工标注高价值样例 强化学习让模型自寻最优策略 [3] - 每新增工具必配套数据集 训练模型调用组合回溯能力 人类专业知识在数据创建中起关键作用 [8][11] - 开发过程经历多次迭代 初期演示版仅用提示工程 后续才引入模型训练与工具开发 团队获数月不受干扰的专注期 [7] 强化学习微调实践 - 强化学习微调(RFT)适用场景:提示工程无效时 或10-15%性能差距对业务至关重要时 [3][9] - 数学编码等专项训练能泛化到写作等领域 但针对性训练效果更优 基因测序等超分布任务需优先考虑RFT [9] - RL算法数据效率高 但高质量数据策划工程量大 需与强大预训练基座模型协同 [12] 智能体架构设计 - 当前工具集包括文本浏览器和Python分析工具 未来将扩展工具集 需同步创建训练数据集 [8] - 记忆功能对复杂任务至关重要 避免用户重复输入 未来需解决长任务上下文窗口耗尽问题 [15][17] - 初期需显式确认建立信任 后期可逐步开放自主操作 安全护栏设置与能力提升需同步 [16] 性能表现与用户场景 - 医学研究和代码搜索等专业领域表现获专家认可 数据分析能力继承自基础模型o3的强大多任务训练 [25][26] - 擅长处理多约束条件查询 如特定商品搜索 能生成超长全面报告 实时信息补充价值显著 [27] - 训练中展现智能规划行为 如自主选择搜索词 但也存在不可预测错误 改进空间大 [28][31] 行业趋势与未来展望 - AGI路径因强化学习复兴更清晰 但需解决工具调用评估 数据精度等挑战 [12] - 未来一年可能推出通用智能体 编码与旅行规划等多任务统一处理 改进速度将超预期 [22] - 终极目标是执行API操作 访问私有数据 形成基础模型与微调能力的正向循环 [23][24]
AI定义汽车,2025汽车大模型技术与产品新趋势
锦秋集· 2025-04-29 22:36
2025上海车展AI大模型趋势 核心观点 - AI大模型成为汽车行业核心焦点 智能驾驶与智能座舱全面渗透 推动汽车软件开发范式变革[2] - 主机厂对Agent应用达成共识 技术落地速度超预期 但实时交互、算力部署等挑战仍存[4][7] - 端云协同架构成为主流 0 9B-8B小模型通过优化实现车规级芯片部署 避免盲目追求大参数量[4][14][15] 技术落地进展与挑战 超预期进展 - 主机厂接纳速度显著加快 2023Q4-2024H1形成明确落地共识 教育成本因全民大模型普及降低[8] - 应用方向聚焦三大领域:智能语音增强(开放域理解)、多模态交互(VLM应用)、端到端智驾(VFM融合)[8] - 生态协同创新加速 车载Agent技术标准快速建立 兼容MCP协议等行业规范[8] 现存挑战 - 算力瓶颈:主流座舱芯片(如高通8295)非为大模型设计 舱驾一体芯片(如8397)需平衡ADAS功能[12] - 数据难题:域集中式架构导致全车数据收集困难 垂直领域数据涉及隐私与高标注成本[11][13] - 实时性问题:推理延迟达300-500ms 幻觉问题与任务执行确定性待解决[7][10] 汽车AI Agent核心能力 产品形态 - GUI Agent突破第三方API限制 支持操作支付宝、导航等9大类APP 实现语音指令闭环[21] - 多模态融合:舱内视觉理解(乘客识别、安全带检测) 舱外环境感知(天气、隧道)[19][35] - 服务模式转型:从"人找服务"到基于场景感知的"服务找人" 实现主动提醒与情感关怀[20][22] 技术架构 - 端侧部署核心大脑 处理高频低延迟任务 云端承担大规模计算与知识更新[37][40] - 分层设计原则:延迟敏感与隐私数据在端侧 复杂计算与生态接入在云端[38][39] - 算力复用策略:利用座舱/智驾芯片空闲算力 停车时调用ADAS算力运行哨兵模式[15][66] 行业实践案例 亿咖通科技 - 构建AIOS全球化系统 集成Auto Agent/Auto Sense/Auto Flow/Auto ECO四大模块[42][75] - Cloudpeak中间件支持模型量化与跨平台部署 实现高通/英伟达/国产芯片适配[42][65] 面壁智能 - 专注0 9B-8B端侧小模型 通过强化学习构建"硅基家人"Agent 实现3K图像毫秒级解析[45][77] - 独创UI Agent架构 突破车机限制完成支付宝操作 结合情感计算提供拟人化服务[77] 未来发展方向 - 中央计算架构普及 推动"舱驾一体"大模型实现座舱与ADAS功能统一[67][69] - AGI技术演进:通过Next Token Prediction实现自主学习 减少人工标注依赖[70] - 交互范式革新:生成式HMI取代传统界面 构建"感知-决策-执行"全闭环体验[69][77]