Workflow
42章经
icon
搜索文档
2018 - 2020,抖音超越快手的关键三年|42章经
42章经· 2025-11-16 20:59
抖音发展历程与关键节点 - 抖音于2016年正式立项,2017年七八月份开始起量 [3] - 2017年下半年经历第一波较大增长,借助“百万英雄”直播答题活动吸引高校年轻用户 [8] - 2017年至2018年春节,因偶然获得春晚资源位,流量翻倍,DAU增速显著,内部首次认识到其增长潜力 [9] - 到2018年底、2019年年初,抖音DAU反超快手 [11] - 2020年之后,业务重点转向电商、本地生活等商业化方向 [15] 字节跳动的战略思考与产品定位 - 公司决定做短视频是基于对内容时长的分析,认为0到1分钟的短内容存在巨大市场空间 [16] - 抖音最初在内部资源较少,预期天花板为600万至1200万DAU,远低于后来实际达到的8亿DAU [20][23] - 产品定位为“无脑”的娱乐消费产品,其最大竞争对手是游戏,满足了用户无需动脑的放松需求 [85][86] - 推荐系统在分发此类内容上具有天然优势,用户打开频次高、停留时间长,能积累更多消费数据以优化算法 [87] 抖音崛起的关键成功因素 - 坚持不从头条导流用户,选择难而正确的独立起量路径 [46] - 建立独特的品牌调性,采用全黑UI等年轻化、高审美的品牌元素 [46] - 在内容池不足的早期阶段,依靠强大的内容运营和“精选标签”手动筛选优质内容,引导社区调性 [47][48] - 目标用户为年轻人,其兴趣广泛易于泛化,为后续内容扩展奠定基础 [66][67] - 采用单列分发器,相比双列具有极高的分发效率和内容泛化效率 [69][70][71] 关键业务决策与竞争战役 - 2018年至2020年,公司将社交视为战略重点,旨在增强用户长期留存和加速泛化,但最终未达预期 [24][25][27] - 2019年推出抖音极速版,对标快手极速版,两周内迅速增长至几千万DAU [87] - 2019年底至2020年初,将火山App更名为“抖音火山版” [87] - 2020年春节,为应对快手独家冠名春晚的竞争,公司发动集团力量,通过“集卡”红包活动为抖音导流,当晚DAU峰值达到4.7亿 [87] - 公司风格追求极致,在关键决策上投入巨大,如考虑将春节红包预算从20亿提升至100亿 [90] 组织文化与人才管理 - 公司文化高度扁平化,弱化层级头衔,鼓励基层员工与高层直接交流,创造了“祛魅”的环境 [101][102][103][104] - 早期非常信任年轻人,抖音团队中一半左右为校招生,为年轻人提供了巨大成长空间 [6][50][52][106] - 核心组织文化是公司早期竞争力的关键,但随着规模扩大,外部人才的引入稀释了原有文化内核 [108] - 公司强调“极致”的思维方式,不仅在行动上不顾一切解决问题,更在战略思考上追求倍增效应,逼问“如何增长五倍”以推动创新 [114][116][118][120] 行业观察与创业思考 - 移动互联网红利期后,给年轻人的高速成长机会减少,AI的出现被视为新的行业机遇 [59][60][63] - 创业成功需要完成从解决具体问题到进行战略选择和资源配置的认知转变 [126] - 创业应聚焦于“难而正确”的事,如产品定义、关键人才招募和资金规划,而非陷入事务性工作的“思维惰性” [130][134][135] - 应对大厂竞争的关键在于想清楚创业项目的长期价值、当前时间窗口以及如何快速验证产品市场匹配度 [138][139][140]
为什么说 AI 还没到泡沫?等四篇 | 42章经 AI Newsletter
42章经· 2025-11-09 21:19
Fal公司的增长策略 - 公司在一年内ARR从200万美元增长至1亿美元,团队规模不足50人 [2] - 战略转折点出现在Stable Diffusion模型引发GPU供需失衡时,公司从原数据处理产品转向AI推理优化服务 [4] - 投资人关键提问促使公司选择新方向,因图像/视频赛道比LLM赛道更易实现千万级ARR增长 [5][6] - 公司认为图像/视频是净增市场,不与巨头直接竞争,且模型碎片化趋势使聚合平台价值凸显 [8][9] - 通过率先引入中国模型Kling的API,意外激活双边市场飞轮,吸引超600个模型入驻 [12] Fal公司的市场进入策略 - GTM策略结合PLG与销售闭环:开发者自助注册后,系统自动筛选日消费超300美元的高潜客户并转为商机 [15][16][17] - 品牌营销采用开发者认同的方式,如设计GPU Poor/GPU Rich文化周边,以及公开直播模型部署过程展示技术实力 [20][22] - 公司通过"上帝视角"发现行业机会,包括图像/视频数据标注平台、垂直广告解决方案等 [24][25] AI行业泡沫争议分析 - 54%的基金管理人认为AI市场已进入泡沫阶段,但Coatue研究基于历史数据反驳此观点 [26][29] - 当前纳斯达克100指数动态市盈率为28倍,远低于2000年互联网泡沫峰值89倍 [32] - 头部公司市值占GDP比例达77%,但业务多元化支撑其价值,高集中度下买入持有策略回报更优 [35][36] - AI领域资本开支占GDP1.6%,但仅消耗企业现金流的46%,远低于2000年泡沫时期的75% [37][40] - ChatGPT的MAU增长曲线超越互联网和PC普及速度,预示强劲需求 [44] AI行业经济前景预测 - 预计5-10年内AI收入增长10倍,2030-2035年收入达1.9万亿美元,EBIT转正至8500亿美元 [52] - 行业ROIC将从当前-3%提升至20%,接近成熟云服务盈利水平 [52] - 历史数据显示市场连续上涨3年后第4年继续上涨概率为48%,长期持有者在技术浪潮中获益更显著 [55][58] - Coatue预测AI泡沫未至但终将发生,当前巨头资本投入若未来收入未跟进可能引发清算 [63] AI产品定价策略 - 早期定价需简单易述,如Superhuman以"每日1美元省4小时"的故事化表述提升接受度 [68] - 规模化阶段谈判技巧包括:折扣交换价值审计报告、引导客户自我验证价值、提供多选项转移焦点至价值而非价格 [69][70][71] - 定价流程强调POC阶段与客户共创商业案例,并按效果付费 [73][74] - 定价框架需考虑价值归因难度与AI自主性,高频迭代以适应市场变化 [77][79] 增长策略的幂律定律 - 增长应基于数据启发而非纯粹数据驱动,避免因片面指标优化导致决策失误 [82][86] - 80%增长由1-2个核心渠道驱动,需聚焦资源发掘"不公平优势" [88][90] - 结合水平产品定位与垂直获客入口,通过具体场景切入后引导用户探索完整产品 [90] - 增长负责人需早期介入,重视一线实操能力以适应AI领域快速变化 [91][92]
OpusClip 增长秘诀:如果每个阶段只让我选一件事做 | 42章经
42章经· 2025-11-02 21:30
获客策略 - 冷启动阶段应寻找真实用户作为合作伙伴共建产品 而非依赖追求佣金的推广者[9][11][12] - 视频产品找到产品市场契合点后 其用户尤其是内容创作者本身就是最佳推广渠道[15] - 应尽早与关键意见领袖建立稳定正式的经济关系 实现长期共赢而非消耗其热情[17][18] - 聚焦少量与公司愿景一致的创作者进行深度合作 能带来更精准的用户并避免早期迭代阶段的噪音[21][22][23] - OpusClip的品牌合作伙伴计划运行两年仅与十几位创作者签年框合同 但带来了大量自然流量[31][32] - 寻找合作伙伴的第一步是锚定特定圈层 例如播客创作者或AI视频导演群体 再从中筛选真实用户[33][34] 付费转化与定价策略 - 灵活精准的定价策略是提升付费转化率的有效短期抓手[39][40] - 视频产品可围绕定制化设计定价 例如RunwayML允许专业方案用户上传自己声音 Higgsfield允许用户创建专属角色[41][42] - 调整定价时需保护老用户利益 他们是长期增长的基石和口碑的决定因素[46][47] - 用户界面传达的信息是定价策略的一部分 优化付费弹窗时机和文案可能带来30%甚至更高的转化提升[50][51] - 付费弹窗是最简单有效的早期测试环节 可测试不同触发时机和设计[89][93] - 采用月付加年付的组合策略 年付设置较大折扣以引导转化并提升整体留存率[127] 用户留存 - 留存是长期最重要的增长指标 决定了付费规模的复利效应[54][55][60] - 留存率90%的公司半年后存量用户几乎是留存率80%公司的两倍[56] - 提升留存70%依靠倾听有良好判断力用户的反馈 30%依靠发掘用户未明确提出的需求[63][64][66] - 搭建以用户为中心的反馈闭环 通过Discord Intercom Canny和社交媒体等多渠道收集反馈[69][70][76] - 重视客服团队投入 团队30人时配备5至6位全职客服 并要求每周输出报告汇总用户痛点和功能需求[73][74] - 形成从收集反馈到内部响应再到产品迭代和用户感知的完整闭环[78][79][80][81] 数据驱动与洞察 - 创业早期数据建设应合理规划 0至50人阶段可依赖SaaS工具搭建基本AB测试体系[98][99][100] - 团队达50人左右且数据需求复杂时才需招聘全职数据分析师 非常后期才需建设数据仓库[101] - AB测试过程本质是学习用户和寻找产品市场契合点的过程 用户的付费点往往对应产品的核心价值[94] - 通过分析用户邮箱后缀和关联社交账号等数据 可发现新用户画像并识别高影响力创作者进行合作[71] - 增长团队应善用SaaS工具提效 例如使用工具提升支付失败用户的重试成功率至40%至50%[134][136][137] 品牌建设与市场观点 - 长期获得稳定流量的关键在于清晰的产品定义和品牌建设 争取成为品类定义者[140][143] - OpusClip的成功主要来自于品牌建设 通过定位播客创作者圈层并与关键意见领袖建立长期合作来打造品牌[145][146][148] - AI视频市场仍处于早期阶段 模型和智能体的可用性在近期才逐渐成熟[152][153][155][156] - 看好Higgsfield和Pixverse等AI特效产品 因其注重角色一致性和专业内容生产场景 能帮助创作者打造IP[157][162] - 当前视频生成技术的卡点在于使用门槛高 未来需要智能体产品封装复杂能力 降低创作者的学习成本[167][168][171]
Figma 如何战胜 Adobe 等六篇 | 42章经 AI Newsletter
42章经· 2025-10-26 21:42
Figma 与 Adobe 的竞争分析 - Figma 通过将设计的原子单位从“文件”转变为“元素”,实现了真正的实时同步协作,而 Adobe 的协作功能仍基于文件传递逻辑 [2][3] - Adobe 受限于其基于文件的历史成功路径和业务包袱,难以彻底重构产品逻辑来应对 Figma 的挑战,内部阻力极大 [3] - 类似的“最小原子单位”改变曾发生在音乐行业,从专辑到单曲的转变催生了 iTunes 和 Spotify 等全新生态系统 [4] - 该案例启发思考 AI 时代的机会:需关注 AI 是否改变了某个领域的“最小工作单位”、组织体系性质或生态系统结构 [6] AI 应用公司的竞争壁垒构建 - Cursor 通过在线强化学习(Online RL)建立高频实时反馈循环,每1.5-2小时上线新模型,将用户交互作为奖惩信号直接用于训练 [7] - 该机制使 Cursor 的代码建议量减少21%,但采纳率提升28%,标志着AI数据飞轮可能开始有效运转 [7] - 应用公司通过类似方法利用专有数据优化自身模型效果,可能成为对抗模型大厂的有效竞争手段 [7][10] Plaud 的成功要素与商业模式 - Plaud 的核心是作为“context收集器”,其价值判断在于对话是智能的体现形式,致力于捕捉和分析用户的对话context [13][14][15] - 公司采用“反过来想”的思维方式,例如从“AI服务人类”转变为“人类服务AI”,并推出AI主动提问用户的“Ask Plaud”功能 [16][17] - Plaud 确立了“世界第一”的目标,认为第二名通常只有第一名80%的性能、50%的定价能力和10%的盈利能力 [21][22] - 公司处于“发展模式”,连续两年实现十倍增长,利润率极高,无投资人压力,注重品牌品味,招聘来自奢侈品行业的人才 [23] 产品“惊喜感”(Delight)的系统化打造 - Delight 被定义为喜悦(Joy)与惊喜(Surprise)的结合,可通过超越预期、预判需求、消除阻力三个抓手实现 [25][27] - 用户分类应按动机(功能动机、个人情感动机、社交情感动机)而非传统的人口特征或行为 [27] - “愉悦感”分为三层:浅层愉悦(占比10%,仅满足情感)、低度愉悦(占比50%,仅满足功能)、深度愉悦(占比40%,同时满足功能与情感) [28][32] - 在B端市场,信任是最高级的愉悦感,例如Buffer主动为不活跃用户退款的反商业直觉操作反而提升了用户黏性 [31][33] AI 产品留存率与商业模式评估 - A16Z 提出以M3(第三个月)作为评估AI产品留存率的新基准,此时尝鲜“游客”已基本流失,数据更能反映真实PMF [34] - 新的北极星指标是M12/M3(第12个月留存用户数除以第3个月留存用户数),超过100%的“微笑留存曲线”在AI时代成为可能 [35][36] - M12/M3 >85% 跑赢市场平均线,>95% 属于前25%,>100% 为顶流水平 [39] - AI 商业模式变化:定价转向基于使用量或结果;存在从个人用户到企业客户的自下而上渗透路径,建议尽早加入团队协作功能并考虑ToB业务 [40][41] Palantir 的 FDE 模式及其在 AI 时代的应用 - FDE 是驻扎客户现场的工程师,核心是“产品探索”,通过定制化解决方案满足客户需求,并将解法抽象沉淀为通用产品功能 [45][46] - FDE 团队关键角色:Echo(来自客户行业的咨询分析师,挖掘痛点)和 Delta(快速原型开发的部署工程师) [46][49] - 该模式适用于产品和市场极度不明确的场景,在AI时代爆发因合同金额大(数百万至上亿)且产品形态不确定,需一线共创 [52][53] - FDE 模式的精髓是“规模化地做那些不规模的事”(doing things that don't scale at scale),是YC建议的进阶版 [53]
一个原教旨主义产品经理眼中的世界|42章经
42章经· 2025-10-20 22:08
产品设计方法论 - 产品设计的本质是资源配置,关键在于观察和积累元素,并将其组合成完整、可理解、既有用又有趣的东西[13][14][15] - 产品经理应通过观察—理解—组合—压缩的方式找到达成目标的最优解,其中压缩是最耗时且关键的步骤[19] - 产品设计过程类似破案,不同元素的动态连接会导出非常不一样的结果,思考过程值得花时间[20][21] - 衡量产品好坏的关键在于其能否陪伴用户一段时间,这段时间的长短取决于产品的“有趣”程度[35] - 一个好产品在用户端会引发四个声音:“诶”(与众不同)、“嗯”(体验很棒)、“哎呦喂”(发现惊喜)、“卧槽”(生命周期末尾的感叹),对应产品完整的生命周期[102][103] 用户需求洞察 - 当前中国用户分层复杂,一二线城市用户在“有用”层面被过度供给,但在“有趣”层面感到贫瘠和未被理解;三四线城市用户受限于社会关系;城乡用户面临资源供给不足[52] - 用户需求存在周期性循环,大众的审美和品味在提升,对好电影和好产品的标准与十年前已完全不同[56][64][65] - 理解用户需求是一个不断提出假设并反复验证的过程,需要真正走近用户,与用户平等沟通,建立“友”而非“神”或“仆”的关系[86][96][99] - 对用户的假设最终取决于产品设计者自身的表达,只要有想表达的东西,就一定会找到对应的用户[94] 产品价值平衡 - 产品必须首先做到“有用”,这是敲门砖,但“有用”之后的关键是“有趣”,这决定了产品能否被用户内化[33][34][36] - 在追求增长(如AB测试)与追求产品被用户真正感受之间存在平衡,只看增长会导致高频迭代和创作者与用户的共同疲惫[27][28][30] - 理想的产品需要兼顾“有用”和“有趣”,追求性价比、技术极致、易操作等多重目标,实现“既要、又要、也要”的周全[118] - 产品设计不能只讲逻辑,逻辑用于传递结果,但设计过程本身要有趣,需要体会生活,避免因纯理性而忽略对生活的观察和品味[108][109] 行业发展趋势与AI影响 - AI的发展将推动产品走向个体化和个性化,未来可能出现AI作为代理角色,为每个用户提供定制化服务[47][49][50] - AI时代的需求到结果之间过程被压缩,要求组织方式必须是端到端而非流水线,个人需要具备更综合的能力,组织形式将发生巨大变革[122][123] - 中国强大的供应链、原教旨主义的互联网人基础以及中国人对美好生活的向往和努力干劲,构成了行业发展的沃土,存在巨大的利差机会和市场潜力[6][66][68][69] - 未来的产品设计最大的机会在于利用AI等技术,观察并理解每个用户的独特诉求,实现点对点的服务[48][49]
组织能力才是 AI 公司真正的壁垒|42章经
42章经· 2025-09-26 16:33
AI Native研发工作流重构 - 默认所有研发工作由AI承担,人类仅在AI无法解决时补位,实现工作流根本性重构 [7] - AI Review将Code Review时间从传统的一两天缩短至10分钟,效率提升超过10倍 [3] - 约90%代码通过Linear管理任务并自动分配给Devin生成,工程师无需打开IDE [7] - 使用incident进行生产监控,可覆盖近一半监控需求,不再需要专职运维人员 [8] - 减少人工对齐,鼓励独立工作,将原则和想法写入codebase实现自动对齐 [10] AI Native人才要求 - 人类核心价值是成为Context Provider,为AI提供其不具备的行业知识和上下文 [12][13] - 需要Fast Learner,快速掌握最少必要知识以与AI高效沟通并激发其潜力 [14] - 每个人都应是Hands-on Builder,对全流程和最终结果负责,避免上下文传递导致的效率下降 [14][15] - 工程师需具备产品设计和go-to-market能力,直接获取客户反馈而非通过中间环节 [20] - 招聘通过take-home任务考察AI工具使用能力,如两天内构建复杂产品或一小时内优化埋雷项目 [38][39] AI Native组织模式 - 按结果分工而非按流程分工,小组具备全链路能力并对最终结果直接负责 [19][20] - 组织以工程团队为核心,工程团队利用工具快速上线60分版本,其他团队再优化 [22] - 未来组织形态可能是少量核心合伙人加大量灵活合同工,核心员工享受合伙人待遇 [24][25] - 公司20人规模下没有全职PM,工程师兼任PM工作,直接对接客户需求 [31] - 创业公司早期没有PM属正常现象,Mercor 150人规模时也只有2个PM [33] 行业趋势与挑战 - AI Native模式在硅谷初创公司中已成为发展方向,并非小众实践 [26] - 大厂推行AI Native组织模式困难,需考虑架构调整外的多种因素 [27] - 可能出现“一人独角兽”公司,几个人就能做出惊人产品,不再需要万人规模公司 [27] - AI不仅适用于从0到1场景,在复杂代码场景中人类提供高质量上下文是关键 [29][30] - 未来岗位界限模糊,PM和工程师都将成为Builder,只要能够Build出东西并对结果负责 [36]
Mercor 高速增长的秘诀与其中的聪明人|42章经
42章经· 2025-09-14 20:40
公司业务定位 - 核心业务是帮助顶尖AI公司招聘各行业专家 而非传统数据标注公司[4][26] - 通过专家提供系统性反馈来提升AI模型智能 替代传统数据标注平台[6][27] - 交付物为评估标准和基准测试规范 相当于模型的PRD[27][28] 商业模式 - 采用平台化运营模式 客户将资金支付给平台 再由平台结算给专家[8] - 平均时薪超过90美元 不同职业差异显著:英文语音训练21美元 软件工程师100-200美元 皮肤科医生高达400美元[16] - 从100万美元到1亿美元年化营收运行率仅用11个月 增速超过Cursor的12个月纪录[39] 市场竞争优势 - 完全替代传统数据标注平台 模型可直接基于其提供的评估标准进行强化学习[6] - 核心能力在于人才质量评估 能通过科学方法从万份简历中筛选顶尖人才[10][11] - 相比Scale AI被收购后的业务下滑 Mercor抓住模型升级带来的市场空白[20][25] 运营流程 - 获客主要依靠熟人推荐(超50%专家来源) 推荐人可获得推荐费[12] - 采用AI视频面试自动生成问题 20-30分钟面试后生成带转录文本的视频报告[13] - 通过多人交叉验证机制确保标注质量 异常方案会被及时识别并淘汰[15] 市场前景 - 数据标注市场规模约50-100亿美元 随OpenAI等公司持续投入而扩大[36] - 业务模式可复用到所有行业 核心是解决"挑选"环节的痛点[32] - 未来工作形态将向项目制演进 全职岗位减少 AI衡量能力将拓展至更多场景[29][30] 团队特质 - 团队平均年龄22岁 多位成员曾获Thiel Fellowship并有过创业经历[39] - 决策速度极快 依赖创始人直觉而非完全数据驱动 强调快速试错[48][49] - 执行能力突出 团队每日工作时间为7:30至凌晨1:00 依靠增长作为核心激励[53][55] 人才标准 - 注重技术实践能力 要求候选人展示实际构建成果[58] - 强调Agency(主动性) 即克服困难达成结果的能力[59][60] - 通过概念类比测试学习能力 例如用MCP vs API的类比快速理解新概念[63][65]
硅谷 AI 大转弯与二级市场的牛市|42章经
42章经· 2025-08-31 20:35
AI行业发展趋势 - AI进入高速发展阶段 核心衡量指标从Scaling Law转变为Token消耗量 7月Token消耗量较6月增长20%以上[3] - 行业预期发生变化 从追求AGI转向优化现有智能的可用性和易用性[4] - AI已超越应用阶段 进入产业化和工业化新阶段[6] 模型发展特点 - GPT-5代表重要转折点 通过整合分散的模型能力和前端界面提升可用性而非追求更聪明[5] - 模型智能评估重要性降低 OpenAI和DeepMind模型已获得IMO金银牌[18] - 模型进入瓶颈期 智能提升主要来自各环节增量优化 仍有几十个百分点提升空间[22] 基础设施优化 - Infra优化分为四层:模型与GPU间优化 模型与应用间推理加速 Agentic Infra优化 context层Infra优化[25][26][27] - 推理加速技术壁垒不高 部分开源 毛利空间存在争议[25] - 英伟达需求来自训练和推理两部分 Token消耗增长推动推理需求持续上升[29] 公司战略演变 - 模型 应用和Infra公司边界变得模糊 出现端到端打通全链条的趋势[13][14] - OpenAI招募创业公司创始人 Google加快应用端发力 Manus开展技术工作 Cursor开始训练自有模型[13] - 公司分工新共识:模型公司提升Token价值 Infra公司优化使用效率 应用公司换取数据反馈[11] 投资市场表现 - 英伟达股价上涨核心驱动是Token消耗量持续增长[29] - ASIC厂商和AMD股价表现亮眼 反映市场对降低成本方案的追求[30][31] - 美国AI估值存在泡沫 但发展前景依然被看好[48] 应用场景发展 - RL范式推动Coding 数学等可验证效果场景发展[37] - 垂类公司找到PMF Harvey AI在法律领域实现高ARR 医疗金融保险领域出现成功团队[37] - 视频Token消耗增速远高于文字 但真正多模态原生应用尚未出现[88][89] 二级市场差异 - 美国市场受AI发展预期主导 AI对整体景气度影响占三分之二以上[45] - 中国市场受多重因素影响 包括居民存款 投资意愿 风险偏好和制造业周期[46] - 腾讯成为国内AI板块代表性标的 因AI努力程度和战略高度获得市场认可[56] 一级市场特点 - 美国模型公司估值达到上百亿美元 出现全明星团队加持现象[79] - 第一梯队与第二梯队公司估值差距创历史纪录[82] - 国内一级市场两极分化严重 头部公司可能获得十倍资金[84] 新兴公司关注 - Reddit因社区数据质量高被ChatGPT高频使用 类似美国版知乎+小红书+B站[76] - ServiceNow通过Workflow梳理和软件交付获得500强客户 增长速度加快[76] - Figma凭借协作场景优势和中生代公司地位 有望将AI融入协作场景[77]
活动报名:AI 视频的模型、产品与增长实战|42章经
42章经· 2025-08-10 22:04
AI视频模型技术路径与能力展望 - Luma AI模型产品Lead戴高乐分享视频模型与世界模型的技术路径及未来能力展望 [2] - 探讨视觉模型从diffusion到DiT再到autoregressive的技术演进历程 [3] - 分析更智能的视觉模型能力发展前景 [3] Pixverse用户增长与商业化策略 - 爱诗科技联合创始人谢旭璋分享Pixverse两年内实现6000万用户的关键决策 [3] - 外部模型、自研模型与应用产品的选择与迭代策略 [4] - 从模型到特效类产品的转化逻辑及0-6000万用户的增长点与商业化路径 [4] 视频工具产品增长方法论 - 前OpusClip增长产品负责人谢君陶提出视频工具获客需聚焦创作者长期合作模式 [5] - 转化阶段强调灵活精准的定价策略与分阶段价格实验设计 [5] - 留存策略以用户为中心,通过客服团队与运营保持长期连接 [5] - 早期数据基建的取舍与数据驱动决策在增长中的关键作用 [5] 行业交流活动信息 - 活动聚焦AI视频领域模型、产品、增长三大维度实战经验分享 [10] - 线上会议时间为8月16日10:30-12:30,限额100人(非投资行业优先) [7][10]
关于 AI Infra 的一切 | 42章经
42章经· 2025-08-10 22:04
AI Infra的定义与架构 - AI Infra包括硬件和软件两部分 硬件指AI芯片 GPU 交换机等设备 软件层面类比云计算分为三层 [3][4] - 最底层类似IaaS 解决基础计算 通信和存储问题 中间层类似PaaS 包含资源调度 资源管理等平台 MaaS归属这一层 [4][5] - 最上层近似SaaS应用层 但在AI Infra领域更倾向于理解为训练及推理框架的优化层 [5] AI Infra的发展历程 - 第一批AI Infra人如贾扬清 李沐 陈天奇等有算法背景 他们为充分利用GPU而开发AI Infra [6] - 第二批AI Infra人主要推动AI Infra在工业界的规模化应用 [6] - 大模型兴起使AI Infra进入主舞台 类似搜索引擎兴起时的机会窗口 可能十年二十年才出现一次 [7][9][10] AI Infra与传统Infra的差异 - AI Infra绝对核心是GPU 传统Infra核心是CPU [11] - AI Infra需要更极致 更贴合AI特殊需求 太阳底下没有太多新鲜事但要做到更极致 [12] - Infra人才相比算法更强调积累 算法依赖年轻人而Infra需要长期经验 [14] AI Infra的核心指标与价值 - 线上服务侧关注首字延迟 吐字稳定性 整体成本 训练侧关注每张GPU处理数据量和训练效率 [15] - 优化Infra可显著降低成本 例如1万张GPU每月租金1亿 利用率提升10%可节省1000万 [18][19] - 小公司可通过对比云厂商方案决定是否自建Infra 云服务商价值在于帮助小公司节省优化成本 [20][21] AI Infra的商业模式 - 第三方公司短期价值在于提供API集贸市场 让客户自由选择不同API [22] - 长期来看 第三方需与硬件或模型垂直整合才能建立壁垒 避免被云厂商或模型公司取代 [24][25] - MaaS服务商可通过与硬件厂商深度合作获得差异化优势 类似游戏机独占游戏 [26][27][28] AI Infra与模型效果 - Infra水平影响模型效果 优化更好的Infra可在相同算力下多学20%数据 提升模型效果 [36][37] - MFU是常见指标但单一指标难判断优劣 DeepSeek的MFU偏低但Infra并不差 [37][38] - DeepSeek成功关键在于选对优化目标 即给定推理成本训出最好模型 而非传统训练算力优化 [39][40][41] AI Infra的未来趋势 - 当前最重要指标是decoding速度 直接影响线上业务成本和强化学习效率 [44] - 多模态仍有突破可能性 需实现理解和生成的统一 类似GPT-3.5让专用模型退休 [63][64] - 开源模型促进AI Infra发展但也可能阻碍创新 如过度优化Llama影响新范式探索 [69] AI Infra的组织架构 - 理想协作是Infra 算法 数据团队共同决策 大厂中Infra常被视为支持角色缺乏影响力 [46][47][49] - 合理架构应是Infra人设计模型结构 数据人负责刷分 算法人主攻训练范式革新 [54] - 大厂人才结构错配 如DeepSeek Infra工程师多于算法工程师 而多数大厂相反 [81][82] AI Infra的创业机会 - 训练侧商业模式难成立 因训练方不愿泄露核心竞争力 推理侧如加速优化仍有机会 [67][68] - 国产芯片需专门设计模型结构提升性价比 Step 3开源模型支持国产卡商用并达到SOTA [69][73][74] - 多模态成本有望大幅下降 理解已不贵但生成仍贵 视频生成一年后可能降至几分之一 [75][76][77]