Workflow
智能创作云
icon
搜索文档
前字节剪映AI产品负责人创业,获硅谷基金及BV百度风投投资,要做营销多模态Agent
36氪· 2025-11-01 09:16
文章核心观点 - 文章聚焦于AI多模态领域的创业机会,认为当前技术拐点已至,创业公司应聚焦于垂直场景的AI应用开发,而非基础模型[7][8][9] - 核心论点是企业用户不需要复杂的AI工具,而是需要能够直接交付成品视频的端到端解决方案,这存在明确的商业机会[11][21][30] - 面对Sora等基础模型的快速迭代,应用层公司应将自己定位为"造船的人",利用底层模型能力的提升来增强自身产品,并保持快速迭代以应对变化[7][44][78] 创始人背景与创业契机 - 创始人廖谦拥有丰富的AI产品经验,曾在腾讯云、字节跳动火山引擎和剪映负责AI产品,其主导的产品曾达到千万DAU和百万月活[5][13][17] - 2024年初Sora的发布被视为多模态的"ChatGPT时刻",促使廖谦加入生数科技,带领Vidu产品从0到1达到数千万美金收入[5][18][19] - 在生数科技期间,通过处理上千单企业级AIGC需求,发现企业端到端交付解决方案的痛点,从而决定创立"极致上下文"公司[8][20][21] - 公司于2024年8月成立,在融资PPT未完成的情况下,半个月内迅速敲定了由HT investment和BV百度风投投资的数百万美金首轮融资[5] 公司定位与产品战略 - "极致上下文"公司不做基础模型,而是定位为"造船的人",即通过整合各种AI模型能力,为企业提供端到端的营销视频生成服务[7][9][30] - 首款产品是一个营销Agent,前端通过多模态交互理解企业需求,后端整合AI模型,直接交付成品视频,而非工具[9][30][34] - 公司选择从"生产力信息"场景切入,如企业营销内容,因为这类需求ROI清晰可量化,目标是将制作成本降低十倍,速度提升百倍[9][35][36] - 未来愿景是打造一个新时代的"AI表达系统",但当前阶段务实聚焦垂直场景,类比移动互联网早期应专注像美团、滴滴这样的垂直应用[10][31][69] 技术拐点与市场判断 - 多模态模型在2024年达到商业化拐点,效果与成本综合达标,AI生成视频成本相比传统制作可降低到十分之一[23][36] - 2024年9月ChatGPT o1的发布标志着大模型推理能力成为优化问题而非可行性问题,多模态模型的一致性也得到显著提升[24][25] - 中国在AI视频领域具有独特优势,短视频生态领先全球1-2年,国内对视频落地的理解和经验可以迁移至海外市场[10][17][62] - 多模态领域的发展路径与大语言模型不同,数据质量的重要性远超参数规模,数据做得好即使模型不大效果也可能很好[60][61] 对Sora的评估与行业影响 - Sora App的发布被评估为一项AI System而不仅是模型,其具备叙事能力和镜头语言,尤其在社交娱乐内容上表现领先[47][48][50] - Sora的发布对应用层公司是重大利好,意味着可用工具更强大、门槛更低,同时会刺激整个行业和资本市场的活跃度[43][45][51] - OpenAI通过Sora App的账号体系设计显示出其构建GPT生态的野心,将永久降低AI社交和娱乐的毛利,迫使大厂防守[54][55] - 创业公司需找到足够硬的切入点,使用户愿意"多持"不同产品,并建立快速反应机制,以每周迭代应对基础模型每两三个月的更新[58][78] 商业模式与未来拓展 - 商业模式是直接交付服务结果(如合格视频),而非保证业务效果(如转化率),价格和质量标准明确,用户为确定性的交付物付费[72][73] - 未来拓展方向是沿垂类场景进行,如教育、办公等,因不同场景的交互形态和行业知识差异大,通用Agent难以做深[69][70][76] - 信息表达正进入"生成时代",AI能聚合理解信息后动态生成全新内容,实现真正个性化,这改变了推荐时代的游戏规则[67][68][76] - 创业公司应更冒险和激进,尝试未被验证的可能性,建立快速迭代文化以在不确定的技术环境中保持竞争力[80][81][83]
剪映前AI产品负责人创业多模态Agent,做懂上下文的007乙方,成立半月融资数百万美元
搜狐财经· 2025-10-29 14:27
公司概况与融资 - 公司名称为极致上下文(Apex Context),由前生数科技产品副总裁廖谦于2024年8月底创立 [1] - 公司成立仅半个月即获得硅谷美元基金HT Investment与BV百度风投数百万美元投资 [1] 创始人背景 - 创始人廖谦拥有计算机视觉技术背景,职业经历覆盖算法、产品、商业化完整路径 [3][11] - 曾任职于腾讯天美工作室、腾讯云、字节跳动火山引擎及剪映、生数科技等公司,具备大厂与0到1创业经验 [3][11][13] - 在字节跳动期间孵化海外AI内容生产与分发平台Pippit,月活已超百万 [13] 产品战略与定位 - 首要目标是打造面向营销场景的多模态AI Agent,提供从创意策划、脚本生成到视频成片的端到端自动化服务 [3][5][6] - 选择营销场景因其需求明确、效果可量化、付费意愿强,最能体现AI真实价值 [3] - 商业模式采用“预期思维”或“结果导向”,为用户提供明确价格与质量标准 [5] - 中长期规划是构建AI时代的信息表达系统,让任何人能实现个性化自我表达 [6] 技术理念与行业判断 - 公司命名源于对AI下一阶段发展的理解:AI应能深度理解并呼应用户上下文,使生成内容更精准 [1] - 判断下一阶段核心竞争力在于帮助人、品牌及组织更好地表达自己 [6] - 当前技术周期进入拐点,语义理解、镜头语言、画面真实度全面提升,技术已达“可用”临界点 [8][9] - 在模型层面,“一致性”是绝对可预见的重点提升方向 [18] 竞争格局与市场机会 - 认为当前时代没有传统意义上的护城河,巨头互殴为创业公司创造了进攻窗口期 [14][15] - Sora 2等模型的发布迫使抖音、TikTok等巨头防守核心业务,从而减缓其他方向创新 [14][15] - 公司优势在于对用户和场景的理解以及团队的热爱 [16]
前字节剪映AI产品负责人创业,获硅谷基金及BV百度风投投资,要做营销多模态Agent
36氪· 2025-10-29 13:08
公司核心业务与产品定位 - 公司“极致上下文”致力于打造一个新时代的“AI表达系统”,其首款产品是一个营销Agent,而非视频生成工具 [6][7][53] - 产品定位为端到端的解决方案,前端通过多模态交互理解企业品牌调性和需求,后端整合各种AI模型能力,直接交付成品视频 [6][26] - 目标是将传统营销视频制作成本降低十倍,交付速度提升百倍,使交付质量达到行业标准 [6][29][30] - 公司选择从“生产力信息”场景切入,优先服务营销人员、品牌方等有明确工作产出目标的用户,因其ROI可量化 [28][29] - 产品开发初期将首先面向海外市场推出,后续计划拓展至教育、办公等更多垂直领域 [7][57] 创始人背景与创业契机 - 创始人廖谦拥有丰富的AIGC产品经验,曾在腾讯云打造DAU千万的换脸产品,在字节跳动从0到1推出火山引擎Top1流量产品“智能创作云”,并主导剪映出海项目Pippit达到月活百万 [1][2][10][13] - 2024年初加入多模态初创公司生数科技,带领Vidu团队实现从0到1的冷启动,达到数千万全球用户和数千万美金收入 [2][15] - 创业想法源于在生数科技期间处理上千单企业级AIGC定制需求时发现的明确痛点:企业用户不需要复杂AI工具,而是需要能直接交付成片的解决方案 [5][16][18] - 公司于2024年8月成立,并在半个月内迅速敲定了由HT investment和BV百度风投投资的数百万美金首轮融资 [2] 行业趋势与技术拐点判断 - 多模态领域的ChatGPT时刻即将来临,底层模型技术处在迅猛变化中,但落地鸿沟依然存在 [2][6] - 2024年被认为是技术拐点,关键因素包括多模态模型效果与成本达到可商业化水平,生成视频成本相比传统制作可降低到十分之一 [19][20] - 模型推理能力的突破(如ChatGPT o1发布)使得大模型落地千行百业成为一个优化程度问题,而非行与不行的问题 [20] - 多模态模型的一致性得到显著提升,为商业化应用扫除了主要瓶颈 [20][21] - 中国在AI视频领域具有独特优势,短视频生态领先全球1-2年,对视频生态的落地探索和理解更深 [7][52] 竞争格局与战略选择 - 公司战略定位为“造船的人”,即应用层开发者,其能力会随着底层模型能力的上升而增强,Sora等基础模型的进步对公司是利好 [4][35][36][37] - 明确选择不做通用Agent,而是聚焦垂直场景,认为移动互联网早期的发展规律(垂直应用胜出)同样适用于AI Agent领域 [7][27][57] - 面对Sora等强大基础模型的发布,公司的策略是建立快速反应机制,产品需每周迭代一次,以应对基础模型每两三个月一次的快速迭代 [64] - 在创业心态上强调要更冒险、更激进,去做尚未被验证过的可能性,而非追求确定性 [5][65][68] 产品交互与交付模式 - 产品交互设计为多模态,不仅限于文字输入,会通过生成参考图等方式更精准地理解用户偏好 [32] - 交付模式是保证交付一个达到行业特定质量标准的、内容本身合格的交付物,但不保证其发布后带来的市场“效果”[59][60] - 对于中小客户,其业务流程可以接受AI完全接管;但对于大客户,仍需要真人参与对接 [33] - 未来信息表达将进入“生成时代”,AI能主动理解、抓取、聚合信息,并为用户动态生成全新的、个性化的内容(如图文报告、播客)[56][62]
剪映前AI产品负责人创业多模态Agent,做懂上下文的007乙方,成立半月融资数百万美元
量子位· 2025-10-29 10:39
公司概况与融资 - 创始人廖谦于2024年8月底成立新公司“极致上下文”,公司成立仅半个月即获得硅谷美元基金HT Investment与BV百度风投的数百万美元投资 [1][2][4][10] - 公司名称源于对AI发展的理解,即AI应能深度理解并呼应用户上下文,目标是构建“更多的Context,更少的Control”的公司文化 [5][6] 创始人背景 - 创始人廖谦拥有计算机视觉技术背景,职业经历涵盖算法、产品、商业化完整路径,以及国内与海外市场、大厂与0到1创业经验 [8][9][27] - 曾任职于腾讯天美游戏工作室、腾讯云、字节跳动火山引擎,并作为发起人孵化剪映海项目Pippit(月活超百万),后加入生数科技担任产品副总裁,主导Vidu产品并带领超百人团队 [28][29][30][31][32][33] 产品战略与目标 - 公司首要目标是打造面向营销场景的多模态Agent,提供从创意、脚本到视频生成、编辑的端到端能力,因营销场景需求明确、效果可量化、付费意愿强 [3][11][12][13][18] - 中长期规划是构建AI时代的信息表达系统,让任何人(品牌或个体)实现个性化自我表达,未来能力可拓展至教育、生活方式、娱乐等领域 [19][20][21][22] 商业模式与用户定位 - 采用“预期思维”或“结果导向”的Agent模式,用户无需学习技能,Agent像专业Agency一样理解用户诉求,全流程自动完成内容生成 [14][15] - 目标用户是“大概知道自己要什么,但不需要懂怎么做的人”,产品核心价值在于持续降低用户的使用成本、理解成本与价格成本 [16] 行业机遇与技术判断 - 当前技术周期进入拐点,语义理解、镜头语言、画面真实度全面提升,Google Veo3和Sora 2等技术已达“可用”临界点,重点是将能力转化为真实产品价值 [23][24][25] - 巨头互殴(如Sora 2侵蚀抖音、TikTok核心业务)为初创公司提供进攻窗口期,可定义新内容形态、协作方式及信息分发逻辑 [36][37][38][39] - AI视频领域,“一致性”是绝对可预见的提升方向,包括画面角色一致性、音色一致性及画面美学(构图、光影等)待解决 [44]