信息表达系统
搜索文档
前字节剪映AI产品负责人创业,获硅谷基金及BV百度风投投资,要做营销多模态Agent
36氪· 2025-11-01 09:16
文章核心观点 - 文章聚焦于AI多模态领域的创业机会,认为当前技术拐点已至,创业公司应聚焦于垂直场景的AI应用开发,而非基础模型[7][8][9] - 核心论点是企业用户不需要复杂的AI工具,而是需要能够直接交付成品视频的端到端解决方案,这存在明确的商业机会[11][21][30] - 面对Sora等基础模型的快速迭代,应用层公司应将自己定位为"造船的人",利用底层模型能力的提升来增强自身产品,并保持快速迭代以应对变化[7][44][78] 创始人背景与创业契机 - 创始人廖谦拥有丰富的AI产品经验,曾在腾讯云、字节跳动火山引擎和剪映负责AI产品,其主导的产品曾达到千万DAU和百万月活[5][13][17] - 2024年初Sora的发布被视为多模态的"ChatGPT时刻",促使廖谦加入生数科技,带领Vidu产品从0到1达到数千万美金收入[5][18][19] - 在生数科技期间,通过处理上千单企业级AIGC需求,发现企业端到端交付解决方案的痛点,从而决定创立"极致上下文"公司[8][20][21] - 公司于2024年8月成立,在融资PPT未完成的情况下,半个月内迅速敲定了由HT investment和BV百度风投投资的数百万美金首轮融资[5] 公司定位与产品战略 - "极致上下文"公司不做基础模型,而是定位为"造船的人",即通过整合各种AI模型能力,为企业提供端到端的营销视频生成服务[7][9][30] - 首款产品是一个营销Agent,前端通过多模态交互理解企业需求,后端整合AI模型,直接交付成品视频,而非工具[9][30][34] - 公司选择从"生产力信息"场景切入,如企业营销内容,因为这类需求ROI清晰可量化,目标是将制作成本降低十倍,速度提升百倍[9][35][36] - 未来愿景是打造一个新时代的"AI表达系统",但当前阶段务实聚焦垂直场景,类比移动互联网早期应专注像美团、滴滴这样的垂直应用[10][31][69] 技术拐点与市场判断 - 多模态模型在2024年达到商业化拐点,效果与成本综合达标,AI生成视频成本相比传统制作可降低到十分之一[23][36] - 2024年9月ChatGPT o1的发布标志着大模型推理能力成为优化问题而非可行性问题,多模态模型的一致性也得到显著提升[24][25] - 中国在AI视频领域具有独特优势,短视频生态领先全球1-2年,国内对视频落地的理解和经验可以迁移至海外市场[10][17][62] - 多模态领域的发展路径与大语言模型不同,数据质量的重要性远超参数规模,数据做得好即使模型不大效果也可能很好[60][61] 对Sora的评估与行业影响 - Sora App的发布被评估为一项AI System而不仅是模型,其具备叙事能力和镜头语言,尤其在社交娱乐内容上表现领先[47][48][50] - Sora的发布对应用层公司是重大利好,意味着可用工具更强大、门槛更低,同时会刺激整个行业和资本市场的活跃度[43][45][51] - OpenAI通过Sora App的账号体系设计显示出其构建GPT生态的野心,将永久降低AI社交和娱乐的毛利,迫使大厂防守[54][55] - 创业公司需找到足够硬的切入点,使用户愿意"多持"不同产品,并建立快速反应机制,以每周迭代应对基础模型每两三个月的更新[58][78] 商业模式与未来拓展 - 商业模式是直接交付服务结果(如合格视频),而非保证业务效果(如转化率),价格和质量标准明确,用户为确定性的交付物付费[72][73] - 未来拓展方向是沿垂类场景进行,如教育、办公等,因不同场景的交互形态和行业知识差异大,通用Agent难以做深[69][70][76] - 信息表达正进入"生成时代",AI能聚合理解信息后动态生成全新内容,实现真正个性化,这改变了推荐时代的游戏规则[67][68][76] - 创业公司应更冒险和激进,尝试未被验证的可能性,建立快速迭代文化以在不确定的技术环境中保持竞争力[80][81][83]