营销多模态Agent
搜索文档
前字节剪映AI产品负责人创业,获硅谷基金及BV百度风投投资,要做营销多模态Agent
36氪· 2025-10-29 13:08
公司核心业务与产品定位 - 公司“极致上下文”致力于打造一个新时代的“AI表达系统”,其首款产品是一个营销Agent,而非视频生成工具 [6][7][53] - 产品定位为端到端的解决方案,前端通过多模态交互理解企业品牌调性和需求,后端整合各种AI模型能力,直接交付成品视频 [6][26] - 目标是将传统营销视频制作成本降低十倍,交付速度提升百倍,使交付质量达到行业标准 [6][29][30] - 公司选择从“生产力信息”场景切入,优先服务营销人员、品牌方等有明确工作产出目标的用户,因其ROI可量化 [28][29] - 产品开发初期将首先面向海外市场推出,后续计划拓展至教育、办公等更多垂直领域 [7][57] 创始人背景与创业契机 - 创始人廖谦拥有丰富的AIGC产品经验,曾在腾讯云打造DAU千万的换脸产品,在字节跳动从0到1推出火山引擎Top1流量产品“智能创作云”,并主导剪映出海项目Pippit达到月活百万 [1][2][10][13] - 2024年初加入多模态初创公司生数科技,带领Vidu团队实现从0到1的冷启动,达到数千万全球用户和数千万美金收入 [2][15] - 创业想法源于在生数科技期间处理上千单企业级AIGC定制需求时发现的明确痛点:企业用户不需要复杂AI工具,而是需要能直接交付成片的解决方案 [5][16][18] - 公司于2024年8月成立,并在半个月内迅速敲定了由HT investment和BV百度风投投资的数百万美金首轮融资 [2] 行业趋势与技术拐点判断 - 多模态领域的ChatGPT时刻即将来临,底层模型技术处在迅猛变化中,但落地鸿沟依然存在 [2][6] - 2024年被认为是技术拐点,关键因素包括多模态模型效果与成本达到可商业化水平,生成视频成本相比传统制作可降低到十分之一 [19][20] - 模型推理能力的突破(如ChatGPT o1发布)使得大模型落地千行百业成为一个优化程度问题,而非行与不行的问题 [20] - 多模态模型的一致性得到显著提升,为商业化应用扫除了主要瓶颈 [20][21] - 中国在AI视频领域具有独特优势,短视频生态领先全球1-2年,对视频生态的落地探索和理解更深 [7][52] 竞争格局与战略选择 - 公司战略定位为“造船的人”,即应用层开发者,其能力会随着底层模型能力的上升而增强,Sora等基础模型的进步对公司是利好 [4][35][36][37] - 明确选择不做通用Agent,而是聚焦垂直场景,认为移动互联网早期的发展规律(垂直应用胜出)同样适用于AI Agent领域 [7][27][57] - 面对Sora等强大基础模型的发布,公司的策略是建立快速反应机制,产品需每周迭代一次,以应对基础模型每两三个月一次的快速迭代 [64] - 在创业心态上强调要更冒险、更激进,去做尚未被验证过的可能性,而非追求确定性 [5][65][68] 产品交互与交付模式 - 产品交互设计为多模态,不仅限于文字输入,会通过生成参考图等方式更精准地理解用户偏好 [32] - 交付模式是保证交付一个达到行业特定质量标准的、内容本身合格的交付物,但不保证其发布后带来的市场“效果”[59][60] - 对于中小客户,其业务流程可以接受AI完全接管;但对于大客户,仍需要真人参与对接 [33] - 未来信息表达将进入“生成时代”,AI能主动理解、抓取、聚合信息,并为用户动态生成全新的、个性化的内容(如图文报告、播客)[56][62]