营销多模态Agent - 财报，业绩电话会，研报，新闻

营销多模态Agent

搜索文档

前字节剪映AI产品负责人创业，获硅谷基金及BV百度风投投资，要做营销多模态Agent

36氪· 2025-10-29 13:08

公司核心业务与产品定位 - 公司“极致上下文”致力于打造一个新时代的“AI表达系统”，其首款产品是一个营销Agent，而非视频生成工具 [6][7][53] - 产品定位为端到端的解决方案，前端通过多模态交互理解企业品牌调性和需求，后端整合各种AI模型能力，直接交付成品视频 [6][26] - 目标是将传统营销视频制作成本降低十倍，交付速度提升百倍，使交付质量达到行业标准 [6][29][30] - 公司选择从“生产力信息”场景切入，优先服务营销人员、品牌方等有明确工作产出目标的用户，因其ROI可量化 [28][29] - 产品开发初期将首先面向海外市场推出，后续计划拓展至教育、办公等更多垂直领域 [7][57] 创始人背景与创业契机 - 创始人廖谦拥有丰富的AIGC产品经验，曾在腾讯云打造DAU千万的换脸产品，在字节跳动从0到1推出火山引擎Top1流量产品“智能创作云”，并主导剪映出海项目Pippit达到月活百万 [1][2][10][13] - 2024年初加入多模态初创公司生数科技，带领Vidu团队实现从0到1的冷启动，达到数千万全球用户和数千万美金收入 [2][15] - 创业想法源于在生数科技期间处理上千单企业级AIGC定制需求时发现的明确痛点：企业用户不需要复杂AI工具，而是需要能直接交付成片的解决方案 [5][16][18] - 公司于2024年8月成立，并在半个月内迅速敲定了由HT investment和BV百度风投投资的数百万美金首轮融资 [2] 行业趋势与技术拐点判断 - 多模态领域的ChatGPT时刻即将来临，底层模型技术处在迅猛变化中，但落地鸿沟依然存在 [2][6] - 2024年被认为是技术拐点，关键因素包括多模态模型效果与成本达到可商业化水平，生成视频成本相比传统制作可降低到十分之一 [19][20] - 模型推理能力的突破（如ChatGPT o1发布）使得大模型落地千行百业成为一个优化程度问题，而非行与不行的问题 [20] - 多模态模型的一致性得到显著提升，为商业化应用扫除了主要瓶颈 [20][21] - 中国在AI视频领域具有独特优势，短视频生态领先全球1-2年，对视频生态的落地探索和理解更深 [7][52] 竞争格局与战略选择 - 公司战略定位为“造船的人”，即应用层开发者，其能力会随着底层模型能力的上升而增强，Sora等基础模型的进步对公司是利好 [4][35][36][37] - 明确选择不做通用Agent，而是聚焦垂直场景，认为移动互联网早期的发展规律（垂直应用胜出）同样适用于AI Agent领域 [7][27][57] - 面对Sora等强大基础模型的发布，公司的策略是建立快速反应机制，产品需每周迭代一次，以应对基础模型每两三个月一次的快速迭代 [64] - 在创业心态上强调要更冒险、更激进，去做尚未被验证过的可能性，而非追求确定性 [5][65][68] 产品交互与交付模式 - 产品交互设计为多模态，不仅限于文字输入，会通过生成参考图等方式更精准地理解用户偏好 [32] - 交付模式是保证交付一个达到行业特定质量标准的、内容本身合格的交付物，但不保证其发布后带来的市场“效果”[59][60] - 对于中小客户，其业务流程可以接受AI完全接管；但对于大客户，仍需要真人参与对接 [33] - 未来信息表达将进入“生成时代”，AI能主动理解、抓取、聚合信息，并为用户动态生成全新的、个性化的内容（如图文报告、播客）[56][62]

Artificial Intelligence

Artificial Intelligence

Sora

智能创作云