多模态Agent
搜索文档
剪映前AI产品负责人创业多模态Agent,做懂上下文的007乙方,成立半月融资数百万美元
搜狐财经· 2025-10-29 14:27
公司概况与融资 - 公司名称为极致上下文(Apex Context),由前生数科技产品副总裁廖谦于2024年8月底创立 [1] - 公司成立仅半个月即获得硅谷美元基金HT Investment与BV百度风投数百万美元投资 [1] 创始人背景 - 创始人廖谦拥有计算机视觉技术背景,职业经历覆盖算法、产品、商业化完整路径 [3][11] - 曾任职于腾讯天美工作室、腾讯云、字节跳动火山引擎及剪映、生数科技等公司,具备大厂与0到1创业经验 [3][11][13] - 在字节跳动期间孵化海外AI内容生产与分发平台Pippit,月活已超百万 [13] 产品战略与定位 - 首要目标是打造面向营销场景的多模态AI Agent,提供从创意策划、脚本生成到视频成片的端到端自动化服务 [3][5][6] - 选择营销场景因其需求明确、效果可量化、付费意愿强,最能体现AI真实价值 [3] - 商业模式采用“预期思维”或“结果导向”,为用户提供明确价格与质量标准 [5] - 中长期规划是构建AI时代的信息表达系统,让任何人能实现个性化自我表达 [6] 技术理念与行业判断 - 公司命名源于对AI下一阶段发展的理解:AI应能深度理解并呼应用户上下文,使生成内容更精准 [1] - 判断下一阶段核心竞争力在于帮助人、品牌及组织更好地表达自己 [6] - 当前技术周期进入拐点,语义理解、镜头语言、画面真实度全面提升,技术已达“可用”临界点 [8][9] - 在模型层面,“一致性”是绝对可预见的重点提升方向 [18] 竞争格局与市场机会 - 认为当前时代没有传统意义上的护城河,巨头互殴为创业公司创造了进攻窗口期 [14][15] - Sora 2等模型的发布迫使抖音、TikTok等巨头防守核心业务,从而减缓其他方向创新 [14][15] - 公司优势在于对用户和场景的理解以及团队的热爱 [16]
剪映前AI产品负责人创业多模态Agent,做懂上下文的007乙方,成立半月融资数百万美元
量子位· 2025-10-29 10:39
公司概况与融资 - 创始人廖谦于2024年8月底成立新公司“极致上下文”,公司成立仅半个月即获得硅谷美元基金HT Investment与BV百度风投的数百万美元投资 [1][2][4][10] - 公司名称源于对AI发展的理解,即AI应能深度理解并呼应用户上下文,目标是构建“更多的Context,更少的Control”的公司文化 [5][6] 创始人背景 - 创始人廖谦拥有计算机视觉技术背景,职业经历涵盖算法、产品、商业化完整路径,以及国内与海外市场、大厂与0到1创业经验 [8][9][27] - 曾任职于腾讯天美游戏工作室、腾讯云、字节跳动火山引擎,并作为发起人孵化剪映海项目Pippit(月活超百万),后加入生数科技担任产品副总裁,主导Vidu产品并带领超百人团队 [28][29][30][31][32][33] 产品战略与目标 - 公司首要目标是打造面向营销场景的多模态Agent,提供从创意、脚本到视频生成、编辑的端到端能力,因营销场景需求明确、效果可量化、付费意愿强 [3][11][12][13][18] - 中长期规划是构建AI时代的信息表达系统,让任何人(品牌或个体)实现个性化自我表达,未来能力可拓展至教育、生活方式、娱乐等领域 [19][20][21][22] 商业模式与用户定位 - 采用“预期思维”或“结果导向”的Agent模式,用户无需学习技能,Agent像专业Agency一样理解用户诉求,全流程自动完成内容生成 [14][15] - 目标用户是“大概知道自己要什么,但不需要懂怎么做的人”,产品核心价值在于持续降低用户的使用成本、理解成本与价格成本 [16] 行业机遇与技术判断 - 当前技术周期进入拐点,语义理解、镜头语言、画面真实度全面提升,Google Veo3和Sora 2等技术已达“可用”临界点,重点是将能力转化为真实产品价值 [23][24][25] - 巨头互殴(如Sora 2侵蚀抖音、TikTok核心业务)为初创公司提供进攻窗口期,可定义新内容形态、协作方式及信息分发逻辑 [36][37][38][39] - AI视频领域,“一致性”是绝对可预见的提升方向,包括画面角色一致性、音色一致性及画面美学(构图、光影等)待解决 [44]
全球超一半风投涌向AI!启明创投发布2025年AI十大展望
证券时报网· 2025-07-28 15:38
AI投资趋势 - 2025年上半年AI初创企业吸引全球53%风险投资基金 [1] - 启明创投累计投资100余个AI项目 覆盖AI产业全链条 [6] 技术发展前景 - 具身智能机器人将在拣选/搬运/组装场景实现规模化部署 构建"模型-本体-场景数据"闭环飞轮 [1] - 通用视频模型有望在12-24个月内出现 处理视频模态生成/推理与任务理解 [1] - 多模态生成模型处于高速发展期 生数科技提出"参考生视频" 阶跃星辰推出多模态推理模型Step3 [1] - 200万Token上下文窗口将成为顶级AI模型标配 [4] - Token消耗量呈爆发式增长 Google/豆包分别激增48倍/137倍 [4] AI应用场景拓展 - AI正深度嵌入日常生活和情感世界 2025年疗愈和陪伴成为最大应用场景 [5] - 垂直场景AI应用潜力巨大 初创公司以"Go Narrow and Deep"策略形成差异化竞争 [5] - AI BPO模式将在12-24个月实现商业化突破 采用"按结果付费"方式在金融/客服/营销/电商标准化行业扩张 [6] - AI交互范式转移加速 手机屏幕依赖减弱推动AI原生超级应用诞生 [6] Agent发展路径 - Agent形态将从"工具辅助"走向"任务承接" 首批"AI员工"将参与客户服务/销售/运营/研发核心流程 [4] - 多模态Agent将融合视觉/语音/传感器输入 在医疗/金融/法律行业率先突破 [4] 基础设施创新 - AI芯片领域将出现更多"国设国造"GPU批量交付 [6] - 3D DRAM堆叠/通算融合创新的新一代AI云端芯片崭露头角 [6] - Token消耗量有望提高1-2个数量级 集群推理优化/终端推理优化/软硬协同推理优化成为降低成本核心技术 [6]