vivago.ai - 财报，业绩电话会，研报，新闻

vivago.ai

搜索文档

36氪· 2026-02-06 10:55

行业现象：AI视频生成应用因特定题材爆发而集体增长 - 2026年元旦前后，多款AI视频生成App因宠物/婴儿跳舞视频题材的爆发而登上各国下载榜单[1] - 社交媒体风潮始于2023年12月21日，相关婴儿舞蹈视频获得260万点赞，多条宠物舞蹈视频点赞量在1万至10万之间[3] - 流量驱动下，多款产品迅速跟进，例如AI Video和PoseAI曾冲上美国iOS下载总榜Top10[3] 公司表现：出海AI公司在风潮中取得显著增长 - 出海AI视频生成公司可灵（Kling）因其Motion Control功能，在2023年12月1日至2024年1月31日期间完成了千万次下载[4] - 出海初创公司智象未来旗下的AI视频App vivago.ai，在近60天（12月1日至1月31日）内获得了1121万全球双端下载量[4] - 在2024年1月中下旬，vivago.ai的下载量甚至一度超过了可灵[4] - 截至2024年2月1日，vivago.ai的日下载量仍保持在30万以上[5] 产品策略：基于趋势预判与快速技术迭代 - 智象未来团队在社媒热潮掀起前，预判趋势并提前优化自研模型，于元旦前上线了自研的“3D特效”功能[5] - “3D特效”项目起始于2023年12月8日，团队发现其3D原生架构的效果远优于主流的2D架构解决方案[6] - 团队通过小规模投放进行AB测试，数据证实动物（尤其是猫咪）舞蹈的互动率和转发率具有极大优势[7] - 团队在确定宠物舞蹈方向后，迅速开发优化，赶在元旦前上线功能，此时距离社媒风潮启动还有一周多时间[7] 增长策略：利用社交媒体情绪与链式传播 - 公司在TikTok上采用“制造情绪对立+链式传播”的打法，利用“猫狗派系之争”引发用户讨论与参与[9] - 优秀素材的互动率能达到20%左右，优于行业平均水平[9] - 传播策略要求达人在视频结束前“@”下一位达人，形成接力，利用算法和用户好奇心延长话题热度与曝光[11] - 该策略是“Tag Challenge”的变种，利用TikTok的协同过滤算法，使关联账号形成闭环，被算法判定为社区共识热点，从而获得更大流量[11] 技术优势：自研3D架构实现差异化效果 - 公司自研模型采用“端到端原生3D架构”，其生成的舞蹈视频效果优于市面上主流的“2D姿态驱动方案”[14] - 3D解决方案在训练时即教会模型主体在三维空间中的位置、朝向等关系，确保动作合理，并能完成推拉、摇移等镜头动作[15] - 技术核心包括“动作脱壳”和“自适应迁移模型”，能将抽象动作逻辑匹配给不同动物，实现丝滑自然的舞步[15] - 为训练模型，团队全网筛选并分析了数万条高质量舞蹈参考视频，并进行人工逐帧分析[15] 运营与迭代：快速响应与高效执行 - 团队在15天内快速上线功能，并在训练期间累计完成超200组核心参数的对比测试[16] - 在效果验证阶段，经历了上千次视频生成与迭代优化，以解决动作卡顿、肢体穿模等问题，最终实现多主体同步自然舞蹈[16] - 第一波热潮引发后，团队在元旦假期连续奋战，处理了高峰时段数十万个排队任务，应对了10余次高优先级告警，并完成了10次以上的扩容[16] - 为处理高并发，团队引入FP8量化、多卡分布式并行推理等技术，将推理耗时从2分钟降至1分钟以内，并通过多种优化将系统整体调度能力提升上百倍[16] 未来规划：功能升级与社区建设 - 2024年2月5日，vivago.ai上线了“多主体舞蹈”功能，计划将第二波增长的核心题材转向“人宠共舞”和“多宠物共舞”，从“舞蹈”引向“关系”[12] - 公司计划让第一波增长中效果较好的达人在第二波增长中“返场”，通过“玩法升级+核心达人返场”驱动用户从“新鲜感”向“社区粘性”转变[12] - 公司团队表示，未来希望持续保持增长，避免成为用户玩完即走的“网红产品”[17]

营收过亿，这个多模态生成式AI黑马开启新一程

36氪· 2026-01-20 16:38

文章核心观点 - 中美AIGC企业发展路径出现分化 OpenAI的Sora面临成本高与用户留存挑战而中国公司智象未来在商业化上实现全面爆发展现出巨大潜力 [1] - 智象未来凭借自研的先进多模态大模型架构、清晰的商业化路径和广泛的产业应用在多模态生成式AI赛道中脱颖而出成为兼具技术实力与产业化落地能力的代表企业 [2][13] 公司概况与市场地位 - 公司专注于视觉多模态生成式AI 2025年全年营收已超过1亿元人民币 [1][13] - 旗下C端产品vivago.ai在2025年1月新增近千万用户在全球100多个国家和地区进入Google Play“视频播放与编辑”类别榜前10 [1] - 公司服务已覆盖全球超2000万个人用户和超4万企业用户 [9] 技术与产品创新 - 公司自研超百亿参数大模型采用全球首创的扩散自回归架构在生成质量与效率上找到平衡 [1] - 2025年4月开源图像生成大模型HiDream-I1与交互编辑模型HiDream-E1 开源24小时内登顶国际权威AI测评榜单Artificial Analysis 并在图像质量、语义理解、艺术表现三大维度刷新行业纪录 [1][4] - 在视频生成领域通过Sparse DiT架构在生成效果和运行速度间找到优异平衡点并通过对抗蒸馏技术增强画面细节和美感 [6][7] - 公司最早研发生成和理解双模型并规划理解生成一体化被视为通往物理世界认知的最佳路径 [6] - 正在研发新一代具备多模态推理驱动和无限记忆的多模态生成架构旨在提升模型推理能力与多任务横向扩展能力 [14] 商业化路径与商业模式演进 - 公司创始人认为多模态比纯语言模型有更广阔的商业化空间当前全球AIGC收入的50%-60%来自图片和视频相关应用 [3] - 公司创立早期形成“1+3+N”布局：一个核心多模态大模型驱动创作工具平台、互动营销内容工具和一站式视频创作Agent三大产品 [9] - 商业模式持续演进：2023年为MaaS（模型即服务） 2024年为SaaS（软件即服务） 2025年升级为RaaS（结果即服务）以用户价值为导向主要赚取客户GMV提升后的分佣 [13][14] - 公司拥有国内最全的多模态版权语料、数十万小时版权视频素材以及上万个授权IP 涵盖国内70%影视数据并已形成上亿条AIGC二创素材在影视、文旅、营销等场景广泛应用 [10] 融资情况与资本认可 - 2024年完成数亿元人民币A轮融资由合肥产投集团领投安徽省人工智能母基金等参与 [10] - 2025年底获得京东集团作为战略投资方的加码 [10] - B轮融资已进入交割阶段融资金额达数亿元人民币下一轮TS（投资意向书）已提前获得老股东持续加持新股东包括产业资本、业务能深度合作的上市公司和知名投资机构 [2][11] - 资本看好公司从技术到落地的全链条能力以及其技术架构向更具通用性与认知深度的世界模型拓展的可能性 [10][11] 行业背景与市场前景 - 2025年被视为中国多模态生成式AI的爆发元年 [13] - 根据IDC数据全球生成式AI市场规模未来五年复合增长率预计高达63.8% 到2028年将达2842亿美元占AI总投资的35% [13] - 根据Fortune Business Insights数据 2024年AI视频生成的全球规模约6.2亿美元预计在2032年达到25.6亿美元 2025至2032年间的复合增速为20% [15] - 行业正意识到AI视频是能直接产生现金流的生产力工具在营销与特定内容领域AIGC已是主流选择未来在解决角色一致性和长时序连贯性问题后有望在影视、游戏等高端应用引爆市场 [15]

多模态生成式AI

AIGC

Artificial Intelligence

Artificial Intelligence

vivago.ai

HiDream - I1

HiDream - E1

智象未来团队荣膺ACM MM 2025最佳演示奖：重新定义对话式视觉创作

格隆汇· 2025-11-06 13:23

公司成就与行业认可 - 智象未来团队在第33届ACM国际多媒体会议(ACM MM 2025)上成功摘得最佳演示奖，成为中国首个获此殊荣的多模态生成式人工智能初创企业团队[1] - ACM国际多媒体会议由国际计算机学会主办，是全球多媒体领域最具权威性与影响力的学术盛会之一，其最佳演示奖具有极高含金量和行业认可度[2] - 公司还举办了Identity-Preserving Video Generation挑战赛，吸引了北京大学、上海交通大学、腾讯等国内外顶尖科研及企业团队参加[6] 核心技术优势 - 获奖的“灵感智能体”统一多模态智能体以革命性技术将复杂的视觉内容创作转化为直观的对话体验[2] - 该技术突破碎片化多模态技术工具的局限，在单一界面内无缝整合了文本生成图像、指令式图像编辑及文本/图像生成视频功能，有效解决了跨模态语义对齐的行业难题[2] - 核心技术基于170亿参数量的HiDream-I1模型，依托稀疏扩散Transformer结构与动态混合专家设计，在国际权威基准测试中表现优异[2] - 针对指令式图像编辑任务，团队通过上下文视觉条件优化HiDream-I1模型，实现精准的图像修改效果[2] 产品应用与市场影响 - 该智能体开创了可及性、交互式视觉叙事和多模态生成AI中协作内容创作的新方式，将生成和编辑融合于一个对话驱动的体验中[5] - 技术显著降低了高质量视觉内容创作的门槛，并缩短了迭代周期，实现从想法到优质产出的“一次会话”创意循环[5] - 该技术原型已成功迭代应用于公司旗舰产品vivago.ai的对话生成功能中，为用户提供更自然、个性化的多模态对话交互体验[5]

多模态生成式AI

人工智能

灵感智能体(Chat Generation)

vivago.ai

多模态生成式AI

人工智能

灵感智能体(Chat Generation)

vivago.ai