Workflow
Diffuse 2.0
icon
搜索文档
图生视频新玩法刷爆外网:图上画两笔就能动起来,终于告别文本提示
机器之心· 2025-08-19 10:43
公司概况 - Higgsfield AI成立于2023年10月,总部位于美国旧金山,专注于为内容创作者开发个性化AI视频工具,团队规模11-50人[36] - 2024年4月完成由Menlo Ventures领投的800万美元种子轮融资,资金用于视频生成工具和社交媒体创作平台开发[36] - 创始人兼CEO Alex Mashrabov曾任Snap公司生成式AI负责人,主导开发MyAI聊天机器人、AR特效等产品[36][37] 核心技术 - 主打产品Diffuse系列支持用户上传单张照片或输入文本生成个性化视频内容,可将用户自然插入场景中[39] - 2025年3月推出视频生成模型DoP I2V-01-preview,具备专业级镜头控制、世界建模和电影级叙事能力[40] - 正在构建世界模型技术,旨在实现顶级视频生成体验与细粒度控制[43] 核心功能 - Draw-to-Video功能:用户上传静态图像后绘制图形/箭头/文字,AI自动生成电影级动态视频,4天内在X平台获530万浏览量[5][17][21] - Product-to-Video功能:拖拽产品图片到人物照片上即可生成广告视频,支持多模型集成,累计160万次浏览[6][26][30] - 每周迭代新功能:包括4K/8K画质提升(UPSCALE)、多参考图角色一致性优化(支持4张输入)、动作风格迁移(STEAL)等[8][9][10] 市场表现 - 功能发布频率极高,平均每周推出新模板或功能升级[8] - 积极整合热门模型如GPT-5、MiniMax、Veo 3等,提供多模型统一创作界面[11][30] - 曾与Meta进行收购谈判但未达成,显示头部科技公司对其技术认可[3][36] 用户反馈 - 网友实测显示Draw-to-Video可快速生成传统需高成本制作的电影场景,如控制镜头运动、物体凭空生成等[16][23] - 用户总结优化技巧:使用透明PNG格式素材、分步骤标注动作顺序、免费版调试后升级分辨率等策略[26] - Product-to-Video被用于创意广告制作,如金刚狼推广可口可乐等案例,支持特效叠加与快速渲染[28][32][33]