AI视频生成

搜索文档
不会剪辑?一句话生成完整可编辑的视频:Medeo 带你看视频生成的未来
歸藏的AI工具箱· 2025-05-16 16:11
Medeo产品核心功能 - 提供AI视频生成服务,可根据用户提供的素材或口播稿自动剪辑并生成完整视频[1][2] - 支持从零开始生成视频,仅需一个点子或提示词即可自动生成科普类视频内容[3][4] - 具备幼儿教育视频生成能力,可制作风格可爱的教学视频[6][7] - 支持小说视频化,能自动提取内容场景并生成连贯视频片段[8] - 适用于营销场景,可快速生成高质量产品广告视频[9][10] 产品技术特点 - 生成速度快,仅需几分钟即可完成视频制作[4] - 支持两种素材处理模式:Fall AI(全生成)和Smart Match(素材匹配)[11] - 可自动提取网页链接中的文字和素材进行视频转换[11] - 允许用户上传自定义图片、视频或文稿进行匹配[11] - 提供精准编辑功能,可单独修改口播内容或替换分镜素材[13][14] 应用场景优势 - 资讯类内容制作时可确保视频与主题高度相关[12] - 教育领域可快速生成专业教学视频[6] - 营销领域能大幅降低广告制作成本至几元级别[9] - 极大降低视频制作门槛,使非专业人士也能产出高质量内容[16] 用户体验设计 - 操作界面简单直观,仅需输入文字要求即可生成视频[11] - 支持高级设置如背景音乐、语音音色、视频时长等参数调整[11] - 提供"Only Use Provide media"选项确保素材准确性[12] - 导出便捷,会员可去除水印[15] 行业影响 - 突破传统视频制作技术门槛,释放个人创意潜力[16] - 可能改变内容创作和广告制作行业的成本结构[9] - 预示AI在内容分发和筛选领域的发展方向[16]
速递|获a16z3200万美元投资,Synthesia与Runway的"中间路线":Hedra生成长对话AI角色
Z Potentials· 2025-05-16 11:46
图片来源: Hedra 人们正利用 AI 视频生成工具参与一场意想不到的病毒式潮流:以 AI 生成会说话婴儿为主角的播客 节目。而帮助创作者实现这一点的公司之一便是 Hedra 。 他说道: '我当时想,如果能在视频生成与 3D 角色交叉领域做些尝试,实现长对话场景和更强的可 控性会怎样' 迈克尔 ·林格尔巴赫, HEDRA 创始人兼首席执行官 图片来源: Hedra Hedra 于 2024 年 6 月推出首款视频模型后迅速获得投资者青睐,从 Index Ventures 、 Abstract Ventures 和 a16z speedrun 处获得 1000 万美元种子轮融资。今年早些时候,亚马逊也通过其风险投资 部门 Alexa Fund 支持了该公司 。 林格尔巴赫指出, 3 月推出的 Character-3 模型是一个重要转折点 (就在公司与 a16z 签署投资条款 清单后不久),目前正推动大量用户增长。 这家 2023 年成立的初创公司,提供基于网络的视频生成与编辑套件, 其核心是自研的 Character-3 模型。 该技术允许用户以 AI 生成角色为视频焦点,并实现跨图像与音频的风格迁移。 人 ...
AI视频生成的Vidu样本:攻坚视频生成核心难题,引领内容生产力变革
锦秋集· 2025-05-06 22:36
多模态 AI 技术正以前所未有的速度重塑内容创作领域。 从2024年 OpenAI Sora 点燃全球想象,到近期,吉卜力风图片席卷全网。这个一度被视为 AI 终极想象力边界 的领域,正以前所未有的速度冲破技术壁垒。 视频生成作为技术难度与应用潜力并存的关键环节,也吸引了全球范围内的广泛关注和投入。 在追求更长时长、更高分辨率、更惊艳视觉效果的同时,内容一致性难以保证、生成过程可控性不足、以及高 昂的计算成本等核心挑战,依然限制了其在专业领域、大众娱乐领域的规模化应用。 在此背景下,由生数科技研发的视频生成模型 Vidu,展现出一条差异化的发展路径。在多模态视频生成技术 的早期发展阶段,通过集中资源解决专业用户的核心痛点,如一致性、可控性、效率,建立起差异化优势和用 户基础,尤其是在动画等特定领域形成壁垒。 根据生数科技廖谦在近期访谈中的阐述,Vidu 的核心定位是"全球领先的AI内容生产平台 ",这也意味着 ,除 了追求基础生成能力的提升,也需要优先解决实际工作流中的关键痛点。 比如,生数科技敏锐的发现,纯粹的文生视频因为难以控制一致性,应用者并不多 。而 Vidu 推出的"参考 生"(Reference ...
清华特奖得主团队视频生成AI一夜刷屏!100%开源+61页技术报告,还能无限扩展生成,网友:游戏规则改变者
量子位· 2025-04-22 13:06
梦晨 西风 发自 凹非寺 量子位 | 公众号 QbitAI 新国产AI视频生成模型横空出世,一夜间全网刷屏。 Magi-1 ,首个实现顶级画质输出的 自回归视频生成模型 , 模型权重、代码100%开源 。 整整61页的技术报告中还详细介绍了创新的注意力改进和推理基础设施设计,给人一种视频版DeepSeek的感觉。 Magi-1将视频生成卷到了新高度,大片级品质直接锁住大家的眼球。 其主打能力,一是 无限长度 扩展 ,实现跨时间的无缝连贯叙事: 二是能将 生成时长控制精确到每一"秒 " : 另外,Magi-1对物理规律也有更深度的理解, Physics-IQ基准测试56.02% ,大幅领先一众顶流。 现在看这张图,Sora的时代是真的过去了。 此 次开源了从24B到4.5B参数的一系列模型,最低配置一块4090就能跑。 这匹"黑马"来自中国团队 S and.ai ,中文名听着有点萌叫 三呆科技 ,实力却不容小觑。 创始人 曹 越 ,清华特奖得主、光年之外联合创始人。 目前大伙儿可在官网免费试玩Magi-1。GitHub更是一晚过后狂揽500+Star。 | Model | Link | Recommend Ma ...
ZPedia丨诺兰看了沉默,王家卫看了流泪:全球首款无限时长AI视频模型横空出世
Z Finance· 2025-04-21 09:56
AI视频生成行业现状 - 当前AI视频生成工具普遍存在单视频时长限制在10秒左右、运镜效果差、角色情绪表达缺失等技术瓶颈,难以实现连贯叙事[1] - 行业陷入闭源垄断与技术停滞困境,多数产品停留在机械执行指令阶段,无法理解影视导演语言[3] - 主流模型在视觉质量、运动动态效果和高分辨率之间难以平衡,导致专业级长视频生成受阻[10] 昆仑万维Skyreels技术突破 - 推出全球首个支持无限时长的开源电影级生成模型Skyreels-V2,突破传统10秒时长限制,实现好莱坞级别"一镜到底"[6][10] - 采用扩散强迫框架将搜索空间从O(1e48)降至O(1e32),配合强化学习解决动态扭曲问题,实现物理规律级运动流畅性[12] - 构建亿级影视专业数据集,通过四阶段渐进式训练策略(概念平衡微调→运动强化学习→扩散强迫训练→高质量微调)提升性能[14] - 内置视频理解引擎SkyCaptioner-V1,能解析"王家卫风格逆光长镜头"等专业导演指令,实现情绪层次化表达[7][9] 核心技术指标表现 - 在人类评估中综合得分3.14分,指令遵循(3.15分)和一致性(3.35分)显著领先Runway-Gen3 Alpha(2.53分)等竞品[18] - 自动化测试总分83.9%,质量分84.7%,超越Hunyuan Video-13B(82.7%)和Wan2.1-14B(83.7%)[19] - 支持720p以上电影级画质输出,解决传统AI视频"塑料感"问题,实现发丝飘动、动态模糊等细节呈现[8] 商业化应用场景 - 小说创作者可将文本直接转化为分镜短剧,无需专业影视制作团队[20] - 品牌方可快速生成"赛博朋克汽车奔跑特写"等广告素材,缩短传统2-3周制作周期至即时输出[22] - 自媒体博主实现"AI日更",单人单日完成原需5人团队的工作量,自动生成字幕/封面等配套内容[23] - 提供"剧情实验室"功能,通过多版本镜头语言测试优化影视表达效果[24] 行业影响与定位 - 首次将影视工业化体系封装为可调用的模型接口,使电影制作门槛从专业团队降至个人创作者[25] - 开创AI视频生成从"工具时代"到"创作时代"的转折,推动行业竞争焦点从技术参数转向艺术表达[3] - 作为全球首个开源电影级解决方案,打破闭源垄断格局,重新定义视频生成技术标准[3][25]
速递|AI视频Runway发布Gen-4,低成本生成720p微电影,影视业是否会买账?
Z Potentials· 2025-04-01 11:49
图片来源: Runway Runway AI 的一款新人工智能模型旨在让用户创建具有一致角色、物体和背景的视频, 这标志着在利用计算机更快速、低成本制作电影的竞赛中可能取得 了重大进展。 Runway 计划在周一向付费用户发布 Gen-4 ,并计划在本周晚些时候添加一个功能,旨在使软件在生成视频场景时更加一致。 公司表示,用户将能够生成 720p 分辨率的五秒和十秒长的剪辑。 本次 Runway 的新 AI 模型 挑战 OpenAI 的 Sora ,将为用户提供更连贯的视频。 这家总部位于纽约的初创公司在 2023 年初推出了一种模型,能够根据书面提示生成略显卡顿的三秒剪辑,从而引发了对 AI 视频生成器的热潮,例如"沙漠 景观的无人机镜头"。两年后,竞争显著加剧,包括 OpenAI 和 Pika 在内的科技公司纷纷推出类似服务。现在, Runway 正努力保持在竞争的前列。 " "我们现在的目标是,确保我们正在开发和构建的东西,达到好莱坞和实际电影制作人及专业人士所要求的标准和质量。" Runway 的联合创始人兼CEO Cris Valenzuela(克里斯·瓦伦苏埃拉)在一次采访中说道。"这感觉像是一个 ...
AI视频鹿影科技将被MiniMax收购,AI创业进入“淘汰赛”
创业邦· 2025-03-15 08:51
详情请戳视频 以上就是本期全部内容,如果您想了解更多 最新 企业 动态, 欢迎登录 睿兽分析 查看,解锁 赛道图 谱 以及 行业报告 。 据报道,上海大模型独角兽MiniMax将收购深圳AI视频生成创企鹿影科技(Avolution.ai),双方目 前已经敲定收购意向,相关流程还在持续进行。 2024年,鹿影科技在天使轮融资时估值水平没有超过2000万美金,约在1亿人民币左右。知情人士 称,去年以来,鹿影科技一直在持续寻求第二轮融资,但过程中并没有很顺利,团队本身在Ai视频领 域方面有一定的经验,最终选择和MiniMax合作。 首家卖身的AI视频创企出现!融资碰壁,CTO出走。 ...
生数科技加速商业化:原字节跳动AI大将、火山引擎高管骆怡航加盟出任CEO
IPO早知道· 2025-03-13 13:06
AI视频生成赛道已到了技术成熟和商业化落地的关键时刻。 本文为IPO早知道原创 作者|Stone Jin 微信公众号|ipozaozhidao 据IPO早知道消息,原字节跳动AI大将、火山引擎高管骆怡航于近日加入生数科技,担任CEO一职, 全面负责公司研发、产品、商业化及团队管理工作。 图 生数 骆怡航博士毕业于清华大学自动化系,深耕云计算及AI领域十余年,拥有深厚的技术背景、产业生态 理解和成熟的商业化经验,还具有丰富的海外拓展经历。 在加入生数科技之前,他担任字节跳动火 山引擎AI应用产品线一号位,汇报火山引擎总裁,全权负责产品线的战略、产品和商业化。 据悉, 该条产品线由骆怡航博士从 0组建,涵盖多个传统AI、大模型及大模型应用产品,管理规模数百人, 服务全球多个行业及国家的近万家客户,该产品线当前是火山引擎的重点产品线之一,也是大模型业 务的主力产品线。更早期,他在字节跳动负责AI解决方案与商业合作,曾参与到字节跳动早期的AI中 台规划与建设,见证并推动了字节跳动在AI领域的发展。 事实上,从整个行业发展来说,骆怡航选择加入生数科技,某种程度上也意味着AI视频生成赛道已到 了技术成熟和商业化落地的关键 ...
速递|OpenAI 计划将Sora接入ChatGPT,Sora的生成能力或扩展到图像
Z Potentials· 2025-03-01 11:53
Sora集成到ChatGPT计划 - OpenAI计划将AI视频生成工具Sora直接集成到ChatGPT中,以扩大产品协同效应 [2][3] - 集成后的Sora版本可能无法提供与独立Web应用相同的视频编辑控制功能 [3] - 该举措旨在通过视频生成能力吸引用户升级ChatGPT高级订阅 [3] Sora产品发展路线 - Sora当前仅通过独立Web应用提供,支持生成最长20秒的电影风格视频片段 [2] - 公司正在开发Sora Turbo模型的新版本以增强现有功能 [6] - 团队积极招募移动工程师,计划未来推出独立的Sora移动应用程序 [4] 多模态能力扩展 - OpenAI研发基于Sora的AI图像生成器,可能比现有DALL-E 3模型产生更真实的照片 [5] - 公司致力于扩展Sora的内容创作范围,包括视频和图像生成能力的结合 [3][5] 产品战略考量 - 初期将Sora作为独立应用推出是为了保持ChatGPT的界面简洁性 [4] - 已逐步完善Sora网络体验,增加社区视频浏览功能以提升用户参与度 [4]
对话 PixVerse 王长虎:AI 视频生成可能通向新平台,Sora 只领先几个月
晚点LatePost· 2024-04-30 18:25
行业竞争格局 - Sora发布后被视为视频生成领域的领先者,其他模型如Runway、Pika、SVD、PixVerse等被比喻为"膜拜者"[4] - PixVerse是中国唯一进入全球视频生成领域第一梯队的产品,月访问量达140万,与Pika(200万)、Runway(600万)同属全球top3[6][10] - 国内所有公司视频生成产品访问量总和仅为PixVerse的三分之一[10] 技术发展现状 - Sora能生成60秒连贯视频,但实际用户需求更多是15秒以内的短视频[9] - 视频生成的ChatGPT时刻定义为普通用户能实时生成高质量视频,目前仍处于GPT-2到GPT-3阶段[9][13] - 当前视频生成模型普遍只能生成4-7秒视频,PixVerse可生成4秒,Runway通过拼接可达18秒[17][18] - 视频生成面临手指、尾巴等细节问题,可通过3D建模信息辅助优化[19] 公司战略与优势 - 公司坚持视频生成方向,认为视频内容最接近用户,团队有字节跳动视频AI技术积累[14][15] - 采用差异化策略,用更少资源(百卡级)达到与Pika、Runway同等水平[15][22] - 新融资将支持升级至千卡级训练,认为达不到此规模的公司将失去竞争力[22] - 同时布局模型层和应用层,目标直接服务C端用户,探索新内容平台可能性[27][28][29] 市场机会判断 - 大平台对AIGC内容持谨慎态度,这为创业公司创造了机会[9][29] - AI视频生成可能催生新内容平台,而非简单融入现有平台[29][30][32] - 全球市场同步推进,认为AI时代产品应面向全球[33][34] - 当前聚焦提升生成能力而非用户增长,商业化将基于ROI考量[36] 团队与资源 - 研发人员占比超70%,保持精简团队规模[38] - 创始人兼具学术和工业背景,有万卡GPU使用经验和国民级产品建设经历[41] - 新融资来自蚂蚁集团,金额达上亿元人民币[7]