AI视频生成

搜索文档
AI视频生成告别默剧时代!谷歌Veo 3一步生成高质量音画大片,rap、电影、动画片都拿捏
量子位· 2025-05-21 14:31
谷歌Veo 3视频生成模型 - 谷歌推出最强视频生成模型Veo 3,能够从画面到对白完全由AI原生生成,支持各种影视风格[1][4] - Veo 3具备电影级音视频能力,用户可通过自然语言描述角色、场景,并指定对白和语气[4][5] - 模型已面向Google AI Ultra订阅用户开放,企业用户可通过Vertex AI平台调用[5] Veo 3的多样化应用 - 用户生成内容涵盖说唱、复古烹饪节目、洗脑神曲等,展示模型强大的创意表现力[6][7][8] - 模型可应用于教育场景,如生成古希腊数学家毕达哥拉斯的教学视频[9] - 支持营销场景,能够重复强调同一概念实现洗脑效果[10] Veo 3的技术特性 - 模型支持连续生成长视频,通过首尾帧功能可制作1分钟左右的连贯视频[13][14] - 音频生成能力突出,可模拟电影级音效和角色自白[14] Veo 2的升级功能 - Veo 2新增"参考视频"功能,用于保持视频风格统一和角色形象一致[16] - 其他升级包括相机控制、画面扩展、物体添加/移除等功能[18] - 新功能已在Flow工具中部分上线,完整版即将登陆Vertex AI平台[19]
诺瓦星云(301589) - 2025年5月20日投资者关系活动记录表
2025-05-20 20:05
产品应用与市场定位 - 公司聚焦视频显控核心算法研究及应用,产品包括显示控制系统、视频处理系统和基于云的信息发布与管理系统,可应用于庆典赛事、会议活动等领域,未提及可用于新能源汽车内显示屏 [2] - 智慧城市是公司产品应用重要场景之一,具体订单和业绩情况关注公司业绩公告 [4] 产品收入占比 - 2024 年 LED 显示控制系统收入实际占比 46.17% [3] - 2024 年售后服务收入占比不足 5% [3] - 2024 年视频处理系统占公司总营收比重为 40.94% [11] 产品技术与市场应对 - 面对 Mini/Micro LED 技术迭代,公司将跟踪 MLED 行业趋势,增强预研和研发投入巩固市场地位 [3] - 有针对 Micro LED 直显专用控制系统研发计划,具体信息关注官网和订阅号、服务号 [3] 服务与运营 - 通过完善服务网络、远程运维平台等提升服务效率,服务收入转型规划关注官网和订阅号、服务号 [3] - 屏老板是免费售前方案工具服务,登录注册为方便记录保存方案库,会分析采纳免费供大众使用建议 [5][6][7] 库存与供应链管理 - 2024 年存货周转率为 1.03 次,同比下降 12%,通过需求预测系统和“PO + Forecast 模式”优化采购和库存管理 [3] - 对同一类型芯片按国际和国产品牌布局供应商,与战略合作供应商联合开发关键器件,PCB 布局三家以上战略供应商并协商年度合作协议 [8] 行业趋势与市场规模 - 受宏观环境影响,国内市场有压力,海外市场预计增长良好,MLED 产业预计保持快速增长,LED 显示屏市场规模将扩大 [4] 应收账款情况 - 2024 年应收账款周转天数同比增加 5 天至 48 天,账龄 1 年以内应收账款占比 97.98%,回款情况良好 [3][7] - 2024 年应收账款坏账准备计提比例同比持平,账龄结构合理 [5] 财务指标与费用管控 - 2024 年毛利率为 55.25%,同比提升 3%,净利率保持稳定,通过费用管控实现盈利韧性,未来重视数字化建设降本增效 [7] - 2024 年海外收入占比 19.1%,财务费用实际为 -272.93%,实施全球化布局提供服务 [7] - 2024 年政府补助占净利润比例达 12%,主要为即征即退增值税,具有可持续性 [9] - 2024 年分红比例维持在 25%,货币资金占总资产比例由 12.69%提高到 18.11%,资本结构稳健 [9][10] - 2024 年资产负债率为 32.52%,同比下降约 16 个百分点,未来优化债务融资结构 [10] - 2024 年研发费用率为 16.47%,研发投入 5.40 亿元,高于行业可比公司,将保持高强度研发投入 [10][11] 客户与市场拓展 - 2024 年度前五名客户合计销售金额占年度销售总额比例为 27.20%,第一大客户占比为 8.66%,无大客户依赖风险,将拓展客户群体 [11] - 通过展会推广、峰会营销等提升品牌影响力,参与虚拟展会和线上技术研讨会拓展获客渠道 [8] 人才结构与创新 - 2024 年年末员工总数同比增长 12.73%,研发人员占比 41.17%,略有下滑因加强海外销售,未来强化研发团队建设 [10] 产品竞争与应对 - 面对行业竞对推出一体化解决方案,公司通过前瞻性技术布局、完善创新体系、优化服务应对产品同质化竞争,并购计划关注公告 [11] - 2024 年视频处理设备收入同比增长 25%,毛利率同比增长 2.99%,通过跟踪新技术、参股上游芯片厂商优化供应链提升溢价能力 [11] ESG 相关 - 公司重视 ESG 工作,践行节能环保措施和绿色办公理念 [12]
38岁创业卖小家电,女大佬一年赚1个亿,刚宣布退市;三十年老牌物流巨头停止运营,老板失联丨Going Global
创业邦· 2025-05-18 18:22
出海四小龙动态 - TikTok被欧盟指控违反《数字服务法》广告信息披露规定,可能面临全球年收入6%罚款(2024年广告收入预计236亿美元,罚款或达14.16亿美元)[5] - Temu或在美国恢复全托管模式,商家被要求备货应对潜在增量订单,但最终落地取决于关税政策[7] - SHEIN美国零售价下调13%(均价从6.38美元降至5.56美元),以应对关税调整后的销售下滑(七天内销售额同比降15%)[9][11] - 速卖通百亿补贴计划吸引安克创新旗下Eufy入驻,其割草机器人德国单周销售额破1万美元,平台园林工具类目GMV同比增50%(割草机器人增153%)[12][14] 大公司海外扩张 - 淘宝哈萨克斯坦站上线俄语版,首周70%新用户订单来自俄语用户,转化率提升47%[16][18] - 阿里国际站借90天关税窗口期加推美国大促,商家订单激增,平台登顶美国AppStore购物榜[19][21] - 美团Keeta计划5年内在巴西投入10亿美元(占2024年净利润20%),蜜雪冰城同期宣布巴西40亿人民币采购及建厂计划[24][26] - 沙县小吃沙特首店日营业额破5万元,全球门店覆盖79国[27][29] 关税与贸易政策影响 - 美国对华小额包裹关税降至30%(原120%),90天窗口期或延续至2025年底,刺激Temu/SHEIN补库存[31][32] - 日本拟取消1万日元以下进口商品消费税豁免,2023年小额进口量五年增5倍至1.7亿件[34] - 高盛预测中国出口将因关税暂缓爆火,美线集装箱运费半月内从2000美元/箱飙至2500美元[31] 行业投融资与并购 - 美国AI视频生成公司Hedra获a16z领投3200万美元A轮融资(估值2亿美元),聚焦多模态生成模型Character-3[43][45] - 电助力自行车厂商特宙斯完成5000万元Pre-A轮融资,欧洲线下门店将扩至100家[45][47] - DHL收购美国IDS Fulfillment以强化中小电商服务,年内第二笔北美电商并购[47][49] 企业运营变动 - 南洋国际物流集团因资金链断裂停止运营,拖欠供应商款项,行业受高关税及恶性竞争冲击[22][24] - 晨北科技从港交所退市(溢价33.3%),2024年营收6.5亿美元(同比增11.5%),退市规避短期业绩波动[49][52] - 星巴克接触中国业务潜在买家,估值或达数十亿美元,中国门店占全球19%(7750家)但同店销售额持平[35][37] 新兴市场动向 - 越南电商Sendo关闭主站转型生鲜配送Sendo Farm,采用社区团购轻资产模式[37][39]
不会剪辑?一句话生成完整可编辑的视频:Medeo 带你看视频生成的未来
歸藏的AI工具箱· 2025-05-16 16:11
Medeo产品核心功能 - 提供AI视频生成服务,可根据用户提供的素材或口播稿自动剪辑并生成完整视频[1][2] - 支持从零开始生成视频,仅需一个点子或提示词即可自动生成科普类视频内容[3][4] - 具备幼儿教育视频生成能力,可制作风格可爱的教学视频[6][7] - 支持小说视频化,能自动提取内容场景并生成连贯视频片段[8] - 适用于营销场景,可快速生成高质量产品广告视频[9][10] 产品技术特点 - 生成速度快,仅需几分钟即可完成视频制作[4] - 支持两种素材处理模式:Fall AI(全生成)和Smart Match(素材匹配)[11] - 可自动提取网页链接中的文字和素材进行视频转换[11] - 允许用户上传自定义图片、视频或文稿进行匹配[11] - 提供精准编辑功能,可单独修改口播内容或替换分镜素材[13][14] 应用场景优势 - 资讯类内容制作时可确保视频与主题高度相关[12] - 教育领域可快速生成专业教学视频[6] - 营销领域能大幅降低广告制作成本至几元级别[9] - 极大降低视频制作门槛,使非专业人士也能产出高质量内容[16] 用户体验设计 - 操作界面简单直观,仅需输入文字要求即可生成视频[11] - 支持高级设置如背景音乐、语音音色、视频时长等参数调整[11] - 提供"Only Use Provide media"选项确保素材准确性[12] - 导出便捷,会员可去除水印[15] 行业影响 - 突破传统视频制作技术门槛,释放个人创意潜力[16] - 可能改变内容创作和广告制作行业的成本结构[9] - 预示AI在内容分发和筛选领域的发展方向[16]
速递|获a16z3200万美元投资,Synthesia与Runway的"中间路线":Hedra生成长对话AI角色
Z Potentials· 2025-05-16 11:46
公司概况 - Hedra是一家2023年成立的初创公司,专注于AI视频生成与编辑技术,其核心产品为自研的Character-3模型,支持跨图像与音频的风格迁移[1] - 公司创始人兼CEO Michael Lingelbach发现市场空白,定位介于Synthesia(虚拟形象叠加)与Runway(短视频生成工具)之间,专注于长对话场景和可控性[2] - 2024年6月推出首款视频模型后迅速获得资本青睐,包括Index Ventures、Abstract Ventures和a16z speedrun的1000万美元种子轮融资,亚马逊Alexa Fund也参与投资[5] 融资与资本动态 - 2025年5月15日完成3200万美元A轮融资,由Andreessen Horowitz领投,原有投资方悉数跟投,a16z的Matt Bornstein加入董事会[2] - 融资将用于训练下一代模型,提升定制化能力并开发AI角色互动技术[5] 技术与产品 - Character-3模型于2024年3月推出,成为用户增长的关键驱动力,专注于角色动作与表情生成[5] - 平台支持调用第三方模型,如视频生成的Veo 2和Kling、图像生成的Flux/Imagen3/Sana/Ideogram V2、语音生成的ElevenLabs/Cartesia[7] - 相比竞争对手(Captions/Cheehoo/Synthesia/HeyGen),Hedra宣称其视频角色表现力更强[7] 市场定位与用户 - 当前目标用户为创作者和专业消费者,同时收到企业营销部门的主动合作意向[6] - Andreessen Horowitz认为AI视频生成领域将细分出角色、动作、语音等垂直工具,Hedra正聚焦于"引发共鸣的故事与角色"方向[7][9] 行业趋势 - AI生成角色(如会说话的婴儿/狗狗)正引发病毒式传播,Hedra技术被用于制作此类播客视频[1][2] - 行业竞争格局分散,各玩家侧重不同领域(智能手机/好莱坞动画/虚拟形象等),Hedra差异化在于角色表现力[7]
AI视频生成的Vidu样本:攻坚视频生成核心难题,引领内容生产力变革
锦秋集· 2025-05-06 22:36
多模态AI技术重塑内容创作 - 多模态AI技术正以前所未有的速度重塑内容创作领域,从OpenAI Sora到吉卜力风图片,技术壁垒不断被突破 [1] - 视频生成作为技术难度与应用潜力并存的关键环节,吸引了全球广泛关注,但仍面临一致性、可控性和计算成本等核心挑战 [1] - 生数科技Vidu通过集中资源解决专业用户痛点(一致性、可控性、效率),在动画等领域建立差异化优势 [1] Vidu的核心定位与技术突破 - Vidu定位为"全球领先的AI内容生产平台",优先解决实际工作流中的关键痛点 [1] - 推出"参考生"(Reference to Video)范式,通过给定参考主体+文字驱动演绎,在可控与创意自由间寻求平衡,可能颠覆传统动画制作流程 [2] - 全球首创多主体参考技术及"主体库"功能,解决内容创作的"一致性"问题,确保角色、物体等在连续画面中保持稳定 [3] - Q1版本模型在语义理解、物理规律模拟和清晰度上改进,提升生成过程的"可控性"与结果的"可靠性" [3] 未来AI视频生成的发展趋势 - 行业在成本和速度方面有望实现10到100倍的优化空间 [4] - 未来将催生"实时可交互、高一致性的新内容平台",用户可主动介入、影响内容进程,甚至与其他用户协作共享 [7] - "生成即消费"模式可能改变当前内容平台生态,降低对特定创作者的依赖性,模糊生产与消费的界限 [5] - 2025年多模态内容领域两大趋势:AI视频内容爆发、涌现大量可消费商业化成片内容 [13] Vidu的技术创新与市场策略 - 主体库功能解决内容创作中的"一致性"难题,未来推出共享主体库支持创作者协作甚至共创IP [18] - 与动画协会、北影等机构及全球高校和专业动画工作室深入合作,探索AI剧集等内容形态 [19] - 市场策略是"把长板做到足够长",优先在动画领域做到最好,不追求大而全 [24] - 在广告营销、动画制作等领域,多模态生成技术已能带来3-5倍的效率提升 [23] 多模态技术的未来挑战与突破点 - 核心挑战在于一致性、实时性和可交互性的完美结合,并且需要在一个可负担的成本下实现 [9] - 未来技术突破点包括:持续的成本与速度优化、对物理世界规律更深层次的理解与模拟、真正的多模态融合与完整内容生成 [16] - 纯粹的文生视频应用者不多,"参考生"范式更具潜力 [10] - 多模态生成技术未来可能会把独立的数字人技术"吃掉" [12] 多模态技术的产业机会 - 通过API等方式将技术能力赋能给现有应用和服务,驱动增长和提升用户体验 [26] - 将多模态技术深度融入现有工作流,提升内部的内容生产效率和创意水平 [27] - "内容即服务"市场需求日益增长,技术提供方可扮演连接者和赋能者角色 [27] - AI普及会改变创作模式,"一人即团队"成为可能,深刻影响产业结构 [28]
生数科技按下B端商业化快进键:30天签约智谱/飞书等8家行业龙头
中国产业经济信息网· 2025-05-06 16:49
AI视频生成行业的商业化落地正在加速。 在多模态生成领域,短短不到一周的时间,明星AI公司生数科技密集官宣与多家行业头部企业达成合 作。 2025年4月27日,智谱宣布融合生数科技旗下旗舰产品Vidu在多模态生成等方面的先进能力,其MaaS平 台将全面接入Vidu视频模型 API接口;而就在两天前的4月25日,飞书宣布与生数科技Vidu达成合作, 飞书用户可通过多维表格的AI字段捷径,直接调用Vidu一键实现从创意到成片的智能化视频生成。同期 4月25日,百度搜索在百度Create大会宣布Vidu已加入百度搜索开放平台。 能够如此密集快速在B端官宣落地,在多模态赛道很难不引人注意。这似乎也意味着,伴随生数科技 Vidu的基座模型能力在文生、图生动漫及写实登榜全球第一,这家聚焦AI视频生成行业的中国AI领军 公司已甩开大厂,率先进入到商业化成规模落地阶段。 B端商业化增速行业第一,不同领域多面开花 实际上,仔细查看生数科技B端动向,可以发现其生猛的商业化落地合作并不是单点单领域爆发,而是 早已在多领域生根,正迅猛进入爆发期。业内对B端合作大多缄默,但根据公开数据,我们还是列数了 生数科技在不到一年内,已部分对外 ...
字节快手迎来关键对决
华尔街见闻· 2025-04-22 20:39
AI视频生成竞争格局 - AI竞赛焦点转向多模态 字节和快手在AI视频赛道竞争激烈[1] - 根据Gartner 2024年新兴技术成熟度曲线 AI视频生成技术仍处于创新触发期[2] - 行业尚未出现类似DeepSeek在LLM领域的标杆性产品[2] 快手技术进展 - 正式发布可灵2.0视频生成模型及可图2.0图像生成模型[1][3] - 提出Multi-modal Visual Language(MVL)交互理念 由TXT和MMW组成[3] - 可图2.0拥有强大复杂语义理解能力和电影级画面质感 图生视频占可灵AI视频创作量85%[3] - 可灵AI全球用户规模突破2200万[1] - 截至2025年2月底 可灵AI累计营业收入超1亿元人民币[9] - 与小米、亚马逊云科技等企业合作 超1.5万开发者接入可灵AI API[9] 字节跳动技术进展 - 发布Seedream 3.0技术报告 综合性能追平文生图SOTA模型GPT-4o[1][4] - Seedream 3.0支持原生2K直出 生成时间仅需3秒[4] - 2024年9月发布豆包视频生成-PixelDance和豆包视频生成-Seaweed两款大模型[5] - 即梦AI月活增速达173.57% 位居全球AI产品增速榜第5 月活规模约2037万[1] 公司战略布局 - 快手将AI作为破解增长曲线难题的最大抓手 同时面向C端和B端提供服务[9] - 字节将即梦AI视为AI战略核心版图 试图打造AI时代的"抖音"[6][8] - 字节内部组建AGI长期研究团队"Seed Edge" 探索跨模态合作[9] - 两家公司都希望在AI时代复制新的"抖音"和"快手" 成功跨越新技术周期[8] 行业发展现状 - AI视频生成领域处于早期发展阶段 技术迭代速度快[2][7] - 产业界对AI视频生成价值存在分歧:可能是AIGC视频生产工具 也可能是通用视频武器[11] - 多模态技术未来可能应用于社交、游戏、VR、AR等多个领域[11] - 相较于大语言模型 AI视频生成在Scaling law、算力需求和商业模式方面挑战更大[11]
清华特奖得主团队视频生成AI一夜刷屏!100%开源+61页技术报告,还能无限扩展生成,网友:游戏规则改变者
量子位· 2025-04-22 13:06
梦晨 西风 发自 凹非寺 量子位 | 公众号 QbitAI 新国产AI视频生成模型横空出世,一夜间全网刷屏。 Magi-1 ,首个实现顶级画质输出的 自回归视频生成模型 , 模型权重、代码100%开源 。 整整61页的技术报告中还详细介绍了创新的注意力改进和推理基础设施设计,给人一种视频版DeepSeek的感觉。 Magi-1将视频生成卷到了新高度,大片级品质直接锁住大家的眼球。 其主打能力,一是 无限长度 扩展 ,实现跨时间的无缝连贯叙事: 二是能将 生成时长控制精确到每一"秒 " : 另外,Magi-1对物理规律也有更深度的理解, Physics-IQ基准测试56.02% ,大幅领先一众顶流。 现在看这张图,Sora的时代是真的过去了。 此 次开源了从24B到4.5B参数的一系列模型,最低配置一块4090就能跑。 这匹"黑马"来自中国团队 S and.ai ,中文名听着有点萌叫 三呆科技 ,实力却不容小觑。 创始人 曹 越 ,清华特奖得主、光年之外联合创始人。 目前大伙儿可在官网免费试玩Magi-1。GitHub更是一晚过后狂揽500+Star。 | Model | Link | Recommend Ma ...
ZPedia丨诺兰看了沉默,王家卫看了流泪:全球首款无限时长AI视频模型横空出世
Z Finance· 2025-04-21 09:56
AI视频生成行业现状 - 当前AI视频生成工具普遍存在单视频时长限制在10秒左右、运镜效果差、角色情绪表达缺失等技术瓶颈,难以实现连贯叙事[1] - 行业陷入闭源垄断与技术停滞困境,多数产品停留在机械执行指令阶段,无法理解影视导演语言[3] - 主流模型在视觉质量、运动动态效果和高分辨率之间难以平衡,导致专业级长视频生成受阻[10] 昆仑万维Skyreels技术突破 - 推出全球首个支持无限时长的开源电影级生成模型Skyreels-V2,突破传统10秒时长限制,实现好莱坞级别"一镜到底"[6][10] - 采用扩散强迫框架将搜索空间从O(1e48)降至O(1e32),配合强化学习解决动态扭曲问题,实现物理规律级运动流畅性[12] - 构建亿级影视专业数据集,通过四阶段渐进式训练策略(概念平衡微调→运动强化学习→扩散强迫训练→高质量微调)提升性能[14] - 内置视频理解引擎SkyCaptioner-V1,能解析"王家卫风格逆光长镜头"等专业导演指令,实现情绪层次化表达[7][9] 核心技术指标表现 - 在人类评估中综合得分3.14分,指令遵循(3.15分)和一致性(3.35分)显著领先Runway-Gen3 Alpha(2.53分)等竞品[18] - 自动化测试总分83.9%,质量分84.7%,超越Hunyuan Video-13B(82.7%)和Wan2.1-14B(83.7%)[19] - 支持720p以上电影级画质输出,解决传统AI视频"塑料感"问题,实现发丝飘动、动态模糊等细节呈现[8] 商业化应用场景 - 小说创作者可将文本直接转化为分镜短剧,无需专业影视制作团队[20] - 品牌方可快速生成"赛博朋克汽车奔跑特写"等广告素材,缩短传统2-3周制作周期至即时输出[22] - 自媒体博主实现"AI日更",单人单日完成原需5人团队的工作量,自动生成字幕/封面等配套内容[23] - 提供"剧情实验室"功能,通过多版本镜头语言测试优化影视表达效果[24] 行业影响与定位 - 首次将影视工业化体系封装为可调用的模型接口,使电影制作门槛从专业团队降至个人创作者[25] - 开创AI视频生成从"工具时代"到"创作时代"的转折,推动行业竞争焦点从技术参数转向艺术表达[3] - 作为全球首个开源电影级解决方案,打破闭源垄断格局,重新定义视频生成技术标准[3][25]