AI视频

搜索文档
一手评测Seedance 1.0 pro,字节首次登顶视频大模型竞技场的大杀器来了。
数字生命卡兹克· 2025-06-11 11:36
火山引擎发布会核心内容 - 火山引擎发布多款AI模型产品线,包括豆包大模型1.6、豆包视频生成模型Seedance 1.0 pro、语音播客模型及端到端语音模型等[1] - Seedance 1.0 pro视频生成模型近期在行业榜单表现突出,技术实力获得市场关注[1][2] - 该模型已通过即梦AI视频3.0 pro形式进行内测,展现六边形战士式的全面能力[6][8] 视频生成技术突破 多镜头组合 - 支持通过"镜头切换"触发词实现分镜自动切换,完成复杂叙事结构[9][13] - 成功实现10秒视频中精确还原包含3次镜头切换的复杂Prompt指令[13][15] - 具备初级文字生成能力,能识别并生成路牌等场景文字元素[16][18] 运动质量 - 物理模拟能力突出,准确表现后坐力、火光反射等细节[20][22] - 复杂动作如骷髅跳踢踏舞、双人互动场景均保持稳定[22][24] - 运动场景处理优异,篮球运球投篮动作符合物理规律[26] 情绪表现 - 实现从微笑到恐惧的完整情绪谱系表现[32][36][38] - 宇航员缺氧场景提供两种差异化表演方案[44][46] - 角色微表情处理细腻,如战场新兵手足无措的状态[71] 技术参数与商业化 - 支持360度环绕、追车等专业级运镜技术[49][51][54] - 物理引擎覆盖陆地、水下及太空场景,保持规律一致性[55][57][59][61] - 风格化处理能力突出,保持像素风、动漫等特定风格一致性[71][73][75] - 商业化定价为每5秒1080P视频3.67元,已开放企业端接入[79] - 消费者端通过豆包App"照片动起来"功能全量上线[80] 行业影响 - 代表国产视频生成模型达到国际第一梯队水平[77] - 技术突破集中在语义理解、物理规律和风格一致性领域[77] - 行业竞争加剧推动技术快速迭代,最终利好终端用户[78][80] - 标志AI视频生成进入多维度能力比拼的新阶段[81][82]
速递|前月之暗面产品负责人发布AI视频产品,无需邀请码,效果惊艳,已获得多家风投投资
搜狐财经· 2025-05-17 20:11
公司动态 - 月之暗面大模型产品负责人王冠2024年年初创办ONE2X 创业方向为AI视频 已获得多家风投机构投资 [3] - ONE2X发布AI视频编辑产品Medeo 主打"只需创意 无需编辑"概念 功能包括自动拆分分镜 生成镜头建议 输出编辑时间线 [3] - Medeo利用大模型将文字模态信息转换为视频模态信息 智能识别场景切换 自动匹配素材和转场效果 [3] - 月之暗面2024年9月进行战略转型 暂停Ohai和Noisee两款出海产品线 集中资源到Kimi Chat研发 [7] - Noisee前产品负责人明超平创立深圳市新言意码科技有限公司 专注AI编程领域 对标美国Cursor公司 [7] - 新言意码估值达8000万美元 已获月之暗面原始股东投资意向 [7] 产品功能 - Medeo文生视频功能:用简单文本提示生成视频 无需复杂编辑界面 [3] - 智能资产功能:访问数百万优质视频素材 AI自动匹配场景画面 [4] - AI智能编辑功能:自动优化脚本 添加专业配音和背景音乐 完善转场和节奏 [5] - URL转视频功能:将网页或文章转换为专业视频 AI创建视觉效果和旁白 [6] - AI动画功能:上传风格参考和文字描述 AI创作独特动画故事 [6] 行业趋势 - 国内"AI六小龙"阵营多家企业经历重要人事调整 月之暗面人才流动为战略调整延续 [7] - AI细分赛道持续获得资本关注 新言意码获一线基金投资 [7][8]
为什么AI视频工具长得越来越像?
36氪· 2025-05-07 15:50
AI视频赛道竞争格局 - 行业从对标Sora转向关注商业化落地,中国玩家可灵、即梦等成为新焦点 [1][4] - 2025年半年内超10家AI视频公司密集发布新模型,迭代周期缩短至半月级 [4][12] - 头部玩家如Runway、可灵、Vidu保持半年一次基座模型更新节奏 [11][12] 技术竞争维度 - 行业聚焦三大方向:一致性(帧间连贯性)、可用性(工作流整合)、可玩性(创意特效) [6][9][14] - 一致性优化手段包括首尾帧控制、笔刷工具、多图参考等,Runway推出Act-One面部表情迁移功能 [9] - 可用性体现在动态编辑、镜头运动控制、端到端工作流(分镜-生成-剪辑)能力 [13] 产品功能同质化与商业化 - 主流产品功能趋同,均支持主体参考、音效生成、多模态编辑等基础功能 [5][15] - 可灵2.0生成5秒视频成本10元,B端API价格2元/5秒,国内厂商B端价格优势显著 [16][20] - 行业未现价格战,闭源模型仍主导市场,开源模型存在性能短板 [21][22] 市场参与者与融资动态 - 2025年初超10家AI视频初创公司获融资,Runway获3.8亿美元D轮,HeyGen获6000万美元A轮 [23][25] - 参与者分化为AGI派(如谷歌DeepMind)、平台派(如Runway)、产品派(如Pika) [26] - 创作者多平台组合使用,Runway强于可控性,Pika擅动漫风格,Vidu稳定写实输出 [26][27] 行业挑战 - 商用落地存在成本高企问题,3分钟短片制作成本达数万元,客户预算持续压缩 [16][18] - 技术路径未收敛,开源与闭源模型性能差距缩小但效率不足问题仍存 [21]
4月23日早餐 | 多地酝酿新一轮刺激政策;美股大涨
选股宝· 2025-04-23 08:18
美股市场表现 - 美股三大指数大幅反弹 道指涨2.66% 标普500涨2.51% 纳斯达克涨2.71% [1] - 特朗普表态不计划解雇鲍威尔并呼吁降息 推动标普500盘后涨1.7% 纳指100涨1.8% [2] - 科技股表现强劲 特斯拉收涨超4%盘后再大涨 亚马逊/苹果/Meta均涨超3% [2] - 中概指数收涨约3.7% 苏轩堂和美物科技股价翻倍 再鼎医药涨超9% 阿特斯涨约8% [2] 大宗商品与外汇 - 黄金盘中涨超2%创历史新高 后因贸易消息回落至跌超1% [3] - 十年期美债收益率刷新日低 美元指数加速反弹 [2] 贸易政策动态 - 美国财长贝森特称关税僵局不可持续 [2] - 特朗普政府接近与日本印度达成贸易协定 最终协议仍需数月 [2] 特斯拉业绩与展望 - Q1盈利锐减40%远逊预期 归因于贸易政策不确定性 [4] - 计划上半年开始生产低价新车 [4] - 预计2025年年底数千套Optimus在特斯拉工厂工作 [4] - 预计明年下半年数百万辆特斯拉实现完全自动驾驶 [4] 国内政策动向 - 广东/上海谋划出台《提振消费专项行动方案》 [5] - 吉林发布《吉林省提振消费专项行动实施方案》 [5] - 辽宁印发《提振消费6条政策》 [5] - 国常会明确提出稳定股市和房地产市场 [5] 行业投资机会 券商 - 外汇局表示境内证券市场对外资吸引力有望继续增强 [6] - QFII进入43只股票前十大流通股东 包括中东主权基金和高盛等机构 [6] - 人民币升值预期吸引外资增配中国权益资产 [6] 低空经济 - 美团获全国首张低空物流全境覆盖运营合格证 [7][9] - 低空物流解决传统物流覆盖难题 提升配送速度和范围 [7] - 无人机环保特性推动绿色高效物流模式转变 [7] 换电模式 - 宁德时代巧克力换电新车型4月23日发布 [7] - 单站服务50辆车即可支撑合理回报率 [8] - 2027年换电市场规模预计达97亿元 年增长率45% [8] - 宁德时代与30余家合作企业签订10.75万块电池订阅服务 [8] AI视频 - 全球首个自回归视频生成模型Magi-1开源 支持无限长度扩展 [8][10] - Physics-IQ基准测试达56.02% 领先行业 [8] - 应用落地领域包括影视/教育/游戏/营销等 [10] 上市公司业绩 业绩高增长 - 全志科技Q1净利润9155.2万元同比增86.51% 因扫地机器人/智能汽车电子收入增加 [12] - 海兰信Q1净利润3480.39万元同比增1324.75% 因海南海洋灾害防治项目验收 [12] - 新易盛2024年净利润28.38亿元同比增312.26% 因数据中心需求带动销售 [18] - 湖南黄金Q1净利润3.32亿元同比增104.63% 因非标金销量增加及产品涨价 [18] - 瑞芯微Q1净利润2.09亿元同比增209.65% 因AIoT市场需求增长 [18] 业绩下滑 - 中兴通讯Q1净利润24.53亿元同比降10.50% [15] - 至纯科技下修2024年净利润预期至2000-3000万元同比降92.05%-94.70% [15] 风险提示 - 铖昌科技被实施退市风险警示 股票简称变更为*ST铖昌 [16] - ST宇顺2024年预计净亏损1900-2630万元 可能被实施退市风险警示 [18] - 紫天科技预计无法按期披露2024年年报及2025年一季报 [17] 重大合同与重组 - 城地香江联合体中标中国移动数据中心项目 报价16.32亿元 [18] - ST宇顺拟收购Olive Ida Limited公司100%股权 预计构成重大资产重组 [18] - 浩云科技签署1.74亿元算力组网集成项目合同 [18] 股票回购 - 双塔食品拟2-3亿元回购公司股份 [18] 创新高个股 - 百利天恒(创新药)涨11.41% 林泰新材(汽车零部件)涨10.92% 国芳集团(新零售)涨10.02% [19] - 红宝丽(环氧丙烷)涨10.01% 中旗新材(股权转让+国产芯片)涨10% [19] 限售解禁 - 南京银行4月23日解禁市值118.09亿元 解禁比例10.21% [20] - 杭州银行4月23日解禁市值73.14亿元 解禁比例7.93% [20]
可灵2.0正式发布 - 现实,真的不存在了。
数字生命卡兹克· 2025-04-15 15:24
可灵2.0技术突破 - 可灵2.0在运镜幅度、物理规律、人物表演、动作稳定性、语义理解等方面实现水桶式提升,将AI视频技术推向新高度[7][9][12] - 霸王龙案例展示2.0版本在环境交互、运动感和物理反馈上的显著进步,1.6版本存在树木橡胶化等缺陷[9][11][12] - 摘眼镜案例体现2.0版本对精细动作的完美还原,包括镜片光影变化和物理反馈,1.6版本出现眼镜腿抖动等穿帮[14][16][17] 多主体交互能力 - 五人篝火场景中2.0版本实现自然表情交互和火光动态映射,1.6版本存在人工感[23][25][26] - 派大星吹笛案例展示2.0强大的语义理解能力,能准确呈现停顿观察等复杂指令[27] - 多人场景下2.0版本保持各主体动作协调,1.6版本出现假动作等问题[20][21] 情感表达真实感 - 小丑妆女孩案例中2.0版本实现电影级情绪传递,包括眼神变化和嘴角抽动等微表情[14][17] - 外星人哭泣、老人敬礼等案例展示2.0版本对复杂情感的精准刻画[30][31] - 通过淋雨失恋、开车第一视角等场景建立强烈沉浸感[32][34] 技术局限性 - 群像高速运动时部分人物稳定性不足,出现分裂现象[49][50] - 投篮等需要精确物理模拟的场景仍存在轨迹失真问题[55] - 怪物猎人等复杂群像场景中小尺寸人物会出现混乱[52] 行业影响 - 技术达到"信"而非"像"的级别,首次实现观众情感共鸣[41][44][45] - 当前水平已超越其他AI视频模型,直接对标好莱坞特效标准[57] - 代表AI视频领域审美跃迁,重新定义真实感标准[38][39][46]
深度|谁正在AI视频上,超越OpenAI 和Google?
Z Potentials· 2025-03-02 10:37
公司战略与定位 - Runway采取差异化战略,专注于服务专业电影制作人而非大众市场,与Lionsgate达成里程碑式合作[1][4] - 面对OpenAI和谷歌等巨头的竞争,公司采取高调回应策略,CEO公开嘲讽对手产品为"概念车",强调自身产品的实用性和专业性[2][6] - 公司定位为"行业领导者",专注于开发电影制作和后期制作的专业工具,而非通用AI视频模型[6][13] 商业模式与财务表现 - 公司2024年12月年化收入达8000万美元,目标2024年全年达3亿美元[8] - 通过好莱坞合作证明AI视频模型盈利能力,使用其工具可节省50%-80%制作成本[12] - 获得英伟达、通用大西洋等投资,去年完成4亿美元融资[5][8] 产品与技术优势 - 开发35种"魔法工具",针对视频创作各环节专业人士[21] - 采用潜在扩散模型技术,成为Stable Diffusion基础[20] - 产品使电影制作人能在摄制后改变摄像机角度、背景、服装等,显著提升创作灵活性[10] 市场拓展与行业合作 - CEO每月花费一周时间在好莱坞进行推广,每天安排6次会议说服行业人士[9] - 与Lionsgate合作允许在2万部电影上训练新模型,是好莱坞首个公开采用AI技术的大型工作室[11][12] - 设立500万美元"百部电影基金",计划2025年制作从短片到长片的各种作品[23][24] 团队与文化 - 创始团队来自艺术背景,毕业于纽约大学艺术项目,非传统科技创业者[8][14] - 公司50%员工来自艺术背景,研究科学家与创意人员紧密协作[22] - 文化强调技术与创意融合,举办年度AI电影节吸引3000份作品[22] 行业影响 - 证明AI可增强而非取代创意工作,改变好莱坞对AI的负面看法[9][10] - 工具被用于奥斯卡获奖影片《一切隔离之处》和《史蒂芬·柯尔伯特深夜秀》等知名项目[21] - 推动视频成为AI领域下一个重要发展方向,吸引多家科技巨头进入该领域[6][13]