Workflow
Seaweed
icon
搜索文档
视频生成大模型群雄逐鹿 却不温不火
中国经营报· 2025-06-27 16:17
国内视频大模型发展现状 - 国内视频生成大模型行业高开低走,目前处于不温不火状态,主要原因是用户更偏好真人博主出演的短视频而非AI生成内容 [2] - 腾讯混元、快手可灵、字节跳动即梦等国内视频大模型各自拥有独特技术优势:可灵擅长图像识别转换、即梦强于自然语言处理、混元结合两者优点并增加自定义选项 [2] - 可灵AI经过一年发展,在影视、短剧、广告、游戏、高校教育等行业实现深度实践探索 [2] 可灵AI商业化进展 - 截至2025年4月,可灵AI全球用户突破2200万,月活增长25倍,累计生成1.68亿个视频及3.44亿张图片 [3] - 可灵系列模型占据全球AI视频工具市场30.7%访问量份额,在文生视频、图生视频赛道稳居全球前二 [3] - 可灵2.0大师版显著提升语义响应、动态质量和画面美学,新增多模态视频编辑功能 [3] - 商业化变现至2025年2月累计营收超1亿元,2025年3月年化收入运行率突破1亿美元,4-5月单月付费均超1亿元 [4] - 专业用户(P端)付费订阅贡献70%营收,这类用户兼具传播属性和付费能力 [4] 国际竞争格局 - OpenAI Sora支持60秒高质量视频生成,采用创新"视频作为图像补码"方法,但对GPU算力要求高导致延迟较长 [5] - Meta Movie Gen擅长社交媒体视频样式,优化移动端性能并具有电影级审美,但动作连贯性有待提升 [5] - RunwayML Gen-4 Alpha专注10-20秒短视频高保真合成,提供丰富编辑功能,更受创意行业青睐 [6] 其他国内厂商技术特点 - 阿里通义万相2.1增强时空上下文建模,支持无限长1080P视频,首创中文文字视频生成功能 [6] - 腾讯混元可生成5秒内2K短视频,在文本一致性、运动质量和画面质量维度领先 [6] - 百度"文心一言"4.0的"一镜流影"插件主打批量化720p短视频生产,整合进大模型生态提高用户可及性 [7] - 字节跳动即梦AI可生成2分钟1080p视频,擅长复杂运动描绘,但内容互动量呈现高开低走趋势 [7] 行业未来发展趋势 - 视频大模型将向智能化、个性化方向发展,提升复杂内容生成能力和定制化服务水平 [8] - 5G等高速网络技术普及将改善视频传输体验,进一步推动行业应用 [8]
字节Seed首次开源代码模型,拿下同规模多个SOTA,提出用小模型管理数据范式
量子位· 2025-05-11 12:20
克雷西 明敏 发自 凹非寺 量子位 | 公众号 QbitAI 字节Seed首次开源代码模型! Seed-Coder ,8B规模,超越Qwen3,拿下多个SOTA。 它证明 "只需极少人工参与,LLM就能自行管理代码训练数据" 。 通过 自身生成和筛选 高质量训练数据,可大幅提升模型代码生成能力。 这可以被视为对DeepSeek-R1模型自我生成和筛选训练数据策略的扩展。 一共包含三个版本: Base Instruct Reasoning 其中,Instruct在编程方面表现出色,拿下两个测试基准SOTA。 | Model | Size | | SWE-bench Verified | Multi-SWE-bench mini | | --- | --- | --- | --- | --- | | Agentless | | | OpenHands | Agentless | | ~8B Models | | | | | | Yi-Coder-9B-Chat | 9B | 0.0 | 1.6 | 0.0 | | Llama-3.1-8B-Instruct | 8B | 1.0 | 1.2 | 0.5 | | Q ...
为什么AI视频工具长得越来越像?
36氪· 2025-05-07 15:50
但现在随着可灵、即梦等中国玩家成为牌桌上的新玩家,总被吐槽「期货」的Sora光芒逐渐变得黯淡,一位AI视频从业者告诉「硅基研究室」,对标Sora 早已不是他们的目标,现在他们把关注点放在加快缩短AI视频生产和消费间的GAP。 距离OpenAI发布Sora过去一年多,AI视频赛道上演了一出「王座交替」的爽文故事。 在Sora发布后,AI视频赛道玩家以对标它为目标,流传在社交媒体上的一张梗图是这样描绘的:坐在王座上的Sora看着眼前膜拜者——Runway、Pika、 PixVerse等十余个竞对。 图源:网络 这也意味着,即便不提Sora,国产AI视频玩家的压力也并没有减轻。 一、不提Sora的AI视频玩家,在卷什么? 比起此前对生成时长、模型参数的强调,大半年来,不提Sora的AI视频玩家将这场「军备竞赛」的重点放在了三个维度上——卷一致性、卷可用性、卷可 玩性。 所谓的「一致性」指的是视频生成过程中帧与帧之间的过渡性、动作的连续性和场景的真实性等。 在不少AI论坛的现场,AI视频玩家们谈Sora的少了,谈DeepSeek的多了,这背后是对AI视频加速商业化和普及的一种期待。 似乎也是某种默契,进入2025年, ...
字节 AI 再创业:独立组织、全链条的饱和出击
晚点LatePost· 2025-03-31 19:58
当中国最大互联网公司遇到一局上限足够高的新游戏,它可能试试就放过吗? 文 丨 王与桐 程曼祺 编辑 丨 程曼祺 黄俊杰 面对 AI,字节依然是那个字节:一旦看到有潜力的方向,就加倍、饱和、全面出击。 一个最新例子是:智能体应用 Manus 出圈前后,字节已有至少 5 个团队在开发不同智能体产品,其中 有些是对内工具。Manus 是 3 月 6 日刚由创业公司 Monica 开始内测的智能体应用。 去年 11 月我们在一篇文章中说:"中国掌握极强产品能力和流量资源的不止字节。微信还没出手呢。" 现在手握微信的腾讯终于出手,以出其不意的方式:全面接入 DeepSeek。 这对字节产生了更实质的影响。3 月 19 日腾讯总裁刘炽平在业绩会上说,从 2 月到 3 月,元宝日活 增长了 20 倍,排名中国 AI 应用第三。他没有说的前两名分别是 DeepSeek 和字节豆包。 仅用字节十分之一的时间和小得多的投放预算,腾讯的用户规模来到了豆包的约 1/5。 在中国所有大科技公司中, 字节本是大语言模型起步最晚的一家。在 2022 年底 OpenAI ChatGPT 上 线前,百度、华为、阿里、腾讯(按发布时间顺序)都已 ...