Workflow
Seedance 2.0
icon
搜索文档
长尾的复兴
乱翻书· 2026-03-27 00:01
核心观点转变 - 行业分析观点发生根本性逆转 从认为3D打印等按需定制技术天花板低、属于制造业旁支 转向认为其与AI及长尾社区结合 正开启一个“丰饶时代” 让小众需求的规模化满足成为可能 [1][3][4][9][10] 历史判断的逻辑基础 - 过去判断3D打印天花板低的逻辑源于“市场方向决定规模” 类比互联网产品 只有新闻这类大众产品能触及最大用户群 而3D打印制造的产品天然是长尾、小众、垂直的 并非“大众产品” 因此其市场规模被认为有限 [3] - 过去的商业逻辑普遍追求工业化大生产和头部规模 无论是制造业还是内容产业 商业计划书的核心都是市场规模和团队规模 所有人都往头部和大众市场挤 [6] 当前趋势的变化 - 趋势正在从追求大众化转向满足个人化 涌现出大量个人创作者和“一人公司” 个人可以独立完成产品、研发、运营和设计 不再需要为庞大市场制定商业计划 只需为自己或身边少数人创造 [7] - 小红书等平台提供了长尾需求的土壤 其通过UGC和双列/发现等产品容器 解决了生活与审美领域的多样性和长尾需求 这不同于追求全球流行逻辑的专业或客观领域 [8] 技术融合与范式转移 - AI与3D打印的结合 将长尾经济从比特世界推进到原子世界 AI压缩了冷门产品的开发周期 3D打印则让实物制造的边际成本趋近于零 [9] - 生产工具普及、传播渠道无限扩展、需求聚合同时发生 使得小众需求第一次有了被规模化满足的可能 [9] - 消费者行为正在从标准化满足转向碎片化探索 汇聚的小众市场足以与主流市场抗衡 从开发者到用户的单向链路 正在走向全民共创 [9] 行业影响与未来展望 - 3D打印机成为“想象力的机床” 与作为“想象力的相机”的AI相结合 正在让创客和业余爱好者迎来复兴 [9] - 这引出一个关键问题:当人人都能进行制造时 现有知识产权和头部企业的价值是会被消解 还是会被原子化重组 [9] - 这种由AI、3D打印和长尾社区共同驱动的趋势 正在以某种方式实现“物质极大丰富”的愿景 标志着进入一个“从未见过的丰饶时代” [9][10]
字节的「罗福莉」,撑起了Seedance的半边天
36氪· 2026-03-26 12:35
字节跳动Seedance 2.0模型与核心技术 - 字节跳动发布的Seedance 2.0视频生成模型,其核心技术突破之一是双分支扩散变换器架构,实现了视频与音频的并行生成和原生协同[53][56][57] - 该模型生成时长1分钟的2K视频仅需60秒,比上一代Seedance 1.5 Pro快了30%[62] - 模型还实现了多镜头叙事能力,能够理解专业的分镜逻辑并自动规划镜头切换,生成带有蒙太奇效果的完整叙事序列[64] 预训练的关键作用与负责人 - 预训练是整个模型的“基石”,决定了模型的能力上限,其过程是“塑造模型的世界观”,而非简单的“喂数据”[8][9] - 预训练负责人曾妍在字节跳动内部晋升迅速,从校招毕业生到4-2职级(高级总监/权威架构师)仅用了5年时间,该职级年包普遍在500万元以上[12][13][14] - 在预训练阶段,团队通过引入“跨分支校准模块”处理海量多模态数据,建立了视觉、文本、音频之间的对齐关系,确保音画同步与情绪一致[59] 曾妍的技术贡献与项目历程 - 曾妍在2021年以第一作者发表X-VLM模型论文,其“多粒度对齐”思想为后来负责视频生成预训练埋下伏笔[19][26] - 2023年转入字节大模型研究部门Seed后,她作为第一作者主导了CCLM(跨语言与跨模态理解)和Lynx(GPT-4风格多模态大模型)两个重要项目[34][36][39] - 其主导的PixelDance项目(后更名为Seedance)解决了视频生成中动态性与稳定性的矛盾,通过在扩散模型中引入首末帧双图像指令等创新,从源头保证一致性[41][44][46] 行业趋势与人才路径 - 2022年底ChatGPT发布后,2023年初各大公司纷纷全力投入大模型研发,行业进入战略调整期[32] - 在AI大模型这个需要长期积累的领域,年轻技术人才可以通过对问题的深刻理解,在短时间内做出关键贡献[75] - 顶尖AI科学家的职业路径呈现多样性,例如从大厂到创业公司,或在单一公司内部深耕并快速晋升,两者均能取得显著成就[73][74]
直面Seedance2.0挑战?快手可灵想要年内收入翻倍
华尔街见闻· 2026-03-25 21:01
行业动态与竞争格局 - OpenAI宣布其AI视频生成模型Sora在面市两年后退出历史舞台,折射出该领域面临艰巨挑战,即便是头部玩家也难以承受高昂成本[2][3] - 行业竞争加剧,字节跳动在2026年春节前推出Seedance 2.0模型,引发全球关注,各大厂商有加速迭代视频生成模型的趋势[8] - 行业领导者认为,竞争加剧对行业有积极影响,降低了用户创作门槛,提升了AI视频生成在更多应用场景的渗透率,让行业蛋糕变大[8] - 高盛预计,全球AI视频生成市场规模将在未来五年增长10倍,至2030年达到约290亿美元,足以容纳多个头部玩家共存,并非“赢家通吃”的零和游戏[10][11] 公司财务表现 - 公司2025年第四季度总收入同比增长11.8%至396亿元,经调整净利润同比增长16%至55亿元[3] - 公司2025年全年总收入同比增长12.5%至1428亿元,经调整净利润达206亿元,同比增长16.5%,经调整净利润率提升至14.5%[3] - 公司在持续加大AI投入的同时,保持了利润率的稳步提升[4] - 公司预计2026年集团整体资本支出将达到约260亿元人民币,较2025年新增的110亿投入将主要用于可灵大模型及其他基础大模型的算力支撑[12] AI视频生成业务(可灵AI)表现 - 可灵AI在2025年第四季度营收达3.4亿元,小幅低于机构年初预期的3.5-4亿区间[5] - 可灵AI在2025年全年收入合计达10.4亿元,折合约为1.5亿美元[6] - 截至2026年1月,可灵AI的年化收入运行率已超过3亿美元[7] - 管理层对可灵AI在2026年实现收入同比翻倍以上增长保持较强信心,认为其商业化有望进一步提速[7] 技术与产品进展 - 2025年第四季度以来,可灵AI先后推出统一多模态视频模型可灵O1、可灵2.6模型以及可灵3.0系列模型[7] - 模型质量提升和产品功能创新推动了其商业化能力的持续突破[7] - 公司认为其模型和产品能力依然处于全球领先位置,在视频生成大模型榜单中基准测试评分排名领先,尤其在角色一致、可控性、物理真实感和复杂场景的稳定性方面表现优秀[9] - 高盛指出,可灵3.0在影视级细节和定价优势上仍保持竞争力,且在第三方基准测试中持续位居全球顶级模型行列[10] AI对核心业务的赋能 - 线上营销服务是公司一半以上的收入来源,2025年第四季度该业务收入达到236亿元,同比增长14.5%[15] - 第四季度,生成式推荐大模型和智能出价模型为国内线上营销服务收入带来了约5%左右的增量[15] - 由AIGC营销素材带来的线上营销服务消耗金额在第四季度总计达到40亿元,较上一季度的超30亿元进一步提升[15] - 公司持续深化AI大模型技术在内容与商业生态的赋能,以及内部组织基础设施的提质增效[14]
OpenAI关停Sora!25个月从封神到退场
量子位· 2026-03-25 07:52
西风 发自 凹非寺 量子位 | 公众号 QbitAI 我勒个让人意想不到的突发, Ope nAI刚刚宣布 关停Sora ! Sora团队发布声明: 我们即将与Sora告别。 感谢每一位用Sora创作、分享作品,并围绕它搭建起社区的用户:你们用Sora创造的一切都意义非凡,我们深知这个消息会令人失 望。 后续我们将尽快公布更多细节,包括app与API的停用时间安排,以及用户作品的留存方案。 消息一出,X上直接炸开了锅,网友一整个大无语: 如果OpenAI推出的面向公众的产品,短短数月后就惨遭叫停,那我们凭什么要信任或投资这类产品? 网友们纷纷艾特奥特曼,质问到底咋回事。 | | | Sora本可基于迪士尼、漫威、皮克斯及星球大战旗下超过200个IP,生成视频。 并且按照原计划,Sora与ChatGPT图像生成功能还将在今年推出"fan-inspired"主题视频,迪士尼流媒体平台Disney+也将上线一批精选的 Sora生成视频。 而现在随着Sora项目终止, 迪士尼已宣布终止与OpenAI的所有合作 ,其中还包括拟斥资10亿美元收购OpenAI股份的计划。 迪士尼一发言人告诉《Variety》: AI行业尚处 ...
中金:Seedance2.0对互联网有何影响?
中金点睛· 2026-03-23 07:35
Seedance 2.0模型发布与市场热度 - 2026年2月,字节跳动正式发布新一代AI视频生成模型Seedance 2.0,引发全球广泛关注[1][3] - 该模型在全模态输入/输出、镜头与叙事一致性等维度展现了系统性领先能力,短期内成为全球现象级产品[3] - 作为首发入口的即梦AI,其国内日活跃用户从2月2日的328万人持续提升至2月23日的572万人[3][6] - 发布后全球搜索热度登顶,高峰时段排队人数平均约9万人,排队等待时间长达数小时[6] Seedance 2.0的技术创新与领先性 - 模型采用双分支并行扩散Transformer架构,实现了视觉与听觉信息流的并行处理,从技术路径上解决了音画错位及口型匹配等长期工程难题[10] - 支持图像、视频、音频、文本四种模态的复合输入,系统最多可同步解析12个参考文件,允许用户进行更精确的控制[11] - 引入了全局角色锚定机制与角色-环境感知编码技术,能够在镜头切换过程中维持角色特征、服饰纹理及环境光影的一致性[11] - 与Seedance 1.0和1.5 Pro相比,2.0版本在生成速度、多镜头一致性、口型同步精度、角色持久性等方面均有显著提升[12] - 相较于其他领先模型,Seedance 2.0在中文理解能力、多模态文件输入功能以及对视频叙事连贯性的深度优化方面形成独特优势[12] 视频生成模型的演进方向:“世界模型” - 相比于人类智能,当下大模型仍欠缺“世界模型”这一关键的基础能力,而多模态生成模型有成为世界模型的潜力[3] - 具备高度一致性、且能精准遵循物理规律的多模态生成模型,其本质是对世界的仿真,本身或许就是世界模型[22] - 视频生成需要保证帧间空间关系、运动关系的一致性和合理性,因此准确的视频生成难度相对图像生产更高[23] - 当前主流的DiT架构模型本质上仍然是概率匹配,并未真正理解物理规律,存在“智能”短板[27] - 借鉴Nano Banana的发展路径,通过结合DiT模型和具有更强智能的多模态大模型,可以提升视频生成模型的“智商”[28] - Seedance 2.0在音视频同步、物理规律遵循、复杂运镜等多维度实现了明显提升,加速了视频生成向“世界模型”的演进[29] 视频生成赛道的市场空间与竞争格局 - 当前视频生成模型仍处于发展初期,根据机构估算,2025年AI视频模型行业赛道空间仅处于10-20亿美元区间[3][32] - 随着模型能力持续进步,基础创意工具情形下的市场空间有望达数百亿美元级别[3][33] - 若AI视频模型能力持续提升,可直接生成具备高消费价值的AIGC视频,潜在市场规模则可能超过千亿美元[33] - 模型能力短期难以成为壁垒,现有用户往往同时使用多个模型,市场难以一家独大[3] - 单个企业平均使用14个生成式AI模型,用户会基于自身不同需求选择对应优势的模型[37] - 市场定位有望成为不同参与者的差异化关键,ToC和ToB用户的需求导致模型优化优先级存在差异[3][38] 综合巨头与垂直厂商的竞争优劣势 - 拥有通用大模型的综合参与者在进军垂类模型时拥有协同优势,能够赋能垂类模型进步,提升了专业应用的入局门槛[35] - 算力基础设施的重要性凸显,模型训练、推理环节的算力储备将直接决定模型能力、用户体验和产品成本等重要竞争要素[36] - 从ToC角度看,综合型公司除在AI模型有系统性布局外,往往拥有渠道与流量优势,在把握AIGC ToC平台型机遇时具备体系性优势[39] - 对于ToB赛道,垂直参与者仍有机会通过深耕特定需求、聚焦细分赛道构建差异化壁垒,企业用户对工具的效果阈值、可靠性、安全性与工作流集成度要求更高[39] AIGC工具对互联网内容生态的影响 - Agent的使用场景更贴近“主动搜索”,而内容消费主要是娱乐场景,更偏“被动推荐”,两者在使用场景上存在本质差异,因此Agent对主流内容平台影响有限[42] - 若Agent等效率工具能够显著提升人类工作效率,人类花在娱乐消遣上的时间可能会增加,这将有利于线上内容平台拓展空间[44] - AIGC工具进一步降低内容生产门槛,或将推高源自DNA遗传的内容消费需求占比,短剧、漫剧、网文等体裁是当下最受益于AIGC工具趋势的赛道[45][46] - 在短视频领域,行业整体呈现需求已处于高位、内容供过于求的状态,AIGC更多带来效率提升与成本优化,对增量需求拉动有限,很难改变现有平台格局[48] - 在长视频、音乐等内容供给不足的赛道,AIGC工具持续降低内容生产门槛,有望通过新体裁满足增量需求,进而催生新平台崛起的机遇[48] Seedance 2.0的产品化落地与商业化 - Seedance 2.0已全面接入字节系核心产品矩阵,包括即梦AI、小云雀和豆包,形成覆盖专业创作、泛C端体验、企业级服务的多层次落地体系[15] - 即梦AI定位为核心变现渠道,推出79元至649元的多档位订阅套餐;小云雀结合免费体验与轻度付费;豆包作为免费的流量入口承担用户教育及引流职能[16] - 对于企业用户,火山引擎提供Seedance 2.0的企业级工作台试用和API服务[16] - 根据公布的定价,Seedance 2.0的整体调用价格低于Sora 2和Veo 3.1,也略低于国内快手Kling 3.0模型调用价格,形成了具备竞争力的“高质中价”优势[17] - Seedance 2.0完整版调用均价为人民币0.346-0.585元每秒,Fast版平均每秒视频消耗5积分[17]
上海凭什么敢自封“开发者之城”?看完这场大会议程我悟了
量子位· 2026-03-22 12:18
大会概览 - 2026全球开发者先锋大会定于3月27日至29日在上海徐汇举办,是一场面向开发者、创业者和AI爱好者的综合性AI盛会 [3] - 大会内容涵盖1场开幕式、3+赛事、50+工作坊、100+互动体验及N场嘉年华,旨在提供通往AGI时代的入口 [5] - 上海正被塑造为“开发者之城”,拥有极致的AI应用场景,并正在构建覆盖上中下游的AI产业集群 [1][2][27] 核心活动与体验 - 现场提供“千万Token免费送”活动,商汤、中国电信、阶跃、阿里云无影、六联智能等厂商将提供“一站式养虾”服务,指导参与者半小时内部署并体验OpenClaw [6][9][10] - 设立AIGC创新创作训练营,由极顶数创、智灵新境等公司专家指导实操Seedance 2.0、OpenClaw等工具,优秀学员可获得结业证书及路演机会 [12][13] - 设置“AI for fun”互动体验区,可体验商汤“办公小浣熊”、萝博派对双足机器人(奔跑速度达3m/s)、讯飞AI耳机等前沿产品 [21][22] 创业与商业赋能 - 大会探讨“一人公司”模式,金珵科技、萝博派对、小山闭门会等创始人将分享如何用AI打造个人IP及实现商业落地 [14][15][16] - 举办SE超级创业者创新大赛,聚焦数字文娱、数字金融、生命健康、智能制造四大赛道,从近300支队伍中筛选优胜项目,提供万元奖金及入驻模速空间等社区的支持 [17] - 主论坛“科创共生聚力向新”邀请著名经济学家黄奇帆、上海交通大学葛冬冬等,探讨AI创业机遇与“学界-产业-开发者”全链路协同 [18] - 开设AI产品出海讲坛,以私董会形式邀请香港美高域集团、FunPlus、赞奇科技、星图比特等公司高层分享出海实战案例与避坑指南 [20] 产业生态与资源链接 - 大会作为WAIC全球创新项目路演的深度链接平台,将吸引近百家国内外投资机构,为优秀项目提供展示机会并全年开放资源链接 [24][25][26] - 上海已集聚以稀宇、商汤、沐曦、壁仞、天数、英矽等为代表的AI上市企业,以及创智学院、上海人工智能实验室、模速空间等研发机构与创新社区 [27][28]
“这就是Kimi”!马斯克冲上热搜,两度点赞中国AI公司月之暗面
证券时报· 2026-03-21 16:57
文章核心观点 - 全球科技领袖埃隆·马斯克持续关注并公开赞赏中国国产大模型的技术进展,表明中国在AI大模型领域的技术实力已获得国际顶尖人士的认可 [1][3] - 中国AI公司(如月之暗面Kimi、阿里通义千问、字节跳动)在模型架构创新、性能提升及多模态生成等关键技术上取得显著突破,正快速缩小与国际前沿的差距 [3] 中国国产大模型的技术突破与行业影响 - 月之暗面Kimi发布《Attention Residuals》技术报告,通过“注意力残差”新方法重构大模型残差连接机制,在48B参数模型上实现训练效率提升1.25倍,科学推理与数学成绩分别提高7.5%和3.6%,被业界视为“深度学习2.0”的重要信号 [3] - 字节跳动旗下视频生成大模型Seedance 2.0采用统一的多模态音视频联合生成架构,支持文字、图片、音频、视频四种模态输入,解决了AI视频生成可用率低、角色细节漂移等行业痛点,最长可生成60秒2K广播级画质视频 [3] - 阿里千问于3月2日正式开源Qwen3.5-0.8B、2B、4B、9B四款小尺寸模型,其“智能密度”获得马斯克赞赏 [3] 国际行业动态与中国模型的关联 - 全球知名编程工具Cursor发布的自研前沿编码模型Composer 2,在测评中性能超过Claude Opus 4.6,后被开发者发现是基于Kimi K2.5微调而来,马斯克在社交媒体上证实了这一点 [1] - 此事件引发行业广泛关注,Kimi团队以中文热梗“听说我,谢谢你,因为有你”幽默致谢,被赞“温柔中展现技术自信” [3] 埃隆·马斯克的积极评价 - 马斯克在社交平台转发并评论Kimi的技术报告为“Impressive work from Kimi”(Kimi的作品令人印象深刻) [3] - 马斯克在阿里千问官方帖子下留言,称赞其开源模型具有“Impressive intelligence density”(令人印象深刻的智能密度) [3] - 马斯克转发关于字节跳动Seedance 2.0的推文并感慨“It's happening fast”(这也太快了) [3]
刚刚,小云雀的短剧Agent上线了,背后是字节自己的Seedance 2.0。
数字生命卡兹克· 2026-03-19 11:31
核心观点 - 字节跳动旗下产品“小云雀”推出了一款基于Seedance 2.0模型的AI短剧创作Agent,该工具通过自动化剧本生成、角色场景设计、分镜脚本到视频合成的全流程,将AI短剧/漫剧的制作效率提升至“生产力级别”,标志着AI影视工业化在短剧领域取得实质性进展 [2][37][38] 产品功能与性能 - **全流程自动化**:用户仅需提供一个剧本或故事设定,Agent即可自动完成从剧本拆解、角色与场景生成、分镜脚本到最终视频合成的全部工序,无需人工进行参考贴图、提示词编写和剪辑 [2] - **底层模型强大**:产品以“世界第一的AI视频模型”Seedance 2.0为技术基底,具备强大的导演思维和分镜能力 [2][37] - **高效率**:使用该Agent制作一集短剧仅需不到一小时,半天时间即可完成四集高质量短剧,相比手动使用Seedance 2.0模型(一集需两三天)效率实现飞跃式提升 [5][8][9] - **多风格支持**:工具不限制创作风格,能够生成包括真人武侠风、19世纪欧洲风格、国漫3D风格乃至创意改编(如猫猫版迅哥)在内的多种类型视频 [10][11][14][15][17] 用户体验与操作流程 - **两种输入模式**:支持用户直接输入完整剧本,或通过口述故事梗概由AI自动生成剧本 [21] - **标准化创作流程**:操作遵循“点子-剧本-人物-分镜-分场生成”的顺序,交互顺畅,易于掌握 [36] - **可控性与可修改性**:在生成过程中,用户可检查并重新生成单个角色、场景或分场视频,对结果拥有较高的控制权 [29][34] - **快速合成**:所有分场视频生成完毕后,点击“合成全集”按钮,仅需等待两三分钟即可得到一集完整的短剧 [33] 剧本创作方法论 - **人机协同**:高质量剧本创作依赖于“人类的审美标准+AI的执行力”,即由人类提供审美指导和关键输入,AI负责高效执行 [47] - **参考学习法**:通过向AI(如Claude模型)提供优秀剧本作为参考,让其总结创作规律,再根据特定要求(如小说改编)进行剧本写作 [48][49] - **处理长篇内容**:对于长达近两千章的网络小说改编,建议先由人类提炼核心“事件列表”以明确故事主线,再交由AI根据列表、剧本格式和原文进行改编,避免生成无关的“水情节” [51][53][55] - **质量定位**:当前方法生成的AI剧本质量尚无法与资深编剧的作品相比,但这代表了AI影视工业化进程中的一个重要实践阶段 [58] 行业意义与未来展望 - **生产力变革**:该工具实现了“人类只出脑子,让AI来干码字、出分镜、剪辑”的创作模式,极大解放了创作者在前期制作中的生产力 [57] - **技术迭代预期**:预计未来将从Seedance 2.0升级至3.0,Agent能力也将变得更加强大和高效 [58] - **人类创作的不可替代性**:尽管技术高效,但源于真实生活体验的情感、恐惧、愤怒与审美构成了人类艺术创作的核心文脉,这是AI无法替代的部分 [60][61] - **新时代的机遇**:工具降低了视频创作门槛,为创作者在AI视频新时代找到自身定位提供了可能 [61]
王兴兴点评Seedance 2.0:全球遥遥领先
经济观察报· 2026-03-18 14:55
文章核心观点 - 宇树科技创始人王兴兴认为,具身智能的“ChatGPT时刻”即将到来,乐观估计需18个月,其个人预估需2-3年,其标志是AI模型能在80%的陌生场景下,通过语言/文字指令完成80%的任务且无需提前建图 [2] - 实现上述目标的最大挑战在于AI模型的泛化能力不足,而解决数据稀缺问题的关键路径在于视频生成模型(如Seedance 2.0)与机器人动作的对齐与统一,一旦突破将从根本上解决数据难题并诞生机器人计算模型 [1][3][4] - 宇树科技在硬件产品、数据采集、远程控制及AI强化学习等方面取得进展,为迎接“ChatGPT时刻”进行技术和产能储备 [2][4][5] 行业趋势与挑战 - **“ChatGPT时刻”预判**:具身智能领域类似ChatGPT的突破性时刻即将来临,定义为AI模型在80%陌生场景下通过语言/文字指令完成80%任务且无需提前建图 [2] - **核心挑战**:当前行业面临的最大挑战是AI模型的泛化能力不足,导致机器人在更换场景后成功率大幅下降 [2][3] - **技术路径分歧**:行业模型主要分为两大流派,即融合语言/文本模型的VLA模型,以及通过对物理世界进行预估和建模来驱动机器人的世界模型 [3] - **关键突破口**:基于视频生成的世界模型被高度看好,文生视频模型(如Seedance 2.0)的发展被视为解决机器人数据稀缺问题的关键,其核心难题在于生成的高质量视频与机器人实际动作无法良好对齐和统一 [1][3][4] 宇树科技的技术与产品进展 - **数据采集与远程操作**:公司开发了全身遥操作系统以实现人机动作同步,该系统具备两大实用功能:1) 大规模数据采集,计划在2026年底前部署上万台机器人每天采集10小时数据,以在2-3年内解决数据稀缺问题;2) 远程实时控制,例如在杭州操作异地机器人 [2] - **硬件产品迭代**: - 2025年发布了适用于工业级应用的新一代机器狗,具备防尘防水功能,满电空载续航超过20千米 [4] - 发布了更大尺寸(1.8米高)的H2机器人,力量更大,适用于工业或农业场景 [4] - 预计2025年年中,其人形机器人的百米冲刺速度能跑进10秒以内,超越人类纪录 [4] - **AI与算法升级**: - 2025年最大的软件升级是“功夫模式”,通过加装两颗128线3D激光雷达和预训练AI模型,使机器人动作可随时暂停或任意切换,灵活性大增 [5] - 开发了集群跑位算法,使机器人能从步行变为跑步变阵,衔接更自然,此能力已在2025年央视春晚表演中得到展示 [5] - **市场与出货量**:截至2025年底,宇树G1机器人全球出货量约5000台,最便宜机型售价约3万元;公司预测若AGI(通用人工智能)达到临界点,其年出货量可能飙升至百万台级别 [5]
谷歌NanoBanana2亮相,多模态步入产业重构深水区
中邮证券· 2026-03-18 12:23
行业投资评级 - 行业投资评级为“强于大市”,且评级为“维持” [1] - 行业收盘点位为825.13,52周最高为1021.75,52周最低为591.71 [1] 核心观点 - 报告核心围绕多模态AI技术的重大进展及其对内容产业的变革性影响展开 [4][5][6] - 谷歌发布Nano Banana 2,其性能登顶文生图全球榜首,在Artificial Analysis的文生图基准测试中位居全球第一,在Image Arena中其文生图斩获1279 Elo得分位居第一 [4] - Nano Banana 2通过成本腰斩与质量跃升,有望加速视觉创作的工业化落地与商业变现 [5] - 同期国内多模态赛道密集发力,阿里发布千问Qwen-Image-2.0,字节Seedance 2.0全量上线,印证2026年或成多模态商业化加速年 [6] - 多模态竞赛已步入产业重构的深水区,模型能否低成本、高质量赋能产业应用已成为未来核心竞争力 [6] 事件与模型分析 - **谷歌Nano Banana 2模型特点**:该模型将Gemini Flash的高速智能融入视觉生成,利用世界知识库实现精准文本呈现与翻译,保持最多5个角色和14个对象的一致性,支持从512p到4K的多种分辨率 [5] - **成本优势**:Nano Banana 2基于Gemini 3.1 Flash架构优化,定价降至每百万token 60美元,相较Nano Banana Pro输出定价(每百万token 120美元)价格腰斩 [5] - **产业影响**:模型迭代显著优化了AI生图的成本与效率曲线,能推动文生图转向生产力工具,助推AI图像生成进入工业化落地阶段,可广泛赋能广告、影视、游戏等B/C端内容生产及创意产业 [5] - **国内进展案例**:使用Seedance工具制作的2分钟科幻短片《归途》整体成本仅330.6元,而传统制作框架下成本可能高达数十万;首批接入Seedance 2.0的时刻互动,月产AI短剧超320分钟 [6] 投资建议 - **广告营销领域**:多模态AI有望推动营销物料边际成本指数级下降,建议关注易点天下、蓝色光标、浙文互联、分众传媒、引力传媒等 [7] - **IP储备与内容转化领域**:AI极大降低了文字IP向视频内容转化的门槛,海量优质IP储备的公司价值有望重估,建议关注光线传媒、中国电影、北京文化、华策影视、上海电影、中文在线、阅文集团等 [7] - **游戏产业领域**:多模态产业化加快有望推动游戏产业从美术降本增效向AI原生游戏变革,建议关注腾讯控股、网易、恺英网络、吉比特、完美世界、巨人网络、世纪华通、贪玩等 [7][8]