春晚张杰《驭风歌》背后的马,是Seedance 2.0做的!
量子位·2026-02-17 11:58

豆包大模型及火山引擎技术在春晚的应用与展示 - 豆包大模型家族的多项技术(包括豆包Seedance 2.0、Seedream、豆包语音识别模型、豆包TTS 2.0、字节Seed 3D模型、DA3模型等)在2025年央视春晚的多个节目中成功落地应用,从舞台视觉特效、机器人表演到直播互动与无障碍字幕,实现了全面覆盖 [6][38][43] - 火山引擎的视频云团队与方舟平台为春晚提供了关键的画质增强、高并发支持与空间视频技术,确保了8K高清、50FPS高帧率等超高规格节目的稳定呈现与流畅互动 [15][29][31] 视频生成与动态控制技术(Seedance 2.0) - 核心能力突破:豆包Seedance 2.0视频生成模型实现了从“能生成”到“能控制”的进化,具备精细的微观控制能力、超强的指令遵循能力和多模态素材参考能力 [8][10][11] - 国风美学理解:该模型成功处理了极具挑战的“中国水墨风”,在张杰《驭风歌》节目中生成了气势磅礴、奔腾的骏马动态水墨画卷,通过了春晚超级严格的审核 [4] - 复杂场景应用:在《贺花神》节目中,为十几位明星定制了“一人一景”的中式视觉奇观,精准控制了植物缓慢绽放及纹理、层次、光影的细微变化 [7] - 视频动作迁移:在《快乐小马》节目中,利用该技术将真人舞蹈动作一键迁移至卡通小马形象上,解决了不同拓扑结构间的适配难题,并保持了原图在剧烈运动时的稳定性 [13][14] 画质增强与空间视频技术(火山引擎) - 智能画质增强框架(MIPP):针对AIGC内容,火山引擎利用超分算法将720P视频提升至8K,并通过插帧技术将24帧补至50帧,同时结合视频理解技术进行针对性去噪、锐化等处理,抹平微小瑕疵 [16][17] - 空间视频技术(4D高斯泼溅/4DGS):在《梦底》节目中,通过70台工业级相机阵列采集演员数据,重建为4D数字资产,实现了与现场灯光实时互动的多个高精度虚拟分身同台表演,创造了虚实难辨的沉浸感 [18][20][21][23] - 性能与细节优化:技术团队利用字节Seed 3D模型预制“影子几何”提升渲染效率,并引入DA3模型从单图推断高精度深度信息,确保了近景皮肤质感等细节的逼真度 [25] 机器人赋能与具身智能 - 多模态模型赋能:豆包大模型全家桶为宇树机器人等春晚登台机器人提供了“眼”(视觉理解模型用于环境识别与避障)、“脑”(大语言模型用于理解自然语言指令)、“嘴”(TTS 2.0用于富有情感的语音合成)的能力,使机器人能看懂环境、听懂人话并带感情说话 [24][27][30] - 行业应用广泛:豆包大模型在具身智能圈已服务宇树、银河通用、智元机器人等40多家公司 [40] 高并发AI互动与平台支撑(火山引擎方舟平台) - 首次AI互动:今年春晚首次实现由大模型驱动的AI互动(如生成新春头像、定制祝福语),其本质是计算密集型的Agent过程,相比以往事务型互动算力消耗巨大 [28] - 抗洪峰解决方案:火山引擎方舟平台通过跨机房联邦集群弹性伸缩、推理层硬件极限优化(如算子手写优化、Prefill/Decode分离)以及秒级权重复制加载等技术,成功顶住了亿万流量瞬间涌入的挑战 [29][31] 语音识别与无障碍字幕 - 复杂场景识别:豆包语音识别模型在春晚直播的复杂噪声环境(含快语速、多梗、方言、掌声、背景音乐)下,展现了多方言鲁棒性、上下文感知(召回率提升15%以上)和低时延流式识别的能力,为抖音直播间提供了AI无障碍直播字幕 [36][37][39] 行业生态与合作伙伴 - 广泛的朋友圈:豆包大模型通过火山引擎已渗透至多个行业,在车圈服务了超9成主流车企(包括奔驰、特斯拉、比亚迪、蔚小理等),在手机/PC圈与全球Top10手机厂商中的9家(如小米、OPPO、vivo、荣耀、三星)及联想等公司合作 [40] - 技术整合价值:春晚作为一次大型“买家秀”,证明了豆包大模型及相关技术能够扛住顶级压力、真正落地并创造价值,其对中国文化的深刻理解与强大的工程化能力是关键 [41][42][45]

春晚张杰《驭风歌》背后的马,是Seedance 2.0做的! - Reportify