阶跃星辰 Tech Fellow 段楠：Step-Video 系列模型的关键技术解读

2025全球机器学习技术大会 - 大会将于4月18-19日在上海虹桥西郊庄园丽笙大酒店举行设有12大技术专题汇聚50+位院士 IEEE Fellow等顶尖专家 [2] - 专题涵盖智能体联邦学习多模态大模型强化学习等前沿议题 [2] - 大会设置AI企业创新展区展示产业链技术产品方案展位所剩不多 [9][11] 段楠博士技术分享 - 阶跃星辰Tech Fellow段楠博士将在「多模态大模型前沿」专场分享《视频生成基础模型进展挑战和未来》 [2] - 段楠博士曾任微软亚洲研究院资深首席研究员12年专注自然语言处理多模态基础模型等领域 [4] - 分享将围绕开源Step-Video系列模型剖析文生视频图生视频等任务的最新进展 [6] 阶跃星辰开源模型 - Step-Video-T2V为300亿参数视频生成模型支持8-10秒540P视频覆盖11类内容生成需求中英双语输入 [5][6] - Step-Audio是首款工业级开源语音交互模型支持多语种实时高保真生成适用于客服翻译等场景 [5][6] - 两款模型在多项指标上超越现有开源模型已应用于自动驾驶影视创作等领域 [6] 行业影响与参与 - 大会为科研学者技术专家提供前沿洞见推动AI技术变革与应用落地 [8] - 活动旨在促进AI生态融合探索产业升级路径拓展应用场景 [9][11]