Workflow
“卷王”阶跃星辰又卷出新花样,但姜大昕的理想道阻且长
观察者网·2025-05-16 15:29

公司动态 - 阶跃星辰开源最新多模态大模型Step1X-3D 总参数量达4.8B(几何模块1.3B 纹理模块3.5B)采用3D原生两阶段架构生成高保真可控3D内容 [1] - 公司自建包含200万高质量训练样本库 数据筛选覆盖超500万原始数据 水密几何转换成功率提升20% [3] - 模型采用FLUX MMDiT结构和Rectified flow算法建模几何生成 基于Diffusion model生成多视角一致纹理 [3] - 模型架构兼容2D控制技术(如LoRA微调) 支持用户精准调控3D资产属性 [5] - 在110项测试用例评估中表现优异 CLIP-Score指标位列开源模型首位 [7] 技术突破 - Step1X-3D实现几何与纹理表征解耦 通过增强型网格-SDF转换技术提升建模效率 [3] - VAE-Diffusion架构延续Stable Diffusion设计范式 实现2D控制技术迁移应用 [5] - 3D原生两阶段架构突破行业数据瓶颈 解决具身智能赛道3D数据稀缺问题 [9] 战略布局 - 公司已发布20多款自研基座模型 以每月高频更新节奏被称为"多模态卷王" [7] - 创始人姜大昕强调多模态是AGI必经之路 需先实现多模态融合再发展Agent技术 [9] - 当前重点布局语音/图像/视频/音乐等多模态方向 每条技术路线需6个月以上积累 [10] 行业定位 - 公司作为"大模型六小虎"中最晚成立者 凭借基座模型实力站稳行业地位 [7] - 多模态模型尚处早期阶段 相当于语言模型2017年前水平 未现Transformer级突破 [9] - 理解生成一体化需综合语言/视觉/推理能力 公司完整多模态布局符合技术演进需求 [10]