通义千问Qwen VLo

搜索文档
赛道Hyper | 通义千问推出多模态模型Qwen VLo
华尔街见闻· 2025-07-01 10:58
阿里云市场地位 - 2024年中国AI基础设施(AI IaaS)市场份额占比23%,位列中国市场第一,超过第二名和第三名总和 [1] - 在生成式AI基础设施领域取得模型训练和模型推理市场的双项冠军 [1] Qwen VLo技术创新 - 推出多模态统一理解与生成模型Qwen VLo,具备理解和基于理解进行再创造的能力 [2] - 采用渐进式生成方式,在生成图像时逐步构建画面并不断调整优化,确保结构、色彩、语义和谐统一 [3] - 运用动态分辨率训练技术,支持任意分辨率和长宽比,打破传统模型固定尺寸限制 [3] - 提升细节捕捉能力,在生成中保持较高语义一致性,精准识别并保留关键特征 [4] - 支持自然语言指令编辑,可完成艺术风格迁移、场景元素添加等复杂操作 [4] Qwen VLo多语言与全球化 - 支持中文、英文等多种语言指令,全球用户可通过简洁描述需求生成结果 [5] - 技术手段打破语言壁垒,促进全球用户在图像生成领域的交流 [5] Qwen VLo行业应用 - 广告设计行业:快速生成多版不同构图、配色的海报草图,缩短设计周期 [5] - 包装设计:根据产品特点和目标受众生成设计图,提供创意灵感 [5] - 教育领域:将抽象知识具象化,如生成地貌图片或古诗词场景图辅助教学 [6] - 自媒体与内容创作:根据主题生成优质配图或视频分镜草图,提升创作效率 [6] - 游戏开发:生成游戏场景、角色、道具等美术素材,降低开发成本 [6] - 影视制作:生成影视场景概念图、角色概念图,为前期设计提供方向 [6]