Workflow
Seedream 5.0 Preview
icon
搜索文档
多款国产大模型将重磅落地,光模块、CPO等算力硬件股回调,通信ETF华夏(515050)跌超1.5%
新浪财经· 2026-02-11 13:40
市场表现与板块动态 - 2月11日AI产业链表现分化,光模块CPO等算力硬件冲高回落,算力租赁、云计算等概念逆势走强 [1] - 热门个股中,华策影视跌超10%,中文在线、蓝色光标、中际旭创、新易盛、昆仑万维等纷纷调整 [1] - 截至13:27,通信ETF(515050)下跌1.88%,创业板人工智能ETF华夏(159381)下跌1.83%,云计算ETF华夏(516000)小幅上涨 [1] - AI板块短期调整,被视为提供更具性价比的布局窗口 [1] 产品与技术进展 - 春节期间国产AI行业将有几款重磅产品推出 [1] - DeepSeek即将发布新一代大模型V4,可能通过创新架构进一步降低训练和推理成本 [1] - 代号"Pony Alpha"的高性能模型被广泛推测为智谱AI新一代旗舰产品GLM-5,其展现的高端编程与智能体水平被视为国产大模型在关键领域的重要突破 [1] - 字节同步推出Seedream 5.0 Preview,对标谷歌Nano Banana Pro,力求在抽象语义处理和多步图文生成上更稳 [1] - 若DeepSeek V4能显著降低训练与推理成本,可能帮助大模型及应用开发商更快地将技术转化为收入,缓解盈利压力 [2] 投资逻辑与关注方向 - 需要关注那些能率先利用新一代大模型能力,打造出颠覆性AI原生应用或智能体的软件公司,其增长天花板可能因模型能力的飞跃而被再次推高 [2] - 全球主要云服务商正全力追逐通用人工智能,资本开支的竞赛远未停歇 [2] - 全球大模型及应用开发商正背负着日益沉重的资本开支负担 [2] 相关ETF产品信息 - 通信ETF华夏(515050)深度聚焦电子(芯片、PCB、消费电子)+通信(光模块、服务器)算力硬件,前五大持仓股为中际旭创、新易盛、立讯精密、工业富联、兆易创新 [2] - 创业板人工智能ETF华夏(159381)跟踪指数CPO权重近50%,同时覆盖国产软件+AI应用企业,具备较高弹性,前三大权重股为中际旭创(15.64%)、新易盛(15.57%)、天孚通信(6.85%),场内综合费率仅0.20% [2] - 云计算ETF华夏(516630)聚焦国产AI软硬件算力,计算机软件+云服务+计算机设备合计权重高达83.7%,deep seek、AI应用含量均超40%,场内综合费率仅0.20% [3]
字节发完阿里发,Qwen-Image 2.0火线出击
36氪· 2026-02-10 20:52
阿里巴巴发布Qwen-Image 2.0模型 - 阿里巴巴发布新一代图像生成基础模型Qwen-Image 2.0,该模型支持长达一千个token的超长指令和2k分辨率,并采用更轻量的模型架构 [2] - 模型尺寸远小于Qwen-Image 2.0的20B,带来更快的推理速度 [2] - 该模型将图像生成与图像编辑两个能力整合到了一个模型中 [12] 模型核心能力与特点 - 模型升级重点是文字渲染,能够用超长提示词精确定义文字的字体、排版、格式,并做到不错的还原 [2] - 能够用毛笔字渲染《兰亭集序》全文,确保文字与画面协调,文字渲染失败的比例很低 [4] - 针对AI生图常见的“油腻感”问题进行了优化,色彩不会过于饱和,观感更像实拍 [5] - 支持一次性渲染数十个子图(例如24个画面),并能保持其中主体(如人物、画风)的一致性 [9] - 模型尺寸比1.0版本(约200亿参数)显著减小,但能力更强,且生成速度更快 [37] 模型性能基准测试表现 - 在AI Arena平台的文生图基准测试中,Qwen-Image 2.0的ELO得分为1029,排名第三,胜率为47.29% [8] - 在图生图(单图编辑)基准测试中,Qwen-Image 2.0的ELO得分为1034,排名第二,胜率为35.97% [12] - 在文生图基准中,排名第一的是谷歌的Gemini-3-Pro-Image-Preview(ELO 1050),排名第二的是OpenAI的GPT Image 1.5(ELO 1043)[8] - 在图生图基准中,排名第一的是谷歌的Gemini-3-Pro-Image-Preview(ELO 1042),排名第三的是字节跳动的Seedream 4.5(ELO 1011)[12] 与竞品的横向体验比较 - 在长指令遵循、长文本渲染方面具有优势,但在图像生成的真实感上仍稍逊于谷歌的Nano Banana Pro [2] - 在超长提示词文字渲染任务中,能准确还原图片布局、字体颜色和内容,而字节跳动的Seedream 5.0 Preview在还原文字内容上出现偏差,谷歌的Nano Banana Pro则存在部分文字模糊的问题 [15][17][19][22] - 在多子图生成任务(生成20个分镜的漫画)中,Qwen-Image 2.0未能完全按要求生成,画面存在不符合常理的现象;而谷歌Nano Banana Pro和字节Seedream 5.0 Preview均未能成功生成 [24][28] - 在超现实场景图像生成任务中,Qwen-Image 2.0生成的画面与提示词存在差距,而谷歌Nano Banana Pro的生成结果更符合提示词的关键描述 [30][32] - 字节跳动的Seedream 5.0 Preview在超现实场景生成中未遵循“像水晶般透明”的要求,但其余内容基本得到还原,画风更具科幻感 [36] 技术路径与未来规划 - 项目负责人表示,Qwen-Image 2.0升级的核心是“信息图”,未来一年团队将继续研究如PPT、多图海报、漫画等复杂“父图”的生成,进一步减少幻觉和错误 [14] - 计划在分层模型基础上,进一步强化模型的分层编辑能力,目标是让生成模型真正成为生产力工具,实现“分而治之”的复杂编辑流程 [14] - 通过提升VAE(变分自编码器)的重构能力和增强对密集细小文字的建模,解决了小文字信息密集导致压缩难度大、容易崩坏的问题 [39] - 采用生成与编辑融合的“二合一”模型,实现了能力相互促进,达到1+1>2的效果,编辑任务训练能反哺文生图,使其对提示词更敏感、遵循更精确 [32][34][35] 市场定位与商业化落地 - 模型能力的提升,尤其是在可控性和稳定性方面,使其能真正渗透到各行各业 [39] - 在电商领域,可用于海量商品的主图、详情图、广告素材图生成,如服装行业的模特换装、商品属性修改以及利用“信息图”能力生成商品详情长图 [39] - 在医疗等专业领域,可将复杂的流程通过信息图、流程图等形式可视化 [39] - 中国AIGC市场在应用落地和产业迭代速度上具有优势,丰富的应用场景能催生新的产业链并快速反哺模型迭代 [39] - Qwen-Image系列将与WPS等国民级应用合作,获取真实用户反馈和需求,形成从应用到技术的闭环迭代 [40] 行业趋势观察 - 图像生成领域的头部厂商已达成共识,模型不仅追求生成逼真画面,更要满足现实场景中对提示词精准遵循、文字准确渲染等关键需求,这些是决定模型生产力的核心要素 [41] - 随着模型不断优化迭代,图像生成有潜力成为企业和个人在信息处理、创作表达及决策支持等方面的强大助手 [41]