Workflow
混元图像3.0(HunyuanImage 3.0)
icon
搜索文档
可能是目前效果最好的开源生图模型,混元生图3.0来了
量子位· 2025-09-30 20:22
模型发布与核心定位 - 腾讯混元发布并开源原生多模态图像生成模型HunyuanImage 3.0,参数规模高达800亿,是目前参数量最大的开源生图模型[1] - 该模型是首个开源工业级原生多模态生图模型,将理解与生成一体化融合,效果对标业界头部闭源模型,堪称开源领域最强图像生成模型[1] - 模型支持多分辨率图像生成,具备强大的指令遵从、世界知识推理和文字渲染能力,出图具有极致的美学与艺术感[1] 模型能力与生成效果 - 模型继承了Hunyuan-A13B的世界知识,具备原生世界知识推理能力,例如能根据“解方程组5x+2y=26,2x-y=5,给出详细过程”的提示词解题并生成步骤图[4][5] - 能够驾驭复杂提示词,如“用一幅图介绍堆排序算法流程,用小黄脸的表情包可视化,表情越开心代表数值越大,并提供伪代码,手帐风格,小红书图片样式”[7] - 通过对文字渲染数据的定向补充和借助HunyuanOCR进行文字识别的能力提升,3.0版本实现了接近头部模型的文字渲染能力,便于海报、表情包制作等创意玩法[7] - 经过与设计师配合的后训练打磨,模型形成了自身的美学风格,能够进行四宫格图生成、漫画创作、不同材质模型设计及素描教程制作[11][14] 核心技术方案 - 新一代模型基于Hunyuan-A13B(总参数量800亿,激活参数量130亿),采用原生多模态、统一自回归框架,将文本理解、视觉理解与高保真图像生成深度融合[17] - 不同于将LLM仅作编码器的传统DiT路线,混元3.0以LLM为核心底座,天然继承强大的语言与推理能力,并在预训练阶段深度混合LLM数据、多模态理解与生成数据,形成“理解反哺生成、语言驱动视觉”的正反馈闭环[19] - 模型采用VAE+ViT的联合特征作为图像理解输入,在图像生成侧将Diffusion建模无缝嵌入LLM架构,实现文本和图像的灵活交互,覆盖从创作到编辑的完整链路[23] 关键技术创新 - 引入广义因果注意力,在保持文本token遵循因果型注意力的同时,对图像token赋予全局注意力能力,形成兼顾“语言因果推理”与“图像全局建模”的注意力矩阵[25][26] - 采用“图文交织”的训练范式提升长上下文理解与生成能力,训练序列可包含多个加噪图像,并通过专用attention mask确保训练与推理的一致性[28] - 将LLM中的一维位置编码扩展为二维位置编码,并保证完全兼容原来文本token的一维编码,以最大程度保持原始LLM的语言能力[30] 数据处理与训练策略 - 采用全面的三阶段过滤流程,从超过100亿张原始图像中筛选出近50亿张高质量、多样化图像,并补充了知识增强、文本相关等专业数据集[32] - 构建了中英双语、分层级的图像描述体系,并集成专门的OCR和命名实体识别代理来保证描述的真实性,还专门构建了推理数据集以激活模型的思维链能力[34] - 采用渐进式四阶段预训练,从256像素分辨率开始逐步提升至1024像素,并引入复杂交错图文数据及思维链数据,后续进行指令微调和多阶段后训练[36][37][38] 模型性能评估 - 模型采用机器指标和人工评测两种方式评估效果,其中SSAE指标构建了500道评测题目并按12个细分要点拆解,HunyuanImage 3.0在各细分要点上都媲美甚至超越业界领先模型[40][43] - 在人工评测GSB中,HunyuanImage 3.0相较于Seedream 4.0胜率为1.17%,相较于Nano Banana胜率为2.64%,相较于GPT-Image胜率为5.00%,相较于上一版本模型HunyuanImage 2.1胜率为14.10%[46] - 评测结果表明HunyuanImage 3.0是足以媲美业界领先闭源模型的开源模型[47]
科创人工智能ETF(588730)涨3.14%,DeepSeek、寒武纪同步发布相关重要事项
格隆汇· 2025-09-30 15:39
节前最后一个交易日,芯片、科创人工智能板块领涨,澜起科技涨超7%,带动科创人工智能ETF(588730)涨3.14%,盘中净值创历史新高。 科创人工智能ETF跟踪上证科创板人工智能指数,聚焦于AI产业链最核心的算力芯片和智能硬件环节,半导体权重达54.1%,前三大权重股包含寒武纪(16.62%)、澜起科技(10%)和芯原股 得益于精准覆盖"AI芯片+AI应用",资金大幅涌入科创人工智能ETF,近5日资金净流入额1.14亿元,最新规模17.47亿元。 科创人工智能、芯片股上涨,消息面上: 华鑫证券表示,国产AI芯片大时代已经来临,国产AI产业链从上游先进制程到先进封装,到下游字节阿里腾讯的模型加速迭代升级已经实现全产业链打通,坚定看好国产AI算力设施的加速突破 DeepSeek介绍,得益于新模型服务成本的大幅降低,官方API价格也相应下调,新价格即刻生效。在新的价格政策下,开发者调用DeepSeekAPI的成本将降低50%以上。 随后,多家国产芯片厂商宣布完成对DeepSeek-V3.2-Exp的适配。寒武纪发文称:已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的适配,并开源大模型推理引擎v ...
华虹半导体涨超15%,科创芯片ETF指数、科创芯片ETF涨超2%
格隆汇APP· 2025-09-30 13:10
科创芯片ETF富国、科创芯片ETF国泰、科创芯片ETF指数、科创芯片ETF博时、科创芯片50ETF、科创 芯片ETF南方、科创芯片ETF基金、科创芯片ETF涨超2%。 | 名称 | 代码 | 涨跌幅 ▼ | 5日涨跌幅 | 估算规模 管理公司 | | --- | --- | --- | --- | --- | | 科创芯片ETF富国 | 588810 | 2.96% | 8.32% | 5.77亿 富国基金 | | 科创芯片ETF国泰 | 589100 | 2.87% | 8.34% | 6.41亿 国泰基金 | | 科创芯片ETF指数 | 588920 | 2.73% | 8.25% | 4.33亿 鹏华基金 | | 科创芯片ETF博时 | 588990 | 2.69% | 8.36% | 6.76亿 博时基金 | | 科创芯片50ETF | 588750 | 2.69% | 8.11% | 53.99亿 汇添富基金 | | 科创芯片ETF南方 | 588890 | 2.59% | 8.23% | 22.58亿 南方基金 | | 科创芯片ETF基金 | 588290 | 2.53% | 8.27% | 36 ...
两大千亿芯片龙头,历史新高
中国证券报· 2025-09-30 12:38
今天上午,有色金属、存储芯片、AI应用三大板块领涨。 有色金属板块全线走强,洛阳钼业(603993)、华友钴业(603799)、江西铜业(600362)、北方稀土(600111)等龙头股上涨。 存储芯片板块爆发,江波龙(301308)、德明利(001309)等个股大涨;半导体产业链走强,华虹公司上涨15.16%,澜起科技上涨6.93%,这两只龙头股 总市值均超千亿元,股价均创历史新高;隔夜美股中存储股纷纷大涨,其中,闪迪涨近17%,美光科技涨超4%。 | 永兴材料 | 38.98 | 7.44% | 10亿 | | --- | --- | --- | --- | | 融 002756 | | | | | 华友钻业 | 64.64 | 7.29% | 80.0亿 | | 融 603799 | | | | | 最终涨停 10:19 | | | | | 云南铜业 | 17.27 | 6.15% | 20.6亿 | | 融 000878 | | | | | 兴业银锡 | 33.13 | 5.98% | 20.1亿 | | ■ 000426 | | | | | 腾远钻业 | 75.70 | 4.75% | 11.1亿 ...
计算机行业点评:腾讯混元开源原生多模态生图模型,3D生成亦再突破
西部证券· 2025-09-29 16:02
核心结论 腾讯混元开源首个工业级原生多模态生图模型,具备强语义理解与知识推理 能力。9 月 28 日,腾讯混元正式发布并开源了原生多模态生图模型,即混元 图像 3.0(HunyuanImage 3.0),参数规模 80B。这是首个开源的工业级原生 多模态生图模型。在技术架构上,它通过一个模型完成文字、图片、视频与 音频等多个模态的输入与输出,而非通过多个模型的组合实现图文理解、图 片生成等任务。混元图像 3.0 以 Hunyuan-A13B 为基础,基于 50 亿量级的图 文对,视频帧,图文交织数据和 6T 的语料数据进行了多模态生成、理解和 LLM 的混合训练,使得模型能够充分融合多任务效果,实现超强的语义理解 能力,能够响应复杂的长文本,生成长文本文字,同时具有 LLM 的世界知 识,能够利用世界知识进行推理。这意味着,混元图像 3.0 不仅拥有生图模 型的画画能力,还具备语言模型的思考能力和常识。它就像一个自带"大脑" 的画家,可以利用智能去思考图像的布局、构图、笔触,利用世界知识去推 理常识性的画面。 腾讯混元 3D 再升级。9 月 26 日,腾讯宣布混元 3D 生成模型家族添加新成 员——混元 3D ...
王健林被限制高消费;贾国龙清空社交账号;小米SU7 Ultra首次在日本亮相;星河动力航天完成24亿元D轮融资丨邦早报
创业邦· 2025-09-29 08:08
万达集团及王健林相关法律纠纷 - 大连万达集团股份有限公司及其法定代表人王健林被限制高消费 案件涉及强制执行金额1.86亿元[3] - 大连万达集团股份有限公司股权冻结信息达47条 被冻结股权的标的企业包括大连万达商业管理集团股份有限公司、万达文化产业发展有限公司等[3] - 大连万达集团股份有限公司还有10条被执行人信息 总金额达52.62亿元[3] - 万达知情人士表示此次是由于下属项目公司经济纠纷导致 或因执行层面信息不对称导致[3] 零跑汽车创始人回应限高事件 - 零跑汽车创始人朱江明回应被限高 称3天的限高已解除 此次风波暴露了团队能力不足[4] - 浙江零跑科技股份有限公司及其全资子公司凌跑汽车商贸有限公司被列为失信被执行人[4] 西贝餐饮创始人清空社交账号 - 西贝餐饮创始人贾国龙清空抖音、小红书及视频号账号内容 仅保留一条发布于2024年9月30日的视频作品[5] - 该视频涉及西贝餐饮成长史 称西贝是西北菜领域佼佼者 年营收达62亿元[5] 娃哈哈饮用水销售权变动 - 浙江娃哈哈饮用水有限公司的桶装水销售业务被要求转移至杭州迅尔城通商贸有限公司 方案于2025年3月25日正式落地实施[6] - 2025年4月 在未与经销商签订购销协议的情况下 要求经销商向杭州迅尔城通商贸有限公司下订单并完成发货及开票[6] 小熊电器养生壶爆炸事件 - 小熊电器回应养生壶爆炸事件 称正在调查当中[6] - 事件导致一岁孩子全身40%大面积烫伤 公司已安排专人慰问并提供帮助[6] 摩尔线程IPO过会及参股公司 - 摩尔线程IPO过会 主要从事全功能GPU相关产品的研发、设计和销售 是国内极少数兼顾图形渲染与AI计算的国产GPU公司[6] - 直接参股公司包括和而泰、盈趣科技等 间接参股公司包括宏力达、初灵信息、长飞光纤等[6] - 部分参股公司年内涨跌幅显著 例如和而泰涨153.22% 初灵信息涨29.50%[6][8] 理想汽车产品线进展 - 理想汽车产品线负责人张骁表示i8和i6拥有独立产线 生产节奏不受影响[8] - 受供应节奏变化和台风影响 72名i8小订用户交付延期至10月4日[8] 胖东来销售额数据 - 胖东来前9个月销售额超170亿元 达171.2亿元 已超2024年全年销售额169亿元[8] - 截至2025年9月27日 集团合计销售达1,712,873万元 本月集团合计销售176,013万元[9] 机器人专家警告人形机器人投资 - 著名机器人专家罗德尼・布鲁克斯警告投资人形机器人初创企业是浪费资金[9] - 其对特斯拉和Figure等公司通过视频训练机器人灵巧操作的做法持高度怀疑态度 称其为纯粹的幻想思维[9] 捷豹路虎获得政府贷款担保 - 英国政府为捷豹路虎提供15亿英镑贷款担保 以增强其现金储备并支持供应链[11] - 贷款偿还期为五年 由英国出口融资机构提供出口发展担保支持[11] 小米SU7 Ultra日本亮相 - 小米SU7 Ultra首次在日本亮相 发售时间未定[11] - 小米计划在日本各大城市开设更多Xiaomi Store门店 并采取在智能手机门店同步销售EV的策略[11] 华为自动驾驶技术规划 - 华为车BU CEO靳玉志表示L3级自动驾驶将在2027年规模放量[11] - 汽车产业正进行三波浪潮变革 2022年至2027年为智能化阶段 算法替代司机[11] 融资事件汇总 - 星河动力航天完成24亿元D轮融资[12] - 微亿智造申请香港IPO 按2024年收益计算是中国最大的工业具身智能机器人供应商[12] - 优理奇完成两轮近亿元天使++轮及天使+++轮融资[12] - 航星传动完成数千万元A++轮融资[12] - 手智创新获得新一轮融资 投资机构包括湖北省人形机器人产业投资基金等[12] - 百型智能获金沙江创投数千万元投资 是国内首家做外贸垂类AI Agent的公司[12] - 天晴空天科技完成超亿元A轮融资[13] 腾讯混元发布开源生图模型 - 腾讯混元发布并开源原生多模态生图模型混元图像3.0 参数规模高达80B[13] - 该模型是首个开源工业级原生多模态生图模型 效果对标业界头部闭源模型[13] vivo手机AI新功能 - vivo X300系列手机推出AI电影分镜功能 支持超高像素一图多裁[15] smart插混车型预售 - smart首款插混车型精灵5 EHD开启预售 价格18.99万起[16] - 该车由梅赛德斯-奔驰全球设计团队打造 CLTC综合续航1615km 纯电续航252km[16] 餐饮行业监管新规 - 《餐饮服务连锁企业落实食品安全主体责任监督管理规定》发布 自2025年12月1日起施行[19] - 规定明确根据门店数量分级负责监管 10000家以上由省级 1000到9999家由市级 999家以下由县级市场监管部门负责[19] 中秋国庆假期交通预测 - 中秋国庆假期全社会跨区域人员流动量预计达23.6亿人次 日均约2.95亿人次 比去年同期日均增长3.2%[19] 美国重型卡车销售数据 - 8月美国重型卡车销售折合年率42.2万辆 创2022年1月以来新低[19] - 三个月移动平均值滑落至43.8万辆 为2020年疫情衰退时期后最弱水平[19] - 自去年5月以来销售量减少13.1万辆 跌幅达24% 连续四个月下滑[19] 上海元宇宙产业规模 - 上海元宇宙相关产业规模已突破3000亿元[19] - 集聚XR终端制造企业30余家 光学模组、空间计算芯片等核心元器件产能占全国40%以上[19]
腾讯发布并开源新一代生图模型“混元图像3.0”
新浪财经· 2025-09-28 11:24
公司技术发布 - 腾讯混元于9月28日发布并开源原生多模态生图模型"混元图像3.0(HunyuanImage 3.0)" [1] - 模型参数规模达80B 是当前参数量最大的开源生图模型 [1] - 该模型可对标业界头部闭源模型 且为首个开源工业级原生多模态生图模型 [1] 行业技术定位 - 该开源模型在工业级多模态生图领域具有开创性地位 [1] - 模型参数规模达到80B级别 显著超越现有开源解决方案 [1] - 技术能力直接对标行业头部闭源模型 体现行业技术竞争新态势 [1]