Workflow
混元图像3.0(HunyuanImage 3.0)
icon
搜索文档
50万激励,腾讯青云奖学金启动申请
机器之心· 2025-10-15 12:08
腾讯青云奖学金项目概述 - 腾讯公司正式启动“腾讯青云奖学金”项目,旨在支持青年学者,特别是计算机科学、人工智能及交叉领域的硕士和博士生 [6][8] - 项目预计从申请者中评选出15位获奖者,评选结果将于12月公布 [9][10] - 每位获奖者将获得20万元人民币现金以及价值30万元人民币的腾讯云异构算力资源 [15] 学术界算力资源挑战 - 全球学术界普遍面临算力紧缺问题,与产业界及大型科技公司相比硬件资源捉襟见肘 [1][3] - 《自然》杂志文章及布朗大学arXiv论文均指出学术界算力受限现状,一项针对50名研究者的调查显示66%的受访者对自身算力资源满意度打3分或更低(满分5分) [1][3] - 算力困境导致研究者需排队等待硬件资源,将时间浪费在申请服务器、调试环境上,影响原创性探索 [5] 产业界对学术界的算力支持举措 - 国际科技公司如亚马逊云科技、谷歌和微软通过提供云积分等方式为研究人员提供算力支持 [5] - 国内高校如清华大学向本科、硕博生免费发放算力券以缓解算力焦虑 [5] - 腾讯青云奖学金将稀缺的算力资源纳入支持体系,切中青年学者核心痛点 [15] 腾讯青云奖学金资源价值与配置 - 价值30万元的云异构算力约可支持3个月前沿GPU实例24小时不间断使用或8卡前沿GPU算力2000小时不间断使用 [18] - 获奖者可灵活配置算力方案,自由选择10余种高性能GPU卡型,以适应大模型研究不同阶段的算力需求 [19] - 该算力资源预计能够覆盖大多数高校科研团队在大部分实验阶段的需求,除百亿及以上参数的超大规模模型 [20] 腾讯公司人工智能技术布局 - 公司已形成混元系列模型、应用产品、AI编程助手和智能体平台在内的全栈式人工智能体系 [23] - 开源文生图模型混元图像3.0在国际权威AI模型盲测榜单LMArena中登顶,击败谷歌Nano-Banana和字节Seedream 4.0 [23][24] - 公司广泛的业务矩阵为技术落地提供丰富场景和数据支撑,构筑在大模型时代的核心竞争壁垒 [24] 产学研结合与人才战略 - 奖学金项目是产业界与学术界保持紧密互动、搭建产学研闭环及储备人才的关键环节 [13][14] - 除资金和算力支持外,公司将为获奖者搭建产学研交流平台,提供企业导师指导与多元成长机会 [15] - 通过“青云计划”,获奖者及实力不俗的青年学者均有机会加入腾讯,将科研成果与产业实践相结合 [23]
可能是目前效果最好的开源生图模型,混元生图3.0来了
量子位· 2025-09-30 20:22
模型发布与核心定位 - 腾讯混元发布并开源原生多模态图像生成模型HunyuanImage 3.0,参数规模高达800亿,是目前参数量最大的开源生图模型[1] - 该模型是首个开源工业级原生多模态生图模型,将理解与生成一体化融合,效果对标业界头部闭源模型,堪称开源领域最强图像生成模型[1] - 模型支持多分辨率图像生成,具备强大的指令遵从、世界知识推理和文字渲染能力,出图具有极致的美学与艺术感[1] 模型能力与生成效果 - 模型继承了Hunyuan-A13B的世界知识,具备原生世界知识推理能力,例如能根据“解方程组5x+2y=26,2x-y=5,给出详细过程”的提示词解题并生成步骤图[4][5] - 能够驾驭复杂提示词,如“用一幅图介绍堆排序算法流程,用小黄脸的表情包可视化,表情越开心代表数值越大,并提供伪代码,手帐风格,小红书图片样式”[7] - 通过对文字渲染数据的定向补充和借助HunyuanOCR进行文字识别的能力提升,3.0版本实现了接近头部模型的文字渲染能力,便于海报、表情包制作等创意玩法[7] - 经过与设计师配合的后训练打磨,模型形成了自身的美学风格,能够进行四宫格图生成、漫画创作、不同材质模型设计及素描教程制作[11][14] 核心技术方案 - 新一代模型基于Hunyuan-A13B(总参数量800亿,激活参数量130亿),采用原生多模态、统一自回归框架,将文本理解、视觉理解与高保真图像生成深度融合[17] - 不同于将LLM仅作编码器的传统DiT路线,混元3.0以LLM为核心底座,天然继承强大的语言与推理能力,并在预训练阶段深度混合LLM数据、多模态理解与生成数据,形成“理解反哺生成、语言驱动视觉”的正反馈闭环[19] - 模型采用VAE+ViT的联合特征作为图像理解输入,在图像生成侧将Diffusion建模无缝嵌入LLM架构,实现文本和图像的灵活交互,覆盖从创作到编辑的完整链路[23] 关键技术创新 - 引入广义因果注意力,在保持文本token遵循因果型注意力的同时,对图像token赋予全局注意力能力,形成兼顾“语言因果推理”与“图像全局建模”的注意力矩阵[25][26] - 采用“图文交织”的训练范式提升长上下文理解与生成能力,训练序列可包含多个加噪图像,并通过专用attention mask确保训练与推理的一致性[28] - 将LLM中的一维位置编码扩展为二维位置编码,并保证完全兼容原来文本token的一维编码,以最大程度保持原始LLM的语言能力[30] 数据处理与训练策略 - 采用全面的三阶段过滤流程,从超过100亿张原始图像中筛选出近50亿张高质量、多样化图像,并补充了知识增强、文本相关等专业数据集[32] - 构建了中英双语、分层级的图像描述体系,并集成专门的OCR和命名实体识别代理来保证描述的真实性,还专门构建了推理数据集以激活模型的思维链能力[34] - 采用渐进式四阶段预训练,从256像素分辨率开始逐步提升至1024像素,并引入复杂交错图文数据及思维链数据,后续进行指令微调和多阶段后训练[36][37][38] 模型性能评估 - 模型采用机器指标和人工评测两种方式评估效果,其中SSAE指标构建了500道评测题目并按12个细分要点拆解,HunyuanImage 3.0在各细分要点上都媲美甚至超越业界领先模型[40][43] - 在人工评测GSB中,HunyuanImage 3.0相较于Seedream 4.0胜率为1.17%,相较于Nano Banana胜率为2.64%,相较于GPT-Image胜率为5.00%,相较于上一版本模型HunyuanImage 2.1胜率为14.10%[46] - 评测结果表明HunyuanImage 3.0是足以媲美业界领先闭源模型的开源模型[47]
科创人工智能ETF(588730)涨3.14%,DeepSeek、寒武纪同步发布相关重要事项
格隆汇· 2025-09-30 15:39
板块市场表现 - 节前最后一个交易日芯片和科创人工智能板块领涨 澜起科技股价上涨超过7% [1] - 科创人工智能ETF上涨3.14% 盘中净值创下历史新高 [1] - 科创人工智能ETF跟踪上证科创板人工智能指数 聚焦AI产业链核心的算力芯片和智能硬件环节 半导体权重达54.1% [1] - 前三大权重股包含寒武纪权重16.62% 澜起科技权重10% 以及芯原股份 [1] - 近5日资金净流入科创人工智能ETF达1.14亿元 最新规模为17.47亿元 [1] 行业动态与催化剂 - 9月29日DeepSeek宣布官方App、网页端、小程序同步更新为DeepSeek-V3.2-Exp [1] - DeepSeek新模型服务成本大幅降低 API价格相应下调 新价格即刻生效 [1] - 新价格政策下开发者调用DeepSeek API的成本将降低50%以上 [1] - 多家国产芯片厂商宣布完成对DeepSeek-V3.2-Exp的适配 [2] - 寒武纪同步实现对DeepSeek-V3.2-Exp的适配 并开源大模型推理引擎vLLM-MLU源代码 [2] - 9月28日腾讯混元正式发布并开源原生多模态生图模型混元图像3.0 参数规模达80B [2] 行业前景与产业链 - 华鑫证券表示国产AI芯片大时代已经来临 [2] - 国产AI产业链从上游先进制程到先进封装 再到下游字节阿里腾讯的模型加速迭代升级 已实现全产业链打通 [2] - 坚定看好国产AI算力设施的加速突破 [2]
华虹半导体涨超15%,科创芯片ETF指数、科创芯片ETF涨超2%
格隆汇APP· 2025-09-30 13:10
半导体芯片股市场表现 - 华虹半导体股价强势上涨超过15%,再度刷新历史新高[1] - 龙头公司中芯国际股价上涨2.88%,同样刷新历史高价[1] - 多只科创芯片ETF产品涨幅超过2%,其中科创芯片ETF富国涨幅达2.96%[1][2] - 科创芯片ETF国泰5日涨跌幅为8.34%,估算规模6.41亿[2] - 科创芯片50ETF估算规模达53.99亿,5日涨跌幅8.11%[2] - 科创芯片ETF估算规模最大,达390.83亿,5日涨跌幅8.37%[2] AI大模型技术进展 - DeepSeek宣布官方App、网页端、小程序同步更新为DeepSeek-V3.2-Exp[3] - DeepSeek API价格下调超过50%,得益于新模型服务成本大幅降低[3] - 多家国产芯片厂商宣布完成对DeepSeek-V3.2-Exp的适配[3] - Anthropic推出全新大模型Claude Sonnet 4.5,能够连续自主运行30小时[4] - 腾讯混元正式发布并开源原生多模态生图模型混元图像3.0,参数规模80B[4] AI算力产业链发展 - 华鑫证券研报表示国产AI芯片大时代已经来临,国产AI产业链实现全产业链打通[3][4] - 中银证券分析AI应用商业化拐点临近,应用端商业化加速催化算力需求[3] - TrendForce研究显示未来两年AI基础设施建置重心将更偏向支持高效能推理服务[4] - 传统大容量HDD严重供不应求,催生专为AI推理设计的Nearline SSD[4] - AI推理应用扩张预计将推动Enterprise SSD供应在2026年呈吃紧状态[4]
两大千亿芯片龙头,历史新高
中国证券报· 2025-09-30 12:38
有色金属板块 - 板块全线走强,能源金属、工业金属、小金属等细分领域大涨 [1][2] - 龙头股表现突出:洛阳钼业、华友钴业、江西铜业、北方稀土上涨,华友钴业单日成交额达80亿元 [1][3] - 政策面主要催化因素为《有色金属行业稳增长工作方案(2025—2026年)》,目标行业增加值年均增长5%,十种有色金属产量年均增长1.5% [4] - 工业金属中铜铝优先,供给侧明年预计保持硬约束,交易逻辑将向需求复苏和价格弹性过渡 [5] - 小金属方面重点看好钨、稀土和锡,钨因供给收缩致供需矛盾突出,稀土行业整合后供给格局良好,锡受益于AI和电子设备普及 [6] 存储芯片与半导体板块 - 存储芯片板块爆发,江波龙、德明利等个股大涨,半导体产业链走强 [1] - 龙头公司华虹公司股价上涨15.16%,澜起科技上涨6.93%,两家公司总市值均超过1000亿元,股价创历史新高 [1] - 隔夜美股存储股跟涨,闪迪上涨近17%,美光科技上涨超过4% [1] AI应用板块 - AI应用板块表现活跃,Sora概念、AI语料等细分领域上涨 [1][7] - 当虹科技股价涨停,涨幅达20%,易点天下上涨12.27%,昆仑万维上涨6.32% [7][8] - 消息面催化包括DeepSeek发布V3.2-Exp模型,API调用成本降低50%以上,以及Anthropic推出Claude Sonnet 4.5模型,腾讯混元开源80B参数的多模态生图模型 [9][10] 市场整体表现 - 上午收盘上证指数上涨0.4%,深证成指上涨0.31%,创业板指上涨0.06% [1] - 全市场半日成交额接近1.37万亿元,较上一交易日增加761亿元 [1]
计算机行业点评:腾讯混元开源原生多模态生图模型,3D生成亦再突破
西部证券· 2025-09-29 16:02
行业投资评级 - 报告未明确给出计算机行业的整体投资评级 [1][2][3][4][5] 核心观点 - 腾讯混元开源原生多模态生图模型,具备强语义理解与知识推理能力,将显著提升AI应用开发和落地密度,并推动腾讯云算力需求快速增长 [1][3] - 腾讯混元3D生成模型实现新突破,支持多种模态输入和灵活可控的部件生成,加速3D生成在游戏、打印和AR/VR等实际生产流程中的落地应用 [2][3] - 腾讯或将维持AI基础设施投入,以支撑千行百业和自身全场景AI产品的高速发展 [3] 腾讯混元图像模型技术要点 - 混元图像3.0(HunyuanImage 3.0)参数规模达80B,是首个开源的工业级原生多模态生图模型 [1] - 模型通过单一模型完成文字、图片、视频与音频等多模态的输入与输出,基于50亿量级的图文对、视频帧、图文交织数据和6T语料数据进行混合训练 [1] - 模型具备超强语义理解能力,能响应复杂长文本并利用世界知识进行推理 [1] 腾讯混元3D模型技术要点 - 混元3D-Omni突破传统图像输入局限性,支持多种模态输入,实现对物体几何结构、拓扑和姿态的精细控制 [2] - 混元3D-Part提出完整的组件化生成新范式,由P3-SAM(高质量原生3D分割模型)及X-Part(工业级组件生成模型)两大模块构成 [2] - 新方案解决了现有组件式3D生成方法可控性不足、部件几何质量不理想及语义连贯性有限的问题 [2] 投资机会 - 报告建议关注IDC领域,如科华数据 [3] - 报告推荐服务器领域,如华勤技术 [3] - 报告推荐算力芯片领域,如海光信息 [3]
王健林被限制高消费;贾国龙清空社交账号;小米SU7 Ultra首次在日本亮相;星河动力航天完成24亿元D轮融资丨邦早报
创业邦· 2025-09-29 08:08
万达集团及王健林相关法律纠纷 - 大连万达集团股份有限公司及其法定代表人王健林被限制高消费 案件涉及强制执行金额1.86亿元[3] - 大连万达集团股份有限公司股权冻结信息达47条 被冻结股权的标的企业包括大连万达商业管理集团股份有限公司、万达文化产业发展有限公司等[3] - 大连万达集团股份有限公司还有10条被执行人信息 总金额达52.62亿元[3] - 万达知情人士表示此次是由于下属项目公司经济纠纷导致 或因执行层面信息不对称导致[3] 零跑汽车创始人回应限高事件 - 零跑汽车创始人朱江明回应被限高 称3天的限高已解除 此次风波暴露了团队能力不足[4] - 浙江零跑科技股份有限公司及其全资子公司凌跑汽车商贸有限公司被列为失信被执行人[4] 西贝餐饮创始人清空社交账号 - 西贝餐饮创始人贾国龙清空抖音、小红书及视频号账号内容 仅保留一条发布于2024年9月30日的视频作品[5] - 该视频涉及西贝餐饮成长史 称西贝是西北菜领域佼佼者 年营收达62亿元[5] 娃哈哈饮用水销售权变动 - 浙江娃哈哈饮用水有限公司的桶装水销售业务被要求转移至杭州迅尔城通商贸有限公司 方案于2025年3月25日正式落地实施[6] - 2025年4月 在未与经销商签订购销协议的情况下 要求经销商向杭州迅尔城通商贸有限公司下订单并完成发货及开票[6] 小熊电器养生壶爆炸事件 - 小熊电器回应养生壶爆炸事件 称正在调查当中[6] - 事件导致一岁孩子全身40%大面积烫伤 公司已安排专人慰问并提供帮助[6] 摩尔线程IPO过会及参股公司 - 摩尔线程IPO过会 主要从事全功能GPU相关产品的研发、设计和销售 是国内极少数兼顾图形渲染与AI计算的国产GPU公司[6] - 直接参股公司包括和而泰、盈趣科技等 间接参股公司包括宏力达、初灵信息、长飞光纤等[6] - 部分参股公司年内涨跌幅显著 例如和而泰涨153.22% 初灵信息涨29.50%[6][8] 理想汽车产品线进展 - 理想汽车产品线负责人张骁表示i8和i6拥有独立产线 生产节奏不受影响[8] - 受供应节奏变化和台风影响 72名i8小订用户交付延期至10月4日[8] 胖东来销售额数据 - 胖东来前9个月销售额超170亿元 达171.2亿元 已超2024年全年销售额169亿元[8] - 截至2025年9月27日 集团合计销售达1,712,873万元 本月集团合计销售176,013万元[9] 机器人专家警告人形机器人投资 - 著名机器人专家罗德尼・布鲁克斯警告投资人形机器人初创企业是浪费资金[9] - 其对特斯拉和Figure等公司通过视频训练机器人灵巧操作的做法持高度怀疑态度 称其为纯粹的幻想思维[9] 捷豹路虎获得政府贷款担保 - 英国政府为捷豹路虎提供15亿英镑贷款担保 以增强其现金储备并支持供应链[11] - 贷款偿还期为五年 由英国出口融资机构提供出口发展担保支持[11] 小米SU7 Ultra日本亮相 - 小米SU7 Ultra首次在日本亮相 发售时间未定[11] - 小米计划在日本各大城市开设更多Xiaomi Store门店 并采取在智能手机门店同步销售EV的策略[11] 华为自动驾驶技术规划 - 华为车BU CEO靳玉志表示L3级自动驾驶将在2027年规模放量[11] - 汽车产业正进行三波浪潮变革 2022年至2027年为智能化阶段 算法替代司机[11] 融资事件汇总 - 星河动力航天完成24亿元D轮融资[12] - 微亿智造申请香港IPO 按2024年收益计算是中国最大的工业具身智能机器人供应商[12] - 优理奇完成两轮近亿元天使++轮及天使+++轮融资[12] - 航星传动完成数千万元A++轮融资[12] - 手智创新获得新一轮融资 投资机构包括湖北省人形机器人产业投资基金等[12] - 百型智能获金沙江创投数千万元投资 是国内首家做外贸垂类AI Agent的公司[12] - 天晴空天科技完成超亿元A轮融资[13] 腾讯混元发布开源生图模型 - 腾讯混元发布并开源原生多模态生图模型混元图像3.0 参数规模高达80B[13] - 该模型是首个开源工业级原生多模态生图模型 效果对标业界头部闭源模型[13] vivo手机AI新功能 - vivo X300系列手机推出AI电影分镜功能 支持超高像素一图多裁[15] smart插混车型预售 - smart首款插混车型精灵5 EHD开启预售 价格18.99万起[16] - 该车由梅赛德斯-奔驰全球设计团队打造 CLTC综合续航1615km 纯电续航252km[16] 餐饮行业监管新规 - 《餐饮服务连锁企业落实食品安全主体责任监督管理规定》发布 自2025年12月1日起施行[19] - 规定明确根据门店数量分级负责监管 10000家以上由省级 1000到9999家由市级 999家以下由县级市场监管部门负责[19] 中秋国庆假期交通预测 - 中秋国庆假期全社会跨区域人员流动量预计达23.6亿人次 日均约2.95亿人次 比去年同期日均增长3.2%[19] 美国重型卡车销售数据 - 8月美国重型卡车销售折合年率42.2万辆 创2022年1月以来新低[19] - 三个月移动平均值滑落至43.8万辆 为2020年疫情衰退时期后最弱水平[19] - 自去年5月以来销售量减少13.1万辆 跌幅达24% 连续四个月下滑[19] 上海元宇宙产业规模 - 上海元宇宙相关产业规模已突破3000亿元[19] - 集聚XR终端制造企业30余家 光学模组、空间计算芯片等核心元器件产能占全国40%以上[19]
腾讯发布并开源新一代生图模型“混元图像3.0”
新浪财经· 2025-09-28 11:24
公司技术发布 - 腾讯混元于9月28日发布并开源原生多模态生图模型"混元图像3.0(HunyuanImage 3.0)" [1] - 模型参数规模达80B 是当前参数量最大的开源生图模型 [1] - 该模型可对标业界头部闭源模型 且为首个开源工业级原生多模态生图模型 [1] 行业技术定位 - 该开源模型在工业级多模态生图领域具有开创性地位 [1] - 模型参数规模达到80B级别 显著超越现有开源解决方案 [1] - 技术能力直接对标行业头部闭源模型 体现行业技术竞争新态势 [1]