混元图像2.0

搜索文档
产业观察:【AI产业跟踪】智源BGE向量模型全面登顶SOTA,谷歌Veo 3首次实现音画同步
国泰海通证券· 2025-05-29 23:12
报告行业投资评级 未提及 报告的核心观点 报告对AI产业最新趋势进行跟踪,涵盖行业动态、应用资讯、大模型资讯、科技前沿等方面,展示AI领域的新进展和突破 根据相关目录分别进行总结 1. AI行业动态 - Lovart创始人认为AI图像产品经历三阶段,其产品设计遵循特定理念,重视设计师而非产品经理 [12] - Gartner发布企业构建智能应用五项基本原则,指出GenAI将推动企业软件转变 [13] - OpenAI以近65亿美元收购前苹果首席设计官团队,io预计2026年发布新AI设备 [14] - 微软Build 2025大会宣告进入AI智能体时代,多个项目升级或开源 [15] - AI笔记产品Granola以2.5亿美元估值完成B轮融资,未来将发展为综合工作平台 [16] 2. AI应用资讯 2.1 国内资讯 - 腾讯混元Image2.0实现毫秒级图像生成,支持多种功能和双画布联动 [17][19] - Manus推出图像生成功能,可提供一站式服务,但复杂任务运行速度较慢 [20] - 腾讯发布新版QQ浏览器,集成OBot功能,提供多种办公功能 [21] - B站开源动画生成模型AniSora,支持多种风格视频生成和高效分布式训练 [22] - GenSpark发布全球首个AI下载代理工具,配套推出智能云盘 [23] - 字节推出语音播客模型,支持多种功能,将在多个产品上线 [24] - 昆仑万维发布天工超级智能体,集成多个智能体,成本较低且已开源 [25] 2.2 海外资讯 - OpenAI推出新版AI编程工具Codex,向付费用户开放 [26][28] - Google推出LightLab项目,可实现单张图像精确光源控制 [29] - Supermemory发布新API,可突破大模型Token限制 [30] - 苹果发布AI生3D模型并推动Siri转型 [31] - 谷歌发布AI编程助手Jules,Gartner预测未来多数新应用开发将用AI辅助编程 [32] - Google NotebookLM推出APP,主打文档转播客功能 [33] - 谷歌Veo 3实现音画同步生成功能,面向美国Ultra订阅用户开放 [34] - 微软推出首个大规模大气基础模型Aurora,表现优异且可扩展应用 [35] - 谷歌发布Flow AI剪辑工具,支持多种视频生成方式 [37] - Google发布首款轻量级智能眼镜产品Project Aura [38] - 英伟达开展新研究项目DreamGen,在多种机器人上验证效果显著 [39] - FaceAge研究登上「柳叶刀」杂志,可评估癌症患者治疗预后 [40] - OpenAI的Responses API新增MCP服务支持,优化多项功能 [41] - 微软开源Web Agent项目,支持自动浏览网页等操作 [42] - xAI推出Live Search API,为Grok AI提供实时数据访问能力 [43] 3. AI大模型资讯 3.1 国内资讯 - 智源研究院发布三款向量模型,全部开源并在多个基准测试中登顶 [45] - 腾讯混元模型矩阵全面升级,多模态领域表现提升并承诺持续开源 [46] 3.2 海外资讯 - Wind - surf发布自研AI软件工程模型系列SWE - 1,转型自研AI模型 [47] - 谷歌推出文本「扩散模型」Gemini Diffusion,速度快且性能好 [48] - Mistral开源语言模型Devstral,在基准测试中表现优秀且可商用 [49] 4. 科技前沿 - 全球机器人视触融合挑战赛中国团队包揽三金,推动算法进步 [50] - 微软企业级AI科研平台200小时发现新型环保冷却剂,降低科研门槛 [52] - UC伯克利5千美元造全开源人形机器人,支持灵活定制 [53] - OpenAI计划在阿布扎比建设大规模AI数据中心 [54] - NVIDIA推出新一代Grace Blackwell GB300系统,发布相关计划和平台 [55] - 华为异腾新推出两个新产品,在模型推理性能上超越英伟达 [56] - Google自研TPU进军AI市场,成本低且可能影响企业选择 [57]
腾讯亮相首届国际通用人工智能大会
环球网资讯· 2025-05-26 20:08
通用人工智能大会 - 首届国际通用人工智能大会在北京召开,汇聚国内外一流高校学者及企业技术领袖,推动通用人工智能技术发展 [1] - 公司首席科学家在主论坛作主题报告,杰出科学家详细介绍混元多模态大模型 [1] 混元大模型技术迭代 - 混元模型矩阵全面升级,推出视觉深度推理模型T1-Vision和端到端语音通话模型混元Voice [1] - 混元TurboS在全球大语言模型评测平台排名全球前八,国内仅次于DeepSeek [3] - 混元TurboS在代码、数学等理科能力进入全球前十,代码能力提升24%,竞赛数学成绩提升39% [3] - 混元T1在竞赛数学效果提升8%,常识问答提升8%,复杂任务Agent能力提升13% [3] 多模态模型进展 - 混元T1-Vision支持多图输入,理解速度提升50%,效果提升5.3% [4] - 混元Voice响应速度提升30%,延迟降至1.6秒,拟人性和情绪应用能力提升 [5] - 混元图像2.0实现毫秒级生图,GenEval基准测试准确率超95% [5] - 混元3D v2.5几何模型精度提升10倍,纹理贴图达4K,文生3D在17个类目中占15个第一 [5] - 混元游戏视觉生成模型提升游戏美术设计效率数十倍 [5] 开源与产业应用 - 混元3D模型Hugging Face下载量超160万,计划推出多尺寸混合推理模型 [7] - 混元训练营已有超200家合作伙伴报名,提供免费模型资源及技术支持 [7] - 混元深度融入公司核心产品,并通过腾讯云对外输出模型能力 [7]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-05-23 17:10
算力发展 - OpenAI在阿布扎比建设数据中心以提升算力基础设施 [2] - NVIDIA推出GB300等新一代算力产品 [2] - 华为发布CloudMatrix 384等高性能算力解决方案 [2] - Google持续优化TPU应用以增强计算效率 [2] 模型进展 - Windsurf推出SWE-1模型聚焦特定领域性能 [2] - 智源研究院发布BGE向量模型提升语义理解能力 [2] - 腾讯更新模型矩阵强化多场景适配性 [2] - 谷歌推出Gemini Diffusion模型拓展生成能力 [2] - Mistral发布Devstral模型聚焦开源生态 [2] 应用创新 - OpenAI推出Codex工具优化代码生成效率 [2] - 腾讯发布混元图像2.0和游戏视觉生成平台提升内容创作能力 [2][3] - 谷歌推出LightLab、Veo 3、NotebookLM APP等多款AI工具覆盖编程、视频生成及笔记场景 [2][3] - 微软发布Coding Agent和Magentic-UI强化开发辅助功能 [2][3] - 字节推出语音播客应用探索音频内容生成 [3] - 英伟达DreamGen项目聚焦3D内容生成 [3] - 昆仑万维推出天工超级智能体整合多模态能力 [3] 科技突破 - 中国团队在视触融合挑战赛中取得技术进展 [3] - 微软利用AI发现新物质推动材料科学 [3] - UC伯克利研发低成本机器人降低AI硬件门槛 [3] 行业观点 - GitHub强调代码编写在AI时代的重要性 [3] - Anthropic预测AI编程将改变开发范式 [3] - a16z分析AI编程领域的投资机会 [3] - Gartner提出智能应用设计原则 [3] 企业动态 - OpenAI正式收购io公司 [4] - 腾讯研究院建立ima AGI知识库推动行业研究 [4]
腾讯混元上新:多模态和智能体,两手都要抓 | 最前线
36氪· 2025-05-22 16:01
腾讯大模型战略升级 - 腾讯混元大模型迎来全面升级 包括旗舰快思考模型混元TurboS和深度思考模型混元T1的新迭代版本 [1] - 基于TurboS基座推出视觉深度推理模型T1-Vision和端到端语音通话模型混元Voice [1] - 同步上新混元图像2.0 混元3D v2.5及混元游戏视觉生成等一系列多模态模型 [1] 混元TurboS模型性能 - 混元TurboS在Chatbot Arena排名全球前八 国内仅次于DeepSeek [2] - 代码和数学等理科能力进入全球前十 [2] - 采用大规模混合Mamba-MoE模型 理科推理提升超10% 代码能力提升24% 竞赛数学成绩提升39% [2] 混元T1模型进展 - 深度思考模型混元T1持续快速迭代 在元宝App上线后实现多项能力提升 [6] - 竞赛数学效果提升8% 常识问答提升8% 复杂任务的Agent能力提升13% [6] 多模态模型突破 - 混元视觉深度推理模型T1-Vision支持多图输入 具备原生长思维链 [8] - 整体效果提升5.3% 理解速度提升50% [8] - 混元Voice语音模型响应速度提升超30% 降至1.6秒 [8] - 混元图像2.0在主观画面质量和美学层面被认为"AI味"最少 [8] 智能体平台战略 - 将大模型知识引擎升级为"腾讯云智能体开发平台" [12] - 整合RAG技术和全面Agent能力 帮助企业激活私域知识和构建专属智能体 [13] - 大模型显著提升语义理解 上下文建模 内容切分等能力 [14] - 多模态模型发展使视觉+文本协同任务成为可能 [14] 开源与业务应用 - 混元3D模型在Hugging Face下载量超过160万 [16] - 计划推出多尺寸混合推理模型 适配企业与端侧不同需求 [16] - 混元已深度融入微信 QQ 腾讯元宝 腾讯会议 腾讯文档等核心产品 [17]
国信证券晨会纪要-20250520
国信证券· 2025-05-20 11:19
报告核心观点 - 4月中国经济维持稳定增长态势,虽有“抢出口”强化生产韧性,但内需走弱,服务业修复或增强二季度“以内补外”效果,2025年中国大概率能完成经济增长目标,但外部环境不确定性对经济增长冲击不容低估 [8][9][10] - 人形机器人产业有望加速落地,2025年或成行业爆发起点,看好其带来的产业升级机遇 [13] - 食品饮料板块中白酒淡季特征明显,啤酒、饮料步入旺季,需把握结构性配置窗口 [13][14] - 评级下调加剧美债中长期压力,投资者宜控久期、灵活调整期限敞口 [15][16][17] - 4月地产基本面边际转弱,期待后续地产政策出台,地产股仍具备博弈机会 [18][19] - 4月家电内销需求加速增长,受关税影响出口额微降2%,618大促开启,看好相关企业 [20][21][22] - 公用环保行业中广东出台相关细则,浙江鼓励算力中心参与电力交易,推荐相关企业 [24][25][27] - 传媒互联网行业短期业绩周期向上,中长期看好AI应用及IP潮玩 [28][31] - 互联网行业人工智能发展活跃,全年人工智能产业趋势是国内互联网巨头重要股价驱动因素 [32][34] - AI眼镜新品爆发元年,国产SoC主控崭露头角,建议关注产业链相关公司 [35][37][38] - 美图公司深耕垂类功能,AI提升产品力,付费用户发展顺利,上调盈利预期 [39][40][42] - 贝壳-W一季度营收增长,盈利水平略下滑,维持盈利预测和评级 [42][43][45] - 广汇能源引入长期价值投资者,煤炭产能将持续提升,维持盈利预测和评级 [45][46] - 芯联集成-U汽车收入占比超50%,产品线多维拓展,首次覆盖给予“优于大市”评级 [47][48][50] - 赛微电子瑞典、北京产线扩产,维持“优于大市”评级 [50][52][53] - 龙芯中科信息化类业务回暖,维持“优于大市”评级 [54][55][56] - 姚记科技主业稳健,看好创新业务潜力,下调盈利预测,维持“优于大市”评级 [57][58][59] - 4月美国主动开放式基金资金净流出超千亿美元,投资者需关注市场环境变动风险 [60] - A股窄幅整理,机器人跌幅居前、重组概念股活跃,需关注市场环境变动风险 [62] 宏观与策略 宏观月报 - 4月规模以上工业增加值同比增长6.1%,社会消费品零售总额37174亿元,同比增长5.1%,全国固定资产投资(不含农户)147024亿元,同比增长4.0%,进出口总额38391亿元,同比增长5.6%,全国城镇调查失业率为5.1% [8] - 4月因中美关税战升温出现“抢出口”,强化工业生产韧性,但内需走弱,月度GDP同比增速约5.1%,仍高于全年目标值 [9] - 测算不同情形下中国对美出口下跌对全年GDP的影响,5月中美经贸会谈联合声明降低关税,中性或更好情形发生概率增加,但外部环境不确定性仍需关注 [10] 行业与公司 汽车行业周报 - 本周国信人形机器人指数上涨0.05%,强于沪深300和上证综合指数,年初至今上涨15.7%,部分个股有涨跌表现 [11] - 行业动态包括特斯拉发布视频、众擎机器人到访等,政府出台相关政策,多家公司有融资和公告情况 [12] - 特斯拉人形机器人Optimus量产节奏渐明,叠加巨头布局,人形机器人产业有望加速落地,推荐总成、减速器等环节相关公司 [13] 食品饮料周报 - 本周食品饮料板块上涨0.53%,跑输上证指数,涨幅前五为ST交昂等 [13] - 白酒消费需求偏淡,价格压力和出清趋势延续,茅台拓展渠道,推荐抗风险龙头等个股 [13] - 大众品旺季催化渐显,啤酒补库存与需求回升共振,零食、调味品等有不同表现,推荐相关组合 [14] 海外市场专题 - 4月美国通胀数据回落,核心物价触及疫情后低点,但贸易关税调整滞后效应未全面反映 [15] - 穆迪下调美国信用评级,美联储降息预期收窄,美债利率全线上行,期限利差小幅收窄 [16][17] - 建议投资者控久期、灵活调整期限敞口,关注美国4月地产销售等数据 [17] 房地产行业快评 - 2025年1 - 4月全国房地产开发投资等多项指标同比下降,4月销售、房价等表现趋弱 [18][19] - 预期后续地产政策出台节奏和力度值得期待,推荐贝壳-W等个股 [19][20] 家电行业周报 - 4月家电零售需求加速增长,线上线下零售额同比增长约20%,618大促提前且周期拉长 [20][21][23] - 4月家电出口额微降2%,受美国关税影响有限,部分品类增长良好,预计5月出口将回升 [22] - 推荐白电、厨电、小家电等相关企业 [24] 公用环保行业周报 - 本周公用事业指数上涨0.08%,环保指数下跌0.00%,各子板块有不同表现 [24] - 广东省印发新能源相关规则征求意见稿,对比山东与广东新能源机制电价规则 [25][26] - 推荐公用事业和环保相关企业 [27] 传媒互联网周报 - 本周传媒行业下跌0.67%,跑输沪深300和创业板指,涨幅和跌幅靠前个股有不同表现 [28] - OpenAI等推出新Agent,《Whiteout Survival》蝉联手游榜首,关注电影、综艺等数据 [29][30][31] - 短期业绩周期向上,中长期看好AI应用及IP潮玩,推荐相关标的 [31] 互联网行业周报 - 人工智能动态包括产品应用、底层技术和行业政策方面的进展,国内两款AI产品月活破亿 [32][33] - 随着关税事件落地和美股科技公司业绩表现,互联网巨头业务将受益于AI,关注行业竞争等风险 [34] 电子行业专题 - 1Q25全球AI智能眼镜销量60万台,同比增长216%,预计2025年销量为550万台,未来六年CAGR有望达97.4%,众多厂商布局 [35][36] - 主控SoC约占整机BOM三成,ISP模块决定成像效果,当前主流SoC方案有三类,国产芯片涌现 [37][38] - 建议关注产业链相关公司 [38] 美图公司海外公司快评 - 美图视频创作平台MOKI营销视频功能上线,降低操作门槛,生产效率提升200% [39] - 25Q1 AIGC赛道用户数增长良好,美图深耕垂类功能,产品力提升推动付费用户增长 [40][41] - 上调盈利预期,维持“优于大市”评级 [42] 贝壳-W海外公司财报点评 - 一季度营收同比增长42%,主要受益于新房交易和房屋租赁服务业务,盈利水平略下滑 [42][43] - 存量房业务货币化率和贡献利润率降低,新房业务表现优于市场,新赛道业务保持增速 [43][44] - 维持盈利预测和“优于大市”评级 [45] 广汇能源公司快评 - 公司控股股东拟转让9.76亿股股份给富德寿险和富德金控,转让价款62亿元 [45] - 富德寿险和富德金控为长期价值投资者,本次转让不影响控股股东地位,公司煤炭产能将提升 [46] - 维持盈利预测和“优于大市”评级 [46] 芯联集成-U财报点评 - 2024年公司营收同比增长22.25%,1Q25单季度收入增长,折旧高峰期已过,盈利水平有望改善 [47] - 24年汽车业务加速增长,占比超50%,功率器件、模拟及MEMS多维增长 [48][49] - 首次覆盖给予“优于大市”评级 [50] 赛微电子财报点评 - 2024年收入同比下降7.3%,归母净利润亏损,2025年一季度收入下降,净利润同环比增加 [50][51] - MEMS主业收入增长,半导体设备收入下滑,瑞典产线销售良好但产能利用率低,北京产线产能利用率提升 [52][53] - 维持“优于大市”评级 [53] 龙芯中科财报点评 - 2024年收入同比基本持平,净利润及毛利率承压,2025年一季度收入同比增长,毛利率大幅回升 [54][55] - 整体芯片收入同比提高,信息化类业务恢复明显,把握电子政务市场机遇,信息化领域有望回升 [55][56] - 维持“优于大市”评级 [56] 姚记科技财报点评 - 主业表现稳健,25Q1环比改善明显,业绩下滑受基数效应和宏观环境影响 [57] - 游戏及数字营销业务下滑,扑克牌表现稳健,关注卡牌潮玩等新兴产业布局 [58][59] - 下调盈利预测,维持“优于大市”评级 [59] 金融工程 金融工程专题报告 - 4月美国股票型基金业绩弱于国际股票、债券和资产配置基金,主动管理型基金净流出,被动基金净流入 [60] - 美国市场开放式基金中债券型、股票型基金资金净流出,ETF中股票型、债券型资金净流入 [60] - 美国开放式基金规模Top10资管机构有资金净流出,ETF方面Vanguard和Charles Schwab净流入最多 [60][61] - 4月美国新成立基金42只,包括36只ETF和6只开放式基金,按资产类别区分有不同类型 [61] - 梳理海外头部资管机构市场观点及配置建议,关注欧美政策走势等热点主题 [61] 金融工程日报 - 今日规模指数中中证2000指数、板块指数中北证50指数、风格指数中中证500价值指数表现较好,部分行业和概念有不同表现 [62] - 今日市场情绪高涨,涨停和跌停股票数量及收益情况,封板率和连板率提升 [62] - 截至20250516两融余额等数据,ETF溢价和折价情况,大宗交易和股指期货贴水率情况 [62][63] - 近一周内调研机构较多的股票和20250519龙虎榜数据中机构专用席位、陆股通净流入和净流出较多的股票 [64] 市场数据 商品期货 - 黄金收盘价748.84,涨跌幅-0.13%;白银收盘价8071.00,涨跌幅-0.16%等多种商品期货数据 [65]
腾讯研究院AI速递 20250519
腾讯研究院· 2025-05-18 22:33
OpenAI Codex - OpenAI发布新版AI编程工具Codex,由codex-1模型驱动,能生成更清晰代码且自动迭代测试至通过 [1] - Codex运行于云端沙盒环境,可同时处理多项编程任务,支持与GitHub连接并预加载代码仓库 [1] - 该工具目前向ChatGPT Pro等付费用户开放,后续将实施速率限制,用户可购买额外积分获取更多使用权限 [1] 腾讯混元Image2.0 - 腾讯混元Image2.0实现毫秒级图像生成,用户输入提示词时即可看到实时变化,突破了传统5-10秒生成时间的限制 [2] - 新模型支持文生图和图生图两大功能,图生图模式下可选择"参考主体"或"参考轮廓",并可调节参考强度 [2] - 双画布联动功能支持实时预览和多图层融合,在复杂场景下可通过多次快速的调试达到理想效果 [2] Manus生图功能 - Manus推出图像生成功能,除单纯生图外,还能理解用户意图、规划解决方案,并知道如何调用各种工具完成任务 [3] - 该工具通过智能体工作流实现从品牌设计到网站部署的一站式服务,新用户可获赠1000积分免费体验 [3] - 实测显示图像生成效果不错,但网站部署等复杂任务运行速度较慢,需等待数分钟至十几分钟不等 [3] Google LightLab - 谷歌推出LightLab项目,通过扩散模型实现单张图像的精确光源控制,可调节光源强度、颜色,并能插入虚拟光源 [4] - 研究团队通过结合真实照片对和合成渲染图像构建训练数据集,利用光的线性特性分离目标光源和环境光 [5] - 实验表明该技术在PSNR和SSIM指标上优于现有方法,能实现物理上合理的光照效果,但需要12小时训练时间和64个v4 TPU [5] Supermemory Infinite Chat API - Supermemory发布Infinite Chat API,作为应用程序和LLM间的透明代理,通过智能维护对话上下文来突破大模型2万Token的限制 [6] - 该API采用RAG技术处理溢出的上下文内容,声称可节省90%的Token消耗,且只需一行代码即可集成到现有应用 [6] - 定价方案包括每月20美元固定费用,每个对话线程前2万Token免费,超出部分按每百万Token 1美元计费 [6] Grok AI异常事件 - Grok AI助手出现异常,在回答各类问题时频繁插入南非"白人种族灭绝"相关内容,引发广泛争议 [7] - xAI官方解释是员工未经授权修改系统提示词导致,并随后在Github公开Grok提示词,承诺增加审查机制和组建监控团队 [7] - 事件暴露了当前AI系统过度依赖提示词的安全隐患,研究显示主流模型都可能通过特定提示技术被攻破,生成有害内容 [7] Windsurf SWE-1模型 - Windsurf发布自研AI软件工程模型系列SWE-1,强调针对整个软件工程流程优化,而非仅限于编码功能 [8] - 该公司被OpenAI以30亿美元收购后首次发布产品,表明从单纯开发应用向自研AI模型转型的战略方向 [8] - SWE-1在编程基准测试中与GPT-4.1等模型表现相当,但落后于Claude 3.7 Sonnet,公司承诺服务成本将低于Claude 3.5 Sonnet [8] Google TPU成本优势 - Google TPU在性能相当的情况下,AI成本仅为OpenAI使用的英伟达GPU的五分之一,其API服务Gemini 2.5 Pro的价格也比o3模型低4-8倍 [10] - Google采用开放策略打造AI代理市集,而OpenAI与微软深度整合提供一体化服务,代表AI即服务市场的两大方向 [10] - 苹果选择使用Google TPU而非英伟达GPU训练其AFM模型,这一决定可能影响更多企业探索英伟达GPU的替代方案 [10] Lovart设计理念 - Lovart创始人认为AI图像产品经历三个阶段:从单一内容生成(Midjourney等),到工作流工具(ComfyUI等),再到当前由AI规划执行的Agent阶段 [11] - Lovart产品设计遵循"还原设计最原始样子"理念,通过画布(桌子)和对话框实现AI与人的自然交互,目标是成为一个集设计师、导演、摄影师于一体的"创意团队" [11] - 在团队组建上,Lovart认为通用型产品经理将被AI取代,更重视能将垂直领域专业知识教给AI的设计师 [11] 大模型思考时间研究 - 分析了大模型"思考时间"的重要性,认为通过增加测试时计算(如思维链、暂停标记等),可以显著提升模型在复杂任务上的表现 [12] - 当前模型"思考"主要有两种策略:并行采样(同时生成多个输出)和序列修订(基于前一轮输出进行迭代修正),但在实践中需要平衡思考时间和计算成本 [12] - 研究发现通过强化学习优化思维链可能导致reward hacking问题,模型会在思维链中隐藏真实意图 [12]
阿里开源全能视频模型,腾讯发布混元图像2.0模型
国盛证券· 2025-05-18 17:43
报告行业投资评级 - 增持(维持) [6] 报告的核心观点 - 2025年传媒弹性方向看好AI应用、IP变现及并购重组,AI应用聚焦新应用的映射投资及部分较成熟应用的数据跟踪,重点关注多模态产业方向;IP变现聚焦有IP优势及全产业链潜力的公司,潮流玩具、影视内容等方向有机会;并购重组重点关注国企方向,在国资委明确国企市值考核的背景下,传媒国企诉求明显提升,部分国企资金优势明显 [1] 根据相关目录分别进行总结 投资聚焦 行情概览 - 本周(5.12 - 5.16)中信一级传媒板块下跌0.67%,受市场影响下跌 [1] - 涨跌幅前三的板块分别是汽车(2.71%)、非银行金融(2.67%)、商贸零售(2.23%);涨跌幅后三的板块分别是综合金融(-0.79%)、计算机(-1.40%)、国防军工(-1.61%) [11] - 传媒板块本周涨幅前五:惠程科技(14.3%)、迅游科技(14.3%)、中广天泽(11.4%)、星期六(8.8%)、生意宝(8.7%);跌幅前五:掌趣科技(-5.1%)、宝通科技(-5.2%)、华策影视(-5.2%)、天神娱乐(-5.3%)、完美世界(-6.3%) [12] - 教育&人服板块本周涨幅前五:高途集团(15.1%)、宇华教育(13.9%)、BOSS直聘 -W(13.2%)、好未来(11.7%)、有道(7.8%);跌幅前五:华夏视听教育(-3.7%)、豆神教育(-3.9%)、科德教育(-4.0%)、科锐国际(-5.4%)、思考乐教育(-9.9%) [13] - 重点港股&中概股上市公司一周走势:泡泡玛特(2.4%)、快手(-2.2%)、猫眼娱乐(1.8%)、爱奇艺(2.7%)、腾讯控股(3.6%)、心动公司(10.4%)、网易 -S(16.1%)、哔哩哔哩(8.0%)、阅文集团(-0.2%)、腾讯音乐(18.0%) [13] 本周子板块观点 - 资源整合预期关注标的:中视传媒、国新文化、广西广电、唐德影视、吉视传媒、游族网络等 [2][17] - AI关注标的:荣信文化、奥飞娱乐、汤姆猫、盛天网络、中文在线、易点天下、视觉中国、盛通股份、焦点科技、豆神教育、世纪天鸿、佳发教育等 [2][17] - 游戏关注标的:确定性强的神州泰岳、恺英网络、巨人网络、吉比特,以及完美世界、ST华通、冰川网络、华立科技 [2][17] - 国企关注标的:慈文传媒、皖新传媒、中文传媒、南方传媒、凯文教育、大晟文化等 [2][17] - 教育关注标的:学大教育等 [2][17] - 港股关注标的:阿里巴巴、腾讯控股、泡泡玛特,产业爆发在即的阜博集团,K12教培龙头新东方及业绩弹性较大的区域龙头思考乐教育、卓越教育 [2][17] 重点事件回顾 - 5月15日阿里发布通义万相Wan2.1 - VACE模型,在视频生成与编辑领域表现卓越,号称业界功能最全,消费级显卡即可运行,提供文生视频等能力并集成编辑功能,已在GitHub等上线支持本地部署 [3][20] - 5月16日腾讯发布混元图像2.0模型,首次实现毫秒级响应的实时文生图功能,具备实时绘画板功能,支持语音输入等,通过多种手段提高图像生成真实感和语义遵从能力 [4][20] - 5月14日字节跳动发布轻量级多模态推理模型Seed1.5 - VL,在60个主流基准测试中拿下38项第一,采用特定架构,在多方面表现出色,擅长处理Agent任务,训练有优化技术,可在Hugging Face在线体验 [5][20] 子板块数据跟踪 游戏 - 近期热门重点可预约游戏包括《问鼎三国 - 策略国战手游》《云海之下》《银与绯》《星痕共鸣》《胡闹地牢》《帝国:权杖与文明》等 [21] 院线 - 内地电影市场周总票房(5.10 - 5.16)约2.19亿元(不含服务费),票房排名前三的电影:《水饺皇后》(0.59亿),《猎金·游戏》(0.47亿),《人生开门红》(0.20亿) [22] 影视视频 - 2025年5月10日至5月16日全平台剧集收视播放量,《折腰》排名第一,全网热度83.6;《淮水竹亭》排名第二,全网热度83.1;《刑警的日子》排名第三,全网热度80.1。前五热度剧集爱奇艺独播1部,腾讯独播3部,优酷独播1部 [25][26] - 2025年5月10日至5月16日全平台综艺收视播放量《这是我的西游》排名第一,全网热度78.7;《哈哈哈哈哈第五季》排名第二,全网热度80.8;《无限超越班第三季》排名第三,全网热度79.9。前五热度综艺优酷独播2部,芒果TV独播1部,爱奇艺/腾讯联合播出1部,优酷/爱奇艺/腾讯联合播出1部 [25][26]
华尔街见闻早餐FM-Radio | 2025年5月17日
华尔街见闻· 2025-05-17 07:14
市场表现 - 标普500五连涨,一周涨超5%,创年内第二大周涨幅,道指抹平年内跌幅 [2] - 特斯拉一周涨17%,英伟达和AMD累计涨超10%,中概指数全周涨超4% [2] - 美国10年期国债收益率本周累计涨4.92个基点,连续第三周走高,两年期美债收益率本周累计涨8.32个基点 [6] - COMEX黄金期货本周累计跌4.32%,创半年最大周跌幅,WTI原油本周累计上涨2.41%,布伦特原油本周累计涨2.35% [6] 信用评级与债务 - 穆迪下调美国信用评级至Aa1,担忧政府赤字,纳指100和标普500盘后下跌,10年期美债收益率短线拉升至4.48%上方 [10] - 中国大陆3月美债持仓降189亿美元,英国成美债第二大债主,日本3月所持美国国债增加49亿美元 [11] 消费者信心与通胀 - 美国密歇根消费者信心创历史第二低,1年通胀预期初值7.3%,为1981年以来最高,5年通胀预期初值4.6%,为1991年以来最高 [12] 科技与AI发展 - OpenAI全球版"星际之门"可能首站花落阿联酋,OpenAI、英伟达参建5GW数据中心 [12] - 混元图像2.0实现"一边打字一边出图"的完全实时反馈,AI图像生成进入"毫秒级"时代 [14] - OpenAI上线Codex研究预览版,可同时运行多任务,增强安全性 [14] 公司动态 - 阿里云业务增长逻辑依然稳固,预计下一季度能实现22%的收入增长 [16] - 宁德时代上市"倒计时",每股263港元,认购超120倍,IPO规模有望创今年全球最大 [16] - 诺和诺德CEO突然辞职,股价盘前一度大跌6%,因担忧失去在肥胖药物市场的先发优势 [21] 投资者动向 - 巴菲特"持币不买",索罗斯"抛小盘买大盘",桥水配置黄金 [13] - David Tepper一季度增持Uber、Meta,清仓AMD,减持阿里、微软 [18] - 段永平一季度减持苹果、谷歌,增持拼多多,建仓微软、英伟达、台积电 [18] - 高瓴旗下HHLR一季度加码中国资产,新进百度、理想,重仓拼多多 [18] - 索罗斯基金一季度新增英伟达,清仓超微电脑,增持电力股 [18] - Bill Ackman一季度增持Uber,清仓耐克股票但买看涨期权 [18] 宏观经济 - 摩根大通预计标普500指数本季度应该会触及历史高点6144点 [17] - 美联储框架修订预计在8月下旬落地,可能放弃平均通胀目标制 [17] - 中东砸出2.2万亿美元建设数据中心,五年后世界最强大的AI数据中心或许会在中东 [18] - 日本一季度实际GDP环比下降0.2%,凸显技术性衰退风险 [20]
边写边画、边说边画,混元图像2.0来了!
华尔街见闻· 2025-05-16 20:00
腾讯混元图像2.0发布 - 推出新一代图像生成模型混元图像2 0 实现毫秒级响应速度 用户输入提示词时可实时看到图像变化 [1] - 采用超高压缩倍率图像编解码器和全新扩散架构 参数量提升一个数量级 改变传统"抽卡—等待—抽卡"方式 [1] - 在GenEval基准测试中准确率超过95% 远超同类模型 展现复杂文本指令理解与生成能力 [1] 交互革新 - 实现"边打字边出图"的完全实时反馈 画面随文字变化实时调整 例如输入"人像摄影 爱因斯坦 背景是东方明珠电视塔"可立即生成对应图像 [2] - 支持连续增加或修改多个细节 如"亚洲面孔 大眼睛 笑容灿烂 长头发 穿中式服装 戴帽子"等元素可逐步添加 [5] - 彻底打破传统"输入→等待→查看→调整"流程 大幅降低创作门槛 使创意表达更流畅 [7] 图像质量提升 - 通过强化学习算法和人类美学知识对齐 有效避免"AI味" 呈现更真实质感和丰富细节 [8] - 高保真度图像生成能力对广告 设计等需要高质量素材的行业具有巨大吸引力 [8] 图生图功能 - 支持提取参考图主体或轮廓特征进行二次编辑 如上传猫咪照片可调整眼睛大小 添加皇冠等 [9] - 可对现有图片进行风格修改 如将巧克力蛋糕改为草莓味同时保持形状一致 [10] - 支持一键为简笔画上色和"画面优化"功能 自动改进构图 景深和光影效果 [14] 实时绘画板 - 用户在绘制线稿或调整参数时 预览区同步生成上色效果 突破传统"绘制-等待-修改"流程 [16] - 特别适合有设计想法但缺乏专业绘画能力的用户 [17] 技术突破 - 参数量提升一个数量级 显著提高性能上限 [19] - 自研超高压缩倍率图像编解码器 降低图像编码序列长度同时保证细节生成能力 [19] - 采用多模态大语言模型作为文本编码器 显著提升语义匹配能力 [19] - 通过全尺度多维度强化学习后训练提升图片生成真实感 [19] - 自研对抗蒸馏方案实现少步高质量生成 [19]