Qwen3系列大模型 - 财报，业绩电话会，研报，新闻

Qwen3系列大模型

搜索文档

每日经济新闻· 2025-05-08 10:15

港股市场表现 - 5月8日早盘港股三大指数集体低开恒生指数跌0 45%报22589 13点恒生科指跌0 28% 国企指数跌0 32% [1] - 盘面上科网股普跌生物技术板块集体上涨茶饮股活跃新股沪上阿姨高开近70% [1] - 开盘后恒生科技指数迅速翻红一度涨近1% 恒生科技指数ETF（513180）跟随指数上扬 [1] - 持仓股中理想汽车美团腾讯音乐小鹏汽车阅文集团等涨幅居前 [1] AI行业动态 - 阿里发布Qwen3系列大模型重回开源系列模型榜首 [1] - 百度召开2025年AI开发者大会发布文心4 5 turbo与推理模型X1 turbo [1] - 文心4 5 turbo升级多模态能力测评文本能力接近DeepSeek V3-0324而领先于GPT-4 5 多模态能力与GPT4 1接近 [1] - 文心X1 turbo完善多模态与思维链能力测评超越GPT-4o 位列行业第一梯队推理成本明显降低 [1] 机构观点与推荐 - 东方证券看好AI新周期带动算力-算法-应用生态三端依次推进建议增加港股互联网板块配置仓位 [2] - 核心推荐阿里巴巴（云消费弹性明显+基模实力领先+算法优势）快手（多模态视频生成模型技术全球领先）腾讯控股（卡位最佳社交场景+数据与应用生态优势）百度集团（加速完善AI基模和应用布局） [2] 恒生科技指数ETF分析 - 恒生科技指数ETF（513180）在A股同赛道ETF中规模和流动性领先支持T+0交易 [2] - 恒生科技指数兼具硬科技与新消费属性成分股深度聚焦AI产业链上中下游包含阿里腾讯小米美团中芯国际联想等 [2] - 新消费领域超一半权重在电商零售汽车家电消电旅游等可选消费板块包含蔚小理小米联想携程同程海尔美的等 [2]

新浪财经· 2025-05-07 10:00

货币政策与市场反应 - 中国人民银行宣布降准0.5个百分点，预计释放长期流动性约1万亿元，同时降低政策利率0.1个百分点，并新增3000亿元科技创新再贷款 [1] - 科创板人工智能指数当日高开1.62%，科创AIETF（588790）高开1.82%，该ETF年内累计涨幅超18% [1] 人工智能技术发展 - AI技术实现从量变到质变的跨越，通用大模型突破专用领域局限，在文本处理、多模态交互等认知层面接近人类能力 [1] - 技术革新推动生产力跃迁，AI在信息检索、知识整合等领域超越人效，催生提示词优化工程师等新职业，推动"一人企业"模式 [4] - 开源模型性能逼近头部产品，行业竞争转向底层技术突破与成本控制，具身智能成为新方向 [7] 应用场景与市场规模 - 数字人技术在教育、医疗、商业等领域实现立体化渗透，2025年中国数字人带动的核心市场规模预计达480亿元，较2023年增长130% [5] - 典型案例包括央视AI主播7×24小时播报、京东品牌数字分身直播，技术应用从商业向公共服务领域扩展 [5] 行业事件与催化因素 - 5月科技领域重要事件密集：联想Tech World大会、中芯国际业绩说明会、神经科技论坛、台北Computex展（英伟达CEO主题演讲）、Google I/O开发者大会等 [2] - 阿里发布Qwen3系列大模型，性能接近OpenAI/Google闭源模型；DeepSeek R2大模型或提前至5月发布 [2] - 人形机器人商业化加速：美的机器人进入工厂、宇树科技举办格斗大赛、雷神AI眼镜预售 [2] 市场表现与资金配置 - TMT板块领涨A股，科技风格调整充分，滚动收益差、拥挤度等指标显示布局时机成熟 [7] - 2025年Q1 TMT板块净利润增速差较2024Q4提升12.37个百分点至16.19%，但机构对计算机、传媒配置比例仍处历史低位 [9] - 科创AIETF（588790）覆盖寒武纪、澜起科技等30家AI全产业链企业，成分股平均研发投入占比23.6%，Q1营收增速中位数61% [9][10] 技术演进与产业趋势 - 多模态大模型与强化学习融合创造新型智能体，可能成为通用人工智能关键路径 [7] - AI产业沿"基础突破-场景渗透-形态进化"螺旋上升，模型成本下降推动智力服务成为社会基础设施 [11] - 高技术制造业PMI在外部冲击下保持扩张，AI与机器人等国内创新催化事件密集 [8]

Qwen3深夜炸场，阿里一口气放出8款大模型，性能超越DeepSeek R1，登顶开源王座

36氪· 2025-04-29 17:53

模型发布与性能 - 公司一次性开源8款混合推理模型，包括2款MOE模型(Qwen3-235B-A22B和Qwen3-30B-A3B)和6款Dense模型(Qwen3-32B至Qwen3-0.6B) [2][4][6] - 旗舰模型Qwen3-235B-A22B拥有2350亿参数，激活参数220亿，在ArenaHard测试(95.6分)接近Gemini2.5-Pro(96.4分)，超越OpenAI o1(92.1分)和DeepSeek R1(93.2分) [2][3] - Qwen3-30B-A3B仅激活30亿参数(总参数300亿)，性能却优于QwQ-32B，小模型Qwen3-4B达到Qwen2.5-72B水平 [5][6] 技术创新 - 国内首个支持"思考模式"(深度推理)和"非思考模式"(快速响应)的混合推理模型，可通过指令切换 [8][10] - 预训练数据量达36万亿token(Qwen2.5的两倍)，支持119种语言，采用三阶段训练策略(S1:30T token基础训练，S2:5T token专业强化，S3:32K上下文扩展) [17][18][12] - 后训练采用四阶段流程：长链推理冷启动→强化学习→模式融合→通用能力强化，实现深度推理与快速响应平衡 [21][22] 行业影响 - 成为全球最大开源模型族群(累计200+模型，衍生模型超10万)，超越Meta Llama系列 [24] - 专家混合模型(MoE)显存效率高，20-30B规模即可实现接近GPT-4的推理能力 [24] - GitHub发布后迅速获17.9k星，用户实测显示其在编程、数学和多语言处理(119种)表现优异 [24][25][28][30] 部署与应用 - 提供0.6B-32B多种规模选择，支持从笔记本测试到多卡集群扩展 [24] - 推荐使用SGLang/vLLM框架部署，本地支持Ollama/LMStudio等工具 [16] - 已上线Hugging Face/ModelScope/Kaggle等平台，普通用户可通过网页/APP直接体验 [13][14][15]

大模型

开源模型

混合推理模型

Artificial Intelligence

Artificial Intelligence

Qwen3系列大模型

性能超越DeepSeek R1，Qwen3正式登场！阿里一口气放出8款大模型，登顶开源王座！

AI科技大本营· 2025-04-29 17:05

模型发布与性能 - 阿里Qwen团队发布全新Qwen3系列大模型，一次性开源8款混合推理模型，包括2个MOE模型和6个Dense模型 [1][3][4] - 旗舰模型Qwen3-235B-A22B拥有2350亿参数，激活参数220亿，在代码、数学和通用能力基准测试中超越DeepSeek R1和OpenAI o1，接近Google Gemini 2.5-Pro [4][5] - Qwen3-30B-A3B总参数300亿，激活参数仅30亿，性能优于QwQ-32B，小模型Qwen3-4B达到Qwen2.5-72B-Instruct水平 [6][7] 技术创新与架构 - Qwen3是国内首个支持"快思考"和"慢思考"混合推理的模型，可根据问题难度切换响应模式 [9][10] - 模型预训练数据量达36万亿token，覆盖119种语言，是Qwen2.5的两倍，采用三阶段训练流程提升专业能力和长文本处理 [16][17] - MOE架构仅激活10%参数即可实现接近Qwen2.5 Dense模型的性能，显著降低训练和推理成本 [19] 行业影响与用户反馈 - Qwen3系列开源模型数量突破10万，超越Meta Llama成为全球最大开源模型族群 [23] - 外媒评价Qwen3接入效率高，几小时可替代OpenAI接口，显存使用效率接近GPT-4 [23] - 用户实测显示Qwen3在编程、数学和多语言处理表现优异，GitHub热度达17.9k Star [25][26][27][31] 多语言与部署支持 - 支持119种语言和方言，覆盖全球主要语系，包括印欧语系、汉藏语系、亚非语系等 [11][13] - 模型已在Hugging Face、ModelScope、Kaggle等平台上线，支持网页端和移动端使用 [14][18] - 推荐使用SGLang、vLLM等推理框架进行部署，本地工具支持包括Ollama、LMStudio等 [15]

阿里巴巴(US:BABA)

大模型

混合推理模型

Artificial Intelligence

Qwen3系列大模型

大模型

混合推理模型

Artificial Intelligence

Qwen3系列大模型