Qwen3大模型
搜索文档
“2025微博之夜”完美收官 重视IP长久价值与持续运营传递正能量
证券日报网· 2026-02-06 15:28
微博之夜活动概况 - 活动由微博与BRTV联合主办 于2月5日落幕 是横跨二十载的经典IP [1] - 活动聚齐文娱 体育 科技 公益等多领域代表 共同见证微博年度荣誉诞生 [1] - 活动核心为“让@有回响” 旨在凝聚社会共识 传递正向价值 记录时代精神 [1] IP定位与品牌价值 - IP已从早期娱乐盘点 拓展为覆盖多领域的年度盛典 体现长期主义下的品牌积淀 [2] - 活动精心设计 成为串联时代记忆 传递核心价值的沉浸式体验 [2] - IP沉淀下强大的用户信任与行业影响力 成为每年岁末全网期待的文化盛事 [2] - 后续将继续秉持“以微博之力 让世界更美”的理念 持续创新内容形式 拓展价值边界 [3] 营销与商业赋能 - 依托红毯秀 荣誉颁发 主题表演等场景 为合作品牌提供多元化营销载体 适配多行业需求 [1] - 从舞台视觉植入到互动环节联动 从明星背书到长尾话题发酵 帮助品牌快速触达目标用户 构建深度认知 [1] - IP展现出强大的IP孵化与赋能能力 能带动衍生IP实现全面破圈 从成熟IP的长效运营到新生IP的快速成长 [3] 内容生态与全民参与 - 依托微博平台的社交媒体属性 盛典打通线上线下全链路 舞台精彩通过多视角直播实时传递 相关话题迅速占领热搜 [3] - 线下互动环节拉近与观众距离 线上全民投票 话题讨论 内容二创 让每个网友都成为IP的参与者与传播者 构建“全民共创 全民共享”的生态 [3] 荣誉与跨界展示 - 苏炳添 汪顺 陈芋汐等运动员荣获“微博年度关注运动员” 中国羽毛球队凭借苏迪曼杯夺冠获得“微博年度关注运动队” [1] - 宇树机器人和通义Qwen3荣获“微博年度科技创新影响力事件” 宇树科技机器人与机器狗的通俗化互动让硬核科技走出实验室 Qwen3大模型展现中国人工智能领域的创新突破 [2] - 2025年恰逢中国电影120周年 活动特设“电影院的等待”致敬环节 张艺谋荣获“微博年度国际影响力导演” [2] - LABUBU荣获“微博年度喜爱IP”并首次登陆微博之夜舞台 虚拟偶像KONG控 《完美世界》火灵儿 喜羊羊获“微博年度喜爱二次元角色” 体现二次元IP跨界融合 [3]
给阿里千问一个“客观估计”——围绕QWen3的大模型横评
阿尔法工场研究院· 2025-11-20 10:21
Qwen3模型定位 - Qwen3旗舰模型综合能力进入全球第一梯队,略低于Gemini3、GPT-5.1和Kimi K2 Thinking,与Grok 4.1、Claude Opus 4.1属于同档[2] - 在国内市场位列Top 2-3行列[2] 模型基本面 - 采用Dense模型与MoE旗舰架构,参数规模从0.6B延伸至32B,旗舰型号Qwen3-235B-A22B总参数235B,活跃参数22B,实现"参数巨舰+算力省电"[4] - 训练数据规模约36万亿token,覆盖119种语言/方言,对数学、代码、STEM推理进行额外强化[5] - 提供文本对话、写作、代码、多模态(图像/文档/表格)功能,长上下文版本支持百万级token[5] 性能评测体系 - 采用AA指数(综合0-100智能分)和人类盲评Elo榜作为核心评测标准[7] - 辅以AIME2025竞赛数学、HLE极难综合考试、LiveCodeBench/SciCode实战代码等专项基准[9][10] 全球竞争力表现 - AA指数得分约60分,与Grok 4.1和Claude 4.1同处顶级区,但与Gemini3 Pro、GPT-5.1、K2 Thinking存在7-10分差距[11] - 人类盲评显示Qwen3已进入第一梯队前列,用户体验与GPT-5/Gemini3差距不明显[12] - AIME2025竞赛数学测试位列第一梯队,在竞赛数学+推理特化场景中略逊于GPT-5.1/K2/Grok 4等专项强化模型[12] - 工程代码能力略弱于GPT-5.1/K2/Grok4,但已达到工程可用的一线水平,科学代码测试中各模型差距缩小至40%多区间[14][15] 国内市场格局 - 中国四强综合智能分数排序:Kimi K2 Thinking约67分 > Qwen3约60分 > DeepSeek-V3.2-Exp约57分 > 豆包1.5 Pro约48分[17][18] - Kimi K2 Thinking在浏览、工具调用、Agent任务方面表现突出,Qwen3各方面均衡,DeepSeek在国产芯片适配和长上下文性能有优势[17][18] 应用场景适配 - 中文/中英混合日常使用已达世界级体验,与顶级模型差距主要在极限长链推理和特定专业英文领域[20] - 多模态能力突出,Qwen2.5-VL和Qwen3-Omni在图像理解、文档解析、表格任务上经常获得高分[20] - 代码开发场景可支撑绝大多数团队日常开发工作,配合工具链后实用性显著提升[20]