智能体Agent - 财报，业绩电话会，研报，新闻

智能体Agent

搜索文档

恒生电子刘曙峰：2025年大模型的产业应用取得实质性突破

经济观察网· 2025-12-29 12:24

文章核心观点 - 2025年大模型的产业应用将取得实质性突破特别是在金融行业的交互入口、文档处理、客户服务及代码生成等场景 [1] - 大模型在金融领域的应用仍处于初级阶段限制因素包括私有化部署有效性、业务合规风险及预算约束观望是部分机构的可行策略 [1] - 长期来看底层技术进步将改变商业模式和产业范式数据中台与AI中台融合以及行业知识深度是核心竞争力关键 [1] 大模型产业应用进展与场景 - 2025年大模型产业应用取得实质性突破 [1] - 金融行业应用场景集中在交互入口、文档信息处理、客户服务等领域 [1] - 大模型在代码生成环节的生产有效性已得到印证 [1] 技术发展趋势与架构 - 智能体Agent领域有望在未来一年取得实质性进展 [1] - 在精准计算领域传统小模型对结构化数据的处理能力无需被替代大小模型混合使用是有效方式 [1] - 大模型的幻觉问题无法根本消除需探索有效边界并与之共存在金融领域这意味着AI在风险管理、投资决策等高价值部位的有效使用 [1] - 最新观察趋势是数据中台和AI中台的融合以及“本体”业务逻辑模型的发展 [1] 行业发展阶段与挑战 - 大模型金融应用仍处于初级阶段 [1] - 限制发展速度的主要因素包括私有化部署的有效性、业务的合规风险以及预算约束 [1] - 对很多机构而言观望不失为一种有限策略 [1] 长期战略与核心竞争力 - 从长期战略角度看底层技术进步最终会改变商业模式和产业范式的基础架构 [1] - 行业know-how的深度和抽象能力仍然是核心竞争力的来源 [1]

阿里Qwen3发布，超越DeepSeek-R1等登顶全球最强开源模型

海通国际证券· 2025-05-06 20:22

报告行业投资评级 - 计算机行业投资评级为增持 [1] 报告的核心观点 - 阿里发布 Qwen3 印证我国头部 AI 公司技术水平位列世界顶尖，开源模型将促进 AI 行业发展，Qwen3 在 BFCL 评测取得新高，支持 AI Agent 时代到来，持续看好计算机板块 [3][9] 根据相关目录分别进行总结投资建议 - 建议关注合合信息、赛意信息、鼎捷数智、虹软科技、万兴科技、金蝶国际、金山办公、海光信息、寒武纪等标的 [3] 阿里发布 Qwen - 3 - 4 月 29 日凌晨阿里巴巴推出 Qwen3，旗舰模型 Qwen3 - 235B - A22B 仅部分指标落后 Gemini - 2.5 - Pro，全面超越 DeepSeek - R1 等顶级模型，小型 MoE 模型 Qwen3 - 30B - A3B 表现更胜一筹，小模型 Qwen3 - 4B 能匹敌 Qwen2.5 - 72B - Instruct 性能，开源两个 MoE 模型和六个 Dense 模型 [3][10] Qwen3 支持两种思考模型 - Qwen3 支持思考和非思考两种模式，结合增强了“思考预算”控制能力，预训练数据集达 36 万亿 tokens，是 Qwen2.5 的近两倍，涵盖 119 种语言和方言 [3][11] Qwen3 集成 MCP - Qwen3 工具调用能力出色，阿里发布 Qwen - Agent 发挥其 Agent 能力，降低代码复杂性，在 BFCL 评测中创下 70.8 的新高，超越顶尖模型，为智能体 Agent 和大模型应用爆发提供支持，阿里正过渡到以训练 Agent 为中心的时代 [3][12] 建议关注标的盈利预测 - 报告给出合合信息、赛意信息等公司 2024A、2025E、2026E 的 EPS 和 PE 等盈利预测数据 [6]

刚刚，Qwen3 终于发布！混合推理模式、支持MCP，成本仅DeepSeek R1三分之一，网友喊话小扎：工程师要赶紧加班了

AI前线· 2025-04-29 07:57

核心观点 - 阿里巴巴发布并开源新一代通义千问模型Qwen3，采用混合专家（MoE）架构，总参数量235B，激活仅需22B，成本大幅下降，性能全面超越全球顶尖模型[2][3] - Qwen3是国内首个"混合推理模型"，集成"快思考"与"慢思考"，可根据需求灵活调整算力消耗[4] - Qwen3在推理、指令遵循、工具调用、多语言能力等方面大幅增强，创下国产及全球开源模型性能新高[5] - Qwen3部署成本大幅下降，仅需4张H20即可部署满血版，显存占用仅为性能相近模型的三分之一[8] - Qwen3提供丰富的模型版本，包含2款MoE模型和6款稠密模型，均斩获同尺寸开源模型最佳性能[9] - Qwen3采用Apache2.0协议开源，支持119多种语言，全球开发者可免费下载商用[10] 模型架构与性能 - Qwen3采用混合专家（MoE）架构，总参数量235B，激活仅需22B，参数量仅为DeepSeek-R1的1/3[3] - Qwen3-235B-A22B在ArenaHard测评中获95.6分，超越OpenAI-o1及DeepSeek-R1[5] - Qwen3在AIME25测评中斩获81.5分，刷新开源纪录；LiveCodeBench评测突破70分，表现超过Grok3[5] - Qwen3-235B-A22B在CodeForces Elo Rating中获2056分，超越OpenAI-o1的1891分[6] - Qwen3-30B-A3B MoE模型在ArenaHard测评中获91.0分，超越Qwen2.5-72B-Instruct的81.2分[7] 部署与成本 - Qwen3仅需4张H20即可部署满血版，显存占用仅为性能相近模型的三分之一[8] - 官方建议使用SGLang和vLLM等框架进行部署，本地使用推荐Ollama、LMStudio等工具[8] - Qwen3-30B参数MoE模型实现10倍以上性能杠杆提升，仅激活3B就能媲美上代Qwen2.5-32B模型性能[9] - Qwen3稠密模型一半参数量可实现同样高性能，如32B版本可跨级超越Qwen2.5-72B性能[9] 训练与数据 - Qwen3使用约36万亿个token进行预训练，是Qwen2.5的两倍，涵盖119种语言和方言[20] - 预训练分为三个阶段：基础语言能力训练、知识密集型数据训练和长上下文能力训练[22] - Qwen3从网页和PDF等文档中提取数据，并利用Qwen2.5系列模型提升数据质量和生成合成数据[21] - Qwen3稠密基础模型整体性能达到参数量更大的Qwen2.5基础模型水平，在STEM等领域甚至超越[25] 功能特点 - Qwen3支持混合思维模式，用户可按需设置"思考预算"，灵活满足不同场景需求[12] - 思考模式适用于复杂问题，非思考模式适合简单问题[13] - Qwen3增强对Agent支持，优化编码和Agent能力，增强对MCP的支持[15] - 在BFCL评测中Qwen3创下70.8的新高，超越Gemini2.5-Pro、OpenAI-o1等顶尖模型[16] - Qwen3原生支持MCP协议，具备强大的工具调用能力，结合Qwen-Agent框架降低编码复杂性[16] 社区与生态 - Qwen3发布后，苹果机器学习研究员Awni Hannun测试显示其在M2 Ultra上运行非常快[31] - 网友评价Qwen3-235B-A22B感觉像是原始o1博客文章中的推理轨迹和R1 zero的结合[32] - 阿里通义已开源200余个模型，全球下载量超3亿次，Qwen衍生模型数超10万个，已超越美国Llama[35]