Workflow
开源大模型
icon
搜索文档
超级大肉!国产GPU第一股上市,最高涨超500%,中一签狂赚27万!股民:我要酸死了...
雪球· 2025-12-05 15:52
市场整体表现 - 12月5日收盘,沪指涨0.7%,深成指涨1.08%,创业板指涨1.36% [1] - 沪深两市成交额达1.73万亿元,较上一交易日放量1768亿元 [1] - 全市场近4400只个股上涨,呈现涨多跌少格局 [1] - 保险、贵金属、福建、商业航天等板块涨幅居前,银行、中药、影视院线等板块跌幅居前 [1] 摩尔线程上市表现 - 被称为“国产GPU第一股”的摩尔线程于12月5日登陆科创板 [3] - 开盘竞价高开468%,盘中最高涨幅超500%,最高价达688元 [3] - 收盘报600.50元/股,总市值达2822亿元 [3] - 投资者中一签开盘卖出可盈利约27万元 [2][3] - 公司发行价为114.28元/股,本次发行募集资金总额约80亿元,净额75.76亿元 [8] - 募集资金将用于新一代AI训推一体芯片、图形芯片、AI SoC芯片研发项目及补充流动资金 [8] - 2022年至2024年及2025年上半年,公司营业收入分别为0.46亿元、1.24亿元、4.38亿元、7.02亿元 [8] - 同期归母净利润分别为-18.94亿元、-17.03亿元、-16.18亿元和-2.71亿元 [8] AI算力板块表现 - 受摩尔线程大涨提振,AI算力板块显著复苏,CPO概念领涨 [9] - 长光华芯收获20%幅度涨停,股价创历史新高,今年以来累计涨幅超230% [9] - 致尚科技、永鼎股份、可川科技涨停,东田微、炬光科技等涨超10% [12] - 深度求索发布DeepSeek-V3.2系列模型,在推理能力、工具调用与开源生态等方面实现突破 [15] - 国泰海通研报认为,DeepSeek-V3.2系列标志着开源大模型进入性能与实用性并重阶段,其推理能力媲美顶尖闭源模型 [15] - 东吴证券研报认为,国产算力呈现“商业兑现加速”与“技术范式突破”共振势头,已进入业绩兑现黄金周期 [15] 大金融板块表现 - 午后保险、证券、互联网金融等大金融板块持续拉升 [16] - 瑞达期货直线拉升封板,中银证券涨停,兴业证券涨超5%,湘财股份、东方财富、东北证券、华泰证券跟涨 [17] - 广发证券研报称,2025年市场活跃度回升,券商业绩高增,2026年行业ROE有望持续提升 [22]
国泰海通|计算机:DeepSeek-V3.2系列发布:推理能力对标顶尖闭源,开源生态引领应用落地
核心观点 - DeepSeek-V3.2系列的发布标志着开源大模型进入性能与实用性并重的新阶段 其在核心推理能力上达到顶尖闭源模型水平 并创新性地将思考模式融入工具调用 为AI应用开发提供了更高效、更经济的解决方案 推动大模型开源与开发者生态繁荣 [1][2] 模型性能与能力突破 - DeepSeek-V3.2在公开推理基准测试中表现已对标GPT-5 并显著优于部分专注长上下文的开源模型 [2] - 长思考增强版V3.2-Speciale在多项国际顶级竞赛中达到人类顶尖水平 在国际数学奥林匹克(IMO)、国际大学生程序设计竞赛(ICPC)等顶级赛事中斩获金牌 其中ICPC成绩位列人类选手第二名 [2] - V3.2-Speciale版本融合了深度数学定理证明能力 首次在多项高难度推理任务上验证了开源模型达到人类顶尖智力水平的潜力 [2] - DeepSeek-V3.2是业界首个将链式思考能力系统化融入工具调用流程的开源模型 [3] - 通过独创的大规模Agent训练数据合成方法 模型在涵盖1800余个环境的85,000余条复杂指令上进行强化学习 使其在未经特殊训练的工具调用评测中达到开源模型最高水平 显著缩小了与闭源模型的差距 [3] 技术架构与创新 - 模型创新性地实现了思考模式与工具调用的深度融合 大幅提升了智能体在复杂场景中的泛化与执行能力 [3] - 该架构允许开发者在思考模式下进行多轮规划与工具调用 为构建能够处理复杂、多步骤现实任务的AI智能体提供了可靠的开源基础 [3] - 此次更新支持了思考模式下的工具调用 提供了长达128K的上下文窗口 [4] 开源生态与产业影响 - 深度求索已将官方网页、App及API服务全面升级至DeepSeek-V3.2 并为研究社区临时开放了Speciale版本的API [4] - 公司通过HuggingFace、ModelScope等平台完整开源了模型权重与技术细节 [4] - 这种“开放性能 + 开放生态”的组合策略 大幅降低了企业与开发者的应用门槛 有望引领开源模型从技术追赶向规模化、实用化产业部署的关键转折 [4] - 彻底的开放策略预计将吸引大量开发者基于其构建垂直应用 形成以DeepSeek为核心的开源应用生态 进一步巩固其在开源领域的引领地位 [4]
DeepSeek V3.2正式版发布:官方称推理比肩GPT-5
凤凰网· 2025-12-03 17:04
模型发布与性能表现 - 公司于12月1日正式发布新一代开源大模型DeepSeek-V3.2及其长思考增强版DeepSeek-V3.2-Speciale,并同步更新官方网页端、App及API至V3.2版本 [1] - DeepSeek-V3.2在公开推理基准测试中推理能力达到GPT-5水平,与Gemini-3.0-Pro接近,同时输出长度较Kimi-K2-Thinking显著缩短以降低计算开销 [1] - DeepSeek-V3.2-Speciale版本融合DeepSeek-Math-V2定理证明能力,在IMO、CMO、ICPC及IOI等国际竞赛中取得金牌成绩,其中ICPC成绩达到人类选手第二名水平 [1] 技术特性与能力提升 - 新版本首次实现思考模式与工具调用融合,支持在思考过程中调用外部工具 [5] - 通过大规模Agent训练数据合成方法,模型在1800多个环境和超过8.5万条复杂指令上进行强化学习训练,提升了泛化能力 [5] - 公司在智能体评测中达到当前开源模型最高水平,进一步缩小与闭源模型差距 [5] 版本演进与开放策略 - 此前实验版本DeepSeek-V3.2-Exp于两个月前发布,经用户反馈测试,其采用的DSA稀疏注意力机制在各项场景中未出现显著性能下降 [5] - Speciale版本目前以临时API形式开放,供社区研究与评测 [5]
从开源最强到挑战全球最强:DeepSeek新模型给出了解法
观察者网· 2025-12-02 19:38
模型发布核心信息 - 12月1日,公司发布两个正式版模型:面向日常使用的DeepSeek-V3.2和面向极致探索的DeepSeek-V3.2-Speciale [1] - DeepSeek-V3.2是9月底实验版V3.2-Exp的正式版,平衡推理能力与输出长度,适合问答场景并强化了Agent能力,官方网页端、App和API均已更新 [1][4] - Speciale版本是V3.2的长思考增强版,结合了DeepSeek-Math-V2的定理证明能力,目标是将开源模型推理能力推向极致,目前仅以临时API服务形式开放 [1] 模型性能表现 - 在公开推理测试中,V3.2已达到GPT-5水平,仅略低于Google Gemini 3 Pro,相比Kimi-K2-Thinking输出长度大幅降低,减少计算开销与用户等待时间 [6] - Speciale在多个推理基准测试中超越Gemini 3 Pro,包括美国数学邀请赛(96.0分)、哈佛MIT数学竞赛(99.2分)和IMO(84.5分) [7] - 在编程与理工科博士生测试中,Speciale仍略逊于Google顶级模型,如LiveCodeBench(88.7分)和GPQA Diamond(85.7分)低于Gemini 3 Pro的90.7分和91.9分 [7] 技术架构创新 - 公司设计了DSA(DeepSeek稀疏注意力)机制应对长文本计算量爆炸,该机制像图书管理员通过“闪电索引器”只检索关键信息,大幅降低计算复杂度 [8] - V3.2的核心亮点是“Thinking in Tool-Use”(思考型工具调用),这是AI Agent领域的“Interleaved Thinking”(交错思维链)技术的重要背书 [8][9] - 该技术将冗长、重度依赖工具的任务转化为稳定的“计划→行动→反思”循环,通过复用假设与部分结论减少多轮任务中的“状态漂移”与重复性错误 [9] 战略方向与行业定位 - 公司将“Agent能力”提升到与“推理能力”同等重要的战略位置,试图通过Agent能力将模型从“聊天机器人”进化为真正的“数字劳动力” [13] - 从经济维度看,企业真正愿意付费的是“降本增效的行动”而非“更优美的回答”,Agent使LLM从“对话式AI”进化为“动作式AI”以产生商业闭环 [13] - 公司思路已从工具转变为基础设施提供商,大模型正演变成调度工具的通用操作系统,模型是内核,Agent是用户态程序,插件则是工具 [14] 行业竞争格局 - 过去一年开源大模型生态集体爆发,阿里云Qwen系列、月之暗面Kimi、智谱GLM和MiniMax M系列均取得超越当时顶级闭源模型的成果 [1] - Google Gemini 3.0 Pro的发布重新定义了“全球最强”,其强劲性能让开源和闭源的差距瞬间又变成了一道新的天花板 [2] - 开源模型存在三个关键缺陷:对标准注意力机制的过度依赖、后训练阶段计算投入不足、Agent领域泛化能力和指令遵循能力存在明显差距 [15] 未来发展路径 - 公司计划通过增加预训练计算量填补知识空白,并优化模型推理链的“智能密度”提高效率,让模型学会“少说话、多办事” [16] - 研究员Zhibin Gou表示,训练后的瓶颈需通过优化方法和数据解决,而非仅等待更好的基础模型,持续扩大模型规模、数据量、上下文和强化学习 [17] - 公司用实打实的模型证明Scaling没死只是换了战场,当行业讨论Scaling Law是否撞墙时,公司想证明持续扩展的可能性 [19]
第三届全国工业和信息化技术技能大赛举办,首设生成式AI应用赛
新京报· 2025-11-28 12:55
赛事概况 - 第三届全国工业和信息化技术技能大赛决赛于11月26日至28日在重庆举办,共有408支队伍、834名选手参赛 [1] - 大赛由工业和信息化部、人力资源和社会保障部、教育部、中华全国总工会、共青团中央共同主办 [1] - 大赛以"产才融合,技能报国"为主题 [1] 赛项设置与前沿技术 - 本届大赛设置六大赛项,包括智能硬件装调员、生成式人工智能系统应用员、混合集成电路装调工等,赛项数目比前两届提升近一倍 [2] - 首次设置生成式人工智能系统应用员(智能工业机器人领域)赛项,学生组创新场引入自然语言处理和开源大模型等前沿技术 [1] - 混合集成电路装调工(RISC-V等架构芯片开发与系统应用领域)赛项是上届赛项的升级,也是首次在国家级大赛中设置RISC-V架构主题 [2] 聚焦产业方向与人才目标 - 大赛聚焦新能源汽车、工业机器人、智能芯片、工业大数据、制造业数字化转型和工业互联网等六大制造强国重点方向 [1] - 旨在以赛促学、以赛促训、以赛促建,为产业高质量发展选拔和储备高素质技术技能人才 [1] - 赛事被视为深化教育科技人才一体改革发展,加快构建需求导向、标准衔接、产才融合的产业人才培养体系的新起点 [2] 赛事历史与影响 - 全国工业和信息化技术技能大赛是工信领域唯一的国家一类赛事,自2021年创办以来已成功举办三届 [3] - 累计957名选手获奖,涌现出42名全国技术能手、13名全国青年岗位能手及7名全国"五一"劳动奖章获得者 [3] - 赛事品牌效应持续凸显,已成为发现人才的"试金石"、锤炼实战能力的"练兵场"和促进产才融合的"加速器" [3]
AI产业跟踪:阿里首款AI眼镜塞满硬核技术,我国已经成为全球开源AI大模型的最大提供者
国泰海通证券· 2025-11-24 16:15
报告行业投资评级 - 报告未明确给出具体的行业投资评级 [1] 报告核心观点 - 中国AI产业在全球影响力显著提升,已成为全球开源AI大模型的最大提供者 [16] - 中国AI企业在基础模型领域已具备与国际巨头同台竞技的实力,中美顶级AI大模型性能差距大幅缩小至0.3% [15] - AI技术商业化应用加速落地,覆盖金融、教育、工业、内容创作等多个垂直领域 [6][7][10][14][23][24] AI行业动态 - 浙商银行与阿里巴巴达成战略合作,双方将依托金融与"云+AI"优势推动金融服务智能化升级 [6] - 宝马集团在华推出自研AI智能体平台"盖亚",推动AI从"专家专属"到全员化赋能,并在研发、生产、供应链及客户服务等领域应用 [7] - 月之暗面Kimi K2 Thinking模型被AI搜索应用Perplexity接入,成为其接入的唯一国产模型,Perplexity拥有3000万月活跃用户,估值突破200亿美元 [8] - 2025"人工智能+"大会在北京举行,北京市人工智能协会成立,旨在整合产业资源、搭建交流平台 [9] AI应用资讯 - 上海钢联应用AIGC技术开发"小钢"数字智能助手,基于自研垂类大模型"钢联宗师",DeepSeek版已服务超万名正式会员 [10] - 有道音视频翻译升级一站式AI工作台,上线自主研发的"VF原声翻译系统",优化多模态AI翻译体验 [11][12] - 香港推出智能对话应用"港话通",整合全方位生活服务 [13] - 斑马推出首个AI外教一对一产品"斑马口语",面向6-12岁儿童提供全英文沉浸式口语学习体验 [14] AI大模型资讯 - 阿里巴巴推出千问App公测版,其Qwen系列模型全球开源社区下载量已突破6亿,衍生模型超过17万个 [15] - 在"全球AI投资大赛"中,Qwen模型以超20%的收益率夺冠,力压GPT-5等美国头部模型 [15] - 中国工程院院士倪光南表示中国已成为全球开源AI大模型最大提供者,Qwen、DeepSeek、Kimi等模型在评估平台排名靠前 [16] - Gartner报告显示,火山引擎领跑AI应用开发平台挑战者象限,名列全球第五、中国第一,阿里云、腾讯云亦入围 [17] - 字节Seed团队推出在《原神》世界中训练的通用AI智能体Lumine,能够实时感知、思考并行动 [18] 科技前沿 - 阿里巴巴首款自研AI眼镜夸克S1预售超6000台,具备合像距可调节技术、SuperRaw暗光算法及可拆卸换电技术 [20][21] - 蚂蚁集团开源万亿参数强化学习高性能权重交换框架Awex,可在秒级完成TB级大规模参数交换 [22] - 翼菲科技发布首款人形机器人"鸿钧",采用升降+轮式复合底盘,移动速度2m/s,宣称可覆盖95%以上工业场景需求 [23] - 潜行创新发布全球首款融合"激光雷达+AI视觉"的泳池机器人L1 Ultra,标志着行业进入全自主智能新时代 [24]
阿里千问公测一周下载量突破1000万,新一轮中国AI冲击波来袭?
凤凰网· 2025-11-24 14:27
用户增长与市场表现 - 千问App公测一周下载量突破1000万次,成为史上增长最快的AI应用 [1] - 千问App上线三天即冲入苹果App Store免费总榜前三 [1] - Qwen系列模型全球累计下载量已突破6亿次 [1] 产品与技术实力 - Qwen3-Max模型性能跻身全球前三,超越GPT5和Claude Opus 4等国际竞争对手 [1] - 阿里Qwen模型已超越Llama,成为全球性能强劲、应用范围最广的开源大模型之一 [1] - 千问App定位为“会聊天能办事的个人AI助手”,注重Agentic AI能力 [2] 市场战略与生态整合 - 公司将千问视为“AI时代未来之战”,旨在打造C端AI入口 [2] - 计划将千问App与电商、地图、本地生活等业务生态深度整合以强化其Agentic能力 [2] - 模型能力已进入“辅助人”的Agentic AI时代,公司认为这是打造C端入口的绝佳时机 [2] 行业影响与客户认可 - 硅谷市场被快速攻占,Airbnb CEO表示公司正“大量依赖Qwen”,因其比OpenAI模型更快速出色 [1] - 英伟达CEO指出Qwen已占据全球开源模型市场大部分份额并持续增长 [1] - “千问恐慌”成为海外社交媒体热词,公司再度向全球投下中国AI冲击波 [1]
阿里千问App公测一周下载破1000万,成为增长最快的AI应用
观察者网· 2025-11-24 12:08
千问App市场表现 - 公测一周下载量突破1000万次,成为史上增长最快的AI应用 [1] - 上线仅三天即冲入苹果App Store免费总榜前三 [1] - 增长速度超越Sora(首周62.7万次iOS下载量)和ChatGPT(首周60.6万次iOS下载量) [1] 阿里Qwen模型基础 - 千问App基于阿里Qwen模型打造,该模型自2023年全面开源 [1] - Qwen系列模型全球累计下载量已突破6亿次,超越Llama、Deepseek等竞争者 [1] - 旗舰模型Qwen3-Max性能跻身全球前三,超越GPT5和Claude Opus 4 [1] 公司战略与产品定位 - 公司将千问App定位为“会聊天能办事的个人AI助手”,视为“AI时代未来之战” [2] - 产品将深度整合电商、地图、本地生活等业务生态,强化其Agentic能力 [2] - 目标是让AI不仅能理解生成,更能跨场景协同、直接执行任务 [2] 行业影响与前景 - “千问恐慌”成为海外社交媒体讨论热词,显示其广泛影响力 [1] - 行业认为随着开源模型演进和Agent能力迭代,千问App有望成为中国在AI全球竞赛中的“王牌” [2]
中国AI冲击波!刚刚,阿里重大发布!
券商中国· 2025-11-24 11:57
千问APP市场表现 - 千问APP于11月17日开启公开测试后,7天内下载量突破1000万次 [1][2] - 应用上线三天内进入苹果App Store中国区免费总榜前三 [5] - 此增长数据超过了ChatGPT、Sora、DeepSeek等多款知名AI应用 [4] 市场与资本反应 - 受千问APP下载量消息影响,阿里巴巴股价直线拉升,一度涨超5% [2] - 市场反应强烈,可能意味着国内乃至全球AI应用市场竞争格局将迎来重大变化 [4] 技术与战略背景 - 千问APP的底层技术是阿里千问大模型,该系列模型自2023年起采取积极开源策略 [5] - Qwen系列模型在Hugging Face等全球开发者社区获得广泛认可,全球累计下载量已超过6亿次 [5] - 英伟达CEO黄仁勋指出Qwen已占据全球开源模型市场大部分份额 [5] - 爱彼迎CEO布莱恩·切斯基公开表示公司正"大量依赖Qwen",因其比OpenAI模型更快速、更出色 [5] 产品定位与未来规划 - 千问APP定位为"会聊天能办事的个人AI助手",未来将着力发展"Agentic AI"能力 [6] - 公司计划将千问APP与电商、地图、本地生活等庞大业务生态进行深度整合 [6] - 业内分析认为,凭借领先的模型技术和商业生态,应用在将初期热度转化为长期活跃用户上具备独特优势 [6] - Agent能力与阿里生态加速融合,有望重塑用户与数字服务的交互方式 [6]
阿里千问App公测一周下载量破千万 成为增长最快的AI应用
格隆汇· 2025-11-24 10:32
核心观点 - 阿里巴巴旗下AI助手千问App公测一周下载量突破1000万次,成为史上增长最快的AI应用,标志着公司在C端AI市场取得重大突破 [1][2] - 千问App的爆发式增长源于其底层Qwen系列开源大模型长期积累的技术实力与行业影响力,该模型系列全球累计下载量已突破6亿次,性能跻身全球前三 [1] - 公司战略将千问App定位为“AI时代未来之战”的关键,旨在打造一个能深度整合电商、地图等生态的“会聊天能办事”的个人AI助手,推动AI进入“辅助人”的Agentic时代 [2] 市场表现与增长数据 - 千问App公测一周下载量突破1000万次,超越ChatGPT、Sora、DeepSeek等应用的增长速度 [1] - 上线仅三天即冲入苹果App Store免费总榜前三 [2] - 其底层Qwen系列模型的全球累计下载量已突破6亿次 [1] - Qwen系列模型已占据全球开源模型市场的大部分份额,且份额持续增长 [1] 技术实力与行业地位 - 阿里Qwen模型自2023年全面开源后,已超越Llama、Deepseek等竞争者,成为全球性能强劲、应用范围最广的开源大模型之一 [1] - 近期发布的旗舰模型Qwen3-Max性能表现已跻身全球前三,超越国际竞争对手如GPT5和Claude Opus 4 [1] - 硅谷企业如爱彼迎(Airbnb)公开表示“大量依赖Qwen”,认为其比OpenAI的模型更快速、更出色 [1] - 英伟达(NVIDIA)CEO指出Qwen已占据全球开源模型市场的大部分份额 [1] 公司战略与产品定位 - 阿里巴巴管理层将千问视为“AI时代未来之战”,认为大模型能力进入“辅助人”的Agentic AI时代,是打造C端AI入口的绝佳时机 [2] - 千问App定位为“会聊天能办事的个人AI助手”,计划与公司电商、地图、本地生活等业务生态深度整合 [2] - 战略目标是持续强化其Agentic能力,让AI不仅能理解、生成,更能跨场景协同并直接执行任务 [2] 行业影响与未来展望 - 千问App的公测爆火在海外社交媒体引发“千问恐慌”讨论,被视为继2025年年初DeepSeek之后,中国AI对全球市场的又一次冲击 [2] - 行业观点认为,随着开源模型演进、Agent能力迭代及生态融合加速,千问App有望成为AI时代的国民级应用 [2] - 千问App承载着中国AI赢得全球顶级竞争的使命 [2]