Seek . - 财报，业绩电话会，研报，新闻

Seek .(SKLTY)

搜索文档

36氪· 2025-05-02 10:21

宝马中国接入DeepSeek的战略合作 - 宝马中国宣布接入DeepSeek AI大模型，未来功能将应用于国产宝马新世代车型，2025年三季度率先搭载于第9代BMW操作系统的中国在售新车 [1] - 公司以AI创新引擎加速中国AI战略落地，此前已与阿里巴巴达成AI大语言模型战略合作，此次合作进一步深化本土AI生态布局 [1] - 宝马集团董事长齐普策强调AI是未来合作关键领域，体现本地化战略持续深化，目标是通过与中国科技领军企业合作让AI赋能中国车型 [1] AI技术对宝马产品体验的升级 - DeepSeek接入显著拓展BMW智能个人助理能力边界，强化理解和共情能力，使车机在复杂语境和模糊表达下快速响应 [2] - 研发团队认为AI时代的驾驶体验从机械默契转向智能共情，智能座舱将成为用户情感联结空间而非单纯科技堆砌 [2] 宝马智能化战略的演进路径 - 2023年3月公司已启动360度全链AI战略，上海车展发布与阿里巴巴合作开发的"用车专家"与"出行伴侣"智能体 [3] - 公司传统优势在于精湛机械制造技术、优秀操控性能及高端品牌形象，发动机技术和底盘调校处于行业领先地位 [3] 宝马面临的转型挑战与应对 - 智能化水平不足是当前主要问题，车机系统功能与用户体验较国内新势力存在差距，转型速度落后于市场趋势 [4] - 选择与DeepSeek合作是重要战略决策，既提升产品智能化水平，也展现公司积极学习中国市场先进技术的姿态 [4] - 中国作为全球最大汽车市场及智能网联技术发展最快区域，为宝马提供理想试验田和技术借鉴机会 [4][5] 国际车企在中国市场的战略调整 - 面对中国汽车产业技术快速进步，国际车企需重新审视策略，学会利用中国市场独特资源成为竞争关键 [5][6] - 与本土科技公司深度合作是国际车企适应中国市场的有效途径，宝马此举属于主动战略转型而非妥协 [6]

DeepSeek开源新模型，数学推理能力大提升

虎嗅· 2025-05-01 08:48

模型发布与版本 - DeepSeek在Hugging Face正式发布DeepSeek-Prover-V2，同步上线模型卡及示例代码，共推出两个版本：7B和671B [1][4] - DeepSeek-Prover-V2-7B基于上一代V1.5模型，支持最长32K上下文输入 [4] - DeepSeek-Prover-V2-671B在DeepSeek-V3-Base基础上训练，推理性能最强 [4] 训练方法与技术 - 训练核心采用"递归+强化学习"组合，由DeepSeek-V3拆解复杂定理生成子目标和推理思路，再通过GRPO算法从候选方案中学习最优解 [3] - 训练分为两阶段：第一阶段采用"专家迭代"方法，模型通过解决难题反哺自身 [5]；第二阶段迁移DeepSeek-V3数学知识并引入形式化数据，构建复杂推理路径 [6] - GRPO强化学习算法引导模型在32个候选证明方案中选择被Lean验证系统判定为正确的答案（奖励1分，否则0分） [8][9] 模型能力与特点 - 671B模型能力被"蒸馏"到7B模型，使小模型在资源有限设备上获得接近大模型的数学推理能力 [10][11] - 提供两种解题风格：快速模式（non-CoT）直接生成精炼答案；逻辑模式（CoT）详细展示推理过程 [12] - DeepSeek-V3负责拆解定理生成推理草图，7B模型完成子证明并拼接完整推理，形成"模糊思考+精确证明"机制 [14][15] 性能评估与数据集 - DeepSeek-Prover-V2-671B在MiniF2F测试中通过率达88.9%，成功解出PutnamBench数据集49道难题 [17] - 推出全新数学形式化数据集ProverBench，包含325道题目，涵盖AIME竞赛题、数论、代数、微积分等10个领域 [18][19] - 在15道AIME竞赛题中，DeepSeek-Prover-V2解出6道，DeepSeek-V3通过多数投票解决8道 [20] 行业趋势与方向 - 大型语言模型在"非正式数学推理"与"正式数学推理"间的表现差距明显缩小，逐步学会写出规范可验证的数学证明 [21][22] - 模型从生成内容迈向生成结构化逻辑，可能最早触碰通用人工智能的底层结构，推理能力成为知识系统边界的关键 [32][33][34] 商业化与部署 - 新模型遵循公开许可证，可通过Hugging Face平台免费下载并支持Transformers接口部署 [23][24] - Novita AI成为首批上线Prover-V2-671B推理服务的第三方提供商 [24]

Seek .(US:SKLTY)

Artificial Intelligence

Mathematical Reasoning

Artificial Intelligence

DeepSeek-Prover-V2

DeepSeek-ProverBench

Artificial Intelligence

Mathematical Reasoning

Artificial Intelligence

DeepSeek-Prover-V2

DeepSeek-ProverBench

美乌重磅协议签署！矿产开发+重建基金；道指月线3连跌，美油跌超3%；证监会副主席王建军被查；DeepSeek开源新模型丨每经早参

每日经济新闻· 2025-05-01 07:00

隔夜市场表现 - 美股三大指数4月30日收盘涨跌不一，纳指跌0.09%，标普500指数涨0.15%，道指涨0.35% [2] - 4月份美股表现分化，纳指累计上涨0.85%，标普500指数累计下跌0.76%，道指累计下跌3.17%，其中标普500指数和道指连续下跌3个月 [2] - 大型科技股多数下跌，特斯拉跌超3%，亚马逊、英特尔跌超1%，超微电脑跌超11% [2] - 中概股涨跌互现，纳斯达克中国金龙指数跌0.95%，4月份累计下跌9.79% [2] - 美国2025年第一季度GDP环比按年率计算萎缩0.3%，而2024年第四季度为增长2.4% [2] - 国际油价大幅走低，美油主力合约跌3.64%至58.22美元/桶，布油主力合约跌3.37%至61.15美元/桶，4月份分别下跌18.55%和18.22%，创近三年半最大月跌幅 [2] - 现货黄金跌0.85%至3288.26美元/盎司，COMEX黄金期货跌1.03%至3299.20美元/盎司 [3] - 欧洲三大股指小幅上涨，德国DAX指数涨0.32%，法国CAC40指数涨0.5%，英国富时100指数涨0.37% [3] 政策与监管动态 - 《中华人民共和国民营经济促进法》获表决通过，共9章，自2025年5月20日起施行 [4] - 外交部表示中美双方未就关税问题进行磋商或谈判 [4] - 央行4月开展12000亿元买断式逆回购操作 [5] - 中央网信办部署开展为期3个月的“清朗·整治AI技术滥用”专项行动 [6] - 七部门联合发布《终端设备直连卫星服务管理规定》，自2025年6月1日起施行，支持终端设备直连卫星技术研究及融合发展 [7] - 证监会副主席王建军涉嫌严重违纪违法被调查 [8] - 武汉提高第二套个人住房公积金贷款最高额度，与首套房保持一致，并对多子女家庭发放购房补贴 [9] 公司动态与市场新闻 - 淘宝天猫“小时达”业务升级为“淘宝闪购”，在淘宝App首页设一级入口，首日上线50城，5月6日推广至全国，联合饿了么加大补贴 [13] - 东北证券首席经济学家付鹏因身体原因离职 [14] - 极石汽车辟谣创始人“跑路”传闻，称公司运营正常且有充足资金支持 [16] - 港交所股东质疑普华永道继续担任外聘核数师的资格和能力 [18] - 高盛（中国）证券2024年净利润大增158%至4.98亿元，但投行业务收入同比减少96.91%，自营业务收入同比减少56% [19] - DeepSeek发布DeepSeek-Prover-V2-671B模型，参数达6710亿 [21] - 小米开源推理大模型XiaomiMiMo，7B参数规模在多项测评中超越更大规模模型 [22] - 法拉第未来与纽约车行JC Auto签订1000台FX Super One预订单合同，含不可退定金 [23] - 美国UPS计划裁员约2万人，占员工总数4%，以降低成本35亿美元 [24] - 李开复受曹德旺邀请出任福建福耀科技大学理事会理事 [26] 科技行业与AI发展 - DeepSeek发布6710亿参数大模型DeepSeek-Prover-V2-671B，采用MoE模式 [21] - 小米开源推理大模型XiaomiMiMo，7B参数在数学推理和代码竞赛中表现优异 [22] - 中央网信办开展“清朗·整治AI技术滥用”专项行动，分两阶段强化AI技术源头治理和内容管理 [6] 企业财报与业绩 - 微软第三财季营收700.7亿美元超预期，Azure增长对AI业务贡献16个百分点 [27] - Meta第一季度营收423.1亿美元超预期，经营利润175.6亿美元同比增长27% [27] - 高通第二财季经调整营收108.4亿美元超预期，预计第三财季营收99亿至107亿美元 [28] 上市公司公告 - 奥来德全资子公司与成都京东方签订6.55亿元销售合同 [33] - 华达科技获得多个客户项目定点，预计生命周期总销售额63亿元 [34] - 通光线缆预中标1.42亿元国家电网采购项目 [34] - 寒武纪拟定增募资不超过49.8亿元，用于大模型芯片平台项目 [35] - 多家公司公布股份回购进展，包括极米科技已回购2.28亿元、海尔智家斥资2483.59万元回购等 [34]

AI数学天花板来了？DeepSeek新模型低调开源，网友直呼：R2指日可待！

华尔街见闻· 2025-04-30 20:52

DeepSeek-Prover-V2-671B模型发布 - 公司于4月30日在Hugging Face平台开源了专注于数学定理证明的大语言模型DeepSeek-Prover-V2-671B [1] - 模型采用DeepSeek-V3架构，参数高达6710亿，采用MoE模式，具有61层Transformer层，7168维隐藏层 [3][6] - 模型最大位置嵌入达到16.38万，能够处理极其复杂的数学证明问题 [6] 模型技术细节 - 模型分为163个分片，每个分片大小约为4.3GB [4] - 使用safetensors文件格式，支持BF16、FP8、F32等多种计算精度 [4] - 采用FP8量化技术减小模型大小，提高推理效率 [8] - 结合合成数据、强化学习与蒙特卡洛树搜索等优化技术 [6] 模型性能提升 - 在高中数学题测试中，成功率从50%提高到了63.5% [12] - 相比V1.5版本7B参数的小模型，此次直接升级为大模型 [14] 公司发展动态 - 创始人梁文锋表示要将探索通用人工智能作为核心使命 [7] - 团队保持每季度重大更新的开发范式：2024年9月V2.5、12月V3、2025年3月V3-0324 [7] - 3月发布的V3-0324版本已被业内视为未来R2的基础模型 [5][7] 行业反响 - 在社交平台X上，网友对R2大模型发布表示期待 [7] - 有评论称"中国的AI初创公司正在改变整个游戏规则" [15] - 行业对"中国正在将一些功夫应用于AI"表示兴奋 [16]

Seek .(US:SKLTY)

Artificial Intelligence

数学定理证明

Artificial Intelligence

DeepSeek-Prover-V2-671B

DeepSeek R2

Artificial Intelligence

数学定理证明

Artificial Intelligence

DeepSeek-Prover-V2-671B

DeepSeek R2

华为郭振兴： DeepSeek浪潮后，AI将快速释放巨大的制造业生产红利 | 最前线

36氪· 2025-04-30 17:48

行业峰会概况 - 华为AI+制造行业峰会2025在广州举办主题为"加速行业智能化" 参会人数超过900人涵盖汽车机械电子医药重工业轻工业等多个制造行业 [1] - 公司发布"三层五阶八步"方法论分享制造行业七大场景20个解决方案 [1] 华为AI解决方案 - 全栈AI基础设施可灵活适配制造多场景降低企业使用AI门槛智能应用让一线工人也能轻松使用AI [1] - 联合伙伴打造系列化方案覆盖车辆装备机械电子医药轻工到具身智能等新领域 [1] - 基于昇腾解决方案对DeepSeek进行全方位适配从预训练到推理场景均有针对性计算方案帮助客户快速完成二次训练 [3] - 与主流模型(包括DeepSeek)进行资源匹配调优使各模型在昇腾环境下达到性能最优 [3] - 昇腾全栈软件站已开源开放已有100多个制造业伙伴基于昇腾打造DeepSeek方案 [3] 汽车行业应用案例 - 与广汽集团合作建设智能化研发平台将新车研发周期从36个月缩短至18个月 [1] - 联合发布智能化研发平台解决方案启动样板点建设 [1] 研发效率提升 - 将1300多万片高价值基础文档 1万多篇API文档 850多万个开源代码舱导入研发数据平台 [2] - 通过研发大模型和AI助手软件版本开发周期从9-18个月缩短至1个月 [2] 行业部署情况 - 2025年预计有300多家企业制定大模型部署计划 [2] - 一汽使用DeepSeek代码能力使代码输出效率提升30% [2] - 广药集团用DeepSeek建设医药知识库实现知识跨部门复用应用于研发销售医学研究等多个场景 [2] 未来规划 - 2025年将围绕数据"采传存算管用"等需求提供智能联接存储算力平台的端到端全栈新型基础设施 [3] - 设置车辆装备电子及新能源计算部件伙伴等分论坛围绕细分行业深入交流 [3]

从DeepSeek到硬科技：国中资本的投资新视野 | 投资人：快答2025

搜狐财经· 2025-04-30 14:29

人工智能与硬科技投资趋势 - DeepSeek的出现是AI领域的里程碑事件通过算法优化节约算力打破传统算力-算法-数据三要素的机械排序 [3][4] - AI三要素(算力算法数据)是动态互动关系任一要素突破都可能改变发展路径 [3][4] - 中国在AI技术深度和突破认知方面与海外差距快速缩小 [4] 创业者特质与企业家精神 - 优秀创业者需具备"五个力"：使命感动力解决问题能力创新活力坚韧毅力务实定力 [5][6] - 生物医药案例显示坚持11年研发最终打开70亿美元市场 [6] - 年轻企业家如梁文锋王兴兴体现时代创新精神反映中国创业环境活力 [5] 2025年核心投资赛道 - 重点布局硬科技领域：新能源汽车(含自动驾驶) 半导体 AI 医疗大健康新材料与先进制造 [7] - 关注两类项目：国家战略性新兴产业项目具有技术创新优势的项目 [7] - 投资逻辑强调"四个不"原则：不追风不搭车不着急不眼红 [8][15] AI大模型投资前景 - 头部大模型企业优势明显从零开始的新模型机会有限但改进型模型存在空间 [9][10] - DeepSeek未开放融资其成功启发投资逻辑创新证明技术路径多样性 [10] 政府与GP合作模式 - 政府资金占行业资金来源绝大多数双方需磨合适应新要求 [12] - 城市发展AI需构建完整生态非简单复制成功案例 [11] 中小企业发展环境 - 2025年政策环境向好国家持续出台支持民营企业的法律政策 [13] - 创业者需强化核心竞争力坚持专业深耕适应市场变化 [13] 募资与退出策略 - 完成40亿元新基金募资 2025年探索天使基金并购基金等新类型 [14] - 当前退出仍依赖IPO路径并购基金和S基金发展受文化基因制约 [14] 文化消费投资机遇 - 国潮崛起体现文化自信关注传统文化IP与现代科技融合项目 [15][16] - 消费是永恒主题 2025年将出现科技驱动的智能终端消费新形态 [18][19] 行业未来十年展望 - 投资机遇集中于科技创新领域：AI 生物科技新能源新材料及"卡脖子"技术突破 [16][17] - 成功机构需坚守价值投资紧扣国家战略管理规模达160亿元 [17] - 对2025年一级市场持乐观态度关注市场波动中的策略适应性 [20]

Qwen3深夜炸场，阿里一口气放出8款大模型，性能超越DeepSeek R1，登顶开源王座

36氪· 2025-04-29 17:53

模型发布与性能 - 公司一次性开源8款混合推理模型，包括2款MOE模型(Qwen3-235B-A22B和Qwen3-30B-A3B)和6款Dense模型(Qwen3-32B至Qwen3-0.6B) [2][4][6] - 旗舰模型Qwen3-235B-A22B拥有2350亿参数，激活参数220亿，在ArenaHard测试(95.6分)接近Gemini2.5-Pro(96.4分)，超越OpenAI o1(92.1分)和DeepSeek R1(93.2分) [2][3] - Qwen3-30B-A3B仅激活30亿参数(总参数300亿)，性能却优于QwQ-32B，小模型Qwen3-4B达到Qwen2.5-72B水平 [5][6] 技术创新 - 国内首个支持"思考模式"(深度推理)和"非思考模式"(快速响应)的混合推理模型，可通过指令切换 [8][10] - 预训练数据量达36万亿token(Qwen2.5的两倍)，支持119种语言，采用三阶段训练策略(S1:30T token基础训练，S2:5T token专业强化，S3:32K上下文扩展) [17][18][12] - 后训练采用四阶段流程：长链推理冷启动→强化学习→模式融合→通用能力强化，实现深度推理与快速响应平衡 [21][22] 行业影响 - 成为全球最大开源模型族群(累计200+模型，衍生模型超10万)，超越Meta Llama系列 [24] - 专家混合模型(MoE)显存效率高，20-30B规模即可实现接近GPT-4的推理能力 [24] - GitHub发布后迅速获17.9k星，用户实测显示其在编程、数学和多语言处理(119种)表现优异 [24][25][28][30] 部署与应用 - 提供0.6B-32B多种规模选择，支持从笔记本测试到多卡集群扩展 [24] - 推荐使用SGLang/vLLM框架部署，本地支持Ollama/LMStudio等工具 [16] - 已上线Hugging Face/ModelScope/Kaggle等平台，普通用户可通过网页/APP直接体验 [13][14][15]

大模型

开源模型

混合推理模型

Artificial Intelligence

Artificial Intelligence

Qwen3系列大模型

DeepSeek-R2发布在即，参数量翻倍，华为昇腾芯片利用率达82%！

搜狐财经· 2025-04-29 15:17

模型参数与架构 - DeepSeek-R2采用混合专家模型（MoE）架构，配备智能门控网络层以优化高负载推理任务性能 [5] - 模型总参数量达1.2万亿，较DeepSeek-R1（6710亿参数）提升约1倍 [5] - 规模对标ChatGPT的GPT-4 Turbo和谷歌Gemini 2.0 Pro [5] 硬件与算力效能 - 基于华为昇腾910B芯片集群训练，FP16精度下算力达512 PetaFLOPS，芯片利用率82% [7] - 昇腾910B集群算力达同规模A100集群的91%（华为实验室数据） [7] - 单位推理成本降至0.07美元/百万token，较GPT-4（0.27美元/百万token）下降97.4% [8] 供应链与生态合作 - 华为昇腾生态核心代工厂承接DeepSeek超算中心50%以上算力基建订单（拓维信息） [7] - 英博数科独家运营华北算力节点，储备3000P+AI算力（鸿博股份） [7] - 中科曙光提供国产液冷服务器集群，单机柜功率密度40kW [7] - 云暴智联为DeepSeek搭建政务大模型专用云，落地15个省级智慧城市项目 [7] - 新易盛CPO硅光方案通过验证，能耗降低35% [7] - 润建股份运维华南超算中心，年服务合同金额超5亿元 [7] - 中贝通信运维西北算力中心，储备1500P异构算力 [7] 国产化替代进展 - 昇腾910B集群降低对英伟达A100等海外芯片依赖 [10] - 华为昇腾910C芯片进入量产阶段，CloudMatrix 384超节点采用384颗910C芯片，或替代英伟达NVL72集群 [10]

Seek .(US:SKLTY)

Artificial Intelligence

Hardware Autonomy

Artificial Intelligence

DeepSeek-R2

华为昇腾910B

华为昇腾910C

Artificial Intelligence

Hardware Autonomy

Artificial Intelligence

DeepSeek-R2

华为昇腾910B

华为昇腾910C

阿里发布并开源模型Qwen3，成本仅为DeepSeek-R1的1/3

观察者网· 2025-04-29 11:27

4月29日凌晨，阿里巴巴开源新一代通义千问模型Qwen3（简称千问3），参数量仅为DeepSeek-R1的 1/3，成本大幅下降，性能全面超越R1、OpenAI-o1等领先模型，登顶全球最强开源模型。千问3是国内首个"混合推理模型"，将"快思考"与"慢思考"集成进同一个模型，大大节省算力消耗。根据官方的说法，千问3的旗舰版本 Qwen3-235B-A22B，在代码、数学、通用能力等基准测试中，达到了与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 同一梯度的水平。在奥数水平的 AIME25 测评中，Qwen3-235B-A22B 斩获 81.5 分，刷新了开源模型的纪录；在考察代码能力的 LiveCodeBench 评测中，Qwen3-235B-A22B 突破 70 分，表现甚至超过 Grok 3；在评估模型人类偏好对齐的 ArenaHard 测评中，Qwen3-235B-A22B 以 95.6 分超越 OpenAI-o1 及 DeepSeek-R1。 | | Qwen3-235B-A22B | Qwen3-32B | OpenAl-o1 | Dee ...

阿里Qwen3性能超越DeepSeek-R1；美媒曝马斯克孩子数量远超14个；ChatGPT推出购物功能

观察者网· 2025-04-29 09:10

美股市场 - 美股三大指数收盘涨跌不一，道指涨0.28%，标普500指数涨0.06%，纳指跌0.1% [1] - 大型科技股互有涨跌，英特尔涨超2%，苹果、特斯拉、奈飞、Meta小幅上涨，英伟达跌超2%，微软、谷歌、亚马逊小幅下跌 [1] 人工智能与科技 - 阿里巴巴开源大模型Qwen3，性能超越DeepSeek-R1和OpenAI o1，采用MoE架构，总参数235B，8款混合推理模型全部开源并免费商用 [2] - OpenAI更新ChatGPT Search，新增电商功能，用户可通过自然语言搜索商品并直接购买，目前覆盖时尚、美妆、家居用品和电子产品 [7] - 苹果重组机器人团队至硬件部门，库克对AI进展不满，Siri团队移交VisionPro部门主管，AI主管JG团队将独立负责底层模型开发 [5][6] 航天与通信 - 亚马逊发射"柯伊伯计划"首批量产卫星，计划部署超3200颗近地轨道卫星，提供全球互联网服务 [7] 资本市场与融资 - 谷歌母公司Alphabet计划发售约40亿美元高等级公司债券，最长40年期债券收益率或比美国国债高1-1.05个百分点 [7] - 赛力斯申请港股主板上市，2024年收入1451亿元，同比增长305.5%，毛利率23.8%，成为全球第四家盈利的新能源车企 [9] - 石头科技考虑今年香港IPO，拟筹资至多5亿美元，目前处于初期阶段 [10] 机器人产业 - 北京亦庄等地方政府设立机器人产业基金，首期规模3亿元，全国已有超700亿元地方政府基金投向人形机器人产业链 [8] 互联网平台 - 抖音、美团、小红书等平台加速算法透明化，算法治理成为互联网企业2025年必修课，但透明化对部分商业模式构成挑战 [10]