Workflow
Seek .(SKLTY)
icon
搜索文档
宝马中国宣布接入DeepSeek,宝马妥协了?
36氪· 2025-05-02 10:21
宝马中国接入DeepSeek的战略合作 - 宝马中国宣布接入DeepSeek AI大模型,未来功能将应用于国产宝马新世代车型,2025年三季度率先搭载于第9代BMW操作系统的中国在售新车 [1] - 公司以AI创新引擎加速中国AI战略落地,此前已与阿里巴巴达成AI大语言模型战略合作,此次合作进一步深化本土AI生态布局 [1] - 宝马集团董事长齐普策强调AI是未来合作关键领域,体现本地化战略持续深化,目标是通过与中国科技领军企业合作让AI赋能中国车型 [1] AI技术对宝马产品体验的升级 - DeepSeek接入显著拓展BMW智能个人助理能力边界,强化理解和共情能力,使车机在复杂语境和模糊表达下快速响应 [2] - 研发团队认为AI时代的驾驶体验从机械默契转向智能共情,智能座舱将成为用户情感联结空间而非单纯科技堆砌 [2] 宝马智能化战略的演进路径 - 2023年3月公司已启动360度全链AI战略,上海车展发布与阿里巴巴合作开发的"用车专家"与"出行伴侣"智能体 [3] - 公司传统优势在于精湛机械制造技术、优秀操控性能及高端品牌形象,发动机技术和底盘调校处于行业领先地位 [3] 宝马面临的转型挑战与应对 - 智能化水平不足是当前主要问题,车机系统功能与用户体验较国内新势力存在差距,转型速度落后于市场趋势 [4] - 选择与DeepSeek合作是重要战略决策,既提升产品智能化水平,也展现公司积极学习中国市场先进技术的姿态 [4] - 中国作为全球最大汽车市场及智能网联技术发展最快区域,为宝马提供理想试验田和技术借鉴机会 [4][5] 国际车企在中国市场的战略调整 - 面对中国汽车产业技术快速进步,国际车企需重新审视策略,学会利用中国市场独特资源成为竞争关键 [5][6] - 与本土科技公司深度合作是国际车企适应中国市场的有效途径,宝马此举属于主动战略转型而非妥协 [6]
DeepSeek开源新模型,数学推理能力大提升
虎嗅· 2025-05-01 08:48
模型发布与版本 - DeepSeek在Hugging Face正式发布DeepSeek-Prover-V2,同步上线模型卡及示例代码,共推出两个版本:7B和671B [1][4] - DeepSeek-Prover-V2-7B基于上一代V1.5模型,支持最长32K上下文输入 [4] - DeepSeek-Prover-V2-671B在DeepSeek-V3-Base基础上训练,推理性能最强 [4] 训练方法与技术 - 训练核心采用"递归+强化学习"组合,由DeepSeek-V3拆解复杂定理生成子目标和推理思路,再通过GRPO算法从候选方案中学习最优解 [3] - 训练分为两阶段:第一阶段采用"专家迭代"方法,模型通过解决难题反哺自身 [5];第二阶段迁移DeepSeek-V3数学知识并引入形式化数据,构建复杂推理路径 [6] - GRPO强化学习算法引导模型在32个候选证明方案中选择被Lean验证系统判定为正确的答案(奖励1分,否则0分) [8][9] 模型能力与特点 - 671B模型能力被"蒸馏"到7B模型,使小模型在资源有限设备上获得接近大模型的数学推理能力 [10][11] - 提供两种解题风格:快速模式(non-CoT)直接生成精炼答案;逻辑模式(CoT)详细展示推理过程 [12] - DeepSeek-V3负责拆解定理生成推理草图,7B模型完成子证明并拼接完整推理,形成"模糊思考+精确证明"机制 [14][15] 性能评估与数据集 - DeepSeek-Prover-V2-671B在MiniF2F测试中通过率达88.9%,成功解出PutnamBench数据集49道难题 [17] - 推出全新数学形式化数据集ProverBench,包含325道题目,涵盖AIME竞赛题、数论、代数、微积分等10个领域 [18][19] - 在15道AIME竞赛题中,DeepSeek-Prover-V2解出6道,DeepSeek-V3通过多数投票解决8道 [20] 行业趋势与方向 - 大型语言模型在"非正式数学推理"与"正式数学推理"间的表现差距明显缩小,逐步学会写出规范可验证的数学证明 [21][22] - 模型从生成内容迈向生成结构化逻辑,可能最早触碰通用人工智能的底层结构,推理能力成为知识系统边界的关键 [32][33][34] 商业化与部署 - 新模型遵循公开许可证,可通过Hugging Face平台免费下载并支持Transformers接口部署 [23][24] - Novita AI成为首批上线Prover-V2-671B推理服务的第三方提供商 [24]
美乌重磅协议签署!矿产开发+重建基金;道指月线3连跌,美油跌超3%;证监会副主席王建军被查;DeepSeek开源新模型丨每经早参
每日经济新闻· 2025-05-01 07:00
隔夜市场表现 - 美股三大指数4月30日收盘涨跌不一,纳指跌0.09%,标普500指数涨0.15%,道指涨0.35% [2] - 4月份美股表现分化,纳指累计上涨0.85%,标普500指数累计下跌0.76%,道指累计下跌3.17%,其中标普500指数和道指连续下跌3个月 [2] - 大型科技股多数下跌,特斯拉跌超3%,亚马逊、英特尔跌超1%,超微电脑跌超11% [2] - 中概股涨跌互现,纳斯达克中国金龙指数跌0.95%,4月份累计下跌9.79% [2] - 美国2025年第一季度GDP环比按年率计算萎缩0.3%,而2024年第四季度为增长2.4% [2] - 国际油价大幅走低,美油主力合约跌3.64%至58.22美元/桶,布油主力合约跌3.37%至61.15美元/桶,4月份分别下跌18.55%和18.22%,创近三年半最大月跌幅 [2] - 现货黄金跌0.85%至3288.26美元/盎司,COMEX黄金期货跌1.03%至3299.20美元/盎司 [3] - 欧洲三大股指小幅上涨,德国DAX指数涨0.32%,法国CAC40指数涨0.5%,英国富时100指数涨0.37% [3] 政策与监管动态 - 《中华人民共和国民营经济促进法》获表决通过,共9章,自2025年5月20日起施行 [4] - 外交部表示中美双方未就关税问题进行磋商或谈判 [4] - 央行4月开展12000亿元买断式逆回购操作 [5] - 中央网信办部署开展为期3个月的“清朗·整治AI技术滥用”专项行动 [6] - 七部门联合发布《终端设备直连卫星服务管理规定》,自2025年6月1日起施行,支持终端设备直连卫星技术研究及融合发展 [7] - 证监会副主席王建军涉嫌严重违纪违法被调查 [8] - 武汉提高第二套个人住房公积金贷款最高额度,与首套房保持一致,并对多子女家庭发放购房补贴 [9] 公司动态与市场新闻 - 淘宝天猫“小时达”业务升级为“淘宝闪购”,在淘宝App首页设一级入口,首日上线50城,5月6日推广至全国,联合饿了么加大补贴 [13] - 东北证券首席经济学家付鹏因身体原因离职 [14] - 极石汽车辟谣创始人“跑路”传闻,称公司运营正常且有充足资金支持 [16] - 港交所股东质疑普华永道继续担任外聘核数师的资格和能力 [18] - 高盛(中国)证券2024年净利润大增158%至4.98亿元,但投行业务收入同比减少96.91%,自营业务收入同比减少56% [19] - DeepSeek发布DeepSeek-Prover-V2-671B模型,参数达6710亿 [21] - 小米开源推理大模型XiaomiMiMo,7B参数规模在多项测评中超越更大规模模型 [22] - 法拉第未来与纽约车行JC Auto签订1000台FX Super One预订单合同,含不可退定金 [23] - 美国UPS计划裁员约2万人,占员工总数4%,以降低成本35亿美元 [24] - 李开复受曹德旺邀请出任福建福耀科技大学理事会理事 [26] 科技行业与AI发展 - DeepSeek发布6710亿参数大模型DeepSeek-Prover-V2-671B,采用MoE模式 [21] - 小米开源推理大模型XiaomiMiMo,7B参数在数学推理和代码竞赛中表现优异 [22] - 中央网信办开展“清朗·整治AI技术滥用”专项行动,分两阶段强化AI技术源头治理和内容管理 [6] 企业财报与业绩 - 微软第三财季营收700.7亿美元超预期,Azure增长对AI业务贡献16个百分点 [27] - Meta第一季度营收423.1亿美元超预期,经营利润175.6亿美元同比增长27% [27] - 高通第二财季经调整营收108.4亿美元超预期,预计第三财季营收99亿至107亿美元 [28] 上市公司公告 - 奥来德全资子公司与成都京东方签订6.55亿元销售合同 [33] - 华达科技获得多个客户项目定点,预计生命周期总销售额63亿元 [34] - 通光线缆预中标1.42亿元国家电网采购项目 [34] - 寒武纪拟定增募资不超过49.8亿元,用于大模型芯片平台项目 [35] - 多家公司公布股份回购进展,包括极米科技已回购2.28亿元、海尔智家斥资2483.59万元回购等 [34]
AI数学天花板来了?DeepSeek新模型低调开源,网友直呼:R2指日可待!
华尔街见闻· 2025-04-30 20:52
DeepSeek-Prover-V2-671B模型发布 - 公司于4月30日在Hugging Face平台开源了专注于数学定理证明的大语言模型DeepSeek-Prover-V2-671B [1] - 模型采用DeepSeek-V3架构,参数高达6710亿,采用MoE模式,具有61层Transformer层,7168维隐藏层 [3][6] - 模型最大位置嵌入达到16.38万,能够处理极其复杂的数学证明问题 [6] 模型技术细节 - 模型分为163个分片,每个分片大小约为4.3GB [4] - 使用safetensors文件格式,支持BF16、FP8、F32等多种计算精度 [4] - 采用FP8量化技术减小模型大小,提高推理效率 [8] - 结合合成数据、强化学习与蒙特卡洛树搜索等优化技术 [6] 模型性能提升 - 在高中数学题测试中,成功率从50%提高到了63.5% [12] - 相比V1.5版本7B参数的小模型,此次直接升级为大模型 [14] 公司发展动态 - 创始人梁文锋表示要将探索通用人工智能作为核心使命 [7] - 团队保持每季度重大更新的开发范式:2024年9月V2.5、12月V3、2025年3月V3-0324 [7] - 3月发布的V3-0324版本已被业内视为未来R2的基础模型 [5][7] 行业反响 - 在社交平台X上,网友对R2大模型发布表示期待 [7] - 有评论称"中国的AI初创公司正在改变整个游戏规则" [15] - 行业对"中国正在将一些功夫应用于AI"表示兴奋 [16]
华为郭振兴: DeepSeek浪潮后,AI将快速释放巨大的制造业生产红利 | 最前线
36氪· 2025-04-30 17:48
行业峰会概况 - 华为AI+制造行业峰会2025在广州举办 主题为"加速行业智能化" 参会人数超过900人 涵盖汽车 机械电子 医药 重工业 轻工业等多个制造行业 [1] - 公司发布"三层五阶八步"方法论 分享制造行业七大场景20个解决方案 [1] 华为AI解决方案 - 全栈AI基础设施可灵活适配制造多场景 降低企业使用AI门槛 智能应用让一线工人也能轻松使用AI [1] - 联合伙伴打造系列化方案 覆盖车辆装备 机械电子 医药轻工到具身智能等新领域 [1] - 基于昇腾解决方案对DeepSeek进行全方位适配 从预训练到推理场景均有针对性计算方案 帮助客户快速完成二次训练 [3] - 与主流模型(包括DeepSeek)进行资源匹配调优 使各模型在昇腾环境下达到性能最优 [3] - 昇腾全栈软件站已开源开放 已有100多个制造业伙伴基于昇腾打造DeepSeek方案 [3] 汽车行业应用案例 - 与广汽集团合作建设智能化研发平台 将新车研发周期从36个月缩短至18个月 [1] - 联合发布智能化研发平台解决方案 启动样板点建设 [1] 研发效率提升 - 将1300多万片高价值基础文档 1万多篇API文档 850多万个开源代码舱导入研发数据平台 [2] - 通过研发大模型和AI助手 软件版本开发周期从9-18个月缩短至1个月 [2] 行业部署情况 - 2025年预计有300多家企业制定大模型部署计划 [2] - 一汽使用DeepSeek代码能力使代码输出效率提升30% [2] - 广药集团用DeepSeek建设医药知识库 实现知识跨部门复用 应用于研发 销售 医学研究等多个场景 [2] 未来规划 - 2025年将围绕数据"采传存 算管用"等需求 提供智能联接 存储 算力 平台的端到端全栈新型基础设施 [3] - 设置车辆装备 电子及新能源 计算部件伙伴等分论坛 围绕细分行业深入交流 [3]
从DeepSeek到硬科技:国中资本的投资新视野 | 投资人:快答2025
搜狐财经· 2025-04-30 14:29
人工智能与硬科技投资趋势 - DeepSeek的出现是AI领域的里程碑事件 通过算法优化节约算力 打破传统算力-算法-数据三要素的机械排序 [3][4] - AI三要素(算力 算法 数据)是动态互动关系 任一要素突破都可能改变发展路径 [3][4] - 中国在AI技术深度和突破认知方面与海外差距快速缩小 [4] 创业者特质与企业家精神 - 优秀创业者需具备"五个力":使命感动力 解决问题能力 创新活力 坚韧毅力 务实定力 [5][6] - 生物医药案例显示 坚持11年研发最终打开70亿美元市场 [6] - 年轻企业家如梁文锋 王兴兴体现时代创新精神 反映中国创业环境活力 [5] 2025年核心投资赛道 - 重点布局硬科技领域:新能源汽车(含自动驾驶) 半导体 AI 医疗大健康 新材料与先进制造 [7] - 关注两类项目:国家战略性新兴产业项目 具有技术创新优势的项目 [7] - 投资逻辑强调"四个不"原则:不追风 不搭车 不着急 不眼红 [8][15] AI大模型投资前景 - 头部大模型企业优势明显 从零开始的新模型机会有限 但改进型模型存在空间 [9][10] - DeepSeek未开放融资 其成功启发投资逻辑创新 证明技术路径多样性 [10] 政府与GP合作模式 - 政府资金占行业资金来源绝大多数 双方需磨合适应新要求 [12] - 城市发展AI需构建完整生态 非简单复制成功案例 [11] 中小企业发展环境 - 2025年政策环境向好 国家持续出台支持民营企业的法律政策 [13] - 创业者需强化核心竞争力 坚持专业深耕 适应市场变化 [13] 募资与退出策略 - 完成40亿元新基金募资 2025年探索天使基金 并购基金等新类型 [14] - 当前退出仍依赖IPO路径 并购基金和S基金发展受文化基因制约 [14] 文化消费投资机遇 - 国潮崛起体现文化自信 关注传统文化IP与现代科技融合项目 [15][16] - 消费是永恒主题 2025年将出现科技驱动的智能终端消费新形态 [18][19] 行业未来十年展望 - 投资机遇集中于科技创新领域:AI 生物科技 新能源 新材料及"卡脖子"技术突破 [16][17] - 成功机构需坚守价值投资 紧扣国家战略 管理规模达160亿元 [17] - 对2025年一级市场持乐观态度 关注市场波动中的策略适应性 [20]
Qwen3深夜炸场,阿里一口气放出8款大模型,性能超越DeepSeek R1,登顶开源王座
36氪· 2025-04-29 17:53
模型发布与性能 - 公司一次性开源8款混合推理模型,包括2款MOE模型(Qwen3-235B-A22B和Qwen3-30B-A3B)和6款Dense模型(Qwen3-32B至Qwen3-0.6B) [2][4][6] - 旗舰模型Qwen3-235B-A22B拥有2350亿参数,激活参数220亿,在ArenaHard测试(95.6分)接近Gemini2.5-Pro(96.4分),超越OpenAI o1(92.1分)和DeepSeek R1(93.2分) [2][3] - Qwen3-30B-A3B仅激活30亿参数(总参数300亿),性能却优于QwQ-32B,小模型Qwen3-4B达到Qwen2.5-72B水平 [5][6] 技术创新 - 国内首个支持"思考模式"(深度推理)和"非思考模式"(快速响应)的混合推理模型,可通过指令切换 [8][10] - 预训练数据量达36万亿token(Qwen2.5的两倍),支持119种语言,采用三阶段训练策略(S1:30T token基础训练,S2:5T token专业强化,S3:32K上下文扩展) [17][18][12] - 后训练采用四阶段流程:长链推理冷启动→强化学习→模式融合→通用能力强化,实现深度推理与快速响应平衡 [21][22] 行业影响 - 成为全球最大开源模型族群(累计200+模型,衍生模型超10万),超越Meta Llama系列 [24] - 专家混合模型(MoE)显存效率高,20-30B规模即可实现接近GPT-4的推理能力 [24] - GitHub发布后迅速获17.9k星,用户实测显示其在编程、数学和多语言处理(119种)表现优异 [24][25][28][30] 部署与应用 - 提供0.6B-32B多种规模选择,支持从笔记本测试到多卡集群扩展 [24] - 推荐使用SGLang/vLLM框架部署,本地支持Ollama/LMStudio等工具 [16] - 已上线Hugging Face/ModelScope/Kaggle等平台,普通用户可通过网页/APP直接体验 [13][14][15]
DeepSeek-R2发布在即,参数量翻倍,华为昇腾芯片利用率达82%!
搜狐财经· 2025-04-29 15:17
模型参数与架构 - DeepSeek-R2采用混合专家模型(MoE)架构,配备智能门控网络层以优化高负载推理任务性能 [5] - 模型总参数量达1.2万亿,较DeepSeek-R1(6710亿参数)提升约1倍 [5] - 规模对标ChatGPT的GPT-4 Turbo和谷歌Gemini 2.0 Pro [5] 硬件与算力效能 - 基于华为昇腾910B芯片集群训练,FP16精度下算力达512 PetaFLOPS,芯片利用率82% [7] - 昇腾910B集群算力达同规模A100集群的91%(华为实验室数据) [7] - 单位推理成本降至0.07美元/百万token,较GPT-4(0.27美元/百万token)下降97.4% [8] 供应链与生态合作 - 华为昇腾生态核心代工厂承接DeepSeek超算中心50%以上算力基建订单(拓维信息) [7] - 英博数科独家运营华北算力节点,储备3000P+AI算力(鸿博股份) [7] - 中科曙光提供国产液冷服务器集群,单机柜功率密度40kW [7] - 云暴智联为DeepSeek搭建政务大模型专用云,落地15个省级智慧城市项目 [7] - 新易盛CPO硅光方案通过验证,能耗降低35% [7] - 润建股份运维华南超算中心,年服务合同金额超5亿元 [7] - 中贝通信运维西北算力中心,储备1500P异构算力 [7] 国产化替代进展 - 昇腾910B集群降低对英伟达A100等海外芯片依赖 [10] - 华为昇腾910C芯片进入量产阶段,CloudMatrix 384超节点采用384颗910C芯片,或替代英伟达NVL72集群 [10]
阿里发布并开源模型Qwen3,成本仅为DeepSeek-R1的1/3
观察者网· 2025-04-29 11:27
4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3),参数量仅为DeepSeek-R1的 1/3,成本大幅下降,性能全面超越R1、OpenAI-o1等领先模型,登顶全球最强开源模型。 千问3是国内首个"混合推理模型",将"快思考"与"慢思考"集成进同一个模型,大大节省算力消耗。 根据官方的说法,千问3的旗舰版本 Qwen3-235B-A22B,在代码、数学、通用能力等基准测试中,达到 了与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 同一梯度的水平。 在奥数水平的 AIME25 测评中,Qwen3-235B-A22B 斩获 81.5 分,刷新了开源模型的纪录;在考察代码 能力的 LiveCodeBench 评测中,Qwen3-235B-A22B 突破 70 分,表现甚至超过 Grok 3;在评估模型人类 偏好对齐的 ArenaHard 测评中,Qwen3-235B-A22B 以 95.6 分超越 OpenAI-o1 及 DeepSeek-R1。 | | Qwen3-235B-A22B | Qwen3-32B | OpenAl-o1 | Dee ...
阿里Qwen3性能超越DeepSeek-R1;美媒曝马斯克孩子数量远超14个;ChatGPT推出购物功能
观察者网· 2025-04-29 09:10
美股市场 - 美股三大指数收盘涨跌不一,道指涨0.28%,标普500指数涨0.06%,纳指跌0.1% [1] - 大型科技股互有涨跌,英特尔涨超2%,苹果、特斯拉、奈飞、Meta小幅上涨,英伟达跌超2%,微软、谷歌、亚马逊小幅下跌 [1] 人工智能与科技 - 阿里巴巴开源大模型Qwen3,性能超越DeepSeek-R1和OpenAI o1,采用MoE架构,总参数235B,8款混合推理模型全部开源并免费商用 [2] - OpenAI更新ChatGPT Search,新增电商功能,用户可通过自然语言搜索商品并直接购买,目前覆盖时尚、美妆、家居用品和电子产品 [7] - 苹果重组机器人团队至硬件部门,库克对AI进展不满,Siri团队移交VisionPro部门主管,AI主管JG团队将独立负责底层模型开发 [5][6] 航天与通信 - 亚马逊发射"柯伊伯计划"首批量产卫星,计划部署超3200颗近地轨道卫星,提供全球互联网服务 [7] 资本市场与融资 - 谷歌母公司Alphabet计划发售约40亿美元高等级公司债券,最长40年期债券收益率或比美国国债高1-1.05个百分点 [7] - 赛力斯申请港股主板上市,2024年收入1451亿元,同比增长305.5%,毛利率23.8%,成为全球第四家盈利的新能源车企 [9] - 石头科技考虑今年香港IPO,拟筹资至多5亿美元,目前处于初期阶段 [10] 机器人产业 - 北京亦庄等地方政府设立机器人产业基金,首期规模3亿元,全国已有超700亿元地方政府基金投向人形机器人产业链 [8] 互联网平台 - 抖音、美团、小红书等平台加速算法透明化,算法治理成为互联网企业2025年必修课,但透明化对部分商业模式构成挑战 [10]