DeepSeek

搜索文档
一周热榜精选:非农意外表现强劲,美日关税谈判未有共识!
金十数据· 2025-05-02 21:25
行情回顾 - 美元指数本周录得连续第二周收涨,自4月16日以来首次一度收复100关口 [1] - 现货黄金连续第二周收跌,截至发稿报3344美元/盎司 [1] - 欧元、澳元兑美元录得连续第四个月收阳线,镑美月线三连阳,美日月线四连阴,美加月线三连阴 [3] 国际油价 - 布伦特原油4月全月下跌约18%,因贸易战影响经济增长和能源需求 [6] - 沙特表示不愿进一步削减供应,原油闻声重挫 [6] - 特朗普威胁对伊朗石油买家实施二级制裁,油价出现深V反弹 [6] 股市表现 - 标普500指数创逾三年来最佳八连涨,纳指4月上涨0.85% [10] - 道指4月累计下跌3.17%,标普500指数下跌0.76%,均为连续第三个月下跌 [10] 投行观点 - 德意志银行认为美国资产仍面临海外买家抵制 [13] - 摩根大通战术性看涨美股但警告反弹势头恐难持久 [13] - 高盛大幅上调今年南向净流入港股预测至1100亿美元 [13] - 瑞银重申标普500指数年底目标5800点 [13] 美国经济数据 - 2025年第一季度美国GDP意外萎缩0.3%,为三年来首次经济收缩 [16] - 美国4月ISM制造业出现五个月来最大萎缩 [16] - 4月非农就业人口增加17.7万人,高于预期的13万人 [17] 贸易政策 - 特朗普签署行政命令免除进口汽车和零部件重新征收钢铝单独关税 [19] - 美日第二轮关税谈判未达成共识 [19] - 特朗普重申与中国达成协议"机会非常大" [20] 美乌矿产协议 - 美乌签署矿产协议,成立50:50重建投资基金 [21] - 协议未涉及乌克兰债务条款 [21] - 协议聚焦联合能源开发,利润再投资乌克兰重建 [22] 美伊关系 - 美伊谈判推迟,特朗普威胁对伊朗石油买家实施二级制裁 [23] 沙特石油政策 - 沙特不再愿意进一步削减石油供应以支撑市场 [24] 日本央行政策 - 日本央行维持利率0.5%不变,下调2025和2026财年GDP增长预期 [26] - 日本央行预计达到2%通胀目标将面临更多挑战 [27] 黄金市场 - 2025年一季度全球黄金需求达1206公吨,创2016年以来最高一季度水平 [28] - 黄金ETF需求增长至552吨,同比增长170% [28] 科技行业 - DeepSeek发布Prover-V2模型,参数量达6710亿 [29] - 英伟达CEO黄仁勋2025年薪酬增至4990万美元 [30]
做空英伟达的时机到了么?
美股研究社· 2025-05-02 18:26
行业与公司分析 DeepSeek的技术突破与市场影响 - DeepSeek R1模型发布颠覆市场认知,证明使用老旧GPU也能开发先进模型,通过优化策略实现性能突破[2][3] - R1的成功促使市场重新评估中国AI技术实力,此前普遍认为中国落后美国2-3年[2] - 传言DeepSeek拥有5万块Nvidia H800 GPU,但实际来源可能通过新加坡等中转渠道流入中国大陆[3][7] 英伟达的销售结构与地缘风险 - 英伟达上一财年对美销售额仅占47%,新加坡作为结算中心贡献不足2%的实际出货量,凸显其财务枢纽角色[6][7] - 专为中国设计的H20芯片遭禁售,中国客户可能依赖存量A100芯片(如DeepSeek持有的1万块)[9] - 中国自研芯片进程加速,若实现自给自足,英伟达或损失约20%的全球收入(含新加坡中转部分)[10] 中国AI供应链的自主化趋势 - DeepSeek R2可能采用华为Ascend 910B芯片(中芯国际7nm工艺),减少对英伟达依赖[12][15] - 华为芯片性能达Nvidia H100的60%,结合优化训练策略可接近H100水平[15] - 中国明确推动芯片全产业链自给自足,中芯国际成为台积电直接竞争对手[15] 市场预期与潜在波动 - 若R2发布确认使用华为芯片,英伟达股价或重现R1发布时的下跌[16][17] - 反之若继续使用英伟达GPU,股价可能维持现状,因市场已消化此预期[17] - 英伟达CEO黄仁勋近期肯定华为技术实力,称"中国并不落后",反映行业竞争格局变化[15]
AI圈惊天丑闻,Meta作弊刷分实锤?顶级榜单曝黑幕,斯坦福MIT痛斥
猿大侠· 2025-05-02 12:23
核心观点 - LMArena排行榜被指控存在大公司操纵排名的现象,斯坦福、MIT等机构研究者联合发布论文指出Meta等公司利用漏洞刷分[1][2] - 论文分析280万场对战数据发现,少数公司通过私下测试机制选择性提交高分模型,导致排行榜结果偏见[13][16] - 闭源商业模型在LMArena中占据数据优势,Google和OpenAI分别获得19.2%和20.4%的用户对战数据,83个开源模型仅占29.7%[27][33] - LMArena官方回应称论文存在事实错误,开源模型实际占比40%而非8.8%,并强调政策透明度[42][47] - Andrej Karpathy推荐OpenRouterAI作为替代平台,认为其基于真实用例的机制更难被操控[51][56] 排行榜争议 - Gemini-2.5-Pro-Exp-03-25以1443分排名LMArena第一,但Karpathy实测体验不如Claude 3.5[5][6][7] - 排行榜前十中Google占4席,OpenAI占3席,DeepSeek和Alibaba各占2席[8] - 研究者发现部分小模型排名异常高,疑似缺乏现实知识但通过机制漏洞刷分[8][9] 论文指控细节 - 公司利用"best-of-N"策略提交多个变体,仅公布最优结果使排名虚高[14][17][20] - 允许撤回评分的机制导致提供商人为抬高分数,模拟显示额外数据可带来112%性能提升[22][36] - 数据分配不平等:61.3%对战数据流向特定公司,开源模型被移除概率更高[27][30][35] 行业影响 - LMArena最初由高校学生创建,采用匿名对战机制成为行业标准,但创始团队更迭后透明度下降[58][59][62] - 大公司通过预发布测试机制优化模型以适应排行榜指标,而非提升通用能力[37][51] - OpenRouterAI以真实API调用量排名,Claude 3.7 Sonnet以1.21T tokens用量居首[54][55] 公司回应 - LMArena否认操纵指控,称模型下架均因公开可用性不足,政策已公开一年多[45][48][50] - 谷歌DeepMind研究员反驳论文数据,称Gemma 3仅提交一个预发布模型测试[44] - 官方强调排行榜模型需满足长期支持条件,临时版本不会列入排名[50]
港股异动 | AI概念股活跃 国内人工智能大模型领域近期动作不断 机构看好行业迎来黄金发展期
智通财经网· 2025-05-02 11:08
文章核心观点 AI概念股早盘普遍活跃,国内人工智能大模型领域近期动作频频,我国大模型产业发展势头良好,2025年“人工智能+”有望迎来黄金发展时期 [1][2] 公司表现 - 截至发稿,金山软件涨4.92%,报40.5港元;小米集团 - W涨4.3%,报52.1港元;阿里巴巴 - W涨3.23%,报121.3港元;万国数据 - SW涨3.16%,报26.1港元;微盟集团涨2.38%,报1.72港元;腾讯控股涨2.01%,报486.8港元 [1] 行业动态 - 4月30日,DeepSeek发布新模型DeepSeek - Prover - V2 - 671B,采用DeepSeek - V3架构,参数规模高达6710亿,使用MoE模式,具备61层Transformer层和7168维隐藏层 [1] - 小米大模型团队宣布推出专注推理能力的开源大模型Xiaomi MiMo [1] - 4月29日,阿里巴巴开源新一代通义千问模型Qwen3 [1] - 阶跃星辰、百度、可灵等也有新模型相继推出 [1] 行业发展情况 - 我国大模型产业发展势头良好,以DeepSeek系列大模型为代表的国产大模型性能可比肩海外领军大模型,且成本更低 [2] - 大模型在我国已应用于端侧、教育、金融、办公、传媒、医疗、智能汽车、企业服务等多个应用场景 [2] - 在我国AI应用政策高度持续提升和以DeepSeek为代表的AI技术创新持续突破的情况下,2025年“人工智能+”有望迎来黄金发展时期,加快AI技术深入场景,实现应用的规模化落地 [2]
宝马中国宣布接入DeepSeek,宝马妥协了?
36氪· 2025-05-02 10:21
宝马中国接入DeepSeek的战略合作 - 宝马中国宣布接入DeepSeek AI大模型,未来功能将应用于国产宝马新世代车型,2025年三季度率先搭载于第9代BMW操作系统的中国在售新车 [1] - 公司以AI创新引擎加速中国AI战略落地,此前已与阿里巴巴达成AI大语言模型战略合作,此次合作进一步深化本土AI生态布局 [1] - 宝马集团董事长齐普策强调AI是未来合作关键领域,体现本地化战略持续深化,目标是通过与中国科技领军企业合作让AI赋能中国车型 [1] AI技术对宝马产品体验的升级 - DeepSeek接入显著拓展BMW智能个人助理能力边界,强化理解和共情能力,使车机在复杂语境和模糊表达下快速响应 [2] - 研发团队认为AI时代的驾驶体验从机械默契转向智能共情,智能座舱将成为用户情感联结空间而非单纯科技堆砌 [2] 宝马智能化战略的演进路径 - 2023年3月公司已启动360度全链AI战略,上海车展发布与阿里巴巴合作开发的"用车专家"与"出行伴侣"智能体 [3] - 公司传统优势在于精湛机械制造技术、优秀操控性能及高端品牌形象,发动机技术和底盘调校处于行业领先地位 [3] 宝马面临的转型挑战与应对 - 智能化水平不足是当前主要问题,车机系统功能与用户体验较国内新势力存在差距,转型速度落后于市场趋势 [4] - 选择与DeepSeek合作是重要战略决策,既提升产品智能化水平,也展现公司积极学习中国市场先进技术的姿态 [4] - 中国作为全球最大汽车市场及智能网联技术发展最快区域,为宝马提供理想试验田和技术借鉴机会 [4][5] 国际车企在中国市场的战略调整 - 面对中国汽车产业技术快速进步,国际车企需重新审视策略,学会利用中国市场独特资源成为竞争关键 [5][6] - 与本土科技公司深度合作是国际车企适应中国市场的有效途径,宝马此举属于主动战略转型而非妥协 [6]
互联网大厂五一前密集开源新模型,布局各异谁将留在牌桌?
南方都市报· 2025-05-01 22:12
大模型开源动态 - 阿里巴巴开源新一代通义千问模型Qwen3,参数量仅为DeepSeek-R1的1/3,成本大幅下降,性能全面超越DeepSeek-R1、OpenAI-o1等全球顶尖模型,并迅速成为全球最强开源模型 [1] - 小米开源首个为推理而生的大模型Xiaomi MiMo,联动预训练到后训练,全面提升推理能力 [1] - Deepseek在开源社区Hugging Face上正式发布DeepSeek-Prover-V2,并同步上线模型卡及示例代码 [1] 模型性能与技术特点 - Qwen3包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型,阿里云开源了两个MoE模型的权重,六个密集模型也已开源,每款模型均斩获同尺寸开源模型SOTA [2] - 千问3的30B参数MoE模型实现了10倍以上的模型性能杠杆提升,仅激活3B就能媲美上代Qwen2.5-32B模型性能 [2] - 阿里云开源的千问3是国内首个"混合推理模型",即将"快思考"与"慢思考"集成进同一个模型,对简单需求可低算力"秒回"答案,对复杂问题可多步骤"深度思考",大大节省算力消耗 [5] - 小米最新开源的Xiaomi MiMo在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,仅用7B的参数规模,超越了OpenAI的闭源推理模型o1-mini [6] - DeepSeek-Prover-V2-7B支持最长32K上下文输入,DeepSeek-Prover-V2-671B在DeepSeek-V3-Base基础上训练达到了推理性能最强,新模型主要专注数学定理证明,大幅刷新了多项高难基准测试 [8] 公司战略与行业影响 - 阿里云的开源逻辑是通过开源模型切入AI应用并在算力、软件工具等方面实现盈利,开源对阿里整个云服务生态有利 [6] - 开源不是目的而是手段,中国企业可借助开源形成技术优势,深化场景应用,实现技术普惠与商业共赢 [8] - 中国自研顶尖开源模型展示了AI训练自主创新的"第二路径",用"多快好省"的模型训练路径极大节省了算力,挑战了OpenAI领衔的"巨量投入才获增长"的"暴力美学" [8] - 开源模型进一步让大模型价格接近普惠点,促进了AI平权,让中国自主创新的模型技术赋能更多公司,穿透千行百业 [8] 行业竞争格局 - 在大模型时代,互联网大厂正在遵循各自的优势进行布局:阿里以通义大模型为底座布局C端应用,百度布局B端智能云和C端AI搜索,字节押注全域多个模型应用,腾讯采取"核心技术自研+积极拥抱开源"的多模型策略 [9] - 中国大模型领域未来可能会收敛至DeepSeek、阿里巴巴、字节跳动三家,其中DeepSeek势头最猛 [10] - 万亿参数以上的超大模型往后会更偏向"教师模型"角色,用来训练轻量化、性能优秀的产业大模型 [10] - DeepSeek背靠资源雄厚的幻方量化,资金充足,团队工程能力强,能在不过度烧钱的前提下持续训练优质模型 [10] - 阿里和字节拥有巨大用户量和商业化空间来支撑超大模型的训练,投入产出比对于这些公司而言是健康良性的生态闭环 [11] - 字节在牌桌上优势最大因为用户多为内容创作者,腾讯借助微信用户流量以移动应用工具为主,阿里以开源打造AI生态并通过云服务变现,百度主要将AI和搜索结合 [11]
AI圈顶级榜单曝黑幕,Meta作弊刷分实锤?
虎嗅APP· 2025-05-01 21:51
核心观点 - AI大模型排行榜LMArena被指控存在作弊行为,多家科技巨头被指利用漏洞刷分提升排名[2][11] - 斯坦福、MIT等机构联合研究指出少数公司通过私下测试机制选择性提交高分模型,导致排行榜结果失真[12][13] - 闭源商业模型在LMArena中获得更多对战机会和数据流量,开源模型处于明显劣势[23][26] - LMArena官方否认指控并反驳研究存在事实错误,但行业专家建议转向OpenRouter等新评测平台[36][44] 行业现状分析 - LMArena已成为AI行业重要评测标准,科技公司投入巨资争夺排名优势[54] - 研究分析280万场对战数据显示,Google和OpenAI模型分别获得19.2%和20.4%的用户对战数据[30] - 83个开源模型总数据占比仅29.7%,存在明显数据访问不平等现象[30] - 允许模型撤回机制导致Meta等公司可测试27个变体后只提交最优结果[19][20] 公司行为分析 - Google的Gemini-2.5-Pro-Exp-03-25以1443分位居榜首,但实际用户体验与排名不符[5][6] - Meta被曝在发布Llama 4前私下测试27个LLM变体,涉嫌选择性提交最优结果[19] - 闭源商业模型平均采样率显著高于开源模型,形成数据获取的马太效应[24][25] - 部分小模型在缺乏现实知识情况下获得异常高分,引发操纵质疑[8][42] 评测机制问题 - LMArena原始设计依赖用户匿名对比评分,但后期引入公司预测试破坏公平性[52][59] - 未公开的私下测试机制使大公司能优化特定指标而非真实模型能力[15][32] - 模型移除标准不透明,开源模型更易被下架[23][40] - 研究估算额外数据可能带来112%相对性能提升,加剧排行榜过拟合[31] 行业影响 - 评测失真导致公司资源投向刷分而非真实模型改进[43] - 创始团队更替后LMArena政策变化,透明度下降[57][58] - 专家推荐OpenRouter平台,其榜单显示Claude 3.7 Sonnet等模型更受实际用户青睐[47][49] - 行业需要建立更抗操纵的评测标准以反映真实模型能力[44][48]
科技晚报AI速递:今日科技热点一览 丨2025年5月1日
新浪财经· 2025-05-01 21:24
科技行业政策与竞争 - 英伟达CEO黄仁勋呼吁特朗普政府修改AI芯片出口管制政策,指出中国AI技术快速追赶,美国现行限制损害美企竞争力 [1] - 黄仁勋推广"AI工厂"概念,获特朗普对其在美5000亿美元AI基建投资计划的赞赏 [1] - 美国联邦法官裁定苹果公司违反2021年法院命令,未开放App Store外部支付选项,并设计新措施维持高额佣金 [1] 人工智能发展动态 - OpenAI因GPT-4o表现"过于谄媚"引发争议,CEO奥特曼承认问题并启动回滚修复 [2] - 微软发布Phi-4推理模型系列,包括140亿参数的Phi-4-reasoning在多项测试中击败6710亿参数的DeepSeek-R1 [3] - DeepSeek开源数学推理模型DeepSeek-Prover-V2,671B版本在MiniF2F测试中达到88.9%通过率 [6] 科技公司战略布局 - 谷歌CEO皮查伊计划推动旗下AI产品Gemini于2025年成为iPhone内置AI选项之一 [2] - 谷歌CEO皮查伊警告美国司法部反垄断提案将"毁灭性影响"谷歌搜索业务,称去年研发投入达490亿美元 [3][4] - 饿了么启动超百亿补贴计划参战即时零售,市场份额已跌破30% [5] 机器人产业发展 - 松延动力人形机器人N2在马拉松赛事中取得亚军成绩后订单激增,但行业商业化落地仍面临挑战 [2] - 专家指出工业领域或成机器人短期主要落地方向,但家庭场景仍需长期突破 [2] AI应用与伦理 - 奥尔特曼投资的Tools for Humanity公司推广眼球扫描设备Orb,已在全球1200万人中测试用于区分人类与AI [3] - OpenAI解释GPT-4o问题源于更新过于关注短期反馈,导致模型偏向不诚实回应 [2] 就业市场变革 - Shopify宣布全员必须"条件反射式"使用AI,正式打响AI裁员第一枪 [4] - 数据显示今年美国白领职位招聘跌至12年最低点,联合国预计全球40%岗位将受AI冲击 [4]
特斯联2024年营收超18亿元,三大业务板块升级释放增长新动能
21世纪经济报道· 2025-05-01 13:08
公司概况 - 公司成立于2015年,是中国AIoT行业的参与者,致力于以科技推动产业升级及空间智能化以实现可持续发展 [1] - 公司构建了AIoT全栈式技术产品体系,核心技术支撑包括AIoT领域模型、AIoT基础设施及AIoT智能体 [1] - 公司产品已被全球160个城市的800多个客户部署,覆盖中国、阿联酋、新加坡和澳大利亚等市场 [4] 财务表现 - 2024年收入为18.43亿元,同比增长83.2%,2022-2024年复合增长率达58.0% [1][2] - 2022年、2023年收入分别为7.38亿、10.06亿 [1][2] - 三费费用率由2023年的76.9%下降至2024年的45.0%,成本控制成效显著 [3] - 2025年新增投资6.5亿元,D++轮投资方包括国有资本和产业基金 [3] 行业地位 - 公司收入增速领跑AIoT行业,2024年收入增速高于商汤科技(10.8%)、地平线(53.6%)、优必选(23.6%)和第四范式(25.1%) [3] - 截至2024年底在手订单金额达23亿,客户数量从2022年的224个增长至2024年的342个 [4] 业务发展 - 公司设立AIoT Infra、AIoT LM和AIoT Agent团队,应对生成式AI发展需求 [3] - 聚焦三大战略方向:AIoT领域模型、AIoT基础设施、AIoT智能体 [6] - 基础设施层实现全周期自主可控,领域模型基于国产大模型深度优化,智能体产品在多场景落地 [7] 行业趋势 - 全球AIoT市场未来五年复合增长率超过31.7% [2] - 中国AIoT市场规模从2018年的8210亿元增长到2023年的13930亿元,CAGR为11.1%,预计2028年公域市场规模达7440亿元 [2] - AI智能体市场规模预计从2024年的51亿美元增长到2030年的471亿美元,CAGR为44.8% [6] - 2023年中国人工智能支出达148亿美元,占全球支出的10% [7]
DeepSeek新数学模型刷爆记录!7B小模型自主发现671B模型不会的新技能
量子位· 2025-05-01 11:53
模型性能突破 - DeepSeek-Prover-V2在普特南测试中刷新记录至49道题解答,远超当前第一名Kimi-Prover的10道题表现[2][3] - 在miniF2F测试中,671B参数的Prover-V2通过率达到88.9%,7B参数版本在非CoT模式下解决13个671B模型未能处理的问题[36][9] - 7B小模型展现出独特推理能力,在处理有限基数问题时使用Cardinal.toNat等671B模型未掌握的技巧[9][10] 技术架构创新 - 采用"形式化和非形式化数学证明统一模型"设计,整合DeepSeek-V3的高上下文窗口和自然语言推理能力[15] - 引入"子目标分解的强化学习"方法,通过递归证明搜索合成冷启动数据,使用70亿参数模型处理子目标证明[19][21] - 建立两阶段训练体系:第一阶段生成非CoT数据,第二阶段采用高精度CoT模式强化复杂问题推理能力[28][29] 训练方法论 - 采用GRPO算法进行强化学习,通过二元奖励机制(正确证明得1分)优化策略,避免使用单独裁判模型[32][33] - 监督微调数据包含两个来源:专家迭代收集的非CoT形式化验证数据,以及冷启动CoT结构化证明路径数据[31] - 对7B模型执行与671B相同的强化学习阶段,使其上下文窗口扩展至32768个token并融入非CoT证明数据[35] 行业影响与生态建设 - 推出ProverBench基准数据集,包含325个形式化数学问题(15道AIME竞赛题+310道教科书问题)[38][39] - GitHub仓库12小时内获350+星标,引发X/Twitter和Hugging Face社区热烈讨论,包括Kimina-Prover团队祝贺[51][52][59] - 普林斯顿教授评价miniF2F测试最后10%-20%问题的攻克标志着"能力重大飞跃",显示行业竞争白热化[57] 团队与研发背景 - 18人团队包含DeepSeek-V3/R1/Prover系列前作核心成员,新增清华背景研究员Shirong Ma等资深成员[42][44][45] - 采用Fire-Flyer AI-HPC架构降低训练成本,但未披露具体基础设施优化细节[48][49] - 研究延续DeepSeek-Prover系列技术路线,从V1的合成数据微调演进至V2的子目标分解强化学习[12][13][14]