DeepSeek - 财报，业绩电话会，研报，新闻

DeepSeek

搜索文档

从 R1 到 Sonnet 3.7，Reasoning Model 首轮竞赛中有哪些关键信号？

海外独角兽· 2025-03-03 21:10

行业竞争格局 - 头部AI实验室在过去一个月密集发布三个SOTA推理模型：OpenAI的o3-mini和deep research、xAI的Grok 3、Anthropic的Claude 3.7 Sonnet，标志着新范式第一轮竞赛暂告段落 [1] - 当前尚无全面领先的SOTA模型：OpenAI和xAI在基础模型和竞赛解题能力占优，Anthropic更擅长真实世界工程问题，Claude 3.7 Sonnet的混合推理模型可能成为行业新标准 [1][3] - DeepSeek R1在有限资源下实现开源创新，虽表现暂时落后但技术扩散价值显著 [7][8] 模型能力对比 - **数学推理**：o3-mini-high在AIME 2024测试中Pass@1达87.3，显著优于Claude 3.7 Sonnet的61.3/80.0和Grok 3的83.9/93.3 [9] - **工程代码**：Claude 3.7 Sonnet在SWE-bench验证中准确率领先20%+，可靠代码输出长度从3.5版的200行提升至1000-1500行 [19][20] - **多模态**：Gemini 2.0 Flash在多模态理解能力上绝对领先，但高阶融合能力尚未涌现 [6] 技术范式演进 - 基础模型预训练仍具关键价值：高质量基础模型是强化学习的前提，且当前评估方法已落后于模型智能发展 [12] - 混合推理成为趋势：Claude 3.7 Sonnet通过"extended thinking"设置实现快慢思考切换，未来模型需具备动态计算能力 [13][14][16] - RL Scaling效果优于垂直微调：OpenAI竞争性编程报告显示通用RL scaling比领域RL finetuning效果更好 [34][35] 产品应用创新 - Claude Code定位为AI Coding基建：通过命令行界面帮助AI扎根传统代码库，结合action scaling能力实现类Devin的agentic工作流 [22][23] - OpenAI Deep Research确立PMF形态：在网页理解深度、信息准确性、意图识别等方面领先，支持可配置的研究广度/深度控制 [29][31][32] - Agent能力升级关键：action scaling实现连续tool use，verifiable environment构建（如OS browser/Coding）及online learning机制 [25][27][28] 性能基准数据 | 测试维度 | Claude 3.7 Sonnet | Grok 3 Beta | o3-mini-high | |----------------|-------------------|-------------|--------------| | GPQA Diamond | 78.2/84.8 | 80.2/84.6 | 79.7 | | Codeforces评分 | - | - | 2130 | | SWE-bench | 49.3 | - | 49.2 | [9]

RL Scaling

Reasoning model

Hybrid Reasoning Model

Artificial Intelligence

Hybrid Reasoning Model

Artificial Intelligence

o3 - mini

Claude 3.7 Sonnet

DeepSeek公布成本、收入和利润率：最高可日赚346万

36氪· 2025-03-03 17:03

开源彩蛋与成本收入 - DeepSeek在开源周第六天公开了DeepSeek-V3/R1推理系统技术细节及每日成本与理论收入数据 [1] - 2月27日24点至2月28日24点的每日总成本为87072美元（约63万元人民币），若按DeepSeek-R1价格计费，理论每日总收入达562027美元（约409万元人民币），成本利润率为545%，理论日净赚474955美元（约346万元人民币） [1][4][11] - 实际收入低于理论值，因DeepSeek-V3定价低于R1、网页端/APP免费服务占比高及非高峰时段夜间折扣影响 [1][12] 技术架构与性能指标 - 采用跨节点专家并行（EP）技术提升吞吐量并降低延迟，通过增大batch size、计算-通信重叠、负载均衡三大策略应对EP系统复杂性 [2][14][15] - 使用H800 GPU并保持与训练一致的精度（矩阵计算FP8、core-attention BF16），高峰时段全节点部署推理服务，夜间缩减节点以分配资源至研究训练 [5] - 24小时内峰值节点占用率达278个（平均226.75节点，每节点含8个H800 GPU），H800租赁成本按每小时2美元计算 [5] 数据处理与吞吐效率 - 统计周期内总输入Token 608B（56.3%命中KVCache缓存），总输出Token 168B，平均输出速度20-22 tps，输出Token平均kvcache长度4989 [7][8] - 单个H800节点在prefill阶段平均吞吐量73.7k token/s（含缓存命中），解码阶段14.8k token/s [9] - 预填充阶段采用双batch重叠掩盖通信开销，解码阶段拆分为5级流水线实现计算-通信重叠 [18][19] 负载均衡优化 - 通过预填充负载均衡器实现各GPU计算量（core-attention）与输入token量（dispatch发送量）均衡，避免单GPU处理时间过长 [23] - 解码负载均衡器优化目标为各GPU的KVCache占用量与请求数量均衡，减少空转等待 [24] - 专家并行负载均衡器针对MoE模型中高负载专家分布不均问题，优化各GPU专家计算量均衡性 [25][26] 市场反响与对比 - GitHub发布1小时内Star数超5600，网友对比OpenAI定价称"被抢劫"，突显DeepSeek成本优势 [2][3] - 网友以OpenAI定价模型测算DeepSeek理论收入，强化其高利润率认知 [3][4]

跨节点的专家咨询（EP）

Data Parallelism（DP）

Artificial Intelligence

Artificial Intelligence

DeepSeek-V3/R1推理系统

DeepSeek-V3

DeepSeek-R1

The Zacks Analyst Blog Tencent, Alibaba, Baidu, JD.com and PDD Holdings

ZACKS· 2025-03-03 15:40

文章核心观点 2025年中国科技多领域显著进步，为投资者带来增长机会，推荐关注腾讯、阿里巴巴、百度三只科技股 [2][8] 中国科技行业发展情况科技巨头动态 - 腾讯、阿里巴巴、百度、京东、拼多多等科技巨头投资AI和新兴技术，强化中国数字生态 [2] AI领域 - 杭州AI初创公司DeepSeek的R1模型引发关注，其R2模型将提升编码和多语言推理能力，且成本低于西方竞争对手 [3] 半导体行业 - 中国半导体在先进封装技术上取得进展，虽芯片制造非领先，但在封装领域占全球超25%市场份额，先进封装超50% [4] 机器人行业 - 2025年CES上，中国企业展示机器人创新成果，如宇树科技的G1人形机器人灵活性出色 [5] 电动汽车行业 - 极氪、长城汽车展示前沿车型，禾赛科技汽车级激光雷达价格从2017年的8万美元降至2025年约200美元 [6] 增强现实行业 - 北京Xreal展示XReal One Pro眼镜，Rokid展示支持实时多语言翻译的AR眼镜 [7] 推荐关注的中国科技股腾讯 - 推出Hunyuan Turbo S模型，响应速度超竞争对手，性能与DeepSeek - V3相当，成本降低，有望在AI领域获市场份额 [10][11][12] 阿里巴巴 - 预览发布QwQ - Max - Preview模型，挑战行业领先者，承诺开源QwQ - Max和Qwen 2.5 Max，未来三年投资530亿美元发展云和AI基础设施 [14] 百度 - 与宁德时代合作开发无人驾驶汽车，计划3月中旬推出升级的Ernie 4.5 AI模型，6月30日开源 [16][17]

TENCENT(US:TCEHY)

Artificial Intelligence

Artificial Intelligence

超10亿元！杭州国资，投了一家AI“六小虎”！

证券时报· 2025-03-03 12:27

杭州AI产业布局 - 杭州近期在人工智能领域有大动作，重金押注AI"六小虎"之一的智谱，完成超10亿元人民币战略融资，投资方包括杭州城投产业基金、上城资本等国资背景机构[1][4] - 杭州已培育出以DeepSeek、宇树科技、游戏科学等为代表的"六小龙"科技初创公司，成为当地科创实力的代表[3] - 智谱2023年已在杭州成立浙江智谱华章科技，2024年2月又新设浙江智谱新篇科技，注册资本4.5亿元，由北京智谱全资持股[1] 智谱公司概况 - 智谱是国内AI"六小虎"之一，最早突破200亿元估值的AI独角兽，已完成超10轮融资[6] - 公司GLM系列大模型已应用于金融、医疗、教育等多个行业，与地方国资合作将推动杭州及浙江人工智能产业布局[4] - 智谱2024年商业化收入相比2023年逆势增长100%以上，MaaS平台API年收入同比增长超30倍，日均Tokens消耗量增长150倍[10] 杭州选择智谱的核心原因 - 技术全面性：智谱是国内唯一全面对标OpenAI的企业，在基座模型、对话模型、多模态模型等均有完整布局，而DeepSeek等竞争对手在部分领域存在短板[7] - 智能体领先优势：智谱是国内最早探索AI智能体的公司之一，推出全球首个面向公众的电脑智能体GLM-PC，并率先提出Phone Use概念，与三星手机展开合作[8] - 商业化能力突出：构建MaaS平台服务70余万企业开发者，私有化部署覆盖20多个行业万余家单位，形成规模化应用[9] 智谱未来规划 - 2025年定位为开源年，将发布包括基座模型、推理模型等在内的全新大模型并全部开源[10] - 公司预测2025年是AI智能体爆发年，其自主Agentic LLM技术具有领先优势[7]

速递丨全球AI巨头正加急抄DeepSeek作业，蒸馏降本或彻底颠覆美国技术先发优势

Z Finance· 2025-03-03 09:41

蒸馏技术发展现状 - 蒸馏技术利用大型"教师模型"生成数据训练小型"学生模型"，实现知识迁移并降低计算成本 [2] - 技术突破使蒸馏成为AI创业公司降本增效利器，可在不依赖庞大算力下构建高效应用 [2] - OpenAI产品负责人称蒸馏能以极低成本获得快速执行速度，是"近乎神奇的技术" [2] 行业应用与商业影响 - GPT-4/Gemini等大模型训练成本达数亿美元，蒸馏技术使AI能力可运行于笔记本电脑/智能手机 [2] - 微软利用GPT-4蒸馏出小型Phi模型推动商业化落地，累计向OpenAI投资近140亿美元 [3] - IBM指出多数企业无需超大规模模型，蒸馏版已可支持客服机器人等日常业务 [5] 技术局限性 - 模型轻量化会削弱泛化能力，如擅长邮件总结但其他任务表现下降 [5] - OpenAI坚持大模型在高风险任务中不可替代，企业愿为高可靠性支付溢价 [6] - 大模型仍是创新源泉，未来突破仍需依赖其后再蒸馏至小模型 [6] 行业竞争格局 - DeepSeek利用开源系统挑战硅谷领导地位，导致美国科技巨头市值蒸发数十亿美元 [1] - OpenAI设立监控团队防止竞争性蒸馏，已限制DeepSeek相关账户访问 [7] - Meta将蒸馏视为开源精髓，称所有开发者可从中受益 [7] 商业模式变革 - 蒸馏模型计算成本更低，导致OpenAI等公司收入减少，需调整收费策略 [6] - IBM指出蒸馏技术使竞争对手可快速跟进，让AI市场复杂化且商业模式更难预测 [8] - 行业对"先发优势"有效性产生质疑，数十亿美元投入可能被对手数月内赶超 [8]

苹果折叠屏iPhone发布计划公布！或将推动折叠屏市场从“小众”转向“主流”！

21世纪经济报道· 2025-03-02 23:30

苹果折叠屏iPhone相关 - 苹果首款折叠屏iPhone预计2026年秋季发布，可能作为iPhone 18系列成员亮相，供应链预测基础款定价1.5万 - 2万元，顶配或达2.5万元，若定价低于1.2万元，可能抢占三星30%市场份额 [1] - 摩根士丹利认为苹果通过“高端锚定策略”巩固品牌溢价，折叠屏iPhone或成2026年消费电子最大爆点 [1] - 中信证券指出UTG超薄玻璃与屏幕技术、铰链与精密结构件、材料（碳钎维、钛合金、液态金属、动态自愈材料）为充分受益板块 [1] 国产算力相关 - 北京数字经济算力中心落成，集成千P级国产算力集群，PUE指标1.146，覆盖算力、模型、数据全栈国产化，华为、海光等9家厂商完成11款芯片兼容性认证，标志国产芯片在高性能AI场景的成熟度提升 [1] - DeepSeek开源MoE模型代码库，降低算力需求，促进大模型向终端迁移，其文章揭晓V3/R1推理系统关键秘密，假定GPU租赁成本为2美元/小时，总成本为87072美元/天，若所有tokens按DeepSeek R1定价计算，理论上一天总收入为562027美元/天，成本利润率为545% [2] - 券商普遍认为国产算力产业链（芯片/IP、服务器、数据中心）将受益于政策支持与国产化加速，中金报告预计2025年国产AI芯片市场规模增速超50% [2] 《线索早知道》相关 - 今晚10点发布的《线索早知道》专栏整理了关于“苹果折叠屏”“国产算力”等题材的潜力名单 [3] - 《线索早知道》是越声理财推出聚焦A股投资线索的盘前资讯，每个交易日前晚上10点推送，去年12月抓住机器人，节前抓住机器人2.0行情，节后重点推荐多个DeepSeek相关公司 [5]

平常心看全国两会——A股一周走势研判及事件提醒

Datayes· 2025-03-02 22:26

摘要/ 全国两会来了下周全国两会将召开，一些数字从去年十月就开始牵动上亿股民的心！赤字率啊、GDP目标、特别国债规模等，终于要解开神秘的面纱了！摩根士丹利认为，应该平常心看待两会。两会或将把今年的GDP增速目标维持在"5%左右"的较高水平，以此来传递稳经济的决心。同时，通胀目标可能会迎来自2004年以来的首次调整，从此前的"3%左右"下调到"2%左右"。摩根士丹利认为，财政刺激短期内大幅加码的可能性较低。同时，抢出口效应和消费品以旧换新仍将支撑一季度的增长势头，或降低政策刺激加码的紧迫性。因此，预计今年全国两会仅出台2万亿人民币的温和财政扩张。其中包括将官方赤字率从去年的3% 提高到4% ，超长期特别国债的发行量从去年的1万亿人民币提升到2万亿人民币，以及新增5,000亿人民币的地方专项债额度，从而抵消卖地收入下滑对广义财政赤字所带来的拖累。摩根士丹利预计2万亿人民币的财政刺激大部分会用于基建和制造业投资，而仅有三分之一会与消费相关，包括将消费品以旧换新规模从去年的1,500亿人民币适度增加到2,000-3,000亿人民币，温和提高农村居民的养老金支出和医保补贴，以及为G ...

蜜雪冰城IPO认购额超1.7万亿港元，创港股记录；TikTok五年内向泰国投资88亿美元丨36氪出海·要闻回顾

36氪· 2025-03-02 21:42

中国企业出海动态 - 蜜雪冰城港股IPO认购额达1.77万亿港元，创历史记录，公开发售认购倍数5125倍，富途证券认购占比59% [6] - TikTok计划五年内向泰国投资88亿美元，拓展东南亚市场 [4] - 奇瑞汽车递交港交所上市申请，2024年出口汽车114.5万辆，连续22年保持中国品牌乘用车出口第一，年营收4800亿元同比增长超50% [8] - 小鹏汽车加速全球化，目标2027年进入全球新能源出口前三，2033年海外销量占比50% [7] - 喜茶在纽约时代广场开设海外首家LAB店，已在8个海外国家和地区开设超80家门店 [10] - 石头科技2024年海外业务收入大幅提升，带动总营收增长37.82%至119.27亿元 [11] - 王老吉进军沙特市场，产品已进入全球100多个国家和地区 [12] - 2024年中国手机出口量8.14亿部，同比增长1.5%，为八年来首次增长 [18] 行业趋势与市场数据 - 2024年民营企业进出口24.33万亿元，增长8.8%，占外贸总值55.5% [17] - 全球智能手机出货量12.2亿部，同比增长7%，结束两年下滑 [18] - 中国服务机器人全球市场份额近50%，2024年三季度全球智能扫地机器人出货501.4万台 [19] - SHEIN成为全球访问量最大服装购物网站，63%消费者为直接访问 [5] - 宁德时代以41%市占率连续四年蝉联全球储能市场冠军，动力电池出货491GWh占全球42.4% [7] - 拉美智能手机市场增长15%至1.37亿部，小米出货量同比增长20%至2270万部 [11] 科技与AI进展 - OpenAI推出GPT-4.5模型，幻觉率低于GPT-4.0 [14] - Meta计划二季度发布独立AI应用并探索付费订阅 [14] - 英伟达2025财年Q4营收393亿美元同比增长78%，数据中心业务营收356亿美元增长93% [16] - 小米预计2025年研发投入300亿元，AI及相关业务占比25% [11] - DeepSeek加速推出R2人工智能模型，原计划五月发布 [16] 投融资与战略合作 - 阿里国际站与马士基合作简化海运流程，费用降低10% [5] - 阿里宣布三年投入3800亿元建设云和AI基础设施 [5] - 菜鸟海外仓推出8大保障举措，聚焦大件家具等热门品类 [6] - 天合储能与Pacific Green合作建设澳大利亚250MW/500MWh新能源项目 [8] - 海外短剧平台StoReel获数百万美元融资，每月产能3-5部剧集 [22] - 工业智能解决方案供应商格创东智获数亿元C轮融资，海外项目超10个 [21]

DeepSeek的545%利润率，是对算力的核弹吗？

华尔街见闻· 2025-03-02 20:40

文章核心观点 - DeepSeek在开源周展示出高成本利润率，引发对其利润率解读、对算力产业链、云产业链、大模型同行及行业生态影响的讨论，揭示了infra优化潜力，推动行业变革，预示高效、低成本、竞争激烈的AI时代到来 [1][28] 如何解读这个利润率 - DeepSeek官方公布的545%利润率是特定条件下的理论计算，真实利润率没这么夸张 [6] - 科技博主180K解读，R1模型利润率约85%，按V3定价利润率降至70%左右，仍很可观 [7] - 通过对比Anthropic利润率可知，OpenAI和Anthropic虽成本控制不如DeepSeek，但凭借高定价和慷慨客户也能实现类似高利润率，OpenAI常被报道“亏损”是因融资时投资者关注财务会计盈亏 [7] 是否是对算力的核弹 - DeepSeek案例证明在硬件条件有限（使用H800）下，通过极致infra优化可实现高算力利用率和性能，对算力产业链影响大 [8] - 科技博主180K认为“有效算力”重要性将凸显，国产芯片上限有望提升 [8] - 科技博主信息平权认为“杰文斯悖论”生效，算力效率提升会刺激应用场景出现，推动算力需求增长，巴克莱银行预测到2026年业界资本支出可支撑“12000 + 个ChatGPT级别的应用” [9] - 短期内算力需求逻辑可能受质疑，海外大厂CIO或CFO可能面临解释ROI低于DeepSeek的压力 [10] - 知名投资人段永平赞同黄仁勋观点，认为DeepSeek创新不会减少算力需求，R1激发市场对高效AI模型追求，推动行业发展 [11][12] - 国外科技博主Zephyr认为DeepSeek已将英伟达“击倒”，其算力利用率满足全球AI需求绰绰有余 [13] 对云产业链意味着什么 - DeepSeek让AI云计算与传统云计算相似性更明显，面临“低峰期闲置率”和“高峰期稳定性”挑战 [3][19] - 科技博主180K认为云计算规模效应更显著，用户数量正外部性明显，云厂商竞争优势可能变化，有自身业务的云厂商更具成本优势 [19] - 云计算利润率有提升空间，私有云部署吸引力可能下降，普通云计算/AI应用需为高强度用户并发预留更多空间，利润率可能下降 [20] 对大模型同行意味着什么 - DeepSeek开源和技术披露为行业树立新标杆，推理成本“底线”被大幅拉低，可能引发新一轮价格战，同行面临降价压力 [4][21] - DeepSeek为推理团队提供优化路径和目标，后续压力加大，OpenAI高价订阅模式面临挑战 [22][23] 对生态意味着什么 - DeepSeek专注基础模型和前沿创新，通过开源技术吸引业界构建to B和to C业务，形成完整产业上下游 [5][24] - 科技博主极客公园表示生态合作伙伴盈利空间增大 [25] - 后续模型架构差异化可能成竞争关键，DeepSeek开源降低社区复现推理系统难度，利于生态繁荣 [26][27] - 科技博主180K表示行业可能开始卷Infra，Infra重要性和估值提高 [28]

【太平洋科技-每日观点&资讯】（2025-03-03）

远峰电子· 2025-03-02 19:42

行情速递 - 主板领涨个股包括实达集团(+10.09%)、延华智能(+10.01%)、至纯科技(+10.00%)、有研新材(+9.99%)和东尼电子(+9.99%) [1] - 创业板领涨个股包括GQY视讯(+20.06%)、凯旺科技(+20.01%)和宏景科技(+20.01%) [1] - 科创板领涨个股包括汇成股份(+7.84%)、世华科技(+3.08%)和永信至诚(+0.76%) [1] - 活跃子行业中，SW教育出版(-1.58%)和SW半导体材料(-2.52%)表现较弱 [1] 国内新闻 - 百联集团旗下三联公司吴良材眼镜与AR科技公司Rokid合作推出两款AR眼镜新品：Rokid AR护眼套装和Rokid AR Lite [1] - 台积电考虑对韩国芯片设计新创公司FuriosaAI进行战略性投资，同时Meta也在考虑收购FuriosaAI以实现数据中心芯片组合多元化 [1] - 士兰微电子旗下厦门士兰集宏半导体有限公司的8英寸碳化硅（SiC）功率器件芯片制造生产线项目已全面封顶 [1] - DeepSeek发布DeepSeek-V3/R1推理系统，其理论成本利润率高达545% [1] 公司公告 - 中兴通讯2024年总营业收入1,212.99亿元，同比减少2.38%，归母净利润84.25亿元，同比减少9.66% [2] - 利扬芯片全资子公司东莞市利致软件科技有限公司收到政府补助438.96万元 [2] - 海光信息2024年总营业收入91.62亿元，同比增长52.4%，归母净利润19.31亿元，同比增长52.87% [2] - 寒武纪2024年营业收入11.74亿元，同比增长65.56%，归母净利润-4.43亿元 [2] 海外新闻 - 2024年第四季度全球DRAM行业收入超过280亿美元，环比增长9.9%，主要得益于服务器DDR5合同价格上涨和HBM集中出货 [3] - 美光率先出货专为下一代CPU设计的1γ第六代DDR5内存样品 [3] - 特朗普提议对墨西哥和加拿大商品征收25%的关税，并对中国进口商品再征收10%的额外关税 [3] - 2024年全球TFT-LCD和AMOLED面板产能合计4.09亿平方米，同比增长2.5%，预计2025年将继续增长2.3% [3]

电子

眼镜

1γ第六代 (10纳米级) DRAM节点DDR5内存

Rokid AR Lite

电子

眼镜

1γ第六代 (10纳米级) DRAM节点DDR5内存

Rokid AR Lite

Previous Next