Workflow
DeepSeek
icon
搜索文档
从 R1 到 Sonnet 3.7,Reasoning Model 首轮竞赛中有哪些关键信号?
海外独角兽· 2025-03-03 21:10
行业竞争格局 - 头部AI实验室在过去一个月密集发布三个SOTA推理模型:OpenAI的o3-mini和deep research、xAI的Grok 3、Anthropic的Claude 3.7 Sonnet,标志着新范式第一轮竞赛暂告段落 [1] - 当前尚无全面领先的SOTA模型:OpenAI和xAI在基础模型和竞赛解题能力占优,Anthropic更擅长真实世界工程问题,Claude 3.7 Sonnet的混合推理模型可能成为行业新标准 [1][3] - DeepSeek R1在有限资源下实现开源创新,虽表现暂时落后但技术扩散价值显著 [7][8] 模型能力对比 - **数学推理**:o3-mini-high在AIME 2024测试中Pass@1达87.3,显著优于Claude 3.7 Sonnet的61.3/80.0和Grok 3的83.9/93.3 [9] - **工程代码**:Claude 3.7 Sonnet在SWE-bench验证中准确率领先20%+,可靠代码输出长度从3.5版的200行提升至1000-1500行 [19][20] - **多模态**:Gemini 2.0 Flash在多模态理解能力上绝对领先,但高阶融合能力尚未涌现 [6] 技术范式演进 - 基础模型预训练仍具关键价值:高质量基础模型是强化学习的前提,且当前评估方法已落后于模型智能发展 [12] - 混合推理成为趋势:Claude 3.7 Sonnet通过"extended thinking"设置实现快慢思考切换,未来模型需具备动态计算能力 [13][14][16] - RL Scaling效果优于垂直微调:OpenAI竞争性编程报告显示通用RL scaling比领域RL finetuning效果更好 [34][35] 产品应用创新 - Claude Code定位为AI Coding基建:通过命令行界面帮助AI扎根传统代码库,结合action scaling能力实现类Devin的agentic工作流 [22][23] - OpenAI Deep Research确立PMF形态:在网页理解深度、信息准确性、意图识别等方面领先,支持可配置的研究广度/深度控制 [29][31][32] - Agent能力升级关键:action scaling实现连续tool use,verifiable environment构建(如OS browser/Coding)及online learning机制 [25][27][28] 性能基准数据 | 测试维度 | Claude 3.7 Sonnet | Grok 3 Beta | o3-mini-high | |----------------|-------------------|-------------|--------------| | GPQA Diamond | 78.2/84.8 | 80.2/84.6 | 79.7 | | Codeforces评分 | - | - | 2130 | | SWE-bench | 49.3 | - | 49.2 | [9]
DeepSeek公布成本、收入和利润率:最高可日赚346万
36氪· 2025-03-03 17:03
开源彩蛋与成本收入 - DeepSeek在开源周第六天公开了DeepSeek-V3/R1推理系统技术细节及每日成本与理论收入数据 [1] - 2月27日24点至2月28日24点的每日总成本为87072美元(约63万元人民币),若按DeepSeek-R1价格计费,理论每日总收入达562027美元(约409万元人民币),成本利润率为545%,理论日净赚474955美元(约346万元人民币) [1][4][11] - 实际收入低于理论值,因DeepSeek-V3定价低于R1、网页端/APP免费服务占比高及非高峰时段夜间折扣影响 [1][12] 技术架构与性能指标 - 采用跨节点专家并行(EP)技术提升吞吐量并降低延迟,通过增大batch size、计算-通信重叠、负载均衡三大策略应对EP系统复杂性 [2][14][15] - 使用H800 GPU并保持与训练一致的精度(矩阵计算FP8、core-attention BF16),高峰时段全节点部署推理服务,夜间缩减节点以分配资源至研究训练 [5] - 24小时内峰值节点占用率达278个(平均226.75节点,每节点含8个H800 GPU),H800租赁成本按每小时2美元计算 [5] 数据处理与吞吐效率 - 统计周期内总输入Token 608B(56.3%命中KVCache缓存),总输出Token 168B,平均输出速度20-22 tps,输出Token平均kvcache长度4989 [7][8] - 单个H800节点在prefill阶段平均吞吐量73.7k token/s(含缓存命中),解码阶段14.8k token/s [9] - 预填充阶段采用双batch重叠掩盖通信开销,解码阶段拆分为5级流水线实现计算-通信重叠 [18][19] 负载均衡优化 - 通过预填充负载均衡器实现各GPU计算量(core-attention)与输入token量(dispatch发送量)均衡,避免单GPU处理时间过长 [23] - 解码负载均衡器优化目标为各GPU的KVCache占用量与请求数量均衡,减少空转等待 [24] - 专家并行负载均衡器针对MoE模型中高负载专家分布不均问题,优化各GPU专家计算量均衡性 [25][26] 市场反响与对比 - GitHub发布1小时内Star数超5600,网友对比OpenAI定价称"被抢劫",突显DeepSeek成本优势 [2][3] - 网友以OpenAI定价模型测算DeepSeek理论收入,强化其高利润率认知 [3][4]
The Zacks Analyst Blog Tencent, Alibaba, Baidu, JD.com and PDD Holdings
ZACKS· 2025-03-03 15:40
文章核心观点 2025年中国科技多领域显著进步,为投资者带来增长机会,推荐关注腾讯、阿里巴巴、百度三只科技股 [2][8] 中国科技行业发展情况 科技巨头动态 - 腾讯、阿里巴巴、百度、京东、拼多多等科技巨头投资AI和新兴技术,强化中国数字生态 [2] AI领域 - 杭州AI初创公司DeepSeek的R1模型引发关注,其R2模型将提升编码和多语言推理能力,且成本低于西方竞争对手 [3] 半导体行业 - 中国半导体在先进封装技术上取得进展,虽芯片制造非领先,但在封装领域占全球超25%市场份额,先进封装超50% [4] 机器人行业 - 2025年CES上,中国企业展示机器人创新成果,如宇树科技的G1人形机器人灵活性出色 [5] 电动汽车行业 - 极氪、长城汽车展示前沿车型,禾赛科技汽车级激光雷达价格从2017年的8万美元降至2025年约200美元 [6] 增强现实行业 - 北京Xreal展示XReal One Pro眼镜,Rokid展示支持实时多语言翻译的AR眼镜 [7] 推荐关注的中国科技股 腾讯 - 推出Hunyuan Turbo S模型,响应速度超竞争对手,性能与DeepSeek - V3相当,成本降低,有望在AI领域获市场份额 [10][11][12] 阿里巴巴 - 预览发布QwQ - Max - Preview模型,挑战行业领先者,承诺开源QwQ - Max和Qwen 2.5 Max,未来三年投资530亿美元发展云和AI基础设施 [14] 百度 - 与宁德时代合作开发无人驾驶汽车,计划3月中旬推出升级的Ernie 4.5 AI模型,6月30日开源 [16][17]
超10亿元!杭州国资,投了一家AI“六小虎”!
证券时报· 2025-03-03 12:27
杭州AI产业布局 - 杭州近期在人工智能领域有大动作,重金押注AI"六小虎"之一的智谱,完成超10亿元人民币战略融资,投资方包括杭州城投产业基金、上城资本等国资背景机构[1][4] - 杭州已培育出以DeepSeek、宇树科技、游戏科学等为代表的"六小龙"科技初创公司,成为当地科创实力的代表[3] - 智谱2023年已在杭州成立浙江智谱华章科技,2024年2月又新设浙江智谱新篇科技,注册资本4.5亿元,由北京智谱全资持股[1] 智谱公司概况 - 智谱是国内AI"六小虎"之一,最早突破200亿元估值的AI独角兽,已完成超10轮融资[6] - 公司GLM系列大模型已应用于金融、医疗、教育等多个行业,与地方国资合作将推动杭州及浙江人工智能产业布局[4] - 智谱2024年商业化收入相比2023年逆势增长100%以上,MaaS平台API年收入同比增长超30倍,日均Tokens消耗量增长150倍[10] 杭州选择智谱的核心原因 - 技术全面性:智谱是国内唯一全面对标OpenAI的企业,在基座模型、对话模型、多模态模型等均有完整布局,而DeepSeek等竞争对手在部分领域存在短板[7] - 智能体领先优势:智谱是国内最早探索AI智能体的公司之一,推出全球首个面向公众的电脑智能体GLM-PC,并率先提出Phone Use概念,与三星手机展开合作[8] - 商业化能力突出:构建MaaS平台服务70余万企业开发者,私有化部署覆盖20多个行业万余家单位,形成规模化应用[9] 智谱未来规划 - 2025年定位为开源年,将发布包括基座模型、推理模型等在内的全新大模型并全部开源[10] - 公司预测2025年是AI智能体爆发年,其自主Agentic LLM技术具有领先优势[7]
速递丨全球AI巨头正加急抄DeepSeek作业,蒸馏降本或彻底颠覆美国技术先发优势
Z Finance· 2025-03-03 09:41
蒸馏技术发展现状 - 蒸馏技术利用大型"教师模型"生成数据训练小型"学生模型",实现知识迁移并降低计算成本 [2] - 技术突破使蒸馏成为AI创业公司降本增效利器,可在不依赖庞大算力下构建高效应用 [2] - OpenAI产品负责人称蒸馏能以极低成本获得快速执行速度,是"近乎神奇的技术" [2] 行业应用与商业影响 - GPT-4/Gemini等大模型训练成本达数亿美元,蒸馏技术使AI能力可运行于笔记本电脑/智能手机 [2] - 微软利用GPT-4蒸馏出小型Phi模型推动商业化落地,累计向OpenAI投资近140亿美元 [3] - IBM指出多数企业无需超大规模模型,蒸馏版已可支持客服机器人等日常业务 [5] 技术局限性 - 模型轻量化会削弱泛化能力,如擅长邮件总结但其他任务表现下降 [5] - OpenAI坚持大模型在高风险任务中不可替代,企业愿为高可靠性支付溢价 [6] - 大模型仍是创新源泉,未来突破仍需依赖其后再蒸馏至小模型 [6] 行业竞争格局 - DeepSeek利用开源系统挑战硅谷领导地位,导致美国科技巨头市值蒸发数十亿美元 [1] - OpenAI设立监控团队防止竞争性蒸馏,已限制DeepSeek相关账户访问 [7] - Meta将蒸馏视为开源精髓,称所有开发者可从中受益 [7] 商业模式变革 - 蒸馏模型计算成本更低,导致OpenAI等公司收入减少,需调整收费策略 [6] - IBM指出蒸馏技术使竞争对手可快速跟进,让AI市场复杂化且商业模式更难预测 [8] - 行业对"先发优势"有效性产生质疑,数十亿美元投入可能被对手数月内赶超 [8]
苹果折叠屏iPhone发布计划公布!或将推动折叠屏市场从“小众”转向“主流”!
21世纪经济报道· 2025-03-02 23:30
苹果折叠屏iPhone相关 - 苹果首款折叠屏iPhone预计2026年秋季发布,可能作为iPhone 18系列成员亮相,供应链预测基础款定价1.5万 - 2万元,顶配或达2.5万元,若定价低于1.2万元,可能抢占三星30%市场份额 [1] - 摩根士丹利认为苹果通过“高端锚定策略”巩固品牌溢价,折叠屏iPhone或成2026年消费电子最大爆点 [1] - 中信证券指出UTG超薄玻璃与屏幕技术、铰链与精密结构件、材料(碳钎维、钛合金、液态金属、动态自愈材料)为充分受益板块 [1] 国产算力相关 - 北京数字经济算力中心落成,集成千P级国产算力集群,PUE指标1.146,覆盖算力、模型、数据全栈国产化,华为、海光等9家厂商完成11款芯片兼容性认证,标志国产芯片在高性能AI场景的成熟度提升 [1] - DeepSeek开源MoE模型代码库,降低算力需求,促进大模型向终端迁移,其文章揭晓V3/R1推理系统关键秘密,假定GPU租赁成本为2美元/小时,总成本为87072美元/天,若所有tokens按DeepSeek R1定价计算,理论上一天总收入为562027美元/天,成本利润率为545% [2] - 券商普遍认为国产算力产业链(芯片/IP、服务器、数据中心)将受益于政策支持与国产化加速,中金报告预计2025年国产AI芯片市场规模增速超50% [2] 《线索早知道》相关 - 今晚10点发布的《线索早知道》专栏整理了关于“苹果折叠屏”“国产算力”等题材的潜力名单 [3] - 《线索早知道》是越声理财推出聚焦A股投资线索的盘前资讯,每个交易日前晚上10点推送,去年12月抓住机器人,节前抓住机器人2.0行情,节后重点推荐多个DeepSeek相关公司 [5]
平常心看全国两会——A股一周走势研判及事件提醒
Datayes· 2025-03-02 22:26
摘要/ 全国两会来了 下周全国两会将召开,一些数字从去年十月就开始牵动上亿股民的心! 赤字率啊、GDP目 标、特别国债规模等,终于要解开神秘的面纱了! 摩根士丹利认为,应该平常心看待两会。两会或将把今年的GDP增速目标维持在"5%左右"的 较高水平,以此来传递稳经济的决心。同时,通胀目标可能会迎来自2004年以来的首次调 整,从此前的"3%左右"下调到"2%左右"。 摩 根士丹利认为,财政刺激短期内大幅加码的可能性较低。 同时,抢出口效应和消费品以旧 换新仍将支撑一季度的增长势头,或降低政策刺激加码的紧迫性。 因此,预计今年全国两会仅出台2万亿人民币的温和财政扩张。 其中包括将官方赤字率从去年 的3% 提高到4% ,超长期特别国债的发行量从去年的1万亿人民币提升到2万亿人民币,以及 新增5,000亿人民币的地方专项债额度,从而抵消卖地收入下滑对广义财政赤字所带来的拖 累。 摩根士丹利预计2万亿人民币的财政刺激大部分会用于基建和制造业投资,而仅有三分之一会 与消费相关, 包括将消费品以旧换新规模从去年的1,500亿人民币适度增加到2,000-3,000亿 人民币,温和提高农村居民的养老金支出和医保补贴,以及为G ...
蜜雪冰城IPO认购额超1.7万亿港元,创港股记录;TikTok五年内向泰国投资88亿美元丨36氪出海·要闻回顾
36氪· 2025-03-02 21:42
中国企业出海动态 - 蜜雪冰城港股IPO认购额达1.77万亿港元,创历史记录,公开发售认购倍数5125倍,富途证券认购占比59% [6] - TikTok计划五年内向泰国投资88亿美元,拓展东南亚市场 [4] - 奇瑞汽车递交港交所上市申请,2024年出口汽车114.5万辆,连续22年保持中国品牌乘用车出口第一,年营收4800亿元同比增长超50% [8] - 小鹏汽车加速全球化,目标2027年进入全球新能源出口前三,2033年海外销量占比50% [7] - 喜茶在纽约时代广场开设海外首家LAB店,已在8个海外国家和地区开设超80家门店 [10] - 石头科技2024年海外业务收入大幅提升,带动总营收增长37.82%至119.27亿元 [11] - 王老吉进军沙特市场,产品已进入全球100多个国家和地区 [12] - 2024年中国手机出口量8.14亿部,同比增长1.5%,为八年来首次增长 [18] 行业趋势与市场数据 - 2024年民营企业进出口24.33万亿元,增长8.8%,占外贸总值55.5% [17] - 全球智能手机出货量12.2亿部,同比增长7%,结束两年下滑 [18] - 中国服务机器人全球市场份额近50%,2024年三季度全球智能扫地机器人出货501.4万台 [19] - SHEIN成为全球访问量最大服装购物网站,63%消费者为直接访问 [5] - 宁德时代以41%市占率连续四年蝉联全球储能市场冠军,动力电池出货491GWh占全球42.4% [7] - 拉美智能手机市场增长15%至1.37亿部,小米出货量同比增长20%至2270万部 [11] 科技与AI进展 - OpenAI推出GPT-4.5模型,幻觉率低于GPT-4.0 [14] - Meta计划二季度发布独立AI应用并探索付费订阅 [14] - 英伟达2025财年Q4营收393亿美元同比增长78%,数据中心业务营收356亿美元增长93% [16] - 小米预计2025年研发投入300亿元,AI及相关业务占比25% [11] - DeepSeek加速推出R2人工智能模型,原计划五月发布 [16] 投融资与战略合作 - 阿里国际站与马士基合作简化海运流程,费用降低10% [5] - 阿里宣布三年投入3800亿元建设云和AI基础设施 [5] - 菜鸟海外仓推出8大保障举措,聚焦大件家具等热门品类 [6] - 天合储能与Pacific Green合作建设澳大利亚250MW/500MWh新能源项目 [8] - 海外短剧平台StoReel获数百万美元融资,每月产能3-5部剧集 [22] - 工业智能解决方案供应商格创东智获数亿元C轮融资,海外项目超10个 [21]
DeepSeek的545%利润率,是对算力的核弹吗?
华尔街见闻· 2025-03-02 20:40
文章核心观点 - DeepSeek在开源周展示出高成本利润率,引发对其利润率解读、对算力产业链、云产业链、大模型同行及行业生态影响的讨论,揭示了infra优化潜力,推动行业变革,预示高效、低成本、竞争激烈的AI时代到来 [1][28] 如何解读这个利润率 - DeepSeek官方公布的545%利润率是特定条件下的理论计算,真实利润率没这么夸张 [6] - 科技博主180K解读,R1模型利润率约85%,按V3定价利润率降至70%左右,仍很可观 [7] - 通过对比Anthropic利润率可知,OpenAI和Anthropic虽成本控制不如DeepSeek,但凭借高定价和慷慨客户也能实现类似高利润率,OpenAI常被报道“亏损”是因融资时投资者关注财务会计盈亏 [7] 是否是对算力的核弹 - DeepSeek案例证明在硬件条件有限(使用H800)下,通过极致infra优化可实现高算力利用率和性能,对算力产业链影响大 [8] - 科技博主180K认为“有效算力”重要性将凸显,国产芯片上限有望提升 [8] - 科技博主信息平权认为“杰文斯悖论”生效,算力效率提升会刺激应用场景出现,推动算力需求增长,巴克莱银行预测到2026年业界资本支出可支撑“12000 + 个ChatGPT级别的应用” [9] - 短期内算力需求逻辑可能受质疑,海外大厂CIO或CFO可能面临解释ROI低于DeepSeek的压力 [10] - 知名投资人段永平赞同黄仁勋观点,认为DeepSeek创新不会减少算力需求,R1激发市场对高效AI模型追求,推动行业发展 [11][12] - 国外科技博主Zephyr认为DeepSeek已将英伟达“击倒”,其算力利用率满足全球AI需求绰绰有余 [13] 对云产业链意味着什么 - DeepSeek让AI云计算与传统云计算相似性更明显,面临“低峰期闲置率”和“高峰期稳定性”挑战 [3][19] - 科技博主180K认为云计算规模效应更显著,用户数量正外部性明显,云厂商竞争优势可能变化,有自身业务的云厂商更具成本优势 [19] - 云计算利润率有提升空间,私有云部署吸引力可能下降,普通云计算/AI应用需为高强度用户并发预留更多空间,利润率可能下降 [20] 对大模型同行意味着什么 - DeepSeek开源和技术披露为行业树立新标杆,推理成本“底线”被大幅拉低,可能引发新一轮价格战,同行面临降价压力 [4][21] - DeepSeek为推理团队提供优化路径和目标,后续压力加大,OpenAI高价订阅模式面临挑战 [22][23] 对生态意味着什么 - DeepSeek专注基础模型和前沿创新,通过开源技术吸引业界构建to B和to C业务,形成完整产业上下游 [5][24] - 科技博主极客公园表示生态合作伙伴盈利空间增大 [25] - 后续模型架构差异化可能成竞争关键,DeepSeek开源降低社区复现推理系统难度,利于生态繁荣 [26][27] - 科技博主180K表示行业可能开始卷Infra,Infra重要性和估值提高 [28]
【太平洋科技-每日观点&资讯】(2025-03-03)
远峰电子· 2025-03-02 19:42
行情速递 - 主板领涨个股包括实达集团(+10.09%)、延华智能(+10.01%)、至纯科技(+10.00%)、有研新材(+9.99%)和东尼电子(+9.99%) [1] - 创业板领涨个股包括GQY视讯(+20.06%)、凯旺科技(+20.01%)和宏景科技(+20.01%) [1] - 科创板领涨个股包括汇成股份(+7.84%)、世华科技(+3.08%)和永信至诚(+0.76%) [1] - 活跃子行业中,SW教育出版(-1.58%)和SW半导体材料(-2.52%)表现较弱 [1] 国内新闻 - 百联集团旗下三联公司吴良材眼镜与AR科技公司Rokid合作推出两款AR眼镜新品:Rokid AR护眼套装和Rokid AR Lite [1] - 台积电考虑对韩国芯片设计新创公司FuriosaAI进行战略性投资,同时Meta也在考虑收购FuriosaAI以实现数据中心芯片组合多元化 [1] - 士兰微电子旗下厦门士兰集宏半导体有限公司的8英寸碳化硅(SiC)功率器件芯片制造生产线项目已全面封顶 [1] - DeepSeek发布DeepSeek-V3/R1推理系统,其理论成本利润率高达545% [1] 公司公告 - 中兴通讯2024年总营业收入1,212.99亿元,同比减少2.38%,归母净利润84.25亿元,同比减少9.66% [2] - 利扬芯片全资子公司东莞市利致软件科技有限公司收到政府补助438.96万元 [2] - 海光信息2024年总营业收入91.62亿元,同比增长52.4%,归母净利润19.31亿元,同比增长52.87% [2] - 寒武纪2024年营业收入11.74亿元,同比增长65.56%,归母净利润-4.43亿元 [2] 海外新闻 - 2024年第四季度全球DRAM行业收入超过280亿美元,环比增长9.9%,主要得益于服务器DDR5合同价格上涨和HBM集中出货 [3] - 美光率先出货专为下一代CPU设计的1γ第六代DDR5内存样品 [3] - 特朗普提议对墨西哥和加拿大商品征收25%的关税,并对中国进口商品再征收10%的额外关税 [3] - 2024年全球TFT-LCD和AMOLED面板产能合计4.09亿平方米,同比增长2.5%,预计2025年将继续增长2.3% [3]