DeepSeek

搜索文档
速递|DeepSeek加速R2模型研发,计划5月前推出,新模型将强化代码能力
Z Finance· 2025-02-26 16:19
DeepSeek AI模型的市场影响 - DeepSeek的低成本AI推理模型引发全球股市超过1万亿美元的震荡,表现超越许多西方竞争对手[1] - 公司加速推出R1模型的继任者R2,原计划5月初发布但希望提前推出,新一代模型将提升代码生成能力并支持更多非英语语言[1] - R1模型使用计算能力较弱的英伟达芯片,却能媲美美国科技巨头投入数千亿美元打造的高端AI模型[1] 行业竞争格局变化 - DeepSeek R2发布可能成为AI行业关键转折点,其高性价比模型可能打破少数巨头垄断局面[1] - 已有数十家中国企业表示正在将DeepSeek模型集成到产品中[1] - R2发布可能引发美国政府担忧,进一步激励中国企业加速布局AI[1] DeepSeek公司背景 - 创始人梁文峰通过量化对冲基金幻方量化成为亿万富翁,性格低调内敛[2] - 公司更像研究实验室而非传统营利性企业[2] - 外界对公司知之甚少,创始人自2024年7月以来未接受媒体采访[2]
睿郡资产年度思考:2025,我们为什么比较乐观……
聪明投资者· 2025-02-26 15:28
核心观点 - 2025年经济"体感"将比2024年有明显改善,主要因政策拐点明确[67] - 地产行业已连续4年去库存,累计去库存量超7.5亿平方米,2025年对经济拖累基本可忽略[14][15][16] - 半导体行业估值已高,定位为"勇敢者的游戏",看好材料和设计领域[83][84] - 公用事业基本面变化最大,新能源革命带来产业地位和盈利模式翻天覆地变化[91] - 港股优质成长股将有机会,但需经得起国际投资者筛选[102][104] 行业与市场展望 地产 - 2024年是"最后的地产冲击波",销售面积从峰值16亿平米腰斩至8亿平米[16] - 新开工面积已降至5亿平米水平,行业正逐步迈向供需平衡[16] - 一线城市地产更偏向核心资产,与资本市场关联紧密[16] 半导体 - 数字芯片设计部分公司业绩增速不错[21] - 中国半导体产业是长坡厚雪,未来能孕育出大型公司[23] - 数据中心领域真正受益的龙头公司未上市[87] 公用事业 - 中国2024年光伏新增装机277GW,风电79GW,满足5.5%用电增长[88] - 新能源发电方式摆脱对煤炭依赖,风电一度电能赚0.15元[90] - 电力企业盈利可能还会和煤炭企业有所博弈[90] 消费 - 消费行业估值持续下降,商业模式优秀但需大力度政策扭转预期[92][95] - 关键变量是政策,如同去年股票市场一样[93] 港股 - 恒生科技代表的成长股指数过去跌幅大[99] - 港股投资选对股票涨幅惊人,下跌时连跌几年不回头[103] - 优质成长股要求比A股更苛刻,需实现盈利和持续成长[102] 案例研究 胖东来 - 以客户为中心的闭环模式,把产业链价值做厚,脱离同质化竞争[6] - 明码标价非标品销售好,赢得顾客信任[30] - 对供应商不拖欠账期,关心员工福利[33][34] - 薪酬构成中文化理念相关部分占60%[35] - 帮扶同行毫无保留展示供货商系统核心机密[37][38] 美国互联网与AI - 思科2000年市值最高近5500亿美元,类比当前英伟达[51] - 互联网发展分早期、调整期、技术升级后新阶段[48][49] - AI仍处早期阶段,但相关股票价格走势"树似乎长到了天上"[60] - 若AI出现调整,英伟达可能面临较大麻烦[64]
速递|Cohere年化收入三倍增长,初创公司考虑出售员工股票,或将进行E轮融资
Z Potentials· 2025-02-26 11:12
公司业绩增长 - 公司年化收入达到7000万美元 比去年三月增长三倍多 [1] - 公司在面临OpenAI和Anthropic竞争以及DeepSeek等廉价开源替代品激增的情况下仍实现显著增长 [1] 股权与融资动态 - 公司考虑允许出售员工股份 为投资者提供估值窗口 [2] - 潜在投资者预计员工股份出售后可能很快进行E轮主要融资 [2] 行业竞争格局 - 企业AI软件市场日益拥挤 公司面临来自OpenAI和Anthropic的直接竞争 [1] - 廉价开源替代品如DeepSeek的激增加剧了行业竞争压力 [1]
为何Nvidia还是AI芯片之王?这一地位能否持续?
半导体行业观察· 2025-02-26 09:07
文章核心观点 - Nvidia股价涨势停滞,投资者对AI计算发展路径和Nvidia技术依赖度持谨慎态度[1] - 分析Nvidia增长驱动因素及未来挑战,包括产品迭代、技术优势及竞争格局[2] Nvidia核心AI芯片产品 - Hopper H100是目前最赚钱的AI芯片,采用集群计算技术,适用于AI神经网络训练[3] - Blackwell系列将取代Hopper,训练性能提升2.5倍,采用双芯片集成设计[3][4] - GB200超级芯片结合双Blackwell GPU与Grace CPU,强化计算能力[3] Nvidia技术优势与市场地位 - 并行计算技术积累始于图形芯片领域,早期布局使其在AI时代占据先机[5][6] - 数据中心GPU市场份额达90%,主导AI训练芯片市场[7] - CUDA编程语言生态绑定行业,形成软硬件协同壁垒[13] 竞争对手动态 - AMD推出Instinct MI350芯片,性能号称提升35倍,但年收入50亿美元远低于Nvidia的1000亿美元[12] - 英特尔因Falcon Shores芯片市场反馈不佳,暂不商业化,落后于Nvidia[13] - 云计算巨头(AWS、Google Cloud、Azure)尝试自研芯片但未撼动Nvidia地位[7][9] AI芯片需求与行业趋势 - 微软、亚马逊、Meta、谷歌计划投入数千亿美元建设AI数据中心[10] - 市场担忧AI数据中心需求短期见顶,微软取消部分数据中心租约[10] - 中国初创公司DeepSeek通过低资源消耗的推理技术取得突破,但Nvidia强调其GPU仍为推理核心[11] 产品迭代与客户策略 - Nvidia通过快速硬件更新和集群系统设计(如H100批量部署方案)保持领先[9] - 美国政府限制高端AI芯片对华出口,影响Nvidia中国市场布局[4][11]
特斯拉市值跌破1万亿美元!百度斥资21亿美元收购YY直播业务!微信测试版支持电脑上收红包!DeepSeek重新开放API充值!
新浪财经· 2025-02-26 08:47
特斯拉股价大跌 - 特斯拉股价单日大跌超8% 市值蒸发892亿美元(约合人民币6468亿元) 总市值跌破1万亿美元关口 [2][3][4] - 美股科技股普跌 英伟达、谷歌跌超2% 微软、Meta跌超1% 加密货币及半导体板块领跌 嘉楠科技跌超16% Strategy跌超11% [4] - 特斯拉中国推出城市道路Autopilot功能更新 新增驾驶室摄像头监测 但需额外支付6.4万元购买FSD服务 官方将名称从"完全自动驾驶能力"改为"智能辅助驾驶功能" [4][5] 百度收购YY直播 - 百度以21亿美元收购欢聚集团YY直播业务 此前托管账户16亿美元(约116亿元人民币)已退还 资金拟投入云及AI基础设施 [7][8] 微信功能更新 - 微信Windows 4.0.2测试版支持PC端收取红包 数据与手机端同步 但暂不支持PC端发送红包 [9][10][11] DeepSeek技术动态 - DeepSeek重新开放API充值 R1模型百万tokens输入价格1-4元 输出16元 V3模型输入0.5-2元 输出8元 [12][13][15] - 发布开源EP通信库DeepEP 支持MoE模型训练 具备高效all-to-all通信及NVLink/RDMA特性 [16] 中概股表现 - 纳斯达克中国金龙指数涨0.58% 理想汽车涨逾13% 小鹏汽车涨超5% 阿里巴巴、哔哩哔哩涨近4% [4]
“杭州把深圳整急了”
投资界· 2025-02-24 15:56
深圳科技创新生态 - 深圳推出多项支持科技创新和人才发展的举措 包括大学毕业生免费住宿15天 青年创业最高100万资助 设立100亿人工智能和机器人产业基金 发布人形机器人专项政策 为初创企业提供最高60%算力资助[7] - 深圳已形成"产业集聚"发展格局 拥有华为 腾讯 比亚迪 大疆"四龙头"以及大量中小科技企业 构建了庞大的生态协同网络[10] - 深圳无人机产业链完整 拥有1730家相关企业 年产值960亿元 占据全国市场50%份额 南山区可实现"不出南山造一台无人机"[11] 深圳企业表现 - 深圳民营企业数量达262 3万户 A股上市民营企业286家 市值5 1万亿元 数量和市值均全国第一 拥有886家民营国家专精特新小巨人企业 数量全国第一[12] - 深圳企业成长速度快于全国平均水平 从设立到科创板上市平均13 35年 比全国快1 05年 成长为国家级专精特新小巨人企业需13 25年 比全国快1 71年[12] - 深圳孕育了大量科技企业 包括优必选 晶泰科技 速腾聚创 越疆科技 佑驾创新 傲基科技等 被称为"六小过江龙"[11] 深圳创投环境 - 2024年深圳新增私募股权 创投基金152支 管理规模超1 5万亿元 设立"20+8"千亿产业基金群 百亿级天使母基金和20亿元科技创新种子基金[12] - 2025年深圳将开放100个人工智能和机器人应用场景 设立100亿元人工智能和机器人产业基金[12] 杭州科技新势力 - 杭州以互联网和信息经济模式创新为主 催生了DeepSeek 宇树科技等"六小龙"科技新势力 优势在于数字经济生态和商业模式创新[10] - DeepSeek-R1大模型和宇树科技人形机器人引发全球关注 带动华尔街重估中国科技股[7] 城市创新对比 - 深圳走技术创新路线 以制造业为主导 杭州侧重模式创新 以轻资产高增速为特点 两者代表不同产业路径[10] - 深圳拥有2600余家人工智能企业 6家独角兽 34家机器人上市公司 9家机器人独角兽企业 创新实力依然强劲[11]
英伟达5900亿闪崩与反弹:DeepSeek如何引发AI算力误判?
RockFlow Universe· 2025-02-23 22:45
市场恐慌的本质 - DeepSeek R1模型训练成本仅600万美元,为GPT-4的十分之一,引发市场对算力需求崩溃的担忧 [6] - 实际训练成本可能达3000万美元级别,因隐性支出如数据清洗、算法工程师薪酬等未被计入 [8] - AI算力需求存在"冰山结构",训练需求仅占10%,水下需求包括多模态模型、实时推理等呈指数增长 [8] - 市场误判模型优化降低训练成本的同时,低估了大模型迭代加速带来的长期算力总需求提升 [9] 英伟达反弹驱动力 - 2024Q3数据中心收入同比增长112%至308亿美元,云服务商贡献超50% [11][13] - H200销售额连续增长至数十亿美元,成为公司史上增长最快产品 [11] - Blackwell架构需求超出预期,首批样品引发抢购潮 [12][13] - 2.8亿行CUDA代码构筑的生态壁垒形成行业标准,迁移成本极高 [12] - 系统级解决方案如DGX SuperPOD深度绑定客户基础设施,替代需重构整个技术栈 [12] AI竞赛的"军火商"逻辑 - 头部3家云服务商过去12个月投资1860亿美元扩展算力 [17] - Meta、微软、亚马逊、Alphabet 2024年资本支出预计分别达600-650亿、800亿、1000亿、750亿美元 [17] - "星际之门"项目耗资5000亿美元,甲骨文已确定100个数据中心用于未来开发 [17] - 特斯拉完成50000个H100集群组装,用于自动驾驶和Optimus人形机器人开发 [17] - 各国推动"主权AI能力"建设,进一步刺激英伟达产品需求 [17] 短期催化剂 - 2024Q4财报预计总收入375亿美元,同比增长69.7% [12] - 2024全年收入预计1286.6亿美元,同比增长111% [12] - 3月17日GTC大会将披露GB300、Rubin及机器人等实体AI项目新进展 [18] - 推理市场有望推动英伟达多年增长,公司在推理领域地位稳固 [18]
阿里预计未来资本开支超过去十年总和;瑞幸利润微增,迎接成本挑战;游戏和广告让B站连续两个季度盈利丨百亿美元公司动向
晚点LatePost· 2025-02-21 23:30
阿里AI战略与资本开支 - 阿里集团CEO表示AI是几十年一遇的机会 战略第一目标是实现AGI 可能影响或替代全球50%的GDP构成[1] - 阿里具备亚洲最大云服务和自研AI模型 未来三年云和AI基础设施投入将超3800亿元 为过去十年总和[1] - 阿里股价年初至今上涨49% 财报发布后盘前涨超10%至138.2港元[1] 瑞幸咖啡经营状况 - 瑞幸去年营收增长近40%至344.7亿元 但净利润仅微增至29.3亿元 自营门店同店销售增长率为-16.7%[2] - 四季度配送费用和营销费用同比分别增长79%和43% 部分单品涨价2-3元 9.9元专区仅限基本款[2] B站盈利情况 - B站连续两个季度盈利 四季度调整后净利润4.5亿元 美国会计准则下净利润8900万元[3] - 去年收入268.3亿元 全年亏损13.47亿元但同比减亏72% 游戏和广告业务贡献显著[4] - 四季度日活用户1.03亿 日均观看时长99分钟[4] 苹果新产品发布 - 苹果发布入门机型iPhone 16e 搭载A18处理器和自研5G基带 售价4499元起 支持Apple Intelligence功能[5] AI行业动态 - xAI宣布Grok3模型免费开放 当日登顶美区App Store免费榜[6] - DeepSeek否认融资传闻 此前主要研发资金来自创始人旗下量化交易公司[7] 汽车行业并购与业绩 - 海尔18亿美元收购汽车之家42%股份 成为控股股东[8] - 奔驰2024年息税前利润同比下降30% 在华销量下滑6.7% 计划推出专为中国市场开发的车型[9] 新能源汽车进展 - 尊界S800将于5月底上市 预售价100-150万元 搭载4个激光雷达和800V 6C电池包[10] - 乘联会预计2月乘用车零售125万辆 同比增长13.6% 新能源渗透率预计达48%[11] 黄金珠宝行业 - 老铺黄金预计2024年净利润14-15亿元 同比增长236%-260% 新增7家门店[12] - 产品采用古法工艺 定价1-5万元 全国约40家直营店主要位于一线城市核心商圈[13] 航空制造业 - 空客2023年交付766架商用飞机 净利润42.3亿欧元同比增长12% 波音仅交付348架[14]
月之暗面 MoBA 核心作者自述:一个 “新晋大模型训练师” 的三入思过崖
晚点LatePost· 2025-02-20 22:21
注意力机制优化进展 - Kimi和DeepSeek同日发布注意力机制改进成果MoBA和NSA,均针对Transformer核心组件"注意力机制"进行创新[2] - 标准全注意力机制存在计算复杂度随文本长度平方级增长的问题,成为制约长上下文能力的关键瓶颈[4] - 行业出现两大优化方向:稀疏注意力机制(如NSA/MoBA/InfLLM)和线性注意力机制(如MiniMax-01),前者侧重稳健优化,后者尝试根本性解决计算爆炸问题[5] MoBA技术演进 - 项目始于2023年5月,初始目标为支持16K长度预训练,后升级至128K需求,经历v0.5到v2三次架构迭代[6][12][16] - 关键技术突破包括:采用Online Softmax实现与全注意力机制的可对照调试、解决注意力汇聚点问题、最终形成极简单层稀疏注意力结构[13][16] - 在1M长度测试中达到与全注意力机制持平的性能指标,已部署至Kimi生产环境[20] 行业竞争格局 - 中国头部AI公司密集发布注意力机制创新:MiniMax-01采用线性注意力,面壁智能InfLLM被NSA论文引用[5] - 微软亚研院专家指出稀疏注意力与线性注意力的本质差异:前者保留复杂依赖关系捕捉能力,后者可能牺牲部分长程关联性[5] - 清华大学团队证实NSA和MoBA均采用动态注意力选择机制,相比静态方法显著提升模型性能[5] 工程实现细节 - MoBA开源代码已在GitHub发布,包含完整工程实现与技术论文,实际经过1年多线上验证[6][25] - 解码阶段对MHA效果最佳(IO优化达理论最大值),但对GQA/MQA效果递减[22] - Triton实现版本曾获得10%+性能提升,但因维护成本过高暂未持续优化[24] 研发方法论 - 采用"饱和救援"模式推进技术攻坚,整合跨团队资源进行多轮消融实验[15][19] - 通过"思过崖"机制实现快速试错与迭代,三次关键架构调整分别解决参数膨胀、训练不稳定和SFT效率问题[8][13][19] - 最终方案保留数学严谨性(支持全注意力模式对照)与工程实用性(单机/分布式兼容)的双重优势[16][20]
宏观点评:民企座谈会释放积极信号-20250319
五矿证券· 2025-02-20 07:30
报告行业投资评级 未提及 报告的核心观点 - 2025 年 2 月 17 日习近平总书记出席民营企业座谈会并讲话,此次会议在外部压力增长初期召开,给民企吃下“定心丸”,有利于化解关税及科技装备竞争冲击,可能出台的政策会延展党的二十届三中全会第五条,规范公平、法制,解决融资难等问题,还应关注《民营经济促进法》及各地民企座谈会 [2][7] - 会议释放肯定民营企业作用和破除发展障碍两个信号,让企业平稳经营专注主业 [2][12] - 此次会议列席企业与 2018 年有较大差别,原因包括企业头部更替、与“十四五”十大重点领域契合、DeepSeek 释放积极信号等 [3][8] 各部分总结 事件描述 - 2025 年 2 月 17 日,习近平总书记在京出席民营企业座谈会并发表重要讲话 [1] 事件点评 - 会议召开背景为“贸易摩擦 2.0”、全球 AI 竞赛激烈、“十四五”收官、宏观经济信心偏弱,目的是给民企吃“定心丸”,此次在外部压力初期,利于化解后续冲击 [2][7] - 可能出台的政策方向是延展党的二十届三中全会第五条,规范公平、法制,解决融资难等历史问题,还需关注《民营经济促进法》及各地民企座谈会 [2][7] - 会议强调“党的基本方针政策不会变”“两个毫不动摇”,释放肯定民营企业作用和破除发展障碍两个信号 [2] 历史回顾 - 历史上出现过三次较高规格稳民营经济支持政策,分别是 2005 年“非公 36 条”、2010 年“新 36 条”、2018 年“28 条”,对应不同历史背景 [3][7] - 2025 年与 2018 年参会企业有较大差别,原因包括企业头部更替、与“十四五”十大重点领域契合、DeepSeek 释放积极信号 [3][8] 民生 + 科技 - 2025 年参会民企覆盖“十四五”十大重点领域,目的是推动中国制造业转型升级,列席名单与“十四五”涉及行业契合 [8] - 参会企业既有传统赛道企业,也有新兴领域巨头和新秀,民生 + 科技组合更均衡,符合大国战略,科技赋能传统行业是产业调整升级关键 [11] 新质生产力 - 新质生产力是推动中国式现代化关键,提升全要素生产率依赖技术进步迭代,会议背景下需突围贸易壁垒,可转向“南方国家”出口和提升全要素生产率 [12] - 民营企业在各行业竞争前沿推动技术进步,参会代表实现国内研发 - 制造全流程,降低对外依存度,DeepSeek 提振企业信心 [12]