DeepSeek V4模型
搜索文档
DeepSeek,突曝大消息
第一财经· 2026-04-22 22:00
融资动态与估值 - 腾讯与阿里巴巴正在洽谈投资DeepSeek,这是该公司成立以来的首次外部融资,标志着其创始人长期“不引入外部资金”立场的重大转变 [2] - DeepSeek的目标估值已从最初的至少100亿美元上调至逾200亿美元(约合人民币1365亿元),融资规模亦可能随之扩大 [2] - DeepSeek将中国AI初创公司月之暗面作为部分估值参照基准,后者正以180亿美元估值完成新一轮融资 [3] 市场竞争与行业格局 - 与DeepSeek同属大模型赛道的智谱和MiniMax均于今年1月在港股上市,目前智谱估值已超过500亿美元,MiniMax也超过300亿美元 [3] - 截至4月22日收盘,智谱的总市值达到4396亿港元,MiniMax亦高达2911亿港元 [3] - 相比一年前,DeepSeek所处的市场竞争更加激烈,模型迭代更快、训练和运营成本更高,中美两地资金雄厚的科技巨头不断加码竞争 [2] 公司业务与战略 - DeepSeek长期以来更接近一家致力于开源技术的AI实验室,而非以盈利为导向的商业公司,与MiniMax和智谱不同 [3] - DeepSeek迄今尚未产生可观收入,其模型全部开源,面向消费者的聊天机器人亦免费使用 [3] - 外部资本的注入,将直接为DeepSeek提供采购算力与稳定人才队伍所需的财力储备 [4] 技术进展与产品规划 - DeepSeek官方API正式升级至支持100万tokens上下文,较原128k大幅提升 [4] - 这一更新恰好发生在DeepSeek新一代旗舰大模型V4发布前夕,此前有消息称,DeepSeek V4将于4月下旬正式发布 [4] - 在产品研发层面,DeepSeek原计划于今年2月发布下一代旗舰模型V4,但该时间线因工程挑战已多次推迟 [4] 市场影响与潜在合作 - 分析认为,腾讯、阿里巴巴入股DeepSeek,既能在双方持续推进自研AI模型之际对冲风险,又能为与DeepSeek的深度合作打开直接通道 [4] - 受投资洽谈消息影响,阿里巴巴美股盘前股价直线拉升,一度大涨超2% [2][4]
估值超680亿!投资人疯抢梁文锋
商业洞察· 2026-04-21 17:21
文章核心观点 - 长期坚持“不差钱、不融资”的DeepSeek创始人梁文锋,据传正寻求首轮外部融资,估值超过100亿美元(约682亿人民币),计划募资至少3亿美元(约20亿人民币)[1] - 此次融资传闻标志着公司战略的重大转变,其背后驱动因素包括:大模型竞赛的巨额资金需求、激烈的人才竞争与保留压力,以及向国产化算力平台进行战略迁移的宏大计划[13][15][16][19] - 此次融资被视为一次“战略定价”,旨在以极小股权稀释(约3%)完成公司价值锚定、员工期权定价及引入战略资源,为下一阶段的竞争储备关键“燃料”[22][23] 融资传闻与市场反应 - 外媒The Information报道DeepSeek正寻求首轮外部融资,估值超100亿美元,计划募资至少3亿美元[1] - 消息引发投资圈强烈关注,投资人目标高度一致,希望借此机会见到创始人梁文锋[3] - 在过去一年多,接触梁文锋是中国VC圈“可望不可及的目标”,多家顶级投资机构均被婉拒[5][8][10] 创始人过往立场与公司背景 - 创始人梁文锋坚持“不差钱、不融资”,其资金来源于母公司“幻方量化”这一“超级印钞机”[10] - 公司定位为专注于AGI(通用人工智能)研究,不做应用,以避免被外部投资者的KPI和商业化压力绑架[11] - 2025年,母公司幻方量化平均收益率高达56.6%,管理规模超700亿,当年可能为梁文锋带来超过7亿美元的收入[14] 融资动因分析 - **算力竞赛成本飙升**:大模型竞赛烧钱速度惊人,阿里巴巴宣布未来三年投入3800亿,字节跳动2025年资本开支计划1500亿,OpenAI融资400亿美元[15] - **公司面临更高算力成本**:由于在模型结构等方面与海外顶尖水平存在差距,达到同等效果可能需要付出4倍的算力代价[15] - **人才竞争与流失压力**:对手以“薪资包翻倍甚至更多”进行挖角,公司核心研究员等重要贡献者被小米、字节跳动等大厂挖走[16][17] - **员工期权缺乏流动性**:公司不融资、不上市,员工期权在市场上没有定价,缺乏流动性,在对手提供的“真金白银”面前吸引力不足[17] - **战略转向的巨额投入**:下一代模型V4跳票的核心原因是进行“换心手术”,即放弃英伟达CUDA生态,全面转向华为昇腾芯片和CANN框架,此迁移工程浩大,需巨额资金支撑[19] 融资的战略意义与估值分析 - **融资性质**:此次融资更像是一次“战略定价”,而非“缺钱求生”[22] - **战略目的**: - 给公司定价:使公司价值被市场确认,从母公司的“成本中心”转变为价值百亿美元的独角兽[23] - 给人才定价:为员工期权提供明确的市场价值锚,利于留住和吸引顶尖人才[23] - 引入战略资源:引入的不仅是资金,还可能包括算力协同、政策关系或关键客户渠道[23] - **估值水平分析**:100亿美元估值在当下市场显得“克制”甚至“低调”[24] - 对比公司:智谱、MiniMax港股市值在4000亿港元(约500亿美元)量级;月之暗面估值180亿美元;OpenAI估值8520亿美元[24] - 胡润去年给DeepSeek的估值高达1.05万亿人民币(约1450亿美元)[24] - **股权稀释**:融资3亿美元对应100亿美元估值,股权稀释比例约为3%[23] 行业竞争态势 - 人工智能竞争已升级为综合算力、资本、人才、生态乃至地缘政治的“超级国家战役”[24] - 英伟达CEO黄仁勋评论称,若DeepSeek成功基于华为平台优化出顶级模型,对美国将是“一个糟糕的结果”,凸显了地缘政治与技术生态竞争的维度[19] - 对手在人才激励上力度极大,如字节跳动启动“豆包股”回购,价格比授予时涨30%,并承诺部分技术人员四年后收益可能达到数亿元[18]
抛弃英伟达!DeepSeek全面转投华为,黄仁勋直呼“非常可怕”
新浪财经· 2026-04-21 11:33
核心观点 - DeepSeek即将发布的V4模型将全面转向华为昇腾AI芯片及CANN生态,标志着中国AI产业在硬件和软件层面开始与英伟达脱钩[2] - 这一转变被英伟达CEO黄仁勋评价为“非常可怕”,可能动摇英伟达在AI产业的核心地位[3] - 此举可能引发其他中国AI企业效仿,从而对美国在AI领域的长期竞争力构成挑战[4] 行业动态与竞争格局 - 过去几年,全球AI大模型(包括美国的GPT、Claude及国内许多模型)的核心训练和部署高度依赖英伟达的GPU和CUDA生态[3] - 英伟达在AI产业中扮演“卖铲子的人”的角色,无论前端竞争如何,其都处于有利的盈利地位[4] - 中国拥有全球最多的AI人才,且AI芯片发展迅速,为构建独立生态提供了基础[4] - 美国芯片在AI领域看似坚固的护城河已被打开缺口,且这一缺口预计将持续扩大[5] 公司战略与行动 - DeepSeek作为国内代表性AI大模型公司,其转向华为生态的举措,被认为是在履行从底层算力到模型层的全栈国产适配的社会责任[5] - 公司与华为的合作意味着不再购买英伟达的“铲子”,即不再使用其芯片和CUDA生态[2][4] - 公司的这一行动是构建独立于美国的中国AI生态的关键一步[4]
新车上市降价18万元被骂惨!莲花CEO回应降价背刺老车主;三只羊否认借壳美股上市:仅为海外直播运营业务合作;字节估值飙升至5500亿美元
雷峰网· 2026-02-27 08:34
汽车行业动态 - 莲花汽车两款新车大幅降价,ELETRE起售价从72.8万元降至54.8万元,降价18万元,EMEYA起售价从66.8万元降至52.8万元,降价14万元,引发老车主不满[4]。公司CEO承认降价伤害品牌和老用户,并反思最初定价过高,若重新选择会以更合适价格上市[4][5]。 - 斯泰兰蒂斯集团2025年净亏损223亿欧元(约合人民币1801亿元),为集团成立以来首次年度亏损,核心源于254亿欧元的战略调整特殊支出[40]。集团纯电车型毛利率低至-2.7%,并已叫停部分纯电项目[40]。全年销量541.7万辆,位居全球第四[40]。 - 蔚来宣布其芯片子公司安徽神玑完成首轮超22亿元人民币融资,投后估值近百亿[27]。其自研的5nm车规芯片“神玑NX9031”已累计出货超15万套,部署于蔚来全系车型[27]。 - 自动驾驶公司九识智能完成新一轮超3亿美元融资,投后估值超百亿人民币,成为该领域独角兽[28]。其RoboVan车队总规模超2万台,覆盖全球超300座城市,据称能帮助客户降低约50%的末端配送成本[28]。 - 广汽集团孵化成立具身智能机器人公司慧仑科技,计划于2027年实现人形机器人规模化量产[33][34]。 - 博世确认最迟2028年底关停德国魏布林根工厂,涉及约560个岗位,产能将部分转移至中国、泰国等亚洲基地[41]。此前,博世中国已启动裁员,涉及近200人[43]。 人工智能与芯片 - DeepSeek已向华为等国内硬件供应商提供其V4大模型进行测试优化,但未向英伟达和AMD提供[8][9]。此举打破了行业惯例,旨在优先优化国产AI硬件[9]。 - 为旌科技完成新一轮3亿元融资,专注于端侧AI芯片设计[24]。其海山系列芯片已在行业头部客户实现规模量产,获得千万级订单[25]。 - 苹果在NAND闪存供应链的议价优势受AI冲击,与铠侠的采购合同从多年一签缩短为每六个月重新谈判,且支付价格已达此前水平的两倍[47]。调研机构估计2026年全球AI支出将高达2.5万亿美元[48]。 - 前Meta华人AI科学家庞若鸣跳槽至OpenAI,其在Meta的薪酬方案总价值超2亿美元(约14亿元人民币)[37]。 - 关于太空数据中心,英伟达CEO黄仁勋指出太空散热需依靠巨大散热板,但承认有许多运算适合在太空处理,公司已有GPU在太空运行[45]。马斯克则认为太空是解决AI电力需求的终极答案,预言36个月内太空会成为部署AI最便宜的去处[45][46]。 消费电子与手机 - 中国手机行业或将迎来全面涨价潮,3月后发布的新品最低涨幅不低于1000元,中高端机型涨幅可能达2000-3000元[18]。小米高管表示涨价源于上游内存/芯片价格暴涨,是“被动价格上调”[18]。 - 努比亚总裁倪飞点评三星Galaxy S26系列AI功能,称其仅实现了努比亚豆包手机的局部能力,豆包手机已实现系统级全场景AI智能体应用[16][17]。 - 魅族官网手机产品全部显示“补货中”或“售罄”,包括2025年9月发布的旗舰机型魅族22[29]。公司曾提出“三年内重回国内中高端市场前五”的目标,目前期限已至[30]。 - 苹果CEO库克预热春季新品发布会,预计将发布iPhone 17e、低价MacBook等产品[48]。低价MacBook国行价格或下探至4000元档位,首次搭载A系列芯片[49]。 互联网与科技公司 - 字节跳动最新估值在股权交易中飙升至约5500亿美元,较去年股票回购时的估值(超3300亿美元)增长约66%[11]。公司2025年年度利润有望达到约480亿美元[11]。 - 三只羊集团发布声明,否认“借壳美股上市”传闻,称仅为海外直播运营业务合作[12][13]。相关美股公司Rich Sparkle收购了三只羊持股13%的合资公司Step Distinctive,后者估值9.75亿美元[13]。 - 百度发布2025年财报,全年总营收1291亿元,AI业务营收达400亿元[20]。第四季度AI业务收入占一般性业务收入的43%[20]。 - 小红书被传调整商业化和电商团队架构,涉及销售和行业运营团队,官方暂无回应[20]。 - 京东上线“百亿超市”频道,计划未来3年投入超200亿元商品补贴[32]。此外,京东创新零售事业群被调整至京东零售旗下[33]。 企业财报与融资 - 携程集团2025年第四季度净营业收入154亿元,同比上升21%;全年净营业收入624亿元,同比上升17%[26]。 - 前阿里高管、新奥总裁任庚已于近期离职,其在新奥任职仅一年[14]。 - 惠科股份IPO将于3月3日上会,拟募资85亿元[55]。公司2025年实现营业收入约408.71亿元,同比增长1.46%[55]。 - 电子级多晶硅龙头鑫华科技科创板IPO获受理,拟募资13.2亿元[53]。公司2024年在国内集成电路用高纯电子级多晶硅市场占有率超50%[53]。 - 锦欣康养向港交所递交上市申请,2025年前九个月收入5.47亿元,在中国机构养老服务行业排名第一[56]。 - 天辰生物、汉方制药均向港交所递交上市申请[57][58]。汉方制药2025年前九个月营收8.03亿元[58]。
“打破行业惯例,DeepSeek没让英伟达和AMD先测试优化”
新浪财经· 2026-02-26 14:21
公司动态 - 深度求索公司计划在农历新年前后推出下一代旗舰模型V4 [3] - 在发布V4模型前,公司打破行业惯例,未向英伟达和超威半导体提供模型早期访问权限,转而让华为等中国芯片制造商提前数周进行软件适配和处理器优化工作 [1] - 公司模型在开源平台Hugging Face上的下载量已超过7500万次 [3] 行业竞争与地缘政治 - 深度求索的崛起推动了中国开源模型与美国AI实验室竞争的浪潮 [3] - 在Hugging Face平台过去一年发布的模型中,中国模型的下载量超过了其他所有国家 [3] - 中国开源模型的迅速崛起,显著加剧了华盛顿在对华出口美国先进AI芯片问题上的焦虑 [3] - 有分析揣测,深度求索的举动可能是中国政府更广泛战略的一部分,目的是让美国硬件与模型在华竞争中处于劣势 [1] 美国芯片出口管制 - 美国特朗普政府高级官员炒作称,深度求索的AI模型使用了英伟达最先进的AI芯片进行训练,此举可能违反美国出口管制 [3] - 由于美方相关流程中设置的管控限制,美国先进AI芯片的对华出货目前仍处于停滞状态 [5] - 去年12月8日,美国总统特朗普宣布将允许英伟达对华出口其H200芯片,但附带保障美国国家安全及美国政府获得25%分成等条件 [5] - 两个月后,美国政府仍在进行国家安全审查,H200对华销售的许可证尚未发放,最终审批悬而未决 [6] - 美国商务部今年1月发布新规放宽H200芯片对华出口限制,但要求国务院、国防部、能源部联合审查所有许可证申请 [6] - 美国国务院坚持推动更严格限制,声称要降低中国利用H200芯片损害美国国家安全的风险 [6] - 在特朗普政府批准对华出口AI芯片两个月以来,英伟达尚未向中国售出任何H200芯片 [6][7] 产业链影响 - 英伟达在获准对华出口H200芯片的消息后,曾要求供应链增产该芯片,预判中国客户需求旺盛 [6] - 在许可条件不明朗前,中国客户未向英伟达下达H200芯片订单,部分供应商也已暂停生产该芯片的关键组件 [6]
野村控股薪酬调整与业务整合,股价近期上涨
经济观察网· 2026-02-13 02:08
公司近期战略举措 - 国内券商业务部门计划从2026年4月起将员工薪酬提高5%以上,以吸引和保留人才 [1] - 公司任命了新的亚洲及亚太区股票业务负责人,以加速全球股票业务的整合 [1] - 公司已完成对麦格理集团旗下美国和欧洲公共资产管理业务的收购,旨在加强财富管理、资产管理及交易撮合等核心业务 [1] 公司股票近期表现 - 截至2026年2月11日,野村控股股价收于9.42美元,单日上涨0.64%,近5日累计上涨7.05%,年初至今涨幅达12.28% [2] - 成交额为13.14百万美元,换手率0.05%,市盈率为12.50倍,股息率4.24% [2] - 股价波动受全球资本市场板块调整及公司特定事件驱动,流动性保持稳定 [2] 机构研究观点 - 野村证券报告预计,2026年2月中旬推出的DeepSeek V4模型不会重现去年V3发布时引发的全球AI算力需求恐慌 [3] - 报告认为DeepSeek V4的核心价值在于通过底层架构创新推动AI应用商业化落地 [3] - 国际投行研报汇总显示野村近期聚焦万国数据等标的,强调业务扩张与风险控制平衡 [3]
野村控股宣布加薪及业务整合,股价年内涨幅超12%
经济观察网· 2026-02-12 05:36
公司战略举措 - 计划从2026年4月起将国内券商部门员工薪酬提高5%以上,以吸引人才 [1] - 任命新的亚洲及亚太区股票业务负责人,旨在加速全球业务整合 [1] - 已完成对麦格理集团旗下部分欧美公共资产管理业务的收购,旨在加强财富管理等核心业务 [1] 股价与市场表现 - 截至2026年2月11日,野村控股股价收于9.42美元,单日上涨0.64% [2] - 近5日累计上涨7.05%,年初至今涨幅达12.28% [2] - 成交额为13.14百万美元,市盈率为12.50倍 [2] 机构研究与行业观点 - 野村证券报告指出,预计即将推出的DeepSeek V4模型的核心价值在于推动AI应用商业化落地,而非引发算力需求恐慌 [3] - 野村近期研报聚焦部分标的,强调业务扩张与风险控制的平衡 [3]
DeepSeek新模型来了?
华尔街见闻· 2026-02-11 19:21
DeepSeek V4模型技术升级与市场影响 - 公司正在推进新版本模型的灰度测试 这可能是V4正式亮相前的终极灰度版[1] - 新版本模型上下文长度从128K扩展至1M 接近提升10倍 知识库更新至2025年5月[1] - 新版本在复杂任务处理能力上已对齐Gemini 3 Pro及K2.5等主流闭源模型[2] - 内部初步测试显示 V4在编程任务中的表现已超越Anthropic Claude及OpenAI GPT系列同代模型[2] V4模型核心技术架构创新 - V4预计将引入mHC与Engram两项创新技术 从算法与工程层面突破算力芯片与内存瓶颈[2] - mHC全称为“流形约束超连接” 旨在解决Transformer模型在层数极深时信息流动的瓶颈和训练不稳定的问题[3][4] - Engram是一个“条件记忆”模块 设计理念是将“记忆”与“计算”解耦 静态知识被专门存储在可置于廉价DRAM的稀疏内存表中[6] - mHC技术通过改善训练稳定性和收敛效率 对冲国产芯片在互联带宽与计算密度上的代际差距[8] - Engram架构致力于重构内存调度机制 在HBM供应受限的背景下 以更高效的存取策略突破显存容量与带宽制约[8] V4模型对行业成本与竞争格局的影响 - 此次发布的关键意义在于进一步压缩训练与推理成本 为全球大语言模型及AI应用企业缓解资本开支压力提供可行路径[2] - 成本端的优化将有效激发下游应用需求 进而催生新一轮AI基础设施建设周期[8] - 在2024年底 DeepSeek的两个模型曾占据OpenRouter上开源模型Token使用量的一半以上[9] - 到2025年下半年 随着更多玩家加入 其市场份额已显著下降 市场从“一家独大”走向了“群雄割据”[11] 对下游应用与软件行业的潜在机遇 - 更强大、更高效的V4将催生更强大的AI智能体 AI智能体正从“对话工具”转型为能处理复杂任务的“AI助手”[12] - 能执行多任务的智能体需要更频繁地与底层大模型交互 将消耗更多Token 进而推高算力需求[12] - 模型效能的提升为领先的软件公司创造了价值 需要关注那些能率先利用新一代大模型能力打造出颠覆性AI原生应用或智能体的软件公司[12]
下周资本市场大事提醒:美国通胀、非农数据连环发布 中芯、网易等财报将亮相 国产AI大模型扎堆上新
新浪财经· 2026-02-08 21:27
宏观经济数据发布日程 - 中国方面,央行将于2月11日公布1月CPI和PPI数据,国家统计局将于2月13日公布1月商品住宅销售价格指数月度报告,并于2月14日发布流通领域重要生产资料市场价格变动情况,此外1月社融及新增人民币贷款等金融数据也将在下周公布 [1][8] - 海外方面,美国12月零售销售月率将于2月10日公布,美国1月失业率及非农就业人口数据将于2月11日公布,英国第四季度GDP和美国1月PPI将于2月12日公布,欧元区第四季度GDP和美国1月CPI将于2月13日公布 [1][8] 全球企业财报发布日程 - 美股财报季持续,2月10日将有英国石油、巴克莱银行、万豪酒店、可口可乐、阿斯利康、福特汽车、Lyft、吉利德科学发布业绩,2月11日有网易、有道、道达尔、Shopify、思科发布,2月12日有猫途鹰、凯悦酒店、应用材料、淡水河谷、Coinbase、Rivian发布,2月13日有Moderna发布 [2][9] - 港股财报方面,中芯国际将于2月10日发布业绩,百威亚太和网易云音乐将于2月11日发布,华虹半导体和联想集团将于2月12日发布,金沙中国和东亚银行将于2月13日发布 [2][9] 资本市场活动 - 下周A股市场将有33只限售股解禁,按最新收盘价计算,解禁总市值超过360亿元,解禁市值前三名为湖南裕能(240.96亿元)、甘肃能化(40.08亿元)和麦澜德(27.44亿元) [3][10] - 下周央行公开市场将有4055亿元逆回购到期,其中周一至周五分别到期750亿元、1055亿元、750亿元、1185亿元、315亿元,此外周五还将有5000亿元182天期买断式逆回购到期 [3][10] - 财政部将于2月11日在香港发行2026年第一期人民币国债,发行规模为140亿元 [6][13] - 下周A股有1只新股发行,通宝光电于2月9日申购,爱得科技于2月10日在北交所上市,港股方面,澜起科技2月9日上市,爱芯元智和乐欣户外2月10日上市,先导智能2月11日上市,海致科技集团和沃尔核材2月13日上市 [2][9] 行业与公司动态 - 恒生指数公司将于2月13日宣布2025年第四季度恒生指数系列检讨结果 [5][12] - 特斯拉CEO马斯克宣布,自2月14日起全球市场将停止销售FSD(完全自动驾驶能力)一次性买断版,该功能此后仅以月度订阅形式提供 [5][12] - 海南全省首批在海口、三亚、儋州三个地级市共开设5家日用消费品免税店,各店定于2月11日南方小年开业 [6][13] - 2026年春节档(2月15日至2月23日)将有8部影片上映,包括《飞驰人生3》《惊蛰无声》等 [5][12] 科技与地缘政治 - 人工智能领域,DeepSeek据称计划于2月中旬农历新年前后推出V4模型,字节跳动与阿里巴巴也计划在春节前后分别发布豆包2.0与通义千问3.5模型 [4][11] - 地缘政治方面,美国总统特朗普表示下周早些时候将再次与伊朗谈判,并重申伊朗不能拥有核武器 [4][11]
未知机构:据知情人士透露DeepSeek对其计划保持沉默预计不会像去年那样发布重大更新-20260203
未知机构· 2026-02-03 10:00
纪要涉及的公司 * DeepSeek [1] 核心观点与论据 * 公司下一代旗舰模型V4预计将是万亿参数级基础模型 [1] * 模型规模的急剧膨胀拖慢了训练进度并导致发布时间推迟 [1] * 公司预计不会像去年那样发布重大更新 [1] * 公司可能会对其V3模型系列进行小幅更新 [1] * 公司对其计划保持沉默 [1]