DeepSeek

搜索文档
日本为什么没能诞生DeepSeek?
日经中文网· 2025-04-12 08:10
DeepSeek的标志 科大讯飞前副总裁白强指出,在竞争激烈的中国社会,许多年轻人为了成为像马云一样的成功企 业家,正在废寝忘食地投入技术开发和创业。另一方面,日本生活舒适,竞争也不像过去那样激 烈…… 2025年1月,中国初创企业DeepSeek发布了高性能低成本的生成式AI大语言模型(LLM),震惊 了世界。在日本,这些尖端领域的强大初创企业也备受期待。 培育DeepSeek这样有力企业的对策和课题是什么?中国智能语音和人工智能企业科大讯飞前 副总裁白强分析称,DeepSeek如彗星般出现的背景是中国政府改革开放政策的成果。 这是中国改革开放的成果 白强是在美国和中国创办网络服务企业并使之上市的"连续创业者"。目前,他以东京为基地, 在全球范围内从事AI领域的投资和创业支援。 科大讯飞前副总裁白 白强说,在竞争激烈的中国社会,许多年轻人为了成为像阿里巴巴创始人马云一样的成功企 业家,正在废寝忘食地投入技术开发和创业。 另一方面,日本生活舒适,竞争也不像过去那样激烈。白强指出,想要成为软银集团孙正义 一样的创业者的年轻人很少。他表示,IT人才的不足也是无法诞生DeepSeek这样的企业的原 因之一。 "在A ...
AI原生浪潮冲击下,互联网大厂的组织如何进化?
36氪· 2025-04-11 18:20
AI原生组织的崛起 - AI原生组织(AI Native)将AI内化为产品、服务和业务流程的核心驱动力,而非功能附加 [2] - 核心技术均为自研模型(如OpenAI的GPT、DeepSeek的MoE架构),技术迭代速度远超传统企业,OpenAI从GPT-3到GPT-4仅用两年,研发投入占比高达90%以上 [2] - 产品设计天然依赖AI能力,无法脱离AI独立存在,如Midjourney的生成式图像、Character.AI的角色人格化交互 [3] AI原生组织的核心特征 - 技术原生性:自研模型快速迭代,OpenAI单次训练GPT-4成本超1亿美元,DeepSeek MoE架构将参数价值挖掘效率提升300% [4] - 组织液态化:扁平化、自组织结构,DeepSeek科研背景员工占比超80%,通过"影子组织"打破部门墙 [5] - 极客文化与创始人凝聚力:如OpenAI的Altman与DeepSeek的梁文锋以技术远见凝聚顶尖人才 [6] 互联网大厂的挑战 - 大模型开发落后于AI原生组织,大厂虽资源丰富但缺乏领军人才和极致技术追求 [9] - 用户时间争夺战:AI原生APP月活跃用户突破1.2亿,月人均使用时长133分钟,AIGC领域MAU同比增长244.7% [10] - 智能体领域落后:大厂智能体多局限于垂类场景,消费端突破力不足,如阿里钉钉的AI工单系统 [11] 大厂的应对策略 - 数据深化:将数据规模优势转化为智能优势,如DeepSeek重视数据标注,Grok3受益于SpaceX知识库 [16] - 模型竞合:采用合作与自研双轨策略,如微软130亿美元投资OpenAI并成为其独家云服务提供商 [18] - 组织变革:字节设立虚拟小组提升敏捷性,腾讯调整产品线至CSIG,阿里三年投入3800亿元建设AI基础设施 [19][21][22] 组织效率对比 - 决策周期:大厂需周/月级审批,AI原生组织为分钟级数据驱动 [17] - 创新速度:大厂以周/季为单位迭代,AI原生组织以天为单位微调模型 [17] - 人才结构:大厂支持人员占比高,AI原生组织科学家与技术人员密度高 [17] 未来趋势 - "模型-数据-智能体"解构传统互联网公司的"数据-算法-流量"铁三角 [27] - 组织学习速度成为决胜要素,需快速将技术突破转化为商业闭环 [27] - 大厂面临基因突变挑战,如字节用AI-native人才替代搜推广背景人员 [26]
Semiconductors Leading Nasdaq's Bounce-Back: ETFs in Focus
ZACKS· 2025-04-11 01:45
文章核心观点 美国股市受关税政策影响先跌后涨,半导体股票在市场反弹中表现突出,AI领域竞争加剧,虽存在一些问题但半导体行业仍有投资机会 [1][2][14] 关税政策对股市的影响 - 特朗普宣布对所有美国贸易伙伴征收10%关税,引发美国股市大跌,关键股指出现回调和熊市 [1] - 特朗普宣布将多数国家关税临时降至10%,为期90天,引发美国市场历史性上涨 [2] - 关税下调后,标普500指数单日涨幅超9%,道指创2020年3月以来最大百分比涨幅,纳斯达克综合指数创2001年1月以来最佳单日表现 [3] 半导体股票表现 - 4月9日纳斯达克100指数成分股几乎全部上涨,半导体股票表现突出,该指数前八名中有六只为半导体股票 [4] - 4月9日VanEck半导体ETF上涨17.2%,多只芯片股涨幅超20%,如微芯科技涨27.1%、安谋控股涨24.8%等 [4][5] AI领域竞争情况 - 许多公司展示AI产品路线图,有助于芯片股表现,OpenAI新一轮融资400亿美元,对基础设施AI股票是积极进展 [6] - 各公司AI模型竞争激烈,OpenAI宣布GPT - 5将在几个月后推出,Meta发布Llama 4 AI模型,谷歌、Anthropic、xAI、DeepSeek等也有相关动作 [7][8][9] - 中美在AI领域的竞争值得关注,DeepSeek的发展受瞩目 [10] 英伟达情况 - 英伟达是AI股市领先的半导体公司,但其股票在2025年下跌17%,扩大下一代AI芯片生产面临利润率压力 [11] 行业面临的问题 - 2025年投资者对数据中心基础设施股票兴趣降温,AI股票受更严格审查,市场关注投资与创收差距 [13] - 美国收紧对中国半导体出口限制,针对高性能芯片 [13] 投资建议 - 尽管存在痛点,但AI领域发展使半导体行业保持活跃,估值调整是利好,持续市场复苏时投资半导体ETF可能获利 [14]
云大厂卖DeepSeek服务,不得不直面五大拷问
雷峰网· 2025-04-10 18:37
核心观点 - DeepSeek开源大模型引发市场热潮,但云大厂面临商业转化、技术适配和组织调整等多重挑战 [2][3][6][8][11][13] - 国产芯片适配DeepSeek存在技术代差和生态壁垒,信创需求加剧定制化成本 [6][7][18] - 云大厂盈利计划因DeepSeek相关投入延迟,行业重回烧钱竞赛 [11][12][14] 行业动态 DeepSeek市场反响 - 政企客户咨询量激增,但实际成交率不足1%,存在样机占用和回款问题 [3][4] - 云大厂分化为两派:阿里/火山/华为/百度推出一体机方案,腾讯云暂未跟进 [3] - 一体机被质疑为伪需求,客户业务扩展灵活性和模型兼容性存疑 [3] 技术适配困境 - 国产芯片算力密度和显存带宽落后英伟达H800,导致推理效率下降 [6] - 软件生态上需重构CUDA工具链,定制化开发成本高且周期长 [6][7] - 政企私有化部署需求中,90%案例为利用闲置算力,满血版微调成本过高 [7] 公司战略调整 组织架构变革 - **B/C分离模式**:百度将网盘C端划归MEG,阿里拆分通义AI应用至智能信息事业群 [9] - **B/C融合模式**:腾讯将元宝、QQ浏览器等C端产品并入CSIG,强化云与大模型协同 [9] 财务影响 - 阿里云宣布未来三年追加3800亿AI/云投入,腾讯云原定2025年盈利目标或推迟 [11] - DeepSeek服务成烧钱业务,MaaS厂商月亏可达4亿,云大厂难以维持"卖水人"角色 [13][14] 技术经济性 - DeepSeek凭借工程优化实现545%成本利润率,H800集群吞吐达14800 token/s,效率领先同业10倍以上 [13] - 行业面临双重压力:API调用量激增与价格战升级,亏损短期内难以缓解 [13][15]
事关芯片,新加坡警告
半导体芯闻· 2025-04-10 18:10
新加坡的警告称,"从事非法行为可能导致法律、运营和声誉后果",当局将对"通过欺诈或不诚实 行为逃避出口管制"的公司或个人采取行动。 如果您希望可以时常见面,欢迎标星收藏哦~ 来源:内容 编译自 worldecr ,谢谢。 根据新加坡海关和贸易与工业部发布的联合警告,新加坡向企业发出强烈警告,禁止利用新加坡规 避其他国家对先进半导体和人工智能技术的出口管制。 4月4日的通知发布之际,人们越来越担心受限半导体技术通过东南亚第三国转移到中国,最近的 调查突显了新加坡和马来西亚在潜在出口管制违规行为中所扮演的角色。 警告指出:"新加坡政府绝不容忍企业故意利用与新加坡的关系规避或违反其他国家的出口管制。 这适用于我们所有的贸易伙伴。" 虽然新加坡的出口管制制度主要与多边出口管制制度和联合国安理会制裁相一致,但该咨询报告特 别承认,近年来"一些国家对先进半导体、半导体制造设备和铝相关技术实施了单方面出口管制"。 前所未有的警告级别表明新加坡对近期出口管制违规行为的敏感度。2月底,新加坡指控三名男子 涉嫌欺诈,据称这些案件与英伟达受限人工智能芯片的运输有关。据新加坡司法部长兼内政部长尚 穆根称,据称装有英伟达受限芯片的服务 ...
【热点评述】多车企接入DeepSeek,以AI为核心的智能化竞争加剧
乘联分会· 2025-04-10 16:31
点 击 蓝 字 关 注 我 们 本文全文共 1322 字,阅读全文约需 4 分钟 近期,DeepSeek大火,电信、云计算、芯片、金融、汽车、手机等多领域已有超过200家头部企业宣布接 入DeepSeek。聚焦汽车行业,吉利、岚图、智己、长城、广汽、长安、奇瑞等20多个车企纷纷宣布与 DeepSeek深度融合,标志着汽车智能化进程的加速。 DeepSeek介绍 近期,DeepSeek接连发布开源大语言模型DeepSeek-V3、推理模型DeepSeek-R1,凭借低成本、高性能、 开源等特性在全球范围内迅速爆火出圈,国内外众多企业纷纷宣布接入DeepSeek模型,打破了传统AI市场的 格局,为整个行业带来新的活力和可能性。 DeepSeek热潮来袭,国内车企纷纷加急大模型"上车" 借助DeepSeek的理解与推理能力,提升车辆座舱语音交互、感知决策等多方面能力,为用户带来更加智 能化、个性化的用车体验;从技术实现路径看,车企主要采用直接接入、多模型联合协同部署、模型深度融合 与蒸馏三大接入方式。 大模型在接入智驾方面有前景,但仍具较大挑战 一方面,DeepSeek为智驾带来了算法、算力和数据多维度的借鉴,助力 ...
大厂AI to C,进攻是最好的防守
虎嗅· 2025-04-10 15:07
大厂AI战略布局 - 百度在ChatGPT-3.5上线四个月内推出文心一言,字节跳动豆包一度是国内日活最多的C端大模型产品 [2] - 腾讯推出基于混元大模型的AI助手应用"腾讯元宝",但上线半年多几乎没有推广动作 [11] - 阿里通义千问上线时间较早,但未进行大面积推广,后由夸克承担AI to C重任 [21][23] - 字节跳动豆包通过大规模买量推广,日活用户超过2900万,同比增速91% [15][17] - 腾讯元宝接入DeepSeek后增长迅猛,单日下载量最高超50万,新增用户近600万 [19] 商业化挑战 - OpenAI推出会员付费订阅模式,但国内效仿者寥寥,百度文心一言曾因收费被吐槽 [29] - DeepSeek开源冲击会员费模式,OpenAI计划取消部分产品会员费,百度文心一言宣布开源 [30] - AI应用月人均使用时长仅132.8分钟,留存率低于40%,商业化问题被延后 [30] - 零一万物尝试toC应用后发现获客成本高、同质化竞争严重,难以收费 [30] 技术生态与竞争 - 大厂更擅长"后发制人",字节跳动豆包凭借产品能力和买量推广成为日活千万级产品 [14][15] - 腾讯元宝版本更新速度提升至"日更模式",一周内迭代五个版本 [39] - 字节跳动启动Seed Edge前沿研究计划,探索AI技术边界 [42] - 腾讯和字节跳动2024年向英伟达采购GPU数量均超过二十万张,仅次于微软 [33] 入口争夺战 - 到2026年,超过80%的企业将使用生成式人工智能API或应用 [36] - 字节跳动布局多款AI产品,包括智能角色互动产品"猫箱"、图片生成产品"星绘"等 [38] - 腾讯元宝未来将演化为功能齐全的人工智能助手,阿里通义千问成为苹果AI国内合作商 [39][32] - 大厂加速布局AIGC入口,卷产品力、技术力,竞争火药味渐浓 [40][41]
台积电CoWoS,前途未卜
半导体行业观察· 2025-04-10 09:17
台积电CoWoS产能规划与调整 - 高盛证券将2025、2026年CoWoS出货量预测从59.9万片、97.5万片下修至58.5万片与92.3万片,并将同期间CoWoS产能预估调整至66万片与100万片[1] - 摩根士丹利预期2026年CoWoS每月产能约10.5万~12.5万片,较今年底的每月7万~7.5万片大增[1] - 大摩估计2025年CoWoS每月产能7万片,2026年提升至每月9万片,预期台积电在2026年产能扩张规划会较为保守[2] - 台积电2025年底CoWoS月产能估将达7.5万~8万片,预期2028、2029年大增至15万片[3] - 2024年底CoWoS月产能约逾3.5万片,其中CoWoS-S约逾2万片,CoWoS-L约1万~1.5万片[5] - 2025年CoWoS月产能拉升至7.5万~8万片,CoWoS-S与CoWoS-L分别逾2万片、4.5万片,CoWoS-R则拉升至1万片[6] - 2026、2027年月产能将分别达9.5万片、13.5万片,2028年则再增至15万片[6] 资本支出与地缘政治影响 - 高盛证券对2025年资本支出维持400亿美元预估值,将2026年资本支出预测从460亿美元下修至450亿美元[2] - 台积电加码投资美国1,000亿美元,扩建速度可能加快,但日本与德国晶圆厂扩建可能趋缓[2] - 川普提出的关税政策可能对全球经济及未来AI资本支出产生深远影响[2] - 全球政经局势动荡,但台积电未来5年先进封装CoWoS产能规划仍未有太大修正[3] AI供应链与市场需求 - GPU龙头NVIDIA包下过半产能,AI特用芯片(ASIC)投片力道快速增强[3] - 大陆对AI推论需求非常强劲,已导致英伟达显卡现货价格出现上涨[2] - 中国新创DeepSeek迅速崛起,大幅降低AI使用成本,可能威胁NVIDIA的市场地位[3][4] - DeepSeek若真能威胁NVIDIA,将带动更多AI ASIC芯片业者加入战局,边缘AI应用快速扩增[5] - 具有量能与研发实力的ASIC芯片业者如Google、Meta、微软、AWS、博通、Marvell、联发科等都是台积电客户[5] - NVIDIA、台积电至今并未下修AI GPU与CoWoS先进封装需求,先前传出的产能修正只是H200与Blackwell架构B200、B300的产能与时程调配[5] 技术发展与产能分配 - 台积电接下来接收到主要客户的需求反馈后,约5月中就会对2026年CoWoS产能有初步盘算[1] - 台积电向来接单、扩产谨慎,有长足订单才会推进制程技术、建置新厂与扩增产能[3] - 2024年底CoWoS-S约逾2万片,CoWoS-L约1万~1.5万片,CoWoS-R则相对较少[5] - 2025年CoWoS-S与CoWoS-L分别逾2万片、4.5万片,CoWoS-R则拉升至1万片[6] - 2028年CoWoS-S与CoWoS-L分别达1万片、12万片,CoWoS-R则达2万片[6]
Nvidia's H20 AI chips may be spared from export controls — for now
TechCrunch· 2025-04-10 05:07
文章核心观点 英伟达CEO黄仁勋或与特朗普政府达成协议避免H20 AI芯片出口限制 但此举动与政府确保美国AI主导地位目标相悖 且政府保留拜登时期AI芯片出口规则 [1][4][5] 英伟达H20芯片情况 - 英伟达H20是美方可向中国出口的最先进AI芯片 因黄仁勋承诺在美国投资新建AI数据中心而免遭出口限制 [1] - 半导体行业担心H20被限制 因其被中国公司用于训练R1模型 R1性能表现出色 [2] - 两党参议员呼吁对H20实施限制 特朗普政府曾准备实施出口管制后改变决定 [3] 特朗普政府AI芯片政策 - 特朗普政府搁置部分潜在芯片限制 但保留拜登1月出台的AI芯片出口规则 该规则限制对多国芯片出口 对中俄限制更严 [4][5] 其他AI公司举措 - 多家AI公司迎合特朗普“美国优先”AI政策 如OpenAI联合开展5000亿美元美国数据中心项目 微软承诺2025财年投资800亿美元建AI数据中心 一半用于美国 [6] 特朗普对企业施压 - 特朗普向台积电施压 称若不在美新建芯片厂将征收高达100%的税 [7]
DeepSeek-R1与Grok-3:AI规模扩展的两条技术路线启示
Counterpoint Research· 2025-04-09 21:01
核心观点 - DeepSeek-R1 和 Grok-3 代表了AI发展的两种不同路径:前者通过算法创新和高效资源利用实现高性能,后者依赖大规模计算资源投入 [2][8] - 行业趋势正从“原始规模主导”转向“战略效率优先”,算法设计、混合专家模型(MoE)和强化学习成为关键杠杆 [8][10] - 未来AI发展将更注重投资回报率(ROI),平衡规模扩展与算法优化 [8][10] 模型性能与资源对比 - DeepSeek-R1 仅使用约2000块NVIDIA H800 GPU即达到全球前沿推理模型性能,展现高效训练能力 [2] - Grok-3 动用约20万块NVIDIA H100 GPU,性能略优于DeepSeek-R1、GPT-o1和Gemini 2,但资源消耗相差百倍 [2][8] - 两者性能相近,但资源投入差异显著,凸显算法创新可抗衡纯计算规模 [8] 发展路径差异 - Grok-3 采用“蛮力策略”,依赖数十亿美元GPU计算规模,边际性能提升显著但ROI递减 [8] - DeepSeek-R1 通过混合专家模型(MoE)、推理强化学习和高质量数据,以最小硬件代价实现顶尖性能 [8] - 行业可能从“规模法则”转向“算法突破+工程实用主义”的全局发展观 [10] 未来AI趋势 - 集中式训练项目(如Grok-3)成本过高,仅限少数巨头参与,中小机构需转向效率优化策略 [10] - 混合专家模型(MoE)、稀疏化、改进微调和强化学习将成为核心,降低资源消耗 [10] - 新数据训练与强基础模型结合(如RAG或定期微调),可避免持续大规模计算负担 [10]