DeepSeek

搜索文档
Are Nvidia's Market-Beating Gains Over? The Evidence Is Piling Up, and Here's What It Shows.
The Motley Fool· 2025-03-06 17:10
文章核心观点 - 英伟达过去五年表现出色股价飙升,但近期股价下滑,虽面临一些不利因素,但市场领先地位、创新能力和成本管理能力将支持盈利增长,建议逢低买入并长期持有 [1][3][13] 公司表现 - 过去五年股价飙升1500% [1] - 连续多个季度实现两位数和三位数营收增长,营收达数十亿美元且销售盈利高 [2] - 占据AI芯片市场80%份额,提供从网络到软件的完整解决方案,上一财年营收超1300亿美元,毛利率超70% [5] 股价下滑原因 - 初创公司DeepSeek消息引发投资者对英伟达最昂贵芯片需求的质疑 [3] - 政府政策对经济影响的不确定性给股价带来压力 [3] - 政府对中国AI芯片出口管制致中国市场销售额减半,美国对进口商品加征关税或增加制造成本并引发通胀和高利率环境 [8][9] 应对质疑情况 - 英伟达解释下一阶段AI增长需高性能GPU用于推理推断,科技巨头未放弃AI支出并继续购买其顶级产品 [7] 业务积极因素 - 产品需求旺盛,新Blackwell架构推出表现出色,首季营收达110亿美元,需求“非凡” [11] - 今年计划推出Blackwell Ultra和下一代Rubin架构,有望在3月18日年度GTC AI大会公布积极消息 [12]
中泰资管天团 | 王路遥:投研人员的DeepSeek打开方式
中泰证券资管· 2025-03-06 16:58
文章核心观点 - DeepSeek-R1性能追平行业top级别模型并开源权重引发关注,虽存在问题但在内容创造性和思考深度上有帮助,同时阐述使用心得并指出AI发展带来的影响和挑战 [1][6] 公司产品情况 - 今年春节前DeepSeek公司发布推理模型DeepSeek - R1,性能追平OpenAI的O1模型并同步开源模型权重,APP累计下载量超1.1亿次,周活跃用户规模最高近9700万 [1] 使用心得 启发思考 - DeepSeek可展示完整“思维链”,能将复杂问题结构化拆解,帮助连接大问题和具体解决方案之间的思维桥梁 [1][2] 提好问题 - 问题设计要在角度、范围上做减法,问“是不是”好于问“为什么”,还可利用模型“联系上下文”能力追问修正思考方向,提高寻求第一性的效率 [3] 定位助手 - 大语言模型有“幻觉”问题,DeepSeek - R1幻觉发生频率达14.3%,对于有客观答案的问题要核实信息源和校验推理过程,发散性问题可让模型提供思路和潜在方向 [4][5] AI发展影响 - AI离工作和生活越来越近,虽有不足但实力强大,重复性工作会被机器替代,投研场景下信息跟踪转述和随波逐流的投资观点价值将大打折扣,独立自主思考和判断是AI和人的差异分野 [6]
独家洞察 | 用FactSet解码AI新贵DeepSeek:崛起与影响
慧甚FactSet· 2025-03-06 12:33
点击图片查看大图 自上个月国产大模型DeepSeek R1上线以来,就迅速引发了大量的关注和讨论。在上周的文章中,我们着 重探讨了DeepSeek对金融行业的作用。在金融这个数据密集、决策复杂的领域,DeepSeek展现出了令人 瞩目的应用潜力。从年报解读到纪要整理,从数据分析到策略复现等,它将成为金融从业者的得力助手。 不过,我们也认识到,像策略复现、因子挖掘这类问题,其过程本身就相对复杂。DeepSeek 虽然能够生 成相关代码,但却无法在后台对这些代码进行运算检验,也无法获取策略中所需的具体数据。这就意味 着,其生成的代码仅仅只能作为参考,在实际应用于投资决策之前,用户还需要进行严谨的核验和细致的 调 试 。 毕 竟 , 金 融 市 场 容 不 得 半 点 马 虎 , 每 一 个 决 策 都 关 乎 着 巨 大 的 利 益 得 失 。 下 图 1 是 FactSet Workstation中关于DeepSeek的资本情况介绍。 图1: 点击图片查看大图 资料来源:FactSet 在本文中,我们将研究DeepSeek公司本身以及其带来的影响。如下图2所示,DeepSeek自今年1月发布新 模型以来,其网上 ...
独家洞察 | 用FactSet解码AI新贵DeepSeek:崛起与影响
慧甚FactSet· 2025-03-06 12:33
自上个月国产大模型DeepSeek R1上线以来,就迅速引发了大量的关注和讨论。在上周的文章中,我们着 重探讨了DeepSeek对金融行业的作用。在金融这个数据密集、决策复杂的领域,DeepSeek展现出了令人 瞩目的应用潜力。从年报解读到纪要整理,从数据分析到策略复现等,它将成为金融从业者的得力助手。 不过,我们也认识到,像策略复现、因子挖掘这类问题,其过程本身就相对复杂。DeepSeek 虽然能够生 成相关代码,但却无法在后台对这些代码进行运算检验,也无法获取策略中所需的具体数据。这就意味 着,其生成的代码仅仅只能作为参考,在实际应用于投资决策之前,用户还需要进行严谨的核验和细致的 调 试 。 毕 竟 , 金 融 市 场 容 不 得 半 点 马 虎 , 每 一 个 决 策 都 关 乎 着 巨 大 的 利 益 得 失 。 下 图 1 是 FactSet Workstation中关于DeepSeek的资本情况介绍。 图1: 点击图片查看大图 资料来源:FactSet 在本文中,我们将研究DeepSeek公司本身以及其带来的影响。如下图2所示,DeepSeek自今年1月发布新 模型以来,其网上搜索热度飙升,关于 ...
中金 | AI 进化论(3):DeepSeek本地部署需求盛行,一体机硬件乘风而上
中金点睛· 2025-03-06 07:11
文章核心观点 - DeepSeek开源大模型推动私有化部署新趋势,其R1模型在性能、开源策略、硬件成本和适配优化方面具备优势,有望推动包括DeepSeek一体机在内的本地私有化部署需求快速提升,利好算力硬件需求 [1][7][12] DeepSeek开源大模型特点及影响 - DeepSeek V3版本模型以仅1/10训练成本获得与海外领先模型对标能力,R1模型在少量标注数据下提升推理能力,性能比肩OpenAI o1正式版,且于2025年2月24日启动“开源周”丰富开源生态 [7] - 高质量开源模型推动AI大模型能力边界探索和应用落地,利好算力硬件需求;DS在C端APP下载量呈指数级增长,在B端加速垂直领域渗透,45%央企已完成DS模型部署 [8] - 大模型云端部署带动云端算力需求提升,R1模型有望推动云资源消耗量提升,阿里云收入增速和资本开支增长积极 [10] - DeepSeek部署不止于云端,本地化私有部署保障数据安全,C端“云端协同”优化体验与隐私保护,B端部分行业刚性需求驱动本地化部署 [11] C端:DeepSeek - R1+蒸馏技术,轻量化模型推动AI端侧部署 DeepSeek - R1蒸馏 - 知识蒸馏将671B参数量的“教师模型”决策逻辑和特征表征能力迁移至轻量“学生模型”,生成6个不同版本蒸馏模型 [15] - 蒸馏版模型推理性能超越同规模传统模型,在多个推理基准测试中表现优异,兼具经济性与有效性 [16] 蒸馏模型本地部署 - 蒸馏模型减少对显存、内存和存储需求,适合搭载于资源受限终端设备,不同版本参数蒸馏模型需选择合适终端硬件配置 [19][20] - PC是承载本地模型重要终端,DeepSeek - R1轻量化模型推动AI PC升级,换机动力有提升空间,端侧模型进化与硬件迭代形成飞轮效应 [21] B端:AI私有化部署新趋势,DeepSeek一体机的全栈式解决方案 DeepSeek一体机重构本地私有化AI部署模式 - DeepSeek R1全参数模型对系统显存等提出更高要求,一体机是“开箱即用”智能算力解决方案,重构本地私有化AI部署模式 [24][25][26] - 一体机具备深度优化的高性能硬件、内置多种基座大模型、全栈工具链等优势,可缩短部署周期、降低落地门槛 [26][27] DeepSeek一体机软硬件协同难点 - 主流国产AI训练芯片缺少对FP8精度支持,采用16位精度单元计算会大幅降低效率,显存需求增加 [28] - 为在单台8卡服务器上实现全参数DeepSeek R1模型,厂商需进行定点量化,在优化算力效率与保障模型效果间寻求平衡 [30][32] DeepSeek一体机迎合本地化部署需求,市场空间广阔 - 一体机私有化部署满足企业数据安全及合规需求,降低AI大模型部署门槛,减弱B端用户对云的依赖 [33][34][36] - 预计乐观情景下2025年政府、金融等行业约5%的服务器需求转向DeepSeek一体机,需求达7万台,市场规模有望达540亿元 [38][40] 国产算力产业链全方位适配DeepSeek,服务器及云厂商拥抱一体机趋势 - 国产主流GPU厂商宣布适配DeepSeek,超过160家国产算力产业链企业完成适配,昇腾等国产GPU成为重要底层算力支撑 [40] - 算力硬件厂商、云厂商等推出DeepSeek一体机,看好整机环节头部的一体机供应商 [42]
Why Alibaba, JD, and Other Chinese Tech Stocks Rallied Wednesday Morning
The Motley Fool· 2025-03-06 03:01
文章核心观点 中国政府对科技行业的支持承诺推动科技股上涨,相关科技公司股价表现良好,且后续可能还有上涨空间,当前估值具有吸引力 [1][2][8] 行业动态 - 中国领导人承诺支持科技行业并维持经济增长目标不变,推动科技股上涨 [1] - 中国国务院总理李强宣布支持重要新兴产业,特别是科技领域,将建立机制增加对未来产业的资金投入,培育生物制造、量子技术、具身人工智能和 6G 技术等产业 [3] - 尽管面临特朗普政府关税和贸易战担忧,中国维持 5% 的经济增长目标,市场认为中国计划提供额外经济刺激,特别是支持人工智能和量子计算发展 [5] - 中国人工智能初创公司 DeepSeek 发布 R1 推理模型引发关注,虽开发成本存争议,但英伟达 CEO 称其为“世界级推理人工智能模型” [6][7] 公司表现 - 截至美国东部时间下午 12:50,阿里巴巴股价飙升 7.7%,京东上涨 5.7%,腾讯控股上涨 5.3%,自 1 月中旬低点以来,阿里巴巴股价飙升 73%,京东和腾讯分别上涨 41% 和 30% [2][8] - 2024 年腾讯、京东和阿里巴巴分别上涨 41%、20% 和 9%,此前落后于美国同行,此次政府支持信号让投资者相信科技股上涨才刚开始 [9] 公司动态 - 有报道称阿里巴巴正与苹果合作在中国推出人工智能功能 [10] - 京东宣布对京东云产品进行一系列人工智能增强,并为云客户免费提供中国流行大语言模型以创建自己的人工智能系统 [10] - 腾讯最近发布新人工智能模型,称性能可与 DeepSeek 的 R1 相媲美且响应时间更快 [10] 估值情况 - 即使在近期上涨后,腾讯、阿里巴巴和京东的市盈率分别为 16 倍、12 倍和 11 倍,鉴于其未来增长潜力和政府支持,该估值合理 [11]
「实习生也月入过万」,这一行业严重缺人
36氪· 2025-03-05 21:17
AI行业人才需求与竞争态势 - 互联网大厂正以最大能量挖掘AI领域人才 包括顶尖精英和基础岗位员工[3][4] - 阿里巴巴AI To C业务开放数百个岗位 腾讯元宝同时开启热招[4] - 市场对AI人才渴望达到按图索骥程度 投资人循论文作者逐一拜访[3] AI人才薪资水平与涨幅 - DeepSeek所有岗位年薪至少约50万元 深度学习研究员最高年薪超176万元[6] - AI行业近三分之一(30.97%)岗位年薪在50万元以上[7] - 转向AI岗位可获30%以上涨薪 显著高于其他计算机行业涨幅[14][15] - 字节跳动为硕士AI人才提供月基础工资5-6万元 阿里腾讯约3万元[18] - 算法工程师/深度学习/机器学习岗位年薪50万元以上占比分别达31.72%/38.34%/38.71%[19] 人才供需缺口与招聘现状 - 猎聘平台AI技术人才紧缺指数(TSI)达3.24 处于高度紧缺状态[29] - 企业HR几乎每天翘首以待 急缺AI专精类人才和场景运营师[29] - 2030年中国熟练AI专员需求达600万 供应仅200万 存在400万缺口[25] - 阿里巴巴春招3000个实习生岗位中近50%与AI相关 高德AI岗占比65% 阿里云超80%[27] 人才素质要求与培养挑战 - 算法岗要求学历背景和论文成果 注重基础能力和系统性能力[32] - AI技术员工专业背景多元 包括计算机/通信/机械/电子集成电路等[33] - 复合型人才非常稀缺 既懂AI技术又能理解业务场景者稀少[34] - 高校人才培养与产业需求存在差距 毕业生难以满足企业现实需求[34] 行业发展前景与人才吸引力 - IDC预测2026年三分之二云应用将使用AI 八成企业需要AI熟练工[25] - OpenAI开出1000万美元天价年薪招人 国内公司用数百万年薪挖未毕业生[17] - 股票期权成为吸引人才重要手段 OpenAI允许员工定期出售股票份额[38] - 技术抱负成为人才流动因素 有技术骨干为"奔赴AGI梦想"跳槽[39]
Prediction: Nvidia Stock Is Going to Soar in 2025, Thanks to This Incredible News From Jensen Huang
The Motley Fool· 2025-03-05 17:04
文章核心观点 - 英伟达股价虽因DeepSeek消息下跌,但CEO言论或使股价今年飙升 [1][2][3] 英伟达财务表现 - 2025财年总营收达创纪录的1305亿美元,较上年增长114%,超管理层预期 [5] - 数据中心业务营收1151亿美元,较上年增长142% [5] - 2025财年第四季度首次商业发货Blackwell GPU,销售额达11亿美元,超管理层预期 [6] DeepSeek相关情况 - DeepSeek找到低成本、低算力训练先进模型的方法,引发投资者对英伟达芯片需求的担忧 [1][2] - DeepSeek训练V3模型仅花费560万美元,虽不包括5亿美元基础设施支出,但仍引发华尔街关注 [9][10] - DeepSeek因芯片出口禁令无法使用英伟达最新芯片,采用软件技术如蒸馏法抵消算力不足 [11] 行业趋势与英伟达机遇 - 行业从传统训练方法转向构建“推理”模型,将计算资源转向推理工作负载 [13][14] - 推理模型计算需求可能是前代的100倍甚至更多,英伟达或迎来芯片需求新阶段 [14][15] 英伟达股价分析 - 基于2025财年每股收益2.99美元,英伟达股票市盈率为42.5,较10年平均水平折价28% [16] - 华尔街预计2026财年每股收益4.49美元,远期市盈率仅27.7,股价需大幅上涨才能维持或达到平均市盈率水平 [16]
盘前有料丨十四届全国人大三次会议今日上午9时开幕……重要消息还有这些
证券时报· 2025-03-05 07:56
政府工作报告与政策动向 - 十四届全国人大三次会议将于3月5日上午9时开幕 国务院总理李强将作政府工作报告 国务院新闻办公室将于11时30分举行吹风会解读报告 [2] - 大会发言人娄勤俭强调推动民营经济促进法尽快出台 并指出中美经贸关系本质是互利共赢 批评美方单边加征关税违反世贸规则 [3] - 国务院发布《中国的芬太尼类物质管控》白皮书 强调严格监管药品 防范滥用 打击违法犯罪 [4] 中美贸易关系动态 - 中国自3月10日起对原产于美国的部分进口商品加征关税 包括鸡肉等加征15% 高粱等加征10% [5] - 商务部将15家美国实体列入出口管制名单 并对美国因美纳公司采取禁止向中国出口基因测序仪的措施 [6] - 外交部回应美方加征关税 表示中方将奉陪到底 敦促美方回到对话合作轨道 [7] 上市公司公告摘要 - 贵州茅台已耗资12亿元回购82.22万股 顺丰控股耗资7.58亿元回购2077.14万股 [9] - 禾迈股份控股股东拟增持1.12-2.23亿元 芯能科技控股股东拟增持5000万-1亿元 [9] - 嘉必优拟8.31亿元收购欧易生物63.21%股权 光弘科技拟7.33亿元收购AC公司100%股权 [9] - 宁波港2月集装箱吞吐量335万标准箱同比增长11% 北部湾港货物吞吐量2397.93万吨同比增长14.56% [10] - 海南华铁子公司签署36.9亿元算力服务协议 嘉环科技拟中标21.85亿元中国移动集采项目 [10] 券商研究观点 - 广发证券指出2月地产销售、集装箱吞吐量等领域表现亮眼 建筑业开工率尚低 工业与消费价格趋势待观察 [11] - 中泰证券长期看好算力需求 认为头部云厂商将受益 私有云产业也具备投资价值 [12]
中金 | 大模型系列(1):DeepSeek-R1量化策略实测
中金点睛· 2025-03-05 07:33
文章核心观点 - 文章从量化策略角度探讨大模型如何助力投资,测试大模型在行业轮动、风格轮动和市场择时三大任务中的表现,并讨论大模型在量化策略开发中存在的局限性 [1] 大模型助力投资 结合量化投资 - 大语言模型可帮助量化分析师高效实现代码构建,缩短策略开发周期;可通过检索论文网站帮助分析师快速查找研究、提炼观点或形成专家知识库;在策略开发层面,与新闻、研报这类另类数据结合能发挥更大作用 [3] 结合主动投资 - 非量化客户用好大语言模型关键在于明确其长处与局限性,当前大模型在金融领域应用空间大,但只能作为协助者,存在对数字准确度把握不足、知识库滞后、易出现知识幻觉等局限性 [3] 671b标准版DeepSeek - R1在行业轮动任务表现 模型亮点 - DeepSeek - R1基于MoE架构,通过大规模强化学习直接训练基座模型(V3)突破推理能力,在数学、代码、自然语言推理等任务上性能比肩OpenAI o1正式版,验证了强化学习在提升推理能力方面的可能性 [4][11] 测试结果 - 测试发现671b参数版的DS - R1在多项任务中优势明显,后续量化策略任务采用该版本测试;在行业轮动任务上表现更佳,2024年以来行业多头组合相对全行业等权收益率超额22.3%,效果稳定;大小盘轮动策略胜率54.33%,相对等权超额收益超12%;市场择时方面2024年以来超额约18%,稳定性稍弱 [5] 推荐持仓 - 截至2025年2月20日,DS - R1对2025年3月最新推荐持仓为传媒、计算机、电新、汽车、消费者服务、通信;大语言模型在行业配置任务上相对于选股和市场择时任务有独特优势,能更好发挥处理宏观中观信息和逻辑推理的优势 [6] 大模型结合新闻数据在量化策略任务的优势 模型创新点技术细节 - DeepSeek - V3在仅消耗Llama3 405B模型10%计算资源的条件下,实现相当运算效能,源于三项架构革新:多头潜在注意力机制、动态路由混合专家系统及多粒度令牌预测 [10] 使用DeepSeek构造量化模型的流程 - 调用方式有调用官方API、第三方平台API和本地部署三种;不同参数版本模型表现有差异,671b版在逻辑推理、常识问题及脑筋急转弯任务中表现更好,模型处理数字相关计算分析任务能力弱于文本类数据处理能力 [12][15] - 采用数库新闻数据作为提示词信息源,筛选新闻数据以降低数量并保证完整性和有效性;打磨提示词可提升输出质量、降低幻觉概率,还可借助辅助工具生成提示词;设置API接口参数,采用单轮对话方式调用API,对输出结果进行查验 [17][18][19] 回测效果展示 - 设计行业轮动、大小盘轮动和市场择时三个量化策略测试模型表现,行业轮动任务表现亮眼,样本外超额收益超22%,信息比率超1.8,多头组合超额收益回撤小、较稳定,24年10月后明显增长;持仓换手率偏低,为38.5%,多次看好电新、计算机等行业 [21][24][26] 大模型的局限性 幻觉 - 幻觉指模型生成内容无意义或不忠实于源内容,可能源于缺乏对事实的深刻理解,影响模型可靠性;主流AI模型在文本摘要任务中幻觉产生概率在0.7% - 3%之间,DeepSeek早期发布的V2.5幻觉产生概率为2.4%,与OpenAI - o1模型水平大致相同 [32] 随机性 - 大语言模型中temperature等参数控制输出随机程度,取值接近0输出更确定,接近1输出更随机;在行业轮动任务中,temperature = 0.6时,随机性对预测值有影响,但策略均能战胜等权基准;temperature取值干扰模型预测结果构建行业轮动策略的性能,但无直接相关性 [35] 上下文长度限制 - 大语言模型在长文本处理中存在系统性瓶颈,输入序列超过阈值时,对远端信息记忆和调用能力衰减,语义整合误差率非线性上升;DeepSeek - R1上下文长度为64k,限制了可接收新闻数量,影响推理效果 [37][38] 样本内数据泄露的可能性 - 大语言模型处理学术文献存在隐私泄露风险,在量化领域构建策略时,难以保证样本内不出现数据泄露问题,如出现“偷看”问题答案的情况,因此仅测试2024年以来策略表现 [39]