DeepSeek

搜索文档
Baidu, once China's generative AI leader, is battling to regain its position
CNBC· 2025-03-18 14:12
文章核心观点 百度发布两款新人工智能模型以重夺国内AI领域领先地位,但专家认为其处于追赶状态,未来竞争力取决于新模型能否兑现性能和成本优势承诺,不过公司在数据和应用方面有一定优势 [1][2][5] 百度新模型情况 - 周日发布两款新人工智能模型,包括首个推理模型和采用开源许可策略 [1] - 新ERNIE X1推理模型宣称性能与DeepSeek R1相当,但价格仅为一半,且有更强理解、规划、反思和进化能力 [4] 百度面临的竞争压力 - 文心一言作为中国早期类ChatGPT聊天机器人,难以广泛应用,公司在推理模型发布上落后 [2] - 公司创新步伐缓慢,低估市场动态快速变化,在构建专有模型和争夺AI资金时落后,还受政府打击和监管影响 [5][7] - 采用闭源方法训练模型,而开源模型可利用开发者共享部分 [8] 百度的战略转变 - 最新AI模型代表公司战略向开放免费模型转变,是跟随阿里巴巴、DeepSeek和腾讯等竞争对手脚步 [9] 百度的优势 - 中国AI模型的差异化在于模型使用的数据和应用用例,百度运营多种热门应用和服务,有庞大消费用户群 [10][11] - 百度CEO预计生成式AI将使百度搜索成为“AI时代新杀手级应用”,公司拥有AI所需的数据 [12]
Baidu shares jump 10% following release of new open-source AI models
CNBC· 2025-03-18 12:16
文章核心观点 - 百度发布两款新AI模型引发股价上涨,公司试图借此重夺中国AI领域领先地位,但竞争力取决于新模型能否兑现性能和成本优势承诺 [1][2][3] 公司动态 - 百度周日发布两款新人工智能模型,包括最新版“文心一言”基础模型和新推理模型ERNIE X1 [2] - 百度称ERNIE X1性能与DeepSeek R1相当,但价格仅为其一半,且具备更强理解、规划、反思和进化能力 [4] - 百度新模型采用开源策略,与此前专注专有模型策略不同,旨在使技术成为行业标准,增强在AI社区影响力并扩大市场份额 [7][8] 股价表现 - 周二亚洲市场上,百度股价上涨10.7%,这可能是投资者对周末新模型发布的积极反应 [1] 行业竞争 - 中国AI初创公司DeepSeek今年1月发布R1开源推理模型,颠覆AI行业,迅速超越百度,其他科技巨头如阿里巴巴和字节跳动也领先于百度 [5][6] 专家观点 - 晨星高级股票分析师王凯认为,股价上涨可能是对新模型的“延迟反应”,百度有望从更大的AI需求中受益 [3] - Counterpoint Research首席分析师孙伟表示,百度竞争力取决于新模型能否兑现性能和成本优势承诺,且AI定价在中国市场高度多变 [7]
强制跟投,投资经理有话说
叫小宋 别叫总· 2025-03-18 09:49
对"强制跟投"的介绍,请见上一篇《 投资人的收入有多低 》 (一) 请问尊敬的合伙人:目前只有投资团队有跟投机制。您说,因为项目是投资团队找的。 那么,基金里面,募资团队是不是也要跟一点?因为 lp 是募资团队找的呀。 如果 lp 的落地、对赌等条款,导致我们投不到好项目,进而导致我们投的项目退不出来,是不是应该 lp 也负责?募资团队也负责? 但是现在呢,募资团队每年拿的募资奖励,金额比投资团队的投成奖多多了,还没有什么跟投。合伙 人,你能不能给我解释解释? (二) 尊敬的合伙人,感谢您没有设置强行跟投机制。几个老员工常说,感谢合伙人,一定 996 工作,为公司 奋斗到死。 难道 … 不是因为您给的薪资太低了,如果再强制跟投,根本就招不到人了? 然后,因为不强制,所以我入职至今,一个项目都没有参与过跟投。 您那天还问我,怎么不跟?我现在回答您:因为你们这家机构投的项目都不行。 您可能又会问,但是项目不是我挖掘,我推进的么? (四) 尊敬的合伙人,我想请问: 您觉得,假如我们有投资 DeepSeek 、宇树的机会,员工会不会踊跃跟投?如果我们每个项目都是 DeepSeek 、宇树这种档次,还有必要"强制"跟投 ...
特朗普,重创芯片公司
半导体行业观察· 2025-03-18 09:36
科技巨头与特朗普政府关系变化 - 特朗普就任总统时获得科技巨头高调支持,包括埃隆·马斯克、杰夫·贝佐斯、谢尔盖·布林和马克·扎克伯格等出席就职典礼 [1] - 这些行业领袖支持特朗普是希望领导一个亲商的政府 [1] - 但自1月20日特朗普上任以来,这些公司总共损失了2040亿美元 [2] 半导体行业整体表现 - 特朗普赢得大选后,英伟达、博通、英特尔、美光科技等主要半导体公司股价大幅上涨 [2] - 市场预期拜登政府政策将不再限制人工智能技术 [2] - 但特朗普上任后市场对其关税政策做出负面反应,贸易紧张局势升级导致投资者情绪低落 [2] - 摩根大通已将经济衰退风险从30%上调至40% [2] - 过去一个月科技股表现尤其残酷,许多2023-2024年领涨的股票在市场低迷时领跌 [3] 芯片法案与政府政策 - 特朗普批评520亿美元的《芯片法案》,称其为"非常可怕的事情",并敦促废除 [3] - 美国商务部解雇40名负责CHIPS计划的工作人员,暗示可能削减半导体计划 [4] - 特朗普威胁对消费电子产品所需半导体征收关税 [4] - 《芯片法案》已吸引台积电、英特尔和三星等公司总计约4000亿美元投资 [3] 主要半导体公司表现 英伟达 - 2024年股价已下跌14% [6] - 中国初创公司DeepSeek发布廉价AI模型后市值蒸发6000亿美元 [8] - 中国业务收入占比从20%以上大幅下降 [8] - 第四季度利润和收入超出预期,但财报发布后股价仍下跌8.5% [7] - 约15%收入来自中国,面临美国出口管制收紧前景 [7] 台积电 - 2024年股价下跌近15% [9] - 宣布1000亿美元投资计划在美国建五家新芯片工厂 [9] - 增长受到关税升级和中美地缘政治紧张局势担忧的阻碍 [9] 博通 - 2024年股价下跌17% [12] - 第二季度每股收益1.60美元,营收149.2亿美元,超出华尔街预期 [13] - 受益于AI半导体市场增长,CEO预计AI收入将继续保持强劲 [12] 英特尔 - 2024年股价上涨19%,主要得益于新任CEO陈立武上任 [14] - 原本可从《CHIPS法案》获得85亿美元资金,但法案前景不明 [15] - 制造领导地位已被台积电等竞争对手夺走 [15] AMD - 2024年股价下跌18% [16] - 尽管第四季度盈利强劲,但对数据中心业务增长预测谨慎导致股价暴跌 [16] - 作为英伟达AI芯片的经济型替代品,但难以获得市场份额 [16] 行业前景 - 人工智能市场规模预计从2024年的2330亿美元增长到2032年的1.77万亿美元 [18] - 尽管当前面临挑战,AI长期前景仍然乐观 [18]
深度|后DeepSeek时代,AI六小虎高管频繁离职,百川两位联创转身再创业,年内已近10位高管出走
Z Finance· 2025-03-17 16:30
文章核心观点 2024 - 2025年中国AI大模型行业人才流动密集,头部企业多位核心高管离职,创业和加入字节跳动是主要去向,DeepSeek出现后大厂展开人事调整,行业人才重组与流动趋势加速 [2][6] 分组1:AI六小虎高管离职情况 - 百川智能联合创始人焦可正式离职投身AI语音创业,陈炜鹏即将离开筹备AI Coding创业项目 [1] - 除阶越星辰外,其他AI六小虎多位高管离职,离职潮在DeepSeek之后加速 [2] - 离职高管凭借技术积累投身AI细分赛道创业,或加入字节跳动 [2] 分组2:字节跳动人才流动情况 - 多位字节高管离职创业或加入创业公司,如骆怡航加入生数科技,陈志杰AI Coding创业受追捧 [3] - 字节Seed部门负责人朱文佳被“半架空”,吴永辉接管,正全面审视业务线 [5] 分组3:DeepSeek对行业的影响 - DeepSeek出现后大厂展开人事调整,冲击字节AI人才招聘策略 [5][6] - DeepSeek“纯粹技术主义”AGI路线吸引技术理想主义者和顶尖人才 [6] - 行业内大厂与AI公司人员流动将更频繁,人才重组与流动趋势加速 [6]
英伟达芯片,更难了
半导体行业观察· 2025-03-17 09:24
文章核心观点 文章围绕英伟达最新人工智能芯片发售及下一代芯片受关注展开,分析其业务增长预期、面临的不确定性及股票情况 [1][2][3][4] 分组1:英伟达GTC开发者大会情况 - 英伟达年度GTC开发者大会曾相对低调,疫情前最后一年约9000人参加,现预计吸引超25000名现场与会者 [1] 分组2:英伟达芯片产品情况 - 去年GTC大会主要展示的Blackwell AI芯片因量产延迟,最近开始大批量出货,预计成明年AI业务主要支柱,分析师预计CEO黄仁勋将展示升级版Blackwell Ultra [1] - 英伟达观察人士渴望了解下一代人工智能芯片Rubin消息,德意志银行预计其比Blackwell有“非常令人印象深刻的性能提升”,花旗集团指出Blackwell在人工智能推理方面比上一代产品快30倍,不排除Rubin有类似改进 [2] - Rubin产品预计明年开始出货 [3] 分组3:英伟达业务收入预期 - 分析师预测,在截至2027年1月财年,英伟达数据中心业务收入将达约2370亿美元,是目前规模两倍多,根据普遍估计,同一部门年收入预计两年后超3000亿美元,未来四年平均年增长率为30%,该业务过去两年已增长七倍多 [3] 分组4:英伟达面临的不确定性 - 全球经济可能因关税、地缘政治不稳定和通货膨胀陷入衰退,英伟达担心与最大客户内部设计芯片竞争,还担忧中国人工智能初创公司DeepSeek宣称的效率突破减少对其高价芯片集群的需求 [4] 分组5:英伟达股票情况 - 英伟达股价最近几天在市场动荡中有所上涨,但今年迄今下跌逾9%,是标准普尔500指数跌幅两倍多 [4] - 英伟达股票目前市盈率不到今年预期收益的27倍,比去年会议上的市盈率低23%,比大多数增长速度没那么快的大型科技公司股票便宜 [4]
Windows协议到期!华为PC全面转向鸿蒙系统;特斯拉中国版FSD首个迭代曝光,已推送内部员工;DeepSeek 2月盈亏平衡
雷峰网· 2025-03-17 08:24
文章核心观点 文章汇总了近期科技、汽车、外卖等多个行业的公司动态,包括华为PC系统转变、蔚来组织变革、阿里人员离职、车企竞争、科技公司发展战略及财务情况等,反映了各行业的发展趋势和竞争态势[3][7][9] 国内资讯 科技行业 - 微软对华为Windows系统授权即将到期,华为PC将全面转向鸿蒙系统,首款搭载鸿蒙的商用AI笔记本即将上市,华为已推出Linux版笔记本[3] - 阿里通义实验室语音团队负责人鄢志杰离职,其曾担任达摩院机器智能语音实验室负责人等职,下一站或投身AI创业[7][8] - DeepSeek 2月盈亏平衡,梁文锋坚定AGI优先,拒绝融资和盲目商业化,将资源集中在模型开发和追求AGI[11] - 华为海思自研PC处理器麒麟X90首曝,获II级安全可靠等级,有望与鸿蒙PC系统形成垂直生态[12] - 米哈游创始人蔡浩宇创立的AI游戏公司Anuttacon曝光首款项目《Whispers From The Star》,内测已开启[22] - 小马智行、文远知行拟赴港二次上市,但双方均未明确回应[23] 汽车行业 - 蔚来创始人李斌内部讲话详解组织变革,动员团队提升经营意识,争取今年四季度单季度盈利[7] - 上汽大众称日系车全面落后,日产总经理回怼,引发网友热议[9] - 特斯拉中国版FSD首个迭代曝光,支持HW3.0车型,相比首个版本进步明显[15] - 奇瑞汽车赴港IPO,将举行智能化战略发布会,目标是推动油电同价、油电同质[16] - 新款问界M9车载遥控器曝光,功能丰富,2025款问界M9内饰也一同曝光,将于3月20日亮相[18] - 极氪副总裁反思品牌发展问题,此前极氪因快速迭代车辆性能被指“背刺老顾客”[20] - 哈啰出行杨磊斥资6亿入主永安行夺控股权,蚂蚁套现2亿,市场猜测哈啰或借壳上市[21] 外卖行业 - 香港第三大外卖平台Deliveroo退出香港市场,美团在港份额已占43%,市场只剩两大头部平台竞争[13] 电池行业 - 宁德时代2024年净利润超500亿,拟派发现金分红约199.8亿元,并使用不超过400亿元闲置资金委托理财[18] 家电行业 - 小米将“智能家居”商业模式引入日本,计划2025年开5到10家门店,已宣布在埼玉县开设两家[21] 国际资讯 科技行业 - OpenAI向美国政府提交信函攻击DeepSeek,专家称其为毫无依据的污蔑和无理打压[25] - 英特尔新任华人CEO陈立武薪酬曝光,最高可达5亿元,其任命后英特尔股价飙升[27] - 苹果内部已演示个性化Siri,部分功能可用但仍待优化,预计“未来一年”推出[28] - Meta首席AI科学家杨立昆“炮轰”人形机器人,认为演示惊艳实际很蠢,不少公司在豪赌未来AI进展[29] - 传苹果iPhone17系列有望首次推出Ultra机型,产品线将全面调整,或拉高均价巩固高端市场统治力[30] 汽车行业 - 美国加征25%关税,宝马将暂时为美国经销商承担从墨西哥进口车辆的关税成本,反对该关税政策[31] - 特斯拉CAE碰撞安全首席工程师彼得·温伯格宣布离职,其为特斯拉碰撞安全贡献巨大[27]
中金 | AI智道(7):DeepSeek Infra开源周总结,及算力测算一览
中金点睛· 2025-03-17 07:55
文章核心观点 - 2025年2月24 - 28日DeepSeek进行Infra开源周,其Infra工程优化能力国内领先,通过五大Infra核心技术构建大模型 - 算力全栈协同体系,实现大模型开发成本大幅压缩;成本及算力测算显示其毛利率水平国内领先;Infra优化能力推动大模型平权,对推理算力需求有积极影响,AI应用商业化更取决于模型能力和工程优化 [2][3] DeepSeek开源周:Infra层优化能力行业领先 全栈协同体系 - DeepSeek开源周深度适配GPU特性,通过五大Infra核心技术构建大模型 - 算力全栈协同体系,以“单卡算力提升 - 核心计算加速 - 通信延迟降低 - 多卡协作优化 - 数据流高速供给”为脉络形成优化闭环,提升千亿参数模型训练、推理效率,压缩开发成本 [2][6] 每日成果 - **Day1**:发布为英伟达Hopper GPU设计的MLA解码内核FlashMLA,实现MoE模型推理加速,针对变长序列处理等场景优化,核心创新含分页KV缓存、分块调度与内存优化、原生稀疏注意力,实测在H800 SXM5平台有顶尖性能表现 [8] - **Day2**:发布DeepEP,为MoE模型和专家并行设计的专用通信库,支持FP8低精度通信,有高效优化的all - to - all通信、支持NVLink和RDMA技术等特点,实现训练和推理高吞吐、低延迟 [9] - **Day3**:发布DeepGEMM,针对FP8通用矩阵乘法打造,支持密集GEMM和MoE GEMM,采用CUDA核心两级累加机制,核心优化包括线程束优化、利用Hopper TMA特点、特殊优化等,在H800上最高可实现2.7倍加速 [10] - **Day4**:开源DualPipe、EPLB和Profile - data。DualPipe是双向流水线并行算法,通过重叠计算与通信阶段提升训练性能;EPLB是专家并行负载均衡器,用冗余专家策略和组限制专家路由解决负载不均衡问题;Profile - data展示通信计算重叠策略和低级实现细节 [13][14][16] - **Day5**:开源3FS和Smallpond。3FS是高性能分布式文件系统,利用SSD和RDMA网络,在性能、可用性和多样化工作负载方面有优势;Smallpond是基于DuckDB和3FS的轻量级数据处理框架,具备高性能、易操作、可扩展特点 [21][22] DeepSeek成本及算力测算:毛利率水平领先 成本与毛利率测算 - DeepSeek 3月1日公开模型推理效率和成本,过去24小时DeepSeek V3和R1推理服务峰值占用278个节点,平均占用226.75个节点,处理608B输入Token和168B输出Token,总体GPU hours成本8.7万美元;以模型API定价测算收入、GPU hours租赁成本为核心成本项,综合毛利率在71 - 84.5%,处于行业领先水平 [24] 利润率对比 - 理想情况计算的DeepSeek毛利率较高,但实际因部分Token不收费,整体毛利率会降低;海外OpenAI和Anthropic API服务按仅扣GPU Hours口径计算毛利率也领先;其他云厂商为保证稳定性提供冗余算力,集群负载率难达DeepSeek水平,底层优化不足,会损失部分毛利率 [25] 对产业影响 - 推理算力方面,AI infra进步提升算力利用效率,推动行业繁荣,多模态、Manus等Agent应用会激发更大推理算力需求;AI应用方面,模型推理成本降低,商业化更取决于模型能力迭代和合适场景打磨,2C看好互联网大厂产品化进展,2B关注企业服务厂商客户场景磨合,期待2025年出现更多“爆款”AI应用 [26]
中金 | AI进化论(6):DeepSeek横空出世,各行业智能化发展展望
中金点睛· 2025-03-17 07:55
文章核心观点 - DeepSeek带动AI大模型“普惠潮”,数字化程度高的产业有望快速应用相关技术,中美有望引领全球实现AI的产业落地应用,中国制造业有望成为“AI+制造业”的全球领头羊 [3][4] 大模型技术迭代与应用 - AI大模型融合各类AI技术并持续创新,在海量数据和算力支持下成果显著,应用前景广泛 [5] - 行业大模型占比提升,主要因基础技术进步和终端需求多样化,预计未来占比将继续上升 [7] - 大模型可释放企业数据价值,赋能数字化程度高的产业,提升沟通、流程、决策和创新能力 [11][12] - 数字化率较高的行业AI应用加速,如高科技制造、汽车、金融等行业 [13][14][15] DeepSeek技术影响 - DeepSeek通过技术创新大幅降低成本,倒逼其他厂家调整策略,其开源效应有望降低大模型接入成本 [17] - 技术平权与开源生态可提高B端客户效益,促进跨领域协作与创新,推动开发者生态建设 [18] 中美产业应用前景 信息技术支撑行业 - 中美第三产业GDP占比高且数字化水平领先,信息技术相关行业数字化建设成果显著 [23][27] - 中美在信息技术相关行业具备数据、技术、人才和业务需求等优势,有望支撑AI大模型快速部署 [28] 制造业 - 全球布局AI+制造业热情高涨,中美出台政策引导应用 [29] - 中国制造业体系完备、规模庞大、质量提升、创新活跃,为AI落地提供广阔场景 [30] - 中国制造业数字化转型积极,汽车、家电等离散制造业和石化等流程工业有望率先应用AI [32] - AI大模型在离散制造业可解决物流、排产和效率问题,在流程工业可实现数据分析和市场预测功能 [33][34] 区位优势行业 - AI大模型规模化应用将带动算力需求,北京、长三角、粤港澳地区IDC厂商有望受益 [35] - 这些地区头部企业聚集、网络设施发达,具备发展IDC业务的优势 [36]
速递|DeepSeek 2月刚盈亏平衡,梁文锋坚定AGI优先,拒绝融资和盲目商业化
Z Finance· 2025-03-16 19:19
文章核心观点 中国人工智能初创企业DeepSeek专注研究而非追逐收入,决心优先发展AGI,与硅谷对手形成鲜明对比,其发展引发市场对美国科技集团的质疑和担忧,同时自身也面临收入可持续性和芯片获取等问题 [1][2][3] 公司发展策略 - 公司由对冲基金亿万富翁梁文峰领导,选择专注研究,拒绝盲目商业化,将大部分资源集中在模型开发和追求构建人工通用智能 [2][3] - 创始人拒绝了中国科技巨头、风投和国家支持基金的投资兴趣,维持精简运作追求AGI [3] 公司业务情况 - 2月收入首次足以覆盖持续成本,自1月发布低成本R1推理模型后关注度持续上升,该模型性能与对手媲美但构建成本低得多 [2] - 客户主要来自医疗和金融等行业,购买R1和V3模型的API访问权限,因非研究用途资源不足暂停此类服务 [3] 与对手对比 - OpenAI利用早期领先优势围绕ChatGPT构建强大消费者业务,通过销售API创造可观收入,自2019年多轮融资约200亿美元,正计划以2600亿美元估值再筹集400亿美元,去年烧掉50亿美元用于训练新模型,实现约40亿美元收入 [4][5] - DeepSeek约160名员工,OpenAI拥有2000多名员工,且DeepSeek缺乏商业野心,与OpenAI专注推广大众市场产品不同 [6] 市场影响 - DeepSeek引发市场对谷歌和OpenAI等美国科技集团能否保持技术优势的质疑,以及对大型科技集团巨额AI基础设施支出计划是否明智的担忧 [3] - 腾讯采用DeepSeek开源模型后API销量成倍增长,约一半云服务客户尝试使用其模型,20%客户要求定制本地化版本 [6] 潜在问题与计划 - 公司收入流可持续性存疑,如苹果选择阿里巴巴的Qwen而非DeepSeek推出AI功能 [6] - 长远来看,获得英伟达新一代更先进芯片机会有限或成潜在瓶颈 [7] - 工程师正推进R2和V4型号发布,原定于五月的发布时间可能提前 [7]