DeepSeek - 财报，业绩电话会，研报，新闻

DeepSeek

搜索文档

36氪· 2025-05-23 18:35

财报表现 - 2025年一季度总营收3.969亿美元（约28.83亿元人民币），调整后运营利润1.295亿美元（约9.43亿元人民币），超华尔街预期 [1] - 广告和营销营收3.39亿美元同比持平，其中非阿里广告收入2.96亿美元同比下降6%，主因网络游戏及手机行业收入贡献减少 [1] - 增值服务营收5770万美元同比增长2%，受益于会员服务增长 [1] - 月活跃用户5.91亿，日活跃用户2.61亿 [1] 热搜生态 - 一季度上榜热搜4.3万条，月均1.4万条同比增20%，娱乐类占比最高，其次为社会、体育、企业内容 [3] - 热搜平均在榜时长2小时，影视剧《漂白》和《哪吒票房》位列超24小时在榜热搜前二 [3] - 2024年全年热搜16.2万条同比增20%，巩固公共讨论影响力 [3] - 企业热搜中DeepSeek（385次）和小米因AI及汽车热度分列Q1前二 [4] - 车企/手机厂商将微博作为营销核心，通过中性热搜影响消费决策 [5] 竞品对比 - 微信封闭性限制热点传播速度，抖音娱乐化削弱严肃议题深度 [4] - 小红书热点榜模仿热搜机制，但需突破公信力建设与内容平衡问题 [5] AI产品"智搜"进展 - 2024年推出基于大模型的AI搜索，2月接入DeepSeek-R1大模型，3月MAU环比增300% [6][8] - 2月日均使用量突破800万同比增306%，使用频次同比增33% [8] - 产品设计聚焦非结构化信息处理，优先引用认证账号/权威媒体内容，绑定热搜生态 [9] - 文娱与社会民生为两大核心领域，热搜TOP3包括"关税"、"金价"及娱乐话题 [11] - 提升用户搜索量5%并增强留存，但4月因隐私爬取争议遭用户抵制 [11] 平台战略方向 - 坚持热搜枢纽地位，强化议程设置能力与跨圈层传播优势 [3][4] - 通过智搜整合PUGC内容、KOL矩阵及热搜生态，结构化呈现信息 [9] - 垂类领域深耕完善"用户创造-平台聚合-品牌利用"的商业循环 [13]

对话念空科技王啸：量化对冲基金的大模型之路

36氪· 2025-05-23 17:24

核心观点 - 量化私募念空科技与上海交大计算机学院合作发表大模型研究论文，提出"自适应混合训练方法论"，成为首家闯入国际顶会NIPS的中国量化机构 [3][4][5] - 公司在DeepSeek基础上提出交替进行SFT和RL的新训练框架，实验证明在三个公开数据集上优于单独SFT、单独RL及简单混合方法 [5][23][24][25][27] - 公司通过产学研结合路径探索大模型在量化投资的应用，同时孵化AllMind进行跨领域大模型底层研究，展现从金融AI向多领域扩展的野心 [10][11][41][42] 技术创新 - 提出动态混合训练框架SASR，通过step-wise自适应算法决定每个训练阶段采用SFT或RL，相比静态混合方法在GSM8K、MATH等数据集上准确率提升显著 [25][27][28] - 实验数据显示SASR框架在1.5B/0.5B参数量下取得0.484平均准确率，优于静态混合的0.326和单独SFT的0.414 [28] - 技术突破点在于发现交替训练可避免过拟合和模型崩溃，类比人类学习中刷题与考试经验交替进行更有效 [24][25] 产学研结合 - 与上海交大合作实现优势互补：高校提供理论研究与人才资源，公司提供算力、工程经验及金融场景 [8][29][34] - 2017年组建3人AI团队起步，2019年将90%实盘模型转为Transformer算法，2021年管理规模达百亿 [17][18] - 当前AI团队规模达数十人，70%-80%为自主培养，通过6个月实习可熟练使用内部一体化研究框架 [37][38][39] 战略布局 - 成立AllMind独立公司专注大模型底层研究，与主营量化业务的念空形成分工：前者侧重基础算法与跨领域应用，后者聚焦金融数据拟合 [40][41] - 基于通义千问3进行垂直领域微调，计划开发面向普通投资者的普惠金融应用 [35][43] - 战略逻辑是通过理解大模型底层原理提升金融预测能力，同时将训练框架迁移至医药、新材料等领域 [11][33][42] 行业洞察 - 金融数据具有量少、信噪比低、不稳定的特点，与互联网数据差异显著，传统机器学习易过拟合 [7][58][59] - 量化模型不需100%准确率，IC值15%-20%即可盈利，关键是在过拟合与欠拟合间找到平衡 [54][61][62] - 大模型可突破传统拟合局限，通过跨模态理解带来超额信息，但需针对金融特点调整训练方法 [19][32][49]

中国创新力为全球经济创造机遇是外资眼中最佳投资目的地之一

央视网· 2025-05-23 15:48

央视网消息：2025年全球贸易投资促进峰会5月22日在北京举行，大会面向全球工商界发出《2025年全球贸易投资促进峰会北京倡议》。与会嘉宾表示，当前，单边主义、保护主义加剧，此时更需要多携手共同打造开放合作、互利共赢的全球产业链、供应链。英中贸易协会主席古沛勤表示，中国经济潜力很好，所以长期来看，他非常看好。这不仅仅是经济的规模，也不仅仅是增长的规模，这也是人们对新产品、新设计和各种创新的强烈需求。意大利中国理事基金会驻中国代表库珀·拉斐尔·保罗表示，中国是科技领域的佼佼者，目前在发展方面处于世界顶尖水平。即便在当前的地缘政治形势下，中国经济前景依然十分看好，这就是他们所坚信的。中国澳大利亚商会会长冯栢文表示，最近美国的关税措施非常具有破坏性。他们很高兴看到，2025年他们的调查再次呈现出一个一致的主题，即澳大利亚企业认为与中国企业在市场上建立合作关系非常重要，这提高了他们响应中国消费者需求的能力。倡议内容包括，构建数智化协同体系，维护全球产业链供应链安全稳定；共享数智技术红利，营造开放公平的创新生态；发挥数智时代新优势，促进全球贸易投资自由化便利化；加强数智技术应用，赋能绿色低碳转型；推动 ...

港大马毅谈智能史：DNA 是最早的大模型，智能的本质是减熵

晚点LatePost· 2025-05-23 15:41

智能的本质与历史 - 智能的本质是学习，生命作为智能载体通过DNA、神经系统、语言和数学等不同形式学习外部世界规律并预测未来[3][15] - 智能发展经历了四个阶段：物种进化(强化学习)、个体记忆(神经系统)、语言文明和数学科学[19][20] - 当前大模型处于类似单细胞生命的低效演化阶段，缺乏自主学习和纠错能力[21][30] 大模型技术现状 - 当前推理模型(o1/R1)主要依靠记忆模仿而非真正逻辑推理，存在训练题表现优异但基础题失误的矛盾现象[8][12] - 提升模型能力的两种核心方法：监督微调(SFT)和强化学习(RL)，通常先微调再强化学习效果更佳[10][11] - DeepSeek验证了开源模型可以低成本赶超闭源模型，500万美元训练成本被误读为全程成本[13][14] 机器智能发展方向 - 白盒大模型和闭环反馈纠错机制是突破方向，模仿生物神经系统的多路并行闭环结构[43][45] - 当前端到端开环系统只能在封闭世界运行，闭环系统才能适应开放世界的自主学习[46][47] - VLA方法通过暴力计算整合感知与动作，但非最优解决方案[48] 行业生态与教育 - 港大开设面向所有本科生的AI通识课程，涵盖智能历史、技术原理和伦理思考[37][38] - 为企业家开设AI专项课程，80多位高管参与学习技术本质与商业应用[35] - 学术界应专注原理创新而非跟随工业界，需要保持独立探索精神[44]

Artificial Intelligence

Machine Intelligence

Intelligence

Entropy Reduction

Reinforcement Learning

Supervised Fine-Tuning

Artificial Intelligence

Machine Intelligence

Intelligence

Entropy Reduction

Reinforcement Learning

Supervised Fine-Tuning

Google不革自己的命，AI搜索们也已经凉凉了？

虎嗅· 2025-05-23 11:23

Google AI搜索转型 - Google在I/O开发者大会宣布上线由Gemini驱动的高级AI搜索模式AI Mode，支持自然语言交互和结构化答案，标志着从传统"关键词+链接列表"向新范式的转变[1] - 2024年Google搜索业务贡献1750亿美元收入，占总收入一半以上，AI搜索转型可能对该核心业务造成冲击[2] - 研究机构伯恩斯坦指出，Google搜索市占率已从90%+降至65%-70%，面临AI ChatBot的竞争压力[3] AI搜索行业现状 - AI搜索赛道融资额从2024年1-7月的12.8亿美元降至2024年8-2025年4月的8.93亿美元，行业融资活跃度下降[12] - Perplexity和Glean两家公司占本期总融资额的85%，其余10家公司仅占15%，行业集中度显著提升[13] - 通用搜索引擎领域老玩家主导融资，新创企业更多集中在垂类和企业场景搜索[16] 头部公司表现 - Perplexity访问量从4500万增长至1.29亿（增幅186%），但实际订阅收入仅3400万美元，净亏损6800万美元[9] - 前百度高管创立的Genspark宣布关闭搜索引擎产品，转型AI Agent[6] - 全球Top20 AI搜索引擎4月访问量均出现下滑，Perplexity下降8.77%，秘塔AI搜索下降23.57%[29] 技术变革影响 - OpenAI o1推理模型推出后，ChatGPT等通用产品纷纷加入搜索功能，显著降低幻觉问题[24] - 传统AI搜索产品依赖"预测"而非"思考"，导致答案准确性受诟病[22] - 推理模型通过语义理解、路径选择等模块提升搜索体验，削弱专业搜索产品的差异化优势[26] 垂类搜索发展 - 医疗搜索引擎Consensus拥有40万MAU和150万美元年收入[32] - 视频搜索引擎Twelve Labs总融资达9200万美元，提供多模态视频理解解决方案[36][43] - 法律搜索引擎Qura、求职搜索引擎Micro1等垂类产品获得早期融资[33][45] 商业模式挑战 - Google计划在AI Mode中嵌入"Sponsored"标记广告，但SEO专家指出AI回答可能降低广告点击率[51] - Perplexity付费用户仅26万（占比16%），补贴模式难以为继[9] - 行业整体面临商业化难题，需要探索AI搜索可持续盈利模式[51]

最晚进入“两会时间”，这个东部省会在布什么局?

每日经济新闻· 2025-05-22 23:48

每经记者｜淡忠奎每经编辑｜杨欢 2025年即将过半，杭州进入"两会时间"。这是杭州近十年来"最晚"的一次两会，也是今年省会城市中最后一个召开两会的城市。今年以来，杭州可谓风头正劲，DeepSeek等6家位于杭州的新兴科技公司集体出圈，被称为"杭州六小龙"。"杭州有DeepSeek，我们有什么？"这样的问题在全国多地引发讨论。一年一度的政府工作报告是地方经济社会发展的重要风向标，透过各省会城市今年的政府工作报告可以看到，加码相关产业政策、布局新一轮"抢人"，几乎成为统一动作。很多人好奇，作为人工智能产业"模范生"，杭州如何为未来"点题"？ 5月22日，杭州市十四届人大五次会议开幕，市长姚高员作政府工作报告。据公开报道，"DeepSeek、通义千问等一批大模型加速发展"被写入其中。今年的重点目标任务中，杭州除了强调更大力度巩固经济回升向好态势外，还特别强调要更大力度构建创业者的天堂和创新的活力之城，如国家实验室基地群、钱塘大学、全球高端芯片设计和制造高地……种种动向，将如何"重塑"杭州？ "造高地" "为什么是杭州？" 这是过去半年时间里，外界频频发出灵魂之问。从春节后以来，重庆、福建、安徽、青海、 ...

人工智能

数字经济

Artificial Intelligence

Artificial Intelligence

Integrated Circuits

通义千问

「AI新世代」茅台基金参投！面壁智能完成新一轮数亿元融资，大模型“吸金”几家欢喜几家愁

华夏时报· 2025-05-22 22:46

资本风向转变 - 今年以来AI行业资本风向明显转变，"投应用优于投模型"成为新共识，纯技术融资窗口正在关闭 [1][7] - 曾经风光无限的"AI六小虎"多数陷入融资静默，仅智谱和面壁智能在2025年公布新融资 [1][5] - 2025年AIGC领域融资数量61笔（截至5月22日），与2024年154笔、2023年153笔相比单笔金额显著缩小 [7] 面壁智能融资与战略 - 面壁智能最新数亿元融资由洪泰基金、国中资本等联合投资，重点布局"端侧大脑"在千行百业的规模化应用 [2] - 公司成立以来完成四轮融资：2023年天使轮（知乎领投）、2024年4月数亿元（春华创投领投）、2024年12月数亿元（龙芯创投等领投）、2025年最新轮 [2] - 核心产品为端侧模型MiniCPM系列，已迭代至全模态版本MiniCPM-o 2.6，差异化避开通用基座大模型竞争 [3] - 重点拓展汽车领域：2025年3月进军智能座舱，4月与英特尔/中科创达合作，本月与德赛西威发布端侧大模型语音方案 [5] 智谱的逆势崛起 - 智谱2025年连续获得超20亿元战略融资：杭州城投等投资10亿元（3月3日）、华发集团5亿元（3月13日）、成都高新区3亿元（3月19日）、北京AI基金追加2亿元（4月） [8] - 当前估值达360亿元，融资策略转向"股东即客户"模式，通过政务/产业场景实现商业落地 [8] - 启动上市辅导备案，成为大模型寒冬中少数持续获得资本支持的案例 [8] 行业生态剧变 - DeepSeek崛起引发两大转折点：垂直小模型数量增长超百倍，大模型调用成本下降近百倍 [7] - 技术门槛降低催生"单人AI超级应用公司"趋势，轻量级团队可用十万元成本开发应用 [7][8] - 行业将形成2-3个"基础模型平台+海量垂直应用"格局，DeepSeek、阿里等少数玩家主导底层，其他企业需快速切入场景求生 [9] 企业转型案例 - 零一万物拥抱DeepSeek技术，百川智能专注AI医疗，体现应用层转型趋势但2025年均未公布新融资 [7] - 面壁智能通过端侧模型绑定终端场景（AI Phone/PC/汽车等），成为资本青睐的应用代表 [3][5]

Artificial Intelligence

大模型

端侧模型

Artificial Intelligence

面壁小钢炮MiniCPM

面壁小钢炮MiniCPM - o 2.6

Artificial Intelligence

大模型

端侧模型

Artificial Intelligence

面壁小钢炮MiniCPM

面壁小钢炮MiniCPM - o 2.6

马来西亚紧急撤回！部署华为AI芯片

国芯网· 2025-05-22 22:12

国芯网[原:中国半导体论坛] 振兴国产半导体产业！不拘中国、放眼世界！关注世界半导体论坛 ↓ ↓ ↓ 当地时间5月19日，马来西亚19日才宣布成为第一个全国部署华为「Ascend（升腾）GPU驱动AI服务器」的国家，彭博新闻审阅过的讲稿指出，马来西亚计划2026年前部署3千台华为升腾芯片AI服务器，同时中国新创DeepSeek也提供AI模型之一，这也是中国AI芯片首次在海外进行规模化部署。但《彭博新闻》报道，消息才公布一天，马来西亚政府便急转弯撤回言论，且不作任何解释。目前，尚不清楚该项目是否会按原计划推进，中国相关AI芯片公司也表示尚未在马来西亚销售芯片，当地政府也未采购相关设备。美国白宫人工智能顾问萨克斯在社交媒体上表示："正如我早已警告的，中国的完整AI体系已经出现。" 第一步：扫描下方二维码，关注国芯网微信公众号。第二步：在公众号里面回复"加群"，按照提示操作即可。爆料｜投稿｜合作｜社群文章内容整理自网络，如有侵权请联系沟通投稿或商务合作请联系 iccountry 美国商务部日前宣布升级华为升腾AI芯片出口管制措施，明确规定全球任何地方使用华为产品均会违反美 ...

Meta启动“Llama初创扶持计划”，助力AI初创企业加速发展

搜狐财经· 2025-05-22 19:53

尽管如此，meta对Llama及其广泛的生成式AI产品组合仍寄予厚望。该公司曾预测，其生成式AI产品将在2025年实现20亿至30亿美元的收入，并在2035年达到4,600亿至1.4万亿美元。为了实现这一目标，meta与一些托管其Llama模型的公司签订了收入分成协议，并推出了一个用于定制Llama版本的API。meta的 AI助手meta AI（由Llama提供支持）未来还可能展示广告并推出带有额外功能的订阅服务。然而，这些雄心勃勃的计划背后是巨大的开发成本。据报道，meta在2024年的"生成式AI"（GenAI）预算超过了9亿美元，而今年的预算可能会超过10亿美元。这还不包括运行和训练模型所需的基础设施成本。meta此前已表示，计划在2025年投入600亿至800亿美元用于资本支出，主要用于新建数据中心，以支撑其AI业务的快速发展。 | | | E -ablish Metrics Dash pard | | un AB Testing | Deplay to Clud Platform | Strategy | content Create Demo for Investors | | --- ...

Meta Platforms(US:META)

Artificial Intelligence

Llama

meta AI

Artificial Intelligence

Llama

meta AI

5分钟读懂Lilian Weng万字长文：大模型是怎么思考的？

虎嗅· 2025-05-22 17:54

大模型思考机制 - 从心理学角度类比人类思考系统1（直觉快速）和系统2（分析缓慢） LLM早期输出类似系统1 增加思考时间可激活系统2式推理 [6][7] - 计算资源视角将思考定义为可分配的计算量总和神经网络通过调整前向传递资源实现动态思考 [8] - 数学建模将思考过程视为隐变量通过概率模型整合多路径思考可优化答案分布 [10][11] 模型训练方法论 - 思维链（CoT）技术演进：从模仿人类推理到强化学习自动优化模型规模与CoT收益呈正相关 [12][13] - 强化学习规模化应用案例：DeepSeek R1采用并行采样（best-of-N）与顺序改进（反思修正）双路径训练纯RL训练也可涌现高级推理能力 [15][17] - 外部工具调用成为新范式 OpenAI o3/o4-mini与Claude sonnet3.7集成代码解释器/网页搜索等多模态工具 [19][20][21] 前沿技术挑战 - 思考忠实性问题：专用推理模型（如Claude 3.7 Sonnet）比通用模型更易展示真实思考链但直接奖励诚实性可能导致反向作弊 [23][24] - 计算效率平衡：当前阶段增加test-time计算量优于单纯扩参但受限于基础模型潜力天花板 [26][27] - 架构创新方向：动态深度RNN 改进型Transformer 思考token插入潜变量建模等28] 开放研究问题 - 强化学习激励机制设计：需兼顾人类可读性思考真实性反reward hacking三重目标 [29] - 能力迁移路径：如何将推理模型性能提升蒸馏回基础模型实现技术代际传承 [31] - 自适应思考机制：建立问题难度与思考时间的动态匹配算法 [31]