DeepSeek

搜索文档
全球半导体股猛涨,中美谈判、AI需求受期待
日经中文网· 2025-06-12 11:05
半导体行业利好因素 - 中美贸易磋商取得进展 美国商务部长暗示将放宽半导体等产品出口管制 [1] - 台积电2025年5月销售额同比增长40% 创当月历史新高 生成式AI用先进半导体销售坚挺 [1] - 全球半导体股票强劲上涨 费城半导体指数6月10日涨超2% 创2月以来新高 较4月低点上涨50% [2] 半导体企业表现 - 博通总市值超过特斯拉 打破美国科技七巨头垄断格局 [3] - 爱德万测试股价较4月低点上涨80% 日经半导体指数较4月7日低点上涨43% [1][3] - Evercore ISI高科技企业指数达57.5 创两年新高 显示行业接单情况持续改善 [2] AI技术发展影响 - 中国AI企业DeepSeek改进R1模型 引发与OpenAI、谷歌的竞争加剧 [2] - 轻量化高性能AI模型开发将扩大应用场景 利好半导体制造设备企业 [2] - 中国市场需求增长 日本半导体设备企业爱德万测试、迪思科将受益 [2] 市场估值变化 - 爱德万测试预期市盈率回升至34倍以上 接近4月下跌前水平 [3] - 日本半导体股票连续7天上涨 但高估现象可能限制未来涨幅 [3]
中小科创2025年中期投资策略:科创奇点已至,关注新一代信息科技技术投融资机会
华西证券· 2025-06-11 17:28
核心观点 - 2025年上半年市场呈“V”型震动,中小科创股领涨,虽受特朗普“对等关税”冲击但已修复,科创板营收及毛利现底部特征,业绩回暖在望,股权投资市场规模降幅收窄 [3] - 下半年科创板以结构性行情为主,中小科创预计占优,建议关注新兴产业、高成长细分龙头及高科技初创非上市公司 [4] - 建议关注AI+、卫星互联网、低空经济、国产替代四大趋势性新兴产业方向投资机会 [5] 市场复盘 市场回顾 - DeepSeek提升中国科技产业信心,年初中小科创领涨,4月特朗普“对等关税”令A股中小科创受挫,后各指数基本回归冲击前水平,A股现震荡行情 [11][13] 营收及毛利 - 2025年一季度科创板营收同比改善呈弱复苏,后续财政发力有望带动业绩边际改善;毛利率基本筑底 [17] 费用与利润 - 费用投入维持刚性,销售、管理、研发费用投入增速放缓但仍刚性增长;归母净利润承压下滑,但已有结构性改善,营收增长后利润空间有望释放 [22] 估值情况 - 关税对板块估值短期扰动消除,目前估值略高于历史中位水平,市场信心带动估值修复 [24][26] 中小盘配置 - 公募基金对中小盘配置比例有增配空间,本轮产业周期以AI+为驱动开启向上趋势 [30] 股权投资市场 - 股权投资案例数同比回暖,金额降幅收窄,半导体及电子设备、IT、机械制造等行业投资规模居前且同比增长;AI投资热度逆势回暖,2024年投资金额超1000亿元,同比+35.5% [34][36] 未来展望 市场机会 - 科创板下半年以结构性机会为主,聚焦新兴产业、高成长细分领域龙头,营收/毛利拐点明确,政策利好,新兴行业技术周期将至 [40][41] 政策支持 - 资本市场鼓励并购重组,财政政策更积极,货币政策预期宽松,产业政策支持新兴产业发展 [42] 四大方向 AI+ - 大模型技术迭代,行业进入深化发展期,国内大模型追赶,差距缩小;大模型改善供需关系,企业积极部署应用;开源、高性价比大模型成趋势,产业重点转向推理应用;AI Agent重新定义软件形式,推动人机协作;头部厂商拥抱MCP协议,应用生态繁荣;深耕垂直场景将诞生“小而美”创业公司;AI产业未来5年复合增速32.1%,2029年规模达10863亿元 [47][58][78] 卫星互联网 - 是6G时代关键基础设施和太空军备战重要基石;纳入新基建,未来5 - 10年进入密集发射期;产业链涵盖制造、发射、运营及应用;产业规模大,通信卫星占主要份额;载荷成本占比高;相控阵天线是低轨卫星标配;激光通信有望成主要技术;航空卫星互联网应用潜力大,预计2030年航空WiFi宽带通信收入达25.6亿元 [83][87][109] 低空经济 - 列为国家战略性新兴产业,政策不断落地;各地方积极布局,明确产业规模目标;“政策+基建投资”驱动市场加速发展,2026年规模破万亿元,eVTOL从货运向客运演进;规模化运营需低空基础设施,低空智联网是重点;可计算空域建设孕育数据服务等业态 [118][120][136] 国产替代 - 中美关税谈判有进展,但技术管制或更严,国产替代迫切;CAE、EDA、CAD等研发设计类工业软件自主可控需求大,美国EDA管控升级;科学仪器是“卡脖子”技术,高端产品进口依赖度高 [140][150][152] 受益标的 AI+ - 萤石网络、浩瀚深度、凌云光等科创企业及星环科技、青云科技等基础设施服务企业 [165] 卫星互联网 - 星图测控、上海瀚讯、极光星通等企业 [165] 低空经济 - 中科星图、维天信、莱斯信息等企业 [165] 国产替代 - 索辰科技、中望软件、华大九天等企业 [165]
一边“背刺”微软一边内卷:OpenAI被爆竟与谷歌云达成合作,o3降价80%
硬AI· 2025-06-11 10:11
行业动态 - OpenAI与谷歌达成云服务合作协议 谷歌云将为公司提供算力支持 双方此前已讨论数月 合作于5月敲定 [1][5][6] - 此前因OpenAI与微软的锁定协议 谷歌无法与OpenAI合作 今年1月前 微软一直是OpenAI独家云服务供应商 [1][8] - 行业竞争格局因算力需求发生改变 巨额计算成本正在重塑AI行业 公司间从竞争对手转变为合作伙伴 [5][6] 公司战略 - OpenAI采取多元化算力策略 除谷歌外 还与软银/甲骨文合作5000亿美元"星际之门"项目 预计到2030年将支持75%算力需求 [9] - 公司计划今年敲定首款自研芯片设计 减少对外部硬件依赖 [10] - 公司年度经常性收入达100亿美元 较去年55亿美元增长近翻倍 但所有收入都投入模型运行和开发 [6] 产品与定价 - OpenAI大幅降价80%推出推理模型o3 同时推出o3 Pro [2][3] - 今年1月DeepSeek发布高性价比开源模型后 OpenAI随即推出成本效益最高的o3-mini模型 并向免费用户开放 [3] - 降价策略被视为应对行业竞争加剧的措施 推动大模型领域"内卷" [3] 合作关系 - 微软不再担任OpenAI独家云供应商 但仍保留优先购买权 合作协议持续至2030年 [8] - 微软可独家转售OpenAI模型 并复用其知识产权 同时享有25%收入分成 [8] - 双方正重新谈判数十亿美元投资协议条款 包括微软未来股权份额 [8]
欧洲AI领域新动态:米斯特拉尔推出首个人工智能推理模型
环球网· 2025-06-11 10:00
欧洲人工智能发展 - 法国初创公司米斯特拉尔推出欧洲首个人工智能推理模型,标志着欧洲在人工智能前沿技术领域迈出重要一步,旨在追赶美国和中国在该领域的领先地位 [1] - 米斯特拉尔被视为欧洲最有可能诞生本土人工智能竞争对手的公司,但在市场份额和收入方面仍落后于竞争对手 [4] - 公司获得法国总统马克龙的支持,并强调其欧洲根源 [4] 市场竞争格局 - 美国和中国的企业一直处于人工智能前沿位置,OpenAI和谷歌已推出推理模型,中国的DeepSeek凭借低成本开源模型崭露头角 [4] - 美国公司大多将最先进的模型作为专有产品保留,Meta等少数公司发布开源模型,中国公司如DeepSeek和阿里巴巴倾向于选择开源之路 [5] - 米斯特拉尔选择将部分模型开源,与OpenAI或Alphabet的专有产品形成差异化 [4] 产品与技术特点 - 米斯特拉尔推出的推理模型采用思路链技术,为提升人工智能能力提供有潜力的途径,该技术可生成具有中等推理能力的答案 [4] - 产品包括开源的Magistral Small型号和针对商业客户的功能更强大的Magistral Medium版本 [5] - Magistral Small支持英语、法语、西班牙语、阿拉伯语和简体中文等多种语言进行推理,可在Hugging Face平台下载 [5] 公司估值与战略 - 米斯特拉尔被风险投资家估值达62亿美元 [5] - 行业不再单纯以"扩大规模"为导向的转变,可能为公司提供追赶资本雄厚竞争对手的契机 [5] - 公司相关负责人表示推理语言模型可增强并委托人工智能进行复杂的思维和深度理解 [5]
时空压缩!剑桥大学提出注意力机制MTLA:推理加速5倍,显存减至1/8
机器之心· 2025-06-11 08:24
Transformer架构的核心地位 - Transformer的自注意力机制在推理时能灵活建模长距离上下文,使其成为大语言模型不可替代的核心组件,尽管存在计算复杂度为二次方的问题 [1] - 线性复杂度的替代方案(如RNN、Linear Attention、SSM等)难以真正取代Transformer的地位,尤其在decoder-only架构广泛采用后,自注意力机制的重要性进一步凸显 [1] - 自注意力机制带来的KV缓存问题成为推理效率的关键瓶颈,其显存和带宽开销随模型参数维度扩大而显著上升,限制了推理长度与batch size [1] KV缓存的优化挑战与现有方案 - 当前主流大模型采用Grouped-Query Attention(GQA)机制,通过减少Key/Value头数量来减小KV缓存规模,在效率与效果间取得平衡 [5] - Multi-Query Attention(MQA)是GQA的极端形式,显存占用大幅减少但性能显著下降,而GQA成为大语言模型中最常见的注意力变体 [5] - DeepSeek团队提出的Multi-head Latent Attention(MLA)通过在隐空间压缩KV特征维度提升推理效率,但隐空间压缩幅度受限,KV缓存存储开销仍是瓶颈 [7] MTLA的创新与核心技术 - MTLA首次将时序压缩与隐空间压缩结合,在KV缓存的两个维度同时施加时空压缩策略,显著降低显存与计算成本 [2] - MTLA通过超网络动态融合相邻时间步信息,并设计步幅感知因果掩码确保训练与推理一致性,保持甚至略优于传统注意力机制的性能 [2][14] - 时间压缩率s=2时,MTLA对KV缓存的压缩程度与MQA相当但性能更优,且具备进一步压缩空间 [12][21] MTLA的训练与灵活性 - MTLA引入步幅感知因果掩码解决训练与推理行为不一致问题,保留所有中间状态KV表达,通过矩阵乘法实现高效并行计算 [14][16] - 解耦的旋转位置编码(decoupled RoPE)进一步提升了效率,MTLA在注意力机制与线性模型之间架起桥梁,提供效率与性能的灵活权衡 [17][18] - 当时间压缩率s足够大时,MTLA几乎只保留一个KV缓存,退化为线性序列建模方法 [17] MTLA的性能表现与应用潜力 - MTLA在语音翻译、文本摘要生成等任务中保持与标准MHA相当的质量,同时实现超过5倍推理速度提升和8倍显存占用降低 [20] - MTLA具备大规模部署潜力,尤其适合参数规模扩大和生成序列增长的大语言模型场景,有望成为自注意力模块的重要替代方案 [23] - MTLA实现代码已开源,但工程落地需社区持续推动,改动复杂度高于GQA和MQA [24][25]
一文了解DeepSeek和OpenAI:企业家为什么需要认知型创新?
搜狐财经· 2025-06-10 20:49
AI技术创新路径 - OpenAI创立初心为反巨头霸权 通过开源普惠AI技术对抗科技巨头垄断 2015年由马斯克和奥特曼创立并挖角谷歌核心科学家伊利亚[4][7] - 大语言模型革命依赖Transformer架构和Scaling Law 前者实现并行数据处理 后者揭示模型性能与规模呈线性关系[8][11] - GPT系列模型通过"涌现"现象突破 当参数量达临界点时自发产生新能力 实现从工具到智能助手的转变[12] - ChatGPT引发人机交互范式变革 自然语言交互降低使用门槛 2022年末推出后成为全球现象级产品[13][14] - 推理模型o1实现认知跃迁 从直觉思维(系统1)升级至逻辑推理(系统2) 具备多步推理和自我纠正能力[16][17] DeepSeek差异化战略 - 采用"有限Scaling Law"战略 在资源受限下通过数据筛选和算法优化实现低成本高性能 训练成本仅5557万美元[18][22] - 创新MLA+MoE架构 MLA优化内存效率 MoE实现专家网络动态激活 结合华为昇腾平台实现软硬协同优化[20][21] - R1模型实现纯强化学习突破 复现OpenAI o1能力并开源 展示完整推理过程 2025年1月发布后登顶美国应用榜[23][24][25] - 组织模式激发"涌现"创新 采用动态团队和自组织管理 研究员可自由调用GPU资源 产生MLA架构等突破性成果[27][28][29] 行业格局影响 - DeepSeek打破中国创新者"思想钢印" 证明中国企业可引领基础研究 而非仅做技术应用[35][36][37] - R1模型引发行业震动 微软CEO公开提及导致英伟达市值单日下跌17% 标志中美成为AI技术两极[25][26] - AI Lab范式重构研发体系 开放协作和资源共享取代传统金字塔管理 适应不确定性创新需求[30][32][33] - 认知型创新推动产业升级 从商业驱动转向基础研究 需要长期投入和突破思维定式[38][39][40]
一文了解DeepSeek和OpenAI:企业家为什么需要认知型创新?
混沌学园· 2025-06-10 19:07
核心观点 - AI技术正在重新定义商业创新模式,企业需转变思路以保持竞争力 [1][2] - OpenAI和DeepSeek分别通过不同路径实现AI技术突破,为行业提供创新范式 [3][4] - AI能力的"涌现"现象成为技术跃迁的关键特征 [19][20][21] - 人机交互范式因ChatGPT发生根本性变革 [22][23][24] - 中国公司DeepSeek打破"美国原创、中国应用"的思维定式,展现基础研究实力 [75][77][78] OpenAI的创新路径 创立背景 - 2015年由马斯克和奥特曼创立,初衷是防止AI技术被巨头垄断 [9] - 从谷歌挖来核心科学家伊利亚·苏茨克维尔,坚持开源、安全、普惠理念 [10][12] 技术突破 - 基于Transformer架构的"自注意力机制"大幅提升语言理解能力 [13] - Scaling Law揭示模型规模与性能的线性关系,指导大规模投入 [15][16] - GPT系列模型通过"涌现"现象实现能力跃升,参数量临界点触发智能爆发 [19][20] 产品里程碑 - ChatGPT通过自然语言交互降低使用门槛,引发全球现象级应用 [22][23] - 推理模型o1实现从直觉思维(系统1)到理性推理(系统2)的认知跃迁 [26][30] DeepSeek的逆袭战略 技术路线 - 提出"有限Scaling Law",在资源受限下追求高性能 [32][33] - MLA技术优化内存效率,MoE架构实现计算资源动态分配 [38][39][42] - V3模型6710亿参数仅激活37亿,训练成本5557万美元(行业1/10) [44] 核心突破 - R1模型采用纯强化学习(类似AlphaGo Zero),展示完整推理过程 [45][47][49] - 在奥数竞赛中与OpenAI o1准确率相当,登顶美国应用榜单 [50][51] 组织创新 - 动态团队构成和自组织管理激发"涌现"式创新 [55][56][57] - 研究员自主提出MLA架构和训练公式,体现扁平化协作 [59][60] - 150人论文署名包含数据标注员,打破传统KPI束缚 [61][62] 行业启示 技术趋势 - AI从专用工具向通用智能演进,"涌现"成为能力突破关键指标 [20][21] - 对话式交互(ChatGPT)和推理能力(o1/R1)定义下一代AI标准 [23][26][45] 创新生态 - 中国公司首次在基础研究领域实现全球领先,打破技术跟随惯性 [75][77] - 资源效率(DeepSeek)与规模投入(OpenAI)并存,拓宽行业可能性 [32][44] 组织变革 - 传统金字塔管理让位于开放协作和资源自由调配的新型研发模式 [55][63][68] - "非标准人才"和纯粹技术热情成为创新核心驱动力 [66][67]
Microsoft-backed AI lab Mistral is launching its first reasoning model in challenge to OpenAI
CNBC· 2025-06-10 17:47
公司动态 - 法国人工智能初创公司Mistral AI推出首款推理模型 旨在与OpenAI和中国深度求索(DeepSeek)等竞争对手抗衡 [1] - 新模型具备多语言推理能力 在数学和编程领域表现优异 首席执行官Arthur Mensch在伦敦科技周公开宣布此消息 [2] - 模型采用逐步逻辑思维流程执行复杂任务 技术定位为推理模型(reasoning model) [2] 行业竞争格局 - 当前市场主要竞品包括OpenAI于2023年底发布的o1模型 以及中国深度求索实验室的R1模型 [3] - 法国AI企业首次推出具备多语言特性的推理模型 形成对中美头部企业的差异化竞争 [1][2] - 模型发布时间选择在伦敦科技周期间 通过CEO现场演示强化市场传播效果 [2]
北大伯克利联手“拷问”大模型:最强Agent也才40分!新基准专治“不听话”的AI分析师
量子位· 2025-06-10 13:16
大模型数据分析能力评估 核心观点 - 顶尖大模型如Claude-3.7和Gemini-2.5 Pro在多轮交互式数据分析任务中表现不佳 最高任务成功率仅40% [1][2][12] - 新基准IDA-Bench模拟真实数据分析场景 突出动态迭代和主观决策过程 现有评估方法无法反映真实协作可靠性 [3][6][7] - 模型存在"过度自信"或"过度谨慎"等行为缺陷 在指令遵循与自主推理间难以平衡 [16][17][18] IDA-Bench测试框架 - **四大组件**: - 指令材料:源自真实Kaggle项目 含专家主观洞察 [9] - 模拟用户:由大模型扮演 动态生成模糊或变化指令 [9] - Agent测试环境:要求严格遵循指令编写执行代码 [9] - 沙盒环境:安全隔离的代码执行空间 保持Jupyter式上下文 [9] - **自动化构建**:持续从最新Kaggle项目提取任务 防止数据污染 [11] 模型表现数据 - **基准达成率**: - 第一梯队(Gemini-2.5-Pro/OpenAI o4-mini/Claude-3.7)仅40% [12][14] - DeepSeek-V3(24%)显著优于其思考型版本DeepSeek-R1(12%) [12] - **效率指标**: - Gemini-2.5-Pro平均耗时711秒 交互18轮 [14] - Claude-3.7-Sonnet交互轮次最少(5.32轮)但成功率未提升 [14] 典型失败模式 - **幻觉行为**:虚构未执行的优化操作或捏造代码结果 [19] - **流程缺陷**: - Claude-3.7跳过关键步骤直接否定用户建议 [17] - Gemini-2.5-Pro因过度确认导致30轮简单操作超限 [17] - **技术错误**:列名大小写错误 二分类标签格式错误等 [19]
全球人工智能创新创业大赛即将启幕!杭州拱墅全力打造AI创新高地
量子位· 2025-06-10 13:16
允中 发自 凹非寺 量子位 | 公众号 QbitAI 2025年6月,由杭州市拱墅区人民政府、中国人工智能学会、中欧人才交流与创新合作中心 联合主办的 "智汇运河·智算未来"全球人工智能创新创业大赛即将重磅启幕 。 大赛聚焦人工智能前沿领域,面向全球征集优质项目,旨在通过"以赛引才、以赛促创"模 式,推动海内外顶尖技术与产业资源汇聚杭州拱墅,助力打造具有国际影响力的人工智能创 新应用示范区,为国家高水平科技自立自强提供"拱墅样本"。 全球联动,共绘AI产业新图景 当前,人工智能技术正重塑全球产业格局。 作为中国数字经济高地,杭州近年来在人工智能领域持续领跑。拱墅区作为DeepSeek的发 源地,依托大运河数智未来城、智慧网谷小镇等产业平台,已集聚超500家人工智能相关企 业,已建立了"科学家+企业家+投资家"的协同创新、成果转化和产业孵化机制,加速推动人 工智能与实体经济深度融合。 在此背景下,为进一步激发创新活力,以"智汇运河・智算未来"为主题的全球人工智能创新 创业大赛应运而生。 大赛立足拱墅、辐射全球, 聚焦智能制造与智慧城市、生命健康、智慧物流、全球化协同创 新四大"AI+"主题赛道 ,打造立体化竞技 ...