Workflow
开源模型生态
icon
搜索文档
CES2026:英伟达六大芯片协同升级,算力+存力迈入新纪元
信达证券· 2026-01-11 23:04
行业投资评级 - 看好 [2] 报告核心观点 - 英伟达在CES 2026正式发布Rubin平台,标志着AI算力进入新纪元,全球算力设施向“AI工厂”范式全面转型 [2][3] - Rubin平台通过六大芯片的协同设计,实现了推理性能的大幅提升和成本的显著下降 [2][7] - 报告认为,Rubin平台的升级将带动算力、存储、PCB、机架等多个产业链环节价值量显著提升,相关核心环节在基建投资化趋势下具备较大成长空间 [3][39] 根据相关目录分别总结 Vera Rubin:六大芯片协同升级,推理性能大幅提升 - 英伟达于CES 2026发布Rubin平台,该平台由Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9 SuperNIC、BlueField-4 DPU和NVIDIA Spectrum-6以太网交换机六款全新芯片组成,通过协同设计旨在大幅缩短训练时间并降低推理token成本 [2][7] - 平台的旗舰产品是Vera Rubin NVL72机架级系统,其设计目标是实现可预测的延迟、高利用率及高效的电力转化 [7] 算力:NVFP4推理性能提升5倍,推理成本显著下降 - Vera CPU拥有88个定制Olympus核心,系统内存达1.5TB,是Grace CPU的3倍,数据处理性能翻倍提升 [12] - Rubin GPU引入Transformer引擎,其NVFP4推理性能高达50 PFLOPS,是Blackwell GPU的5倍;NVFP4训练性能达到35 PFLOPS,是Blackwell的3.5倍 [2][13] 存储:针对大量KV Cache问题,推出推理上下文内存存储平台 - Rubin GPU集成新一代HBM4,每个GPU最高配备288GB,总内存带宽提升至22 TB/s,是Blackwell的2.8倍 [14][20] - 每个Vera CPU搭载最高1.5TB的LPDDR5X内存,带宽达1.2 TB/s,并通过第二代NVLink-C2C与GPU实现1.8 TB/s的一致性带宽,形成统一内存池 [17] - 平台引入由BlueField-4 DPU驱动的NVIDIA推理上下文内存存储,用于存储KV Cache,该架构可将每秒tokens数提升高达5倍,并实现高达5倍的能效提升 [2][18] - 每个存储节点配置4个BlueField-4 DPU,每个DPU背后有150TB上下文NAND,分配到每块GPU上额外获得16TB NAND,带宽保持200 Gbps [18] PCB:从Cable Tray到Cableless互联,PCB价值量显著提升 - Rubin NVL72采用cableless无缆互联架构,通过PCB板直接传输信号,取代了上一代Blackwell NVL72的复杂线缆连接 [22] - 这种机械简化使组装速度比上一代托盘架构快18倍,并显著缩短了现场维护服务时间,降低了部署和运营成本 [2][22] Rack:系统协同设计显著提升,ODM环节核心受益 - NVIDIA DGX SuperPOD作为大规模AI工厂部署蓝图,采用8套DGX Vera Rubin NVL72系统,并通过极致协同设计大幅降低训练与推理成本 [25] - 与上一代Blackwell相比,训练相同规模的MoE模型仅需1/4的GPU数量;在相同延迟下,大型MoE模型的token成本降低至1/10 [25] 开源模型:从数据到代码全覆盖,Nemotron 3重构Agentic AI范式 - 英伟达扩展其开源模型生态,覆盖生物医学AI、AI物理模拟、Agentic AI、物理AI、机器人和自动驾驶六大领域 [2][29] - Nemotron系列是更新重点,覆盖推理、RAG、安全和语音四个应用方向,提供了包括小型化推理模型、强化学习工具、向量嵌入模型、内容安全模型及语音处理库等一系列工具 [2][32] 物理AI:从Cosmos到Alpamayo,走向商业化落地 - 在物理AI领域,英伟达更新了视频理解与生成模型Cosmos、机器人基础模型Isaac GR00T以及自动驾驶视觉-语言-行动模型Alpamayo [2][33] - Cosmos是一个开源的世界基础模型,能用海量视频、驾驶与机器人数据及3D模拟进行预训练,具备生成内容、推理和预测轨迹等能力 [33] - Alpamayo是面向自动驾驶领域的开源工具链,也是首个开源的视觉-语言-行动推理模型,其突破在于引入了“推理”能力,能理解复杂场景的因果关系并做出多步决策 [34] 投资建议 - 报告建议关注四大方向的投资机会 [3][40] - 海外AI产业链:包括工业富联、沪电股份、鹏鼎控股、胜宏科技、生益科技、生益电子等 [40] - 国产AI产业链:包括寒武纪、芯原股份、海光信息、中芯国际、深南电路等 [40] - 存储产业链:包括德明利、江波龙、兆易创新、聚辰股份、普冉股份等 [40] - SoC产业链:包括瑞芯微、乐鑫科技、恒玄科技、晶晨股份、中科蓝讯等 [40]
报告:中国科技50强营收增长率较去年略有下降
第一财经· 2025-12-17 12:41
2025德勤中国高科技高成长及医药健康企业报告核心观点 - 中国高科技高成长企业整体增长强劲但增速略有放缓,行业分布呈现向硬科技转型趋势,人工智能成为关键驱动力并面临人才与应用挑战 [3][4] - 医药健康领域创新企业估值显著,创新药与医疗器械是核心赛道,创新活动高度集中于三大城市群 [5] 高科技高成长企业整体表现 - 2025年中国50强企业三年累计营收增长率的平均值为490%,较2024年略有下降 [3] - 50强企业中Top10企业的营收增长率与2024年基本持平 [3] - 营收规模在5000万至1亿元区间的企业占比显著提升至38% [3] - 营收规模1亿元以上的企业占比为44%,与去年持平 [3] 高科技高成长企业地域与行业分布 - 从地域分布看,大湾区企业占比达52%,深圳、上海、北京、广州稳居前列 [3] - 硬件行业以28%的占比位居行业分布首位,受益于半导体领域增长 [3] - 高端装备行业以18%的占比位列第二,依托智能制造细分赛道的表现 [3] - 清洁技术行业占比提升至10%,因新能源企业入选较多 [3] - 软件、生命科学行业占比较上年下降,互联网行业降幅显著,体现向硬科技转型趋势 [3] 高科技企业发展的驱动力与挑战 - 人才、资本与AI研发投入成为企业推动科技与创新的三大关键驱动力 [4] - 23%的中国50强企业和66%的明日之星企业,其AI研发投入占营收的50%以上 [4] - 企业普遍面临高技术人才短缺、AI技术业务场景应用不足以及研发成本攀升的挑战 [4] - 核心技术自主研发、产品快速迭代和多元化融资正成为企业韧性发展的突破口 [4] 人工智能与科技发展趋势 - 全球科技行业正经历AI驱动的深层次变革,核心趋势包括算力主权竞争、开源模型生态崛起、软硬件融合下的具身智能落地、AI智能体进化以及AI全域化赋能 [5] - 越来越多的科技企业将AI智能体从工具化向数字员工化演进,以提升效率、创新力与竞争优势 [5] - 2025至2030年,中国将进入“AI+制造/新能源/生命”多技术矩阵爆发期,成为全球“算力替代人力”的受益方与备份提供方 [5] - 当前中国科技正从AI全面渗透、算力与连接技术迭代、机器人技术爆发、能源与绿色科技突破以及空间与低空经济崛起五个方面加强技术创新 [5] 医药健康明日之星企业表现 - 2025年逾六成上榜医药健康企业的估值突破10亿元 [5] - 创新药与医疗器械合计占比达80%,是当前最具创新活力的两大核心赛道 [5] - 长三角、京津冀和珠三角三大区域汇聚了近九成的上榜企业,是医药健康领域的关键创新策源地 [5]
报告:中国科技50强营收增长率较去年略有下降
第一财经· 2025-12-16 17:48
核心观点 - 中国高科技高成长企业增长强劲但增速略有放缓 三年累计营收增长率平均值达490% 头部企业增长稳定 同时行业呈现向硬科技转型的明显趋势 [1] - 人才、资本与AI研发投入是推动企业科技创新的三大关键驱动力 AI研发投入占营收50%以上的企业在明日之星中占比高达66% [2] - 全球科技行业正经历AI驱动的深层次变革 中国科技行业在多领域拓展布局 预计2025-2030年将进入“AI+制造/新能源/生命”多技术矩阵爆发期 [3] 企业增长与营收特征 - 2025年中国50强企业三年累计营收增长率的平均值为490% 相比2024年略有下降 Top10企业营收增长率与2024年基本持平 [1] - 营收规模在5000万至1亿元人民币的公司占比显著提升至38% 营收1亿元以上的公司占比为44% 与去年持平 显示中小企业营收区间占比提升 [1] 地域与行业分布 - 在地域分布上 大湾区占比达52% 深圳、上海、北京、广州稳居前列 一线城市凭借成熟的产业基底、人才储备与资本资源 仍是科技企业主要诞生地 [1] - 在行业分布上 硬件行业以28%的占比居首 高端装备以18%位列第二 清洁技术占比提升至10% 软件、生命科学占比下降 互联网行业降幅显著 体现行业向硬科技转型趋势 [1] 创新驱动力与挑战 - 23%的中国50强企业和66%的明日之星企业 其AI研发投入占营收的50%以上 [2] - 企业普遍面临高技术人才短缺、AI技术业务场景应用不足以及研发成本攀升等挑战 [2] - 核心技术自主研发、产品快速迭代和多元化融资正成为企业韧性发展的突破口 [2] AI技术发展趋势与企业应用 - 全球科技行业趋势包括算力主权竞争、开源模型生态崛起、软硬件融合的具身智能落地、AI智能体进化以及AI全域化赋能 [3] - 越来越多的科技企业将AI智能体从工具化向数字员工化演进 以全面提升效率、创新力与竞争优势 [2] - 中国科技正从AI全面渗透、算力与连接技术迭代、机器人技术爆发、能源与绿色科技突破以及空间与低空经济崛起五个方面加强技术创新 [3] 医药健康行业洞察 - 2025年逾六成上榜医药健康企业的估值突破10亿元人民币 [3] - 创新药与医疗器械合计占比达80% 是当前最具创新活力的两大核心赛道 [3] - 长三角、京津冀和珠三角三大区域汇聚了近九成的上榜医药健康企业 是关键创新策源地 [3]
看完AI总结的Founder Park、量子位、数字生命卡兹克爆款逻辑,「锦秋集」成为科技大号有希望了| Jinqiu Scan
锦秋集· 2025-11-14 15:24
测评设计与方法 - 采用双阶段混合策略解决大语言模型在大规模数据分析时的性能瓶颈问题,包括内存溢出、分析时间拉长、统计一致性下降和可视化绘制不稳定等挑战[3][4][6] - 第一阶段使用Python完成所有可量化分析任务,输出结构化summary.json文件,确保计算严谨性[7][10][12] - 第二阶段由语言模型基于JSON数据生成具有洞察力的完整HTML报告,包含可视化图表和策略建议[8][15][18][22][23] 模型性能对比 - Claude能生成逻辑正确的代码但需人工执行,Minimax Agent能直接生成可运行代码并自动输出JSON文件,集成体验最佳[25] - Step 3生成结果需人工修正,文件格式支持受限,不兼容JSON/TXT文件,文本输入上限偏低[25] - Claude与Minimax具备成熟的长上下文架构与多格式文件解析能力,能完整支撑跨阶段分析任务[25] 量子位内容策略分析 - AI技术类内容占比达62%,确立垂直领域权威地位,爆款层中其他类别占比35%显示潜在增长空间[29] - 周三周四为发文高峰,建议周二晚至周三上午发布重点内容以最大化触达效率[29] - 理性专业叙事占主导,品牌关键词"量子"出现183次强化品牌识别度,爆款层转发率为主要驱动因素[29] Founder Park运营特点 - 内容以AI测评为核心占57.29%,人物访谈为突破口,爆款层中人物访谈和创业经验主题占比显著提升[34] - 高表现内容集中于周三周五,标题长度控制在30-40字符,聚焦AI、模型、DeepSeek等前沿关键词[34] - 爆款层10%内容贡献超50%传播价值,呈现明显长尾效应,关键词集中于AI、Agent、创业[34] 数字生命卡兹克内容特征 - 内容100%聚焦AI领域形成高度垂直化定位,工作日发文占比超95%,周五为发文高峰达23.53%[39][43] - 理性叙事占60.75%,故事化手法占28.5%,形成专业与亲和双重风格,标题平均长度25.95字[43] - 平均阅读量4.37万,转发率9.35%高于行业均值,高表现内容倾向技术与实用场景结合[43] 头部科技号成功要素 - 理性型标题占比79.83%建立专业分析人格,工作日发布占68%体现计划性内容管理[55][72] - DeepSeek现象级传播权重0.23,AI Agent应用落地权重0.16,开源模型生态权重0.11为最具传播势能主题[52] - 模型与情绪词组合在高转发文章中占比较高,数字化表达强化信息具体性,时间词汇塑造独家人设[58][60][61] 高互动内容特征 - 高赞文章聚焦AI与现实场景结合,平衡知识密度与可读性[63] - 高转发内容兼具话题前沿性与实用落地感,激发读者分享新信息优势[65] - 高收藏文章兼具实用性与专业性,提供独特视角或操作指南[69]
心言集团高级算法工程师在Qwen 3发布之际再谈开源模型的生态价值
搜狐财经· 2025-05-07 03:02
阿里Qwen 3大模型发布 - 阿里发布新一代大模型Qwen 3,与DeepSeek共同形成中国开源生态"双子星",正在取代以Llama为主、Mistral为辅的开源生态 [1] - Qwen 3的发布引发行业关注,多家AI创业公司代表就开源闭源选择、模型微调、能力瓶颈及大模型创业等问题展开讨论 [1] 开源与闭源模型选择策略 - 公司业务中90%以上场景使用本地化部署的微调模型,特定任务如数据构造、蒸馏等会直接调用GPT、豆包、Qwen等大模型的API [3] - 本地部署主要基于Qwen微调模型,根据业务需求使用不同量级模型,包括7B、32B、72B等版本,具身智能业务则采用0.5B、1.5B等多模态小模型 [3] - 选择7B模型主要考虑推理速度快、部署成本低及性能与速度的平衡 [3] Qwen模型选择原因 - 生态系统成熟稳定,推理框架(vLLM、SGLang)和微调工具链完善,相比其他模型生态更成熟 [4] - 中文支持能力强,预训练数据包含泛心理、情感陪伴相关内容,更贴合公司业务需求 [7] - 提供从0.5B到72B的完整尺寸系列,降低不同尺寸模型间的微调成本 [7] - 阿里在开源方面的持续投入和可信赖度,为公司长期依赖其模型开发提供保障 [7] 大模型使用与微调挑战 - 具身智能业务面临推理成本和生态适配挑战:英伟达方案端侧推理卡成本高,国产算力芯片生态不完善,适配周期长 [10][11] - 线上互联网业务面临模型能力和推理成本/延迟挑战:情感陪伴对多模态理解要求高,用户量快速增长带来推理成本压力,高峰时段流量达平时3-4倍 [12] 模型能力与业务适配 - 公司专注于情感、情绪化的泛心理应用场景,大多数模型厂商不会特别关注这部分数据,因此坚持进行Post-training [13] - 对基础模型要求主要是通用能力而非特定领域能力,通用能力足够好时更容易通过Post-training拟合到业务方向 [13] - Post-training会对模型其他通用能力造成一定损害,目标是将损害控制在2个点以内,核心领域能力提升10个点 [13] 开源模型发展现状 - 期待开源模型能追平闭源顶尖模型如Claude、GPT-4/4o,希望获得更多技术细节分享 [14] - DeepSeek在MoE、原生多模态、代码等方面探索前沿,Qwen和Llama更注重社区和通用性,技术选型相对稳健 [14][15] 大模型创业关键问题 - 模型与产品适配度及对AI在产品中角色的理解是关键,AI应作为后端能力而非前端界面 [17] - 正确模式应是"X + AI"而非"AI + X",核心是挖掘用户需求并用AI解决,而非技术驱动寻找场景 [19] - 用户留存是重要观察指标,留存差往往意味着产品未抓住真实痛点或个性化不足 [19] 中国开源模型全球化发展 - Qwen、DeepSeek等中国开源模型在国际舞台崭露头角,推动技术生态驱动的全球化进程 [20] - 开源为中国企业提供弯道超车技术路径,创造"全球协作-垂直创新-生态反哺"的良性发展模式 [20]