Workflow
芯片
icon
搜索文档
搜索失速、大模型遇阻,李彦宏的AI生死局
搜狐财经· 2026-01-29 23:44
2026年AI红包大战与行业窗口期 - 2026年春节AI红包大战是科技巨头抢占用户心智的关键战役,百度、腾讯、火山引擎等投入巨额现金红包并绑定春晚资源进行营销[2] - 第三方机构IDC指出,2025-2026年是AI应用用户心智抢占的最后窗口期,错过此窗口期的玩家将彻底失去行业话语权[2] 百度战略调整与核心举措 - 2026年1月,百度旗下AI芯片子公司昆仑芯以保密形式向港交所递交上市申请[2] - 2026年1月,百度完成内部架构整合,将文库与网盘合并为个人超级智能事业群,由集团副总裁王颖直接向李彦宏汇报[2] - 分析认为,昆仑芯独立上市旨在为AI算力业务寻求外部输血,而成立个人超级智能事业群旨在整合C端订阅资产以打造AI时代的现金牛业务[2] 百度财务表现与业务转型 - 2025年第三季度,公司计提162亿元长期资产减值损失,以主动淘汰无法适配高强度AI计算的老旧资产[3] - 同期,AI新业务逆势增长:AI云收入同比增长33%,AI应用收入达26亿元,AI原生营销服务收入激增262%,第二季度AI新业务收入首次突破百亿元[3] - 公司转型路径清晰,正从传统业务彻底重构为AI驱动型公司[3] 核心搜索业务的结构性危机 - 2025年第三季度,百度核心在线营销收入(主要为搜索广告)为153亿元,同比暴跌18%,与2023年第二季度197亿元的峰值相比近乎腰斩[5] - QuestMobile 2025年6月报告显示,百度媒介地位指数已跌至第九位,远落后于抖音、微信等平台[5] - 中国互联网用户日均使用搜索引擎时长从2020年的47分钟骤降至2025年的12分钟,而同期短视频平台日均使用时长达180分钟[5] - 搜索业务面临用户注意力向垂直平台(如小红书、抖音、微信搜一搜)不可逆迁移的结构性挑战[5] AI重构搜索的商业模式悖论 - 百度提出“AI重构搜索”,宣布搜索首条结果富媒体覆盖率达70%,AI将直接给出结构化答案[5] - 此变革可能压缩传统“流量分发-点击变现”的盈利模式,因为AI直接给答案会减少用户点击广告链接,导致广告库存和变现空间大幅压缩[6] - 公司面临两难:不进行AI重构将加速用户流失,进行重构则短期营收和利润必然承压[6] 大模型业务面临的竞争与挑战 - 百度在大模型领域的先发优势在2025年已不复存在,面临如DeepSeek等凭借开源和低推理成本策略的新入局者竞争[8] - 2025年2月,百度被迫宣布文心大模型核心系列开源;4月,文心大模型4.5 Turbo输入价格降至每百万Token 0.8元,仅为当时市场同类产品的40%[8] - 开源与降价策略虽能吸引开发者,但大幅压缩了利润空间且难以形成长期壁垒,有消息称百度在某些竞争对手分析中已非核心关注对象[8] - 即便后续推出文心大模型5.0,字节跳动豆包等产品凭借庞大用户基数已在日活数据上形成压制[9] 自动驾驶业务的进展与压力 - 自动驾驶业务“萝卜快跑”2025年全球累计服务订单超1700万次,在武汉核心运营区实现单车UE平衡,第六代无人车成本下降[9] - 该赛道本质是重资产、长周期,2025年行业头部企业年投入均超百亿元,给百度带来巨大资金压力[9] - 2025年第三季度公司调整后核心净利润仅27亿元,现金流支撑能力减弱[9] - 业务面临特斯拉Robotaxi即将进入中国以及小马智行等国内对手扩张的竞争压力,先发优势窗口期可能仅有一两年[9] - 近期与Uber、Lyft的合作有助于打开海外市场,但需出让部分利润和主导权[9] 大规模组织与资源重组 - 2025年11月底,百度启动近年最大规模人事优化,优化比例在10%-30%之间,非核心业务如游戏部门近乎全员被裁,直播业务裁员比例高达90%[11] - 裁员补偿优厚,应届生及新人获N+1.5补偿,老员工可达N+3,核心岗位甚至达N+3.5,旨在将资源集中转向AI[11] - 2025年11月25日,公司新设基础模型研发部与应用模型研发部,由吴甜、贾磊直接向李彦宏汇报,原CTO王海峰不再直接管辖大模型核心研发[11] - 此次重组本质是李彦宏收权,亲自掌控AI研发方向,内部AI相关部门必须证明能为文心大模型提供关键服务[12] 昆仑芯的战略价值与全栈布局 - 昆仑芯是百度全栈AI布局的核心,估值达210亿元,其最新M300芯片与天池超节点瞄准下一代万卡集群和MoE大模型训练需求[13] - 昆仑芯独立上市有望缓解集团现金流压力,并在国产AI芯片赛道抢占身位,依托国央企采购需求打开B端市场[13] - 出于供应链自主可控考量,昆仑芯已成为众多国央企采购国产AI芯片的优先选择,推动了百度AI云收入增长[13] - 百度试图通过打通“芯片-框架-模型-应用”的全栈技术栈,构建成本壁垒,在B端市场向阿里云、华为云发起冲击[13] - 李彦宏提出“倒金字塔”理论,认为模型层价值应是芯片层的10倍,应用层价值应是模型层的100倍,这构成了公司的生存蓝图[14] 公司现状与未来展望 - 百度面临搜索业务结构性失速、大模型赛道竞争激烈、自动驾驶商业化艰难等多重挑战,转型是一场“背水一战”[16] - 公司优势在于全球少有的全栈AI自研能力、昆仑芯的国产芯片先发优势以及庞大的B端客户基础[17] - 未来成败关键取决于两点:文心大模型在开源与降价背景下能否找到可持续盈利模式;昆仑芯上市后能否成功打开资本市场并为自动驾驶等业务持续输血[17] - 2026年将是决定百度命运的一年,昆仑芯上市进展、大模型商业化成效、自动驾驶城市复制情况将是关键观察点[17]
北京君正(300223.SZ):预计2025年净利润同比增长1.05%~10.05%
格隆汇APP· 2026-01-29 23:01
公司2025年度业绩预告核心数据 - 预计2025年归属于上市公司股东的净利润为3.70亿元至4.03亿元,同比增长1.05%至10.05% [1] - 预计2025年扣除非经常性损益后的净利润为3.08亿元至3.41亿元,同比变动-1.29%至9.27% [1] - 2025年度公司实现营业总收入约47.40亿元,同比增长约12.52% [2] 业绩驱动因素:下游行业复苏与产品线进展 - 汽车、工业及医疗等下游行业市场逐步复苏,存储产品市场需求呈现周期性回升趋势 [2] - 2025年下半年以来,利基型DRAM芯片市场需求进入上行周期,带动了存储芯片产品收入增长 [2] - 嵌入式MPU产品在更多市场领域获得应用,以及在智能安防市场的产品竞争力提升,推动计算芯片产品收入实现较好同比增长 [2] - 模拟芯片持续进行产品研发和市场拓展,带动了模拟与互联芯片销售收入的同比增长 [2] - 2025年第四季度,公司实现了较好的收入增速 [2]
芯片产业链,“涨”声不停
财联社· 2026-01-29 22:49
行业涨价驱动因素 - 自去年下半年以来 AI与数据扩张推动存储芯片进入全新“超级周期” 至今未见衰落迹象 [2] - 有色金属等原材料价格持续上涨 拉高众多芯片公司的生产成本 [2] 2026年以来产业链涨价情况概览 - 进入2026年以来 芯片产业链又有多家公司上调部分产品价格 [2] - 机构普遍预计 芯片行业涨价趋势仍将继续 [2] 芯片设计环节涨价详情 - 中微未营自1月27日起上调MCU、Norflash等产品价格 涨幅15%-50% [3] - 国科微自1月起上调合封KGD产品价格 其中512Mb产品涨40% 1Gb产品涨60% 2Gb产品涨80% 外挂DDR产品价格另行通知 [3] - 中科芯亿达自1月12日起上调部分芯片产品价格 涨幅10%-15% [3] - 富满微自1月19日起上调LED显示屏系列产品价格 涨幅10%以上 [3] - 扬州晶新微自1月1日起上调双面银芯片价格 涨幅10% [3] 存储芯片环节涨价详情 - 三星电子在2026年第一季度上调iPhone手机所用LPDDR内存价格 涨幅超过80% [4] - SK海力士在2026年第一季度上调iPhone手机所用LPDDR内存价格 涨幅接近100% [4] - 东芯股份目前上调存储产品价格 具体涨幅未明确 [4] 晶圆制造与封测环节涨价详情 - 日月光在2026年初上调后段晶圆封测价格 涨幅5%-20% [4] 被动元器件环节涨价详情 - 国巨自2月1日起上调部分电阻产品价格 涨幅15%-20% [4] - 花新科自2月1日起上调“0201”至“1206”全阻值电阻价格 具体涨幅未明确 [4]
全球AI巅峰角力,阿里“通云哥”坐上唯二顶级桌
观察者网· 2026-01-29 22:00
公司核心产品发布 - 阿里巴巴旗下平头哥正式发布高端AI芯片“真武810E”,该芯片此前被央视《新闻联播》曝光,是阿里自研的PPU [1] - 真武810E芯片已在阿里云实现多个万卡集群部署,服务了国家电网、中科院、小鹏汽车、新浪微博等超过400家客户 [1] - 该芯片核心参数包括96GB HBM2e显存、700GB/s片间互联带宽、PCIe5.0×16接口、400W低功耗,性能超越英伟达A800,与主流产品H20性能比肩 [5] 公司战略定位与格局 - 阿里巴巴与谷歌是全球仅有的两家实现了“AI+云+芯”三位一体全栈AI闭环的公司 [3] - 全球云计算市场形成由Microsoft、Amazon、Google、Alibaba组成的“M-A-G-A”四强格局,这四家企业占据全球80%以上的市场份额 [4] - 在四强中,微软与亚马逊选择以云服务为核心,依赖外部算力(如英伟达)和AI公司(如OpenAI、Anthropic)的模式,而阿里与谷歌选择了难度更高的“全栈自研”路径,在云计算、基础大模型、AI芯片三个核心层面同时追求顶级自研能力 [4] - 阿里巴巴是“M-A-G-A”格局中唯一的非美国重量级选手,其全栈自研之路成为中国科技突破“卡脖子”困境、参与全球AI基础设施竞争的关键破局点 [5] 公司技术发展历程与能力 - “通云哥”AI黄金三角由通义实验室、阿里云、平头哥芯片构成,是阿里17年深耕技术的结果 [6] - 阿里云于2009年成立,2013年首次实现单一集群5000台服务器的规模,2025年在Gartner报告中计算、存储、网络、安全四项核心能力评比均获全球最高分 [8] - 阿里云目前服务全球500万客户,市场份额稳居亚太第一 [9] - 平头哥半导体于2018年成立,确立了数据中心“全栈芯片”布局,产品包括AI推理芯片(含光800)、通用服务器CPU(倚天710)、存储芯片(镇岳510)及高端AI芯片“真武810E” [9] - 通义实验室前身源于阿里达摩院,2018年启动大模型研发,2021年落地全球首个十万亿级参数大模型M6,2023年发布千问(Qwen)大模型并坚持开源路线 [10] - 千问开源模型的衍生模型数量已突破20万个,下载量突破10亿次,平均每天被下载110万次,稳居全球第一 [10] 公司协同效应与投资 - “通云哥”AI黄金三角形成“软-硬”联动闭环:平头哥芯片通过云计算为千问大模型提供算力,千问开源生态推动阿里云场景落地,全球开发者(如Meta、李飞飞团队)对千问的研究与二次开发也间接推动了芯片的生态适配 [10] - 2025年初,阿里巴巴宣布未来3年将投入至少3800亿元人民币用于建设云计算和AI基础设施,这一金额超过了公司过去10年在该领域的投入总和 [14] - 公司认为随着AI走向产业落地,算力基础设施将成为决定企业竞争力的核心要素 [14] - 阿里与谷歌在全球算力通胀背景下共掌全球AI定价权,阿里通过“通云哥”黄金三角实现了对底层算力效率的极致开发,形成了“快速迭代+成本优势”的组合 [15] 行业影响与未来展望 - 阿里CEO吴泳铭表示,大模型是“下一代操作系统”,而AI芯片是驱动这一系统的“核心电力” [11] - 阿里巴巴正从科技企业转变为铺设AI时代“水电煤”的基础设施提供商,持续加大投入与美国科技巨头展开正面博弈 [12] - “通云哥”AI黄金三角的亮相与千问大模型的开源,共同推动中国AI实现了从产品输出、服务输出到标准输出的跨越 [15] - 展望未来,随着黄金三角协同效应持续释放,阿里巴巴将有望凭借“通云哥”AI黄金三角,坐上全球AI竞技场里唯二的顶级牌桌 [15]
阿里平头哥发布自研AI芯片“真武” 性能对标英伟达H20
新浪财经· 2026-01-29 21:37
阿里巴巴自研AI芯片“真武810E”发布 - 2025年1月29日,阿里巴巴旗下平头哥半导体公司官网悄然上线高端AI芯片“真武810E”,标志着阿里自研的PPU(处理器)正式亮相 [1] - 至此,由通义实验室、阿里云和平头哥组成的阿里巴巴AI“黄金三角”——“通云哥”首次浮出水面 [1] “真武”PPU关键参数与性能 - “真武810E”采用自研并行计算架构和片间互联技术,配合全栈自研软件栈,实现软硬件全自研 [2] - 芯片配备96GB HBM2e显存,片间互联带宽达700GB/s,参数与2025年9月央视《新闻联播》背景画面中披露的国产卡参数一致 [2] - 据业内人士消息,对比关键参数,“真武”PPU的整体性能超过了英伟达A800和主流国产GPU,与英伟达H20相当 [2] “真武”PPU的部署与客户 - 目前,“真武”PPU已在阿里云实现多个万卡集群部署 [2] - 芯片已服务国家电网、中国科学院、小鹏汽车、新浪微博等400多家客户 [2] 平头哥半导体的背景与定位 - 平头哥成立于2018年,由阿里巴巴全资收购的嵌入式CPU IP Core公司中天微与达摩院芯片团队整合而成 [2] - 公司历史定位是优先满足阿里巴巴内部业务需求,而非作为广泛的商用芯片供应商,研发模式是“从场景中来,到场景中去” [2] - 近日有市场消息称,阿里巴巴正筹划将平头哥重组为部分由员工持股的独立实体,并考虑启动IPO,但公司未予置评 [3] “通云哥”战略与AI协同 - “通云哥”指通义千问(AI模型)、阿里云(云计算)、平头哥(芯片)三位一体的核心技术栈协同 [4] - 该战略旨在将三者打造成一台AI超级计算机,在芯片架构、云平台架构和模型架构上协同创新,以在阿里云上实现训练和调用大模型的最高效率 [4] - 在此架构下,平头哥专注于芯片硬件与底层驱动优化,上层的AI框架、模型服务和行业应用由阿里云和通义千问承载 [4] - 目前,阿里巴巴和谷歌是全球唯二在大模型、云和芯片三大领域均具备顶级实力的科技公司 [4] - “通云哥”战略成型,标志着阿里巴巴已从电商公司转型为“电商+AI”双轮驱动的高科技公司,未来AI提供的驱动力将持续增强 [4] 阿里巴巴对AI需求的判断与投入 - 阿里巴巴CEO吴泳铭表示,目前公司看到的AI客户需求非常旺盛 [4] - 从2025年下半年开始,全球存储厂商、CPU、AI服务器等环节均出现缺货,是AI需求带动整个供应链厂商扩产的周期 [4] - 基于对AI需求的判断,阿里巴巴正以最快速度加快供应链和机房建设节奏 [5] - 公司原定的三年3800亿元人民币基础设施投入计划可能增投,目前该数字看起来偏小 [5]
补上全栈AI能力底层板块,阿里自研AI芯片“真武”亮相
中国证券报· 2026-01-29 21:01
阿里巴巴AI全栈战略布局 - 公司旗下平头哥半导体正式发布高端AI芯片“真武810E”,即此前曝光的自研PPU [1] - 至此,公司已形成由通义千问大模型、阿里云和平头哥半导体构成的“通云哥”AI能力黄金三角,在模型、云、芯片层面完成全栈布局 [1] - 公司正将“通云哥”打造成一台AI超级计算机,寻求在芯片架构、云平台架构和模型架构上协同创新,以实现云上训练和调用大模型的最高效率 [1] 平头哥半导体发展历程与产品线 - 平头哥半导体有限公司于2018年阿里云栖大会上正式官宣成立,由集团全资控股,整合了此前收购的中天微和达摩院自研芯片业务,旨在推进云端一体化芯片布局 [1] - 自成立以来,平头哥已发布含光800(AI推理芯片NPU)、倚天710(服务器芯片CPU)以及存储、网络、端侧和IOT芯片等多款产品 [1] - 新一轮AI技术爆发前夕的2020年,平头哥在内部启动了PPU(真武)的研发工作 [1] “真武”PPU芯片技术规格与应用 - “真武”PPU采用自研并行计算架构和片间互联技术,配合全栈自研软件栈,实现软硬件全自研 [2] - 芯片内存为96G HBM2e,片间互联带宽高达700GB/s,可应用于AI训练、AI推理和自动驾驶领域 [2] - 公司已将“真武”PPU大规模用于通义千问大模型的训练和推理,并结合阿里云完整的AI软件栈进行深度优化,为客户提供一体化产品和服务 [2] 市场部署、客户与竞争格局 - 业内人士透露,对比关键参数,“真武”PPU的整体性能超过主流国产GPU [2] - 截至目前,“真武”PPU已在阿里云多个万卡集群部署,服务了国家电网、中科院、小鹏汽车、新浪微博等超过400家客户 [2] - 不仅阿里巴巴,国外的谷歌和国内的百度也选择了在模型、云、芯片领域进行全栈布局,行业通过软硬件紧密耦合,旨在实现1+1+1>3的效果,以提升算力潜力、集群效率及模型训练推理效率,推动大模型应用落地 [2]
安凯微:公司12nm制程芯片拟集成多核异构CPU及高算力NPU模块
证券日报网· 2026-01-29 20:43
公司技术产品进展 - 公司于1月29日在互动平台披露,其12nm制程芯片旨在满足市场对高算力、低功耗、高集成度SoC的需求 [1] - 该芯片拟集成多核异构CPU及高算力NPU模块,并搭载黑光全彩高性能AI ISP,且功耗低 [1] - 芯片可广泛应用于AI眼镜、高端屏显类交互终端、能够支持较复杂端侧AI处理能力的智能视觉终端等 [1] 行业与市场趋势 - 市场对高算力、低功耗、高集成度的系统级芯片存在明确需求 [1] - 端侧AI处理能力正成为智能视觉终端等产品的重要发展方向 [1]
人工智能算力系列报告一:海外云大厂提价,关注算力涨价周期
国信证券· 2026-01-29 19:46
报告行业投资评级 - 行业投资评级:优于大市(维持评级)[1] 报告核心观点 - 海外云大厂提价,关注算力涨价周期:报告认为,在AI算力需求持续高增长的背景下,云计算厂商因硬件采购、能源等成本上升开始上调服务价格,同时从数据中心租赁、CPU、存储、光纤光缆到光模块上游物料等多个环节均出现或即将出现价格上涨,预示着算力产业链正进入一个全面的涨价周期[1][2] 根据相关目录分别总结 云服务厂商提价 - **谷歌云上调全球数据传输服务价格**:自2026年5月1日起,谷歌云上调包括互联网传输、直连对等、运营商对等在内的全球数据传输服务价格,其中北美地区费率从0.04美元/GiB上调至0.08美元/GiB,同比翻倍,欧洲和亚洲地区费率分别同比提升60%和42%[2][6] - **亚马逊AWS上调机器学习实例价格**:2026年1月,亚马逊AWS在大多数地区将p5e.48xlarge实例价格从每小时34.61美元上调至39.80美元,上调幅度约15%,这反映了强劲的需求和成本端的上涨[2][13] 算力基础设施(AIDC)租赁价格 - **AIDC租赁价格持续上行**:全球数据中心龙头Equinix的单机柜每月租赁价格(MRR Per Cab)从18Q1的1877美元/月持续提升至25Q3的2436美元/月,累计提升29.8%[19] - **租赁价格环比增速提升**:MRR Per Cab的环比增速在25Q1、25Q2、25Q3分别为-0.8%、2.9%、2.5%,显示价格加速增长[2][19] AI驱动CPU需求与价格上涨 - **Agent应用拉动CPU需求**:AI Agent的非线性控制逻辑、密集型系统调用和I/O负载、多智能体系统协调与同步等任务严重依赖CPU性能,而非仅GPU[2][24] - **CPU价格明显提升**:根据Pcpartpicker数据,Intel Core i7 Alder Lake型号CPU价格自2026年1月开始明显提升,TrendForce预计26Q1 CPU价格仍会上涨[2][24] 存储成本推动服务器价格上涨 - **DRAM与NAND价格大幅上涨**:根据PCpartpicker数据,截至2025年底,DRAM和NAND价格自25年8月以来分别提升250%和60%,导致AI服务器和通用服务器成本大幅提升[41] - **预计2026年价格持续上涨**:TrendForce预计26Q1,DRAM和NAND价格将分别继续上涨55-60%和33-38%,推动服务器成本持续上行[41] 光纤光缆行业供需与价格 - **行业供需关系修复,集中度提升**:经历去库存周期及富通出局后,国内光纤行业供需在2025年逐步修复,市场从“五巨头”演变为长飞、亨通、中天、烽火“四巨头”主导,产能利用率维持高位[47] - **G652D光纤价格连续上涨**:由于AI和无人机拉动高端光纤(如G657A2)需求,产能向高端倾斜,导致基础款G652D光纤供不应求,其平均价已连续两个季度上涨,2026年1月散纤市场或已出现40元/芯公里的价格[2][47] - **头部企业业绩弹性显著**:报告测算,在G652D涨价背景下,长飞光纤、亨通光电、中天科技、烽火通信的26年G652D业务利润增量预计分别为13.1亿元、10.9亿元、9.8亿元和5.5亿元[49] - **高端光纤(G657A2)需求与利润增长**:受益于无人机等需求,G657A2当前价格达50元/芯公里(25年均价24元),预计将为头部企业带来显著利润增量,例如长飞光纤26年G657A2利润增量预计为5.7亿元[50] - **全球需求持续释放**:根据Marvell预测,数据中心互连市场规模将从2023年的10亿美元增长至2028年的30亿美元,CAGR达25%,带动光纤光缆需求占比从2024年不到5%提升至2027年的35%,全球光纤需求有望在2027年达到8.8亿芯公里[51] 光模块及上游物料 - **光模块市场规模快速增长**:根据Lightcounting预测,全球光模块市场规模在2024-2029年将以22%的CAGR增长,2029年有望突破370亿美元,主要受AI集群和云服务商网络升级驱动[2][54] - **光芯片供需紧张,价格有望上涨**:光学器件占光模块成本70%以上,Lumentum在25Q3财报会上表示光芯片供需缺口已上升到25%-30%,2026年光芯片价格有望上涨[2][54] - **隔离器需求增长与材料涨价**:1.6T光模块(EML方案)单模块需8颗隔离器,全球光隔离器市场规模预计从2025年的8.35亿美元以4.3%的CAGR增长至2034年的12.174亿美元,其核心材料法拉第旋光片(成本占比35%-40%)受供给影响涨价,带动隔离器涨价[59] AI算力需求驱动因素 - **Token量快速增长驱动AI算力需求**:根据谷歌云数据,谷歌Gemini大模型月均Token处理量从25年6月的980万亿增长至25年10月的1300万亿,阿里云预计接下来一年内全球Token量可能增长100倍或1000倍[30] - **Agent爆发驱动通用计算需求**:2026年AI推理从静态转向动态(Agent),更多“数字员工”将在CPU上执行传统工作负载,驱动通用计算(CPU服务器)需求快速增长[30]
乐鑫科技:Wi-Fi7芯片仍处于内部研发阶段
证券日报网· 2026-01-29 19:41
公司研发进展 - 乐鑫科技Wi-Fi 7芯片目前仍处于内部研发阶段 相关细节暂未公开 [1] - 公司将按照监管要求 定期披露募集资金使用及项目进展情况 [1]
曦望董事长徐冰:把大模型推理这件事,做到极致
搜狐财经· 2026-01-29 19:35
行业趋势与战略背景 - AI产业正从“训练驱动”转向“推理驱动”,推理更强调长期交付能力、单位成本和系统稳定性 [3] - 到2026年,推理算力占比将达到66%,超过训练 [4] - 智能体、3D生成、视频生成、物理世界AI等多模态复杂场景加速落地,推理需求爆发,竞争焦点转向在真实业务中跑得稳、跑得久、跑得划算 [4] - 推理成本在AI应用中的占比已高达70%,是决定AI公司盈利和商业化的关键,行业未来需将推理成本从“元级”降至“分厘级” [4] - 掌握高效、可控、可持续的推理基础设施,将主导AI的落地速度,并决定国家和企业在AI下半场的竞争力 [3][5] 公司定位与历史沿革 - 曦望是一家更懂AI的GPU芯片公司,也是国内第一家all-in推理的GPU芯片公司 [4] - 公司使命是将大模型推理做到极致 [4] - 公司前身是商汤科技的大芯片部门,成立于2020年,完整经历了从人脸识别、自动驾驶到大模型、多模态、物理AI的整个AI发展周期 [5] - 公司从第一天开始就基于真实业务场景设计芯片,被客户需求打磨 [5] - 2025年全球大模型token消耗量增长了100倍 [5] - 公司团队已超过300人,聚拢了来自英伟达、AMD、昆仑芯、商汤等公司的芯片研发精英,核心技术骨干平均有15年行业经验 [5] 产品技术与研发进展 - 公司正式亮相新一代推理GPU芯片启望S3,并披露围绕推理场景构建的算力产品体系及共建推理云生态计划 [3] - 公司并非简单做又一个GPU,而是从底层架构就为推理场景重新设计,彻底重写 [6] - 公司专为大模型推理场景做架构设计,目标是实现极致的成本效益,设计决策的根本出发点是真实业务场景中每个token的成本、能耗和SLA稳定性 [7] - 公司计划将中国的推理成本拉到“百万token一分钱”的新级别,并将其变成行业新基准 [7] - 过去8年,公司累计投入了20亿研发资金,成功量产了S1和S2芯片,S3已发布,并规划了S4和S5的路径图 [7] - S1和S2证明了公司具备芯片设计、量产和被头部客户应用的能力 [7] - 公司致力于让推理成本下降90%,并提供稳定服务,以重写中国AI产业的损益表,助力全行业盈利增收 [7] 商业模式与生态布局 - 公司不希望只做一家卖芯片的公司,而是围绕推理场景,构建“芯片+系统+生态”的整体布局 [3][8] - 商业模式包括:为产业提供推理GPU卡、一体化服务器、整机、集群方案;与商汤、范式等AI巨头、算力厂商和芯片厂商深度合作,成为现有算力系统的推理分流及成本优化层 [8] - 公司目标是让算力更便宜、部署更简单、生态更开放 [9] - 公司致力于成为推理时代让算力便宜稳定且可用的核心底座,连接底层芯片架构、国家产业政策、云厂商、AI公司及千行百业 [9] 财务与运营里程碑 - 过去一年,公司完成近30亿元的战略融资 [6] - 2025年,公司实现了破万片的芯片交付,收入大幅增长,并拿下了多个头部客户的订单 [6]