S2芯片
搜索文档
曦望1年内累计获得近30亿元融资,以差异化路径「重写中国AI产业损益表」
IPO早知道· 2026-01-23 19:50
公司基本情况 - 公司曦望(Sunrise)是国内首家All-in推理的GPU芯片公司,前身为商汤科技大芯片部门,于2020年成立,2024年底完成与商汤的分拆 [4][5] - 公司在一年内完成近30亿元融资,截至2025年6月已累计募得近10亿元融资 [4][5] - 投资方阵容豪华,包括三一集团旗下华胥基金、范式智能、杭州数据集团、正大机器人、协鑫科技等产业投资方,IDG资本、高榕创投、无极资本、中金资本、普华资本、松禾资本、易方达资本、工银投资、心资本等知名VC/PE机构,并获得诚通混改基金等国资背景资本加持 [3][5] 团队与研发实力 - 联席CEO王勇为前AMD、昆仑芯核心架构师,拥有20年芯片研发经验,曾带领百人团队成功主导公司两代芯片的研发和量产 [6] - 联席CEO王湛为百度创始团队成员、原集团副总裁,于2025年初加入,负责公司产品化和商业化 [6] - 团队规模约300人,主要来自NVIDIA、AMD、昆仑芯、商汤等企业,核心技术骨干平均拥有15年行业经验 [6] - 公司全栈自研指令集、GPGPU IP及编译工具链,拥有200余项核心专利,并具备百人团队“一次流片成功”的经历 [8] 产品与技术路径 - 公司聚焦推理场景进行原生架构重构,在调度、缓存、片上SRAM、互联及编译器路径上深度优化,并结合LPDDR内存技术,从根源降低单位Token的推理成本 [7][8] - 已形成三代芯片产品矩阵,覆盖从视觉推理到大模型全场景推理的需求 [11] - 2020年量产的S1芯片可适配千余种CV模型,已实现IP授权索尼、小米等头部客户 [12] - 2024年量产的S2芯片对标主流A/H系列GPU,兼容CUDA生态,已成功适配DeepSeek、Qwen等主流模型 [12] - 2026年即将推出的S3芯片目标在单位Token成本、能耗上实现数量级降低,原生支持FP8/FP4低精度推理,目标直指“百万Token一分钱”的行业新基准 [12] 商业化进展与市场验证 - 2025年,公司与数十家行业领先企业达成战略合作,业务成功拓展至政府智算中心、AI平台、信创、医疗、能源等国家重点领域,实现了营业收入的高速增长 [9] - 公司产品顺利完成在多家大型国央企及重点实验室的官方测试,并获得标杆客户高度评价,同时稳步推进与主流服务器厂商及国产CPU的深度适配 [9] - 公司大模型推理性能已跻身第一梯队,现有产品在多项主流大模型推理任务中展现出顶级性能,并获得业内权威机构认证 [9] - 自研一站式MaaS平台已启动内测,成功接入并优化语言、图像、视频等多模态模型,有效降低AI应用门槛 [9] 公司战略与行业定位 - 公司战略定位为“推理分流与成本优化层”,不与训推一体GPU拼参数,而是聚焦真实场景的单位经济性,目标让推理成本下降90%并提供更稳定的服务 [12] - 公司目标是通过极致降低大模型推理成本与门槛,让算力变得普惠且可广泛获取,从而释放AGI的全部潜力 [12] - 2026年,公司将聚焦三大核心:推动旗舰产品成功上市与规模化应用,打造市场领先的“体验标杆”和“性价比王者”;深入场景渗透,以算力赋能千行百业;以开放姿态携手产业链上下游伙伴,打通“芯片-软件-应用”全链路,推动国产算力生态繁荣 [13]
GPU创企曦望一年融资30亿:出身商汤,押注推理
观察者网· 2026-01-22 21:13
公司融资与资金用途 - 曦望(Sunrise)在一年内完成近30亿元人民币融资 [1] - 投资方包括华胥基金、范式智能、杭州数据集团等产业资本,IDG资本、高榕创投、无极资本等VC/PE机构,以及诚通混改基金、杭州金投、杭州高新金投等国资背景资本 [1] - 所筹资金将用于下一代推理GPU研发、规模化量产及生态共建 [1] 公司背景与团队构成 - 公司成立于2020年,前身为商汤科技大芯片部门,于2024年底分拆独立运营 [1] - 公司专注于高性能GPU及多模态场景推理芯片的研发与商业化 [1] - 公司正式员工超200人,技术和研发人员占比80%以上 [1] - 部分员工来自AMD、百度、华为海思、商汤等行业龙头,核心技术骨干平均拥有15年行业经验,硕士及以上学历占比超过80% [1] - 董事长徐冰曾任商汤科技联合创始人,负责集团战略与资本运作,带领商汤完成累计超66亿美元融资及港交所IPO [1] - 联席CEO王勇拥有20余年芯片行业经验,曾任AMD dGPU首席架构师、百度昆仑芯核心架构师,主导多款7nm高性能芯片从研发到流片及量产 [2] - 另一位联席CEO王湛曾任职百度十六年,为百度创始团队成员、前百度资深副总裁 [2] 技术路线与产品战略 - 公司选择“纯推理”路线,与英伟达等追求“训推一体”的传统GPU厂商不同 [4] - 公司在调度机制、缓存设计、片上SRAM、芯片互联及编译器路径等核心环节针对推理场景做原生深度优化,并融合LPDDR内存技术,以实现单位Token推理成本的显著降低 [4] - 公司目标是极致降低大模型推理的成本与门槛,让推理算力变得普惠,从而充分释放AGI的全部潜力 [4] - 公司宣称其技术能让推理成本下降90%,并提供更稳定的服务 [4] 研发投入与产品矩阵 - 公司在过去数年研发投入累计20亿元人民币 [4] - 已构建起三代芯片产品矩阵 [4] - 2020年量产的S1芯片是国内首款视觉推理芯片,适配千余种CV模型,已实现IP授权索尼、小米等头部客户 [4] - 2024年量产的S2芯片对标主流A/H系列GPU,兼容CUDA生态,已适配DeepSeek、Qwen等主流模型 [4] - 计划于2026年推出的S3芯片定位为“推理性价比之王”,目标在单位Token成本、能耗上实现数量级降低,原生支持FP8/FP4低精度推理,目标直指“百万Token一分钱”的行业新基准 [5]
消息称曦望完成近30亿元融资,将用于下一代推理GPU研发
搜狐财经· 2026-01-22 20:15
公司融资与资金用途 - 曦望公司在过去一年内成功完成近30亿元人民币的融资 [1] - 融资资金将用于下一代推理GPU的研发、规模化量产以及生态系统的共建 [3] 投资方构成 - 融资吸引了众多产业投资方和知名风险投资机构参与 [3] - 产业资本包括三一集团旗下的华胥基金、范式智能、杭州数据集团、正大机器人、协鑫科技等 [3] - 知名VC/PE机构包括IDG资本、高榕创投、无极资本、中金资本、普华资本、松禾资本、易方达资本、工银投资、心资本等 [3] - 公司还获得了诚通混改基金等具有国资背景的资本支持 [3] 公司背景与团队 - 曦望公司成立于2020年,前身为商汤科技的大芯片部门 [3] - 公司核心团队成员包括联席CEO王勇和王湛 [3] - 王勇曾是AMD和昆仑芯的核心架构师,拥有20年芯片研发经验,2020年加入商汤后带领百人团队主导了曦望两代芯片的研发和量产 [3] - 王湛是百度创始团队成员、原集团副总裁,曾带领百度搜索8000人团队,2025年初加入曦望,负责公司产品化和商业化 [3] - 目前曦望团队规模约300人,成员主要来自NVIDIA、AMD、昆仑芯、商汤等知名企业 [3] 产品与技术发展 - 曦望在过去数年投入20亿元人民币进行研发 [4] - 目前已形成三代芯片产品矩阵,覆盖从视觉推理到大模型全场景推理的需求 [4] - 2020年量产的S1芯片是国内首款视觉推理芯片,适配千余种计算机视觉模型,并已获得索尼、小米等头部客户的IP授权 [4] - 2024年量产的S2芯片对标主流A/H系列GPU,兼容CUDA生态,已成功适配DeepSeek、Qwen等主流模型 [4] - 2026年即将推出的S3芯片在单位Token成本和能耗上实现了数量级降低,原生支持FP8/FP4低精度推理,目标是实现“百万Token一分钱”的行业新基准 [4] 行业资本化动态 - 国产GPU行业整体已进入资本化加速阶段 [4] - 沐曦股份和摩尔线程已于去年12月登陆科创板,上市首日股价分别大涨692.95%和425.46% [4] - 壁仞科技、天数智芯于今年1月相继在港股上市 [4] - 燧原科技的科创板IPO申请已于今日获受理 [4] - 瀚博半导体完成了科创板上市辅导 [4] - 百度昆仑芯也计划赴港上市 [4]
30 亿融资砸向推理算力!目标:百万 Token 一分钱!
是说芯语· 2026-01-22 18:21
公司近期重大融资与战略意义 - 杭州GPU芯片企业曦望在一年内完成近30亿元人民币的战略融资 [1] - 融资资金将全部投向下一代推理GPU的研发、量产和生态搭建 [1] - 投资方阵容强大,形成产业、资本、国资三维加持:产业方包括三一华胥基金、杭州数据集团,提供场景与产业链资源;顶尖VC/PE如IDG资本、高榕创投、中金资本持续加码;国资如诚通混改基金入局,凸显公司在国家算力自主战略中的分量 [1] - 此轮融资为公司提供了从技术研发到场景落地、市场拓展的全链条支持 [2] 公司核心管理团队 - 公司由双CEO掌舵,构成黄金搭档 [3] - 联席CEO王勇是芯片行业20年老兵,曾任职于AMD、昆仑芯,并在商汤带领百人团队成功完成两代芯片的研发与量产,精通从架构设计到批量生产的全流程 [3] - 联席CEO王湛是百度创始核心成员、前集团副总裁,曾领导8000人团队负责百度搜索核心业务,于2025年初跨界加入,专注于产品化与商业化,运用互联网思维解决芯片落地难题 [3] 公司核心团队与技术实力 - 公司核心团队约300人,主要来自NVIDIA、AMD、昆仑芯、商汤等头部企业 [5] - 核心技术骨干平均拥有15年行业经验,团队掌握200多项核心专利 [5] - 团队曾创下百人团队“一次流片成功”的行业佳绩,技术硬核且商业落地迅速 [5] 公司产品战略与技术创新 - 公司采取差异化路线,精准卡位AI推理场景,而非主流的训推一体赛道 [6] - 针对推理场景重构原生GPU架构,对调度机制、缓存设计、片上SRAM配置等核心环节进行深度优化 [6] - 创新性融合LPDDR内存技术,从根源上降低单位Token的推理成本 [6] - 通过全栈自研的指令集、GPGPU IP和编译工具链,实现软硬件深度协同,打破“参数越高越好”的行业误区 [6] - 公司目标是极致降低大模型推理的成本和门槛,让算力变得人人可用 [7] 公司产品发展路线与里程碑 - 公司已构建覆盖视觉推理到大模型全场景的三代芯片矩阵 [8] - S1芯片于2020年量产,是国内首款视觉推理专用芯片,适配上千种CV模型,通过IP授权已服务于索尼、小米等大厂 [8] - S2芯片于2024年量产,对标主流A/H系列GPU,兼容CUDA生态,可适配DeepSeek、Qwen等主流大模型,实现了从专用芯片到通用推理芯片的跨越 [8] - S3芯片计划于2026年推出,原生支持FP8/FP4低精度推理,旨在将单位Token成本和能耗降低一个数量级,目标设定为“百万Token一分钱”的行业新基准 [8] - 公司为S3芯片投入了20亿元人民币的研发资金 [8] 公司生态合作与发展理念 - 公司定位为现有算力系统的“推理分流与成本优化层”,不搞零和竞争,旨在与本土芯片厂商深度合作,为客户搭建推理加速专区,实现互补共赢 [10] - 通过生态共建,整合行业资源以提升国产算力整体实力,致力于形成“应用越广→技术越精→成本越低”的良性循环 [10] - 公司从商汤科技大芯片部门独立,发展路径从专注视觉推理到覆盖全场景,精准踩中AI产业核心需求 [10] - 随着30亿融资到账和S3芯片即将量产,公司正通过技术创新与生态协同,在全球算力竞争中走出一条国产芯片的差异化道路 [10] - 在AI商业化浪潮中,推理成为核心抓手,公司的崛起有望重新定义国产算力产业格局,为千行百业提供普惠的推理算力,加速智能化转型与AGI时代到来 [10]
首发丨曦望完成近30亿元战略融资,All-in推理GPU
投中网· 2026-01-22 15:07
融资事件与行业趋势 - AI推理算力赛道公司曦望一年内完成近30亿元战略融资,投资方包括多家产业资本、知名VC/PE及国资背景基金 [2] - 本轮融资资金将主要用于下一代推理GPU研发、规模化量产及生态共建 [2] - 曦望连续获得多家机构投资,折射出AI产业从“训练红利”向“推理红利”切换的核心趋势 [2] - 当模型训练进入深水区,推理环节的效率、成本与稳定性已成为决定AI商业化能否落地的关键因素 [2] 公司背景与团队构成 - 曦望成立于2020年,前身为商汤科技大芯片部门,团队从诞生之初就贴上了“更懂AI的GPU芯片公司”标签 [4] - 联席CEO王勇为前AMD、昆仑芯核心架构师,拥有20年芯片研发经验,主导了曦望两代芯片的研发和量产 [4] - 联席CEO王湛为百度创始团队成员、原集团副总裁,曾带领8000人团队,于2025年初加入曦望负责产品化和商业化 [4] - 团队规模约300人,成员主要来自NVIDIA、AMD、昆仑芯、商汤等企业,核心技术骨干平均拥有15年行业经验 [4] - 同时具备芯片工程能力与大规模业务经验的团队结构,在强调“稳定交付与成本控制”的推理GPU赛道中十分稀缺 [4] 技术路径与产品矩阵 - 曦望选择差异化路径,围绕推理场景的成本与效率对芯片架构进行“重写”,而非在通用GPU参数上追赶 [6] - 公司在调度、缓存、片上SRAM、互联及编译器路径上进行推理场景原生优化,并结合LPDDR内存技术以降低单位Token推理成本 [6] - 公司采取全栈自研,覆盖指令集、GPGPU IP及编译工具链等关键环节,已累计持有200余项核心专利,并实现“一次流片成功” [6] - 过去数年研发投入累计20亿元,已形成三代芯片产品矩阵 [6] - 2020年量产的S1芯片为国内首款视觉推理芯片,适配千余种CV模型,已实现IP授权索尼、小米等头部客户 [6] - 2024年量产的S2芯片对标主流A/H系列GPU,兼容CUDA生态,已成功适配DeepSeek、Qwen等主流模型 [6] - 2026年即将推出的S3芯片定位为“推理性价比之王”,在单位Token成本、能耗上实现数量级降低,原生支持FP8/FP4低精度推理,目标直指“百万Token一分钱”的行业新基准 [6] 商业模式与市场定位 - 公司定位为AI产业的“损益表优化师”,其竞争不是“又一个芯片”,而是“重写中国AI产业的损益表” [8] - 公司认为推理能效、SLA稳定性与Token成本是决定业务毛利率与用户体验的核心指标 [8] - 公司选择不与训推一体GPU拼参数,而是聚焦真实场景的单位经济性,成为现有算力系统的“推理分流与成本优化层” [8] - 公司通过与本土芯片厂商合作为客户构建推理加速专区,形成独特的竞争生态 [8] - 公司的目标是极致降低大模型推理成本与门槛,让算力变得普惠且可广泛获取,从而释放AGI的全部潜力 [9] 行业影响与未来展望 - 曦望的崛起标志着国产AI芯片正从“跟跑”转向“差异化领跑” [9] - 随着AI推理红利的全面释放,当推理成为AI产业盈利的核心抓手,专注于降低推理成本的公司或将重塑中国AI基础设施的产业格局 [9]
商汤分拆的AI芯片公司,为何全盘押注模型推理市场?
南方都市报· 2025-11-25 14:45
公司战略定位 - 公司全盘押注AI推理芯片市场,选择在推理芯片上进行单点突破,以缩短与英伟达的距离 [2] - 公司认为模型训练和推理在计算精度、内存架构等方面存在较大区别,一颗芯片难以兼顾训练效能与推理的经济性 [2] - 公司脱胎于商汤的芯片业务部门,于2024年底独立并完成第一轮外部融资,2025年7月宣布完成近10亿元的新一轮融资 [2] 产品与技术路线 - 公司已推出三代推理芯片:第一代S1芯片于2020年量产,累计销售超2万颗;第二代S2芯片从2024年9月起量产,实测性能接近英伟达A100的80%;第三代S3芯片于2025年5月立项,预计2026年点亮 [3] - 第三代S3芯片针对大模型推理定制优化,支持FP8和FP4低精度数据格式,将配置200G以上的显存及足够带宽,目标是在大模型推理部署成本上接近英伟达下一代Rubin架构芯片 [3] 市场环境与行业趋势 - 相较于训练芯片,推理芯片的设计难度和数据处理规模相对较低,成为众多国产AI芯片公司的竞争焦点 [4] - 随着预训练模型成熟和智能体及下游应用爆发,行业预见推理算力需求将在未来数年占据上风,进入“大模型下半场” [4] - AI芯片范式正向高性价比推理芯片变迁,高性能训练芯片市场发展空间小,而高性价比推理芯片是市场蓝海 [4] 商业化与生态策略 - 公司选择兼容英伟达的CUDA并行计算框架,以降低客户迁移成本 [5] - 公司通过资本投融资及深度业务合作,紧密绑定上下游企业,确保芯片从设计第一天起就有客户,从而获得反馈提高易用性 [5] - 公司背后的产业资本包括三一集团、第四范式、美的控股、游族网络等,并与商汤科技、世纪互联、超云、硅基流动等建立合作 [5] - 在优化推理芯片性价比方面,关键在于取得算力与显存带宽之间的平衡,避免在推理任务中浪费算力或带宽 [5]
商汤拆分芯片业务始末:百度创始成员加入,半年已融15亿
36氪· 2025-09-19 21:42
公司背景与团队构成 - 曦望由商汤科技拆分成立 专注于大模型推理芯片研发 采用"1+X"战略推动芯片业务独立发展[4][5] - 高管团队包括联席CEO王湛(前百度创始产品经理)和王勇(前AMD、昆仑芯老将) 王湛负责运营管理和商业化 王勇主导产品与技术[11][12] - 团队规模达200人 年增长50% 核心成员来自AMD、Intel、阿里等企业[12] 技术研发与产品布局 - 累计投入11亿元研发资金 已量产两款芯片:S1(云边视觉推理芯片 出货超万片)和S2(大模型推理GPGPU)[13][14] - 下一代S3芯片计划2026年推出 通过架构创新将推理成本降低10倍 采用低精度计算单元和大容量显存设计[15][16] - 实现100%自主知识产权 覆盖指令集定义、GPGPU IP架构及编译器工具链[17] - 研发周期仅14个月 较行业平均22个月缩短36% 团队规模为行业普遍水平的1/3[17] 融资与商业化进展 - 2025年完成多轮融资 累计超15亿元 其中70%资方为产业资本(三一集团、第四范式、游族网络等)[13][19] - 通过绑定产业资本实现研发与商业化协同 在芯片规划阶段即考虑实际应用场景[19] - 与商汤日日新大模型和万卡智算中心形成技术协同 提供验证和商业化支撑[22] 行业趋势与竞争格局 - 2025年被视作中国GPU行业元年 推理市场爆发和外部环境变化为国产芯片创造机会窗口[22] - 国产芯片企业迎来商业化突破:寒武纪营收同比增长4347% 沐曦出货超2.5万颗 海光芯片出货迈过10万大关[22] - 行业共识转向兼容CUDA架构和聚焦细分赛道 避免早期企业在技术路线上的试错成本[24] - 市场至少支撑3-5家头部企业 2025年成为入场资格线 未实现流片的企业将失去竞争机会[25] 战略定位与发展路径 - 坚持兼容CUDA生态 选择推理芯片细分赛道 利用后发优势规避行业早期试错风险[24] - 核心竞争要素包括软硬件一体化能力、市场预判能力以及商业化落地速度[25] - 通过产业资本联动和商汤技术背书 实现从研发到商业化的闭环推进[19][22]
商汤拆分芯片业务始末:百度创始成员加入,半年已融15亿
36氪· 2025-09-19 09:58
公司动态 - 商汤科技将芯片业务拆分并命名为曦望Sunrise 主要研发大模型推理芯片 该计划源于2024年底的1+X战略 [2] - 前百度创始团队成员王湛加入曦望担任联席CEO 另一位联席CEO是前AMD和昆仑芯老将王勇 [2][5] - 高管团队分工明确 王勇负责产品技术 王湛和商汤联合创始人徐冰主导运营管理和商业化 [5] - 曦望团队规模在2025年增长50%至近200人 核心成员来自AMD Intel 阿里和商汤等企业 [5] - 公司2025年已密集融资多轮 近半年累计融资超15亿元 [6] - 商汤过去五年在芯片上累计投入超过11亿元 [6] 产品与技术 - 已量产两款芯片:S1芯片为云边视觉推理专用芯片 2019年流片 NPU IP授权索尼和小米 累计出货超万片;S2芯片为大模型推理GPGPU 2024年量产 兼容CUDA架构 [6] - 下一代产品S3芯片瞄准推理计算市场 通过架构创新将推理成本降低10倍 计划2026年推出 [8] - S3芯片设计更高配比低精度计算单元 搭配经济性更佳显存 针对大模型推理Prefill和Decode阶段分别优化 [8] - 研发追求100%自主知识产权 从指令集定义 GPGPU IP架构设计到编译器工具链实现全自研 [8] - 研发效率显著高于行业平均水平 团队规模为行业1/3 研发流片到量产周期压缩至14个月 行业平均需22个月 [8] 行业背景 - 2025年是中国AI芯片行业关键一年 英伟达市值冲破4万亿美元 寒武纪市值突破六千亿 [4] - 国产GPU厂商摩尔线程 沐曦 壁仞科技 燧原科技 瀚博半导体集体闯入上市辅导关卡 [4] - 行业从烧钱技术突破阶段迈入商业化造血新时期 [4] - 推理市场爆发 英伟达受外部环境影响 国产GPU迎来真正机会窗口 [11] - 寒武纪上半年营收同比增长4347% 结束多年亏损;百度昆仑芯中标中国移动十亿级订单;阿里推AI芯片战略市值一夜增2600亿;摩尔线程上半年营收超过去三年总和;沐曦出货超2.5万颗;海光芯片首次迈过10万大关 [11] 战略与优势 - 曦望70%资方为产业资本 包括三一集团华胥基金 第四范式 游族网络 美的控股等 [10] - 与产业资方血缘关系使芯片研发到商业化自下而上推进 规划时充分考虑用途和场景 [10] - 商汤日日新大模型和AI云能力与曦望芯片协同 提供技术验证和万卡智算中心商业化支撑 [10] - 芯片创业存在后发优势 太早入局可能在错误道路上试错消耗资源 [11] - 行业已验证兼容CUDA更易落地 聚焦细分赛道比通用芯片更务实 [11] 未来展望 - AI芯片赛点包括:GPU是软硬一体生意 考验厂商软硬件技术能力;需对市场趋势有提前预判和布局;国产AI芯片到达大规模商业化前夜 [12] - 中国GPU市场至少能支撑3-5家头部企业 2025年是入场资格线 无流片及成功产品的厂商可能再无机会入局 [12]