Workflow
S1
icon
搜索文档
推理需求爆发,国产芯片从“堆算力”转向系统协同
第一财经· 2026-01-27 20:00
行业趋势与共识 - 大模型行业经过2025年发展已形成共识,推理需求将以复合倍速增长,行业需要高性能、高性价比的芯片 [3] - AI应用场景发生变化,多模态需求爆发,智能体需要高频响应与实时交互,物理AI也在加速落地 [3] - 行业成本结构改变,推理成本已从“元级”压到“分级”,未来AI会像水电一样成为普惠基础设施 [3] - 每当百万token的成本降低一半,市场上AI应用数量会显著增长,算力市场的繁荣度也将呈倍数级提升 [5] 公司战略与产品发布 - 曦望公司于1月27日发布第三代推理GPU芯片启望S3,设定目标是将百万token成本打到一分钱 [3] - 公司战略专注推理方向,预计到2030年,推理芯片将占到公司资源分配的80% [3] - 截至目前,曦望已发布三款芯片:云边端视觉推理专用的S1、对标英伟达A100的训推一体芯片S2,以及最新的推理芯片S3 [3] - 公司认为先将推理做到极致能够在商业上形成优势,这是战略定力问题 [3] - 曦望同时发布了AI算力平台,以自研芯片为底座,与多家大模型进行适配,从系统侧提高芯片利用效率 [4] 技术挑战与竞争焦点 - 训推一体芯片存在三大困境:成本高昂且供应不稳定、能耗惊人、部署运维复杂 [4] - 芯片行业竞争核心从“堆算力”转变,随着推理算力需求爆发,“内存墙”逐渐成为芯片性能的主要瓶颈 [4] - 计算单元算力提升速度远快于访存带宽提升速度,导致大多数芯片的纸面算力无法在实际场景中释放,这一矛盾在推理芯片中尤为突出 [4] - 未来合理的算力访存比才是芯片竞争的关键,该指标是衡量芯片算力与数据传输能力匹配度的核心 [4] - 英伟达创始人提出从单芯片优化升级为系统级协同设计的方案,以应对挑战 [4] 产业生态与国产算力定位 - 以DeepSeek为代表的大模型公司,不仅会做大模型,也会牵引框架变化,带动从模型架构到算子开发、推理系统的全链路技术创新 [4] - 大模型公司正推动框架适配新计算范式与跨硬件部署,试图摆脱对英伟达CUDA生态的依赖 [4] - 国产芯片定位越来越准确,从最初盲目追求与国际高性能算力比肩,转变为在追求性能的同时也追求极致成本 [5] - 国产算力正处于一个非常有利的位置 [1][5]
北京利尔(002392.SZ)与商汤科技、曦望达成战略合作协议
证券之星· 2025-09-04 18:40
战略合作框架 - 北京利尔与商汤科技及曦望签署三方战略合作协议 共同推进AI算力合作、工业制造与决策AI垂直模型开发应用及智能体推广[1] - 合作聚焦丙方曦望的AI芯片销售与多领域应用 优先采用已量产S1 S2及待量产S3推理芯片 辅以其他AI芯片厂商产品[1] - 计划在市场需求稳定时成立算力业务联合体 条件成熟时组建专项业务团队[1] 业务拓展方向 - 利用北京利尔在钢铁企业的客户资源 推进曦望AI芯片或联合算力租赁设施在钢铁企业AI数据中心业务的应用[1] - 合作助力公司开拓工业制造与决策AI垂直模型开发应用的新业务领域[2] 行业动态 - 多家钢铁企业正切入数据中心建设业务 为AI芯片及算力设施提供潜在应用场景[1]
2025世界机器人大会:这些“未来神器”将如何改写人类生活
环球网资讯· 2025-08-09 13:01
展会概况 - 2025世界机器人大会在北京亦创国际会展中心举办,200余家顶尖企业参展,展品数量达1500余件,首发新品数量较去年翻倍至100余款 [1] - 展会涵盖外骨骼机器人、人形机器人、家务机器人、宠物机器人等多种类型,展现机器人技术在日常生活和工业领域的广泛应用 [1] 外骨骼机器人技术 - 傲鲨智能展示VIATRIX外骨骼机器人,采用FLOAT 360浮动式髋关节架构与腿部电机设计,大幅提升动作流畅性,体验者反馈穿戴后无束缚感且助力效果显著 [3] - VIATRIX搭载自研车规级响应电机,实现毫秒级精准动力输出,双腿总计46Nm动力配合AI步态算法,降低体能消耗 [3] - 产品具备四大功能模式(AI自适应模式、阻抗模式、骑行模式、开发者模式)和IP54级防尘防溅水性能,适应多元场景 [4] 人形机器人技术 - 星尘智能展示S1机器人,采用绳驱传动设计模仿人类肌肉施力方式,结合自研运动控制算法,实现毫秒级低延时动作复刻 [4][6] - 傅利叶GR-3人形机器人以"温暖科技"为理念,配备55个自由度、柔肤软包设计和全感交互系统,支持拟人化肢体表达和情感化交互 [7][8] - 宇树科技展示G1格斗款人形机器人,具备动态平衡算法,可完成高难度格斗动作,摔倒后能自主恢复 [12] - R1人形机器人以3.99万元起售,集成多模态大模型,支持复杂动作,EDU版本开放软硬件接口供二次开发 [14] 服务与家庭机器人 - 星海图R1 Lite机器人通过端到端VLA基础模型G0实现自然语言指令响应,可自主完成铺床等高复杂度家庭任务 [7] - 大象机器人展示仿生宠物metaCat2025和手宠pawbots,新增眼睫毛、耳朵动、嘴巴张合等功能,吸引大量观众互动 [10] 行业合作与商业化 - 京东宣布将在智能机器人领域投入超百亿资源,目标三年内助力100个智能机器人品牌销售破10亿,覆盖超百万终端场景 [14] - 京东推出附身智能品牌JoyInside,已接入数十家头部品牌,涵盖陪伴类和教育类机器人 [14] 技术突破与趋势 - 展会展示机器人产业在动力架构、AI算法、情感交互等领域的最新突破,包括傲鲨FLOAT 360架构、星尘绳驱传动技术、傅利叶情感化设计等 [16] - 人机共生趋势显著,机器人技术正从实验室加速走向商业化落地,覆盖日常生活、工业、教育等多场景 [16]
商汤新布局,融资10亿
搜狐财经· 2025-07-21 15:44
公司动态 - 商汤联合创始人徐冰发起成立GPU芯片公司曦望,并辞任商汤执行董事及董事会秘书职务[2] - 曦望已完成首轮近10亿元融资,投资方包括华胥基金、第四范式、游族网络等[11] - 商汤大芯片团队已整体加入曦望,曦望官网和官微已正式运营[2][8] - 曦望定位为商汤生态中的算力底座,同时保持独立性[2][15] 战略调整 - 商汤2024年底推动"1+X"组织架构重组,曦望是"X"阵营最新板块[2][9] - "1"代表商汤核心业务,"X"代表拆分出的生态企业矩阵[9] - "X"企业将设立独立CEO,获得更灵活激励机制和融资通道[9] - 战略调整旨在聚焦核心业务,改善财务状况[10] 技术布局 - 曦望技术路线为GPGPU,已实现100%自主知识产权[20] - 商汤已推出S1、S2芯片,S3芯片预计2026年流片[16] - S3芯片架构革新可将推理成本降低90%[16] - 曦望已完成技术攻坚,将继续服务于商汤战略[15] 行业背景 - 中国本土AI芯片品牌2024年渗透率约30%,出货量82万张[20] - 国产GPU赛道方兴未艾,国产替代需求推高市场热度[20] - 行业面临国际巨头竞争压力,英伟达H20芯片将恢复对华供应[20] 人物背景 - 徐冰是商汤联合创始人,曾主导商汤融资工作[5] - 徐冰担任曦望董事长,负责战略发展和公司文化[8] - 曦望联席CEO王湛和王勇分别来自百度和AMD[6]
Sunrise Raises $139 Million in Pre-A Round as China Ramps Up GPU Independence Push
钛媒体APP· 2025-07-21 09:32
融资与估值 - 公司完成1.39亿美元Pre-A轮融资 由华胥基金、第四范式、游族网络等机构参与投资 [2][3] - 融资将用于加速研发、扩大市场运营及扩充工程团队规模 [3] - 深圳上市企业北京利尔及其董事长赵伟以2.0895亿美元投前估值向母公司上海振亮智能投资3483万美元 [11] 公司背景与战略定位 - 公司由商汤科技半导体业务分拆成立 定位为全栈高性能GPU及多模态推理芯片开发商 [4] - 中国每年支付139.3亿美元算力税 公司使命是实现计算自主权 [4] - 采用"1+X"战略重组 成为商汤科技芯片业务旗舰企业 [9] 技术产品进展 - 团队150人 主要来自AMD、阿里巴巴、百度和商汤科技 已实现两代芯片一次流片成功 [5] - S1视觉推理芯片专注云边视频分析 出货量超2万片 S2通用GPU兼容CUDA生态并对标英伟达A100 已量产数万片 [6][7] - 预计2026年推出S3芯片 采用自研架构 目标降低90%推理成本 [7] 业务与财务表现 - 平台战略涵盖硬件加速器、大模型服务器及算力集群 重点布局智能计算中心、金融服务、智能制造等领域 [8] - 2024年营收3.35万美元 净亏损2647万美元 2025年第一季度零营收 亏损318万美元 [11] - 截至2025年3月总资产1313万美元 净资产1172万美元 [11] 行业趋势 - 地缘政治与供应链压力推动中国本土GPU替代需求 壁仞科技获国家主导基金投资 沐曦集成与摩尔线程科创板IPO获受理 [12]