启望S3
搜索文档
未知机构:每日复盘128标普五连阳美元创四年新低黄金新高原油拉升A股震荡上-20260128
未知机构· 2026-01-28 10:45
涉及的行业与公司 * **行业**:全球金融市场(股市、债市、外汇、商品)、人工智能(AI)应用与算力、光纤光缆、大飞机制造、半导体、云计算、生物疫苗、贵金属、商业航天、脑科学与脑机接口、量子计算[1][2][3][4][5] * **公司**: * **海外**:Meta、康宁、美光、微软、特斯拉、联合健康、SpaceX、谷歌[1][5][6] * **A股/港股**:MINIMAX、智谱、值得买、宏景科技、润泽科技、长飞光纤、亨通光电、中天科技、航发动力、中航西飞、中航沈飞、中微半导、北方华创、中微公司、拓荆科技、优刻得、青云科技、首都在线[5][6] 核心观点与论据 * **宏观与市场动态**: * 海外市场在科技巨头财报前情绪乐观,标普500指数连续五天上涨并创下收盘最高纪录[1] * 美元指数大幅下跌超过1%,创下四年新低[1] * 国内12月规模以上工业企业利润同比增长5.3%,较11月的下降13.1%显著好转[1] * A股市场成交额从上一交易日的3.28万亿元人民币萎缩至2.92万亿元人民币[2] * **行业趋势与热点**: * **AI与算力**:AI应用端新品频出(如Deepseek-OCR2、Kimi k2.5),春节期间各大模型将陆续推出;算力硬件产业链走强;新一代推理GPU芯片可将单位Token推理成本降低90%[2][5] * **光纤光缆**:Meta计划向康宁公司支付高达60亿美元用于购买光纤电缆,刺激康宁股价暴涨15%,可能成为市场热点[1][6] * **半导体**:中微半导对MCU、Norflash等产品调价,涨价幅度为15%至50%[6] * **云计算**:谷歌宣布将于2026年5月1日调整数据传输价格,其中北美地区价格翻倍[6] * **大飞机**:市场消息称中国商飞今年将适度提高C919窄体客机的产量和交付量[6] 其他重要内容 * **商品市场表现**:现货黄金价格盘中上涨超过3%;受中东局势影响,原油价格尾盘一度上涨超过3%;比特币价格重新站上8.9万美元[1] * **债券市场**:10年期美国国债收益率上行2.6个基点至4.247%[1] * **港股资金流向**:南向资金净卖出超过6亿港元[4] * **前沿科技动态**:欧盟正式启动成员国政府卫星通信计划;SpaceX星舰V3版计划在六周后发射;超导量子计算机“本源悟空”全球访问量突破4000万次;北京将举办脑科学与脑机接口产业创新研讨会[5] * **板块表现**:A股贵金属板块大涨,生物疫苗题材回调[2][3]
至少有九家中国AI芯片公司出货量超万卡
36氪· 2026-01-28 09:46
文章核心观点 - 在严格的芯片出口管制倒逼下,国产数据中心AI芯片自主化进程加速,一批公司出货量或订单量已达到万卡级别,市场份额迅速攀升至35%,行业竞争进入“规模化交付验证”新阶段 [1][2] - 国产AI芯片在推理场景寻求突破,部分产品性能已接近或超过英伟达特供版H20,并通过优化致力于大幅降低推理成本,但整体在软件生态适配、先进制程与内存供应方面仍面临挑战 [12][14][11] - 行业未来可能参照光伏产业发展路径,通过激烈竞争跑出具备国际竞争力的企业,但AI芯片的竞争由软件、硬件和生态共同决定,其淘汰机制与光伏产业存在本质差异 [15][16] 国产AI芯片市场规模与份额 - 2025年上半年中国加速服务器(AI芯片)市场规模达160亿美元,出货量超过190万张,其中国产AI芯片市场份额约占35%,英伟达占62%,国产芯片需求增长速度远超英伟达 [2] - 国产AI芯片单价约在3万至20万元人民币每卡不等,出货量或订单量达到万卡规模,表明其性能、稳定性和总拥有成本已获得一定市场认可 [1] - 随着国产AI芯片代工产能提升,预计2026年国产AI推理芯片出货量将迎来一轮爆发式增长 [2] 主要参与者及出货情况 - 华为昇腾与百度昆仑芯是出货规模最大的国产AI芯片,性能突出并已用于部分模型训练场景,IDC数据显示华为昇腾市场份额位居国内第一,百度昆仑芯位居国内第三 [5] - 百度已于2025年2月点亮昆仑芯P800万卡集群,并计划未来点亮三万卡集群,客户包括金融、能源、制造等领域大型企业 [5] - 寒武纪是国内出货量最大的国产AI芯片之一,主要客户包括大型互联网公司、电信运营商和金融机构 [5] - 多家AI芯片创业公司累积出货量已超过万卡:沐曦超过2.5万卡 [8],天数智芯已交付5.2万枚芯片 [8],燧原科技AI加速卡及模组合计销量达9.72万张 [9] - 包括曦望、清微智能在内的非上市公司出货量或订单量也已超过万卡:曦望2025年AI芯片交付破万卡 [10],清微智能截至2026年1月订单量累计超过至少2万卡 [10] 技术路径与产品策略 - 部分国产AI芯片创业公司为追求可用、可控及出货规模,并未采用7nm及以下先进制程和HBM内存,而是采用更成熟且本土产业链能更快量产的12nm工艺和LPDDR内存,价格可低至3万元/卡 [11] - 行业预计2026年-2027年中国市场还会有多款国产AI推理芯片上市,并迎来爆发 [11] - 国产AI芯片公司普遍注重提升推理性能以“榨干”每一枚芯片的Token(词元)生成能力,这是衡量芯片实际推理效率的核心指标 [12] - 曦望公司目标是将百万Tokens的推理成本从2025年的1元人民币降低至1分级别,其下一代启望S3芯片目标推理性能相比上一代提升十倍以上 [13] 性能表现与生态挑战 - 在推理场景,部分国产AI芯片性能表现已接近或超过英伟达特供版H20芯片,例如百度昆仑芯P800、阿里PPU在运行适配优化模型时,Token吞吐效率优于H20 [14] - 国产AI芯片在软件生态层面普遍面临适配慢、适配难的问题,无法像英伟达芯片一样快速适配市面上大部分模型,为国产芯片适配新模型通常需一两个月,导致无法第一时间使用最新模型 [15] - 据业内人士表示,某国产AI芯片在Hugging Face开源社区上适配的模型数量只有几十款,而该社区拥有超过200万款模型 [15] - 国产AI芯片上游受限于芯片代工产能,下游受限于软件生态,其交付稳定性、软件栈成熟度与生态迁移成本将决定“万卡之后”的复购与生存 [16]
推理需求爆发,国产芯片从“堆算力”转向系统协同
第一财经· 2026-01-27 20:00
行业趋势与共识 - 大模型行业经过2025年发展已形成共识,推理需求将以复合倍速增长,行业需要高性能、高性价比的芯片 [3] - AI应用场景发生变化,多模态需求爆发,智能体需要高频响应与实时交互,物理AI也在加速落地 [3] - 行业成本结构改变,推理成本已从“元级”压到“分级”,未来AI会像水电一样成为普惠基础设施 [3] - 每当百万token的成本降低一半,市场上AI应用数量会显著增长,算力市场的繁荣度也将呈倍数级提升 [5] 公司战略与产品发布 - 曦望公司于1月27日发布第三代推理GPU芯片启望S3,设定目标是将百万token成本打到一分钱 [3] - 公司战略专注推理方向,预计到2030年,推理芯片将占到公司资源分配的80% [3] - 截至目前,曦望已发布三款芯片:云边端视觉推理专用的S1、对标英伟达A100的训推一体芯片S2,以及最新的推理芯片S3 [3] - 公司认为先将推理做到极致能够在商业上形成优势,这是战略定力问题 [3] - 曦望同时发布了AI算力平台,以自研芯片为底座,与多家大模型进行适配,从系统侧提高芯片利用效率 [4] 技术挑战与竞争焦点 - 训推一体芯片存在三大困境:成本高昂且供应不稳定、能耗惊人、部署运维复杂 [4] - 芯片行业竞争核心从“堆算力”转变,随着推理算力需求爆发,“内存墙”逐渐成为芯片性能的主要瓶颈 [4] - 计算单元算力提升速度远快于访存带宽提升速度,导致大多数芯片的纸面算力无法在实际场景中释放,这一矛盾在推理芯片中尤为突出 [4] - 未来合理的算力访存比才是芯片竞争的关键,该指标是衡量芯片算力与数据传输能力匹配度的核心 [4] - 英伟达创始人提出从单芯片优化升级为系统级协同设计的方案,以应对挑战 [4] 产业生态与国产算力定位 - 以DeepSeek为代表的大模型公司,不仅会做大模型,也会牵引框架变化,带动从模型架构到算子开发、推理系统的全链路技术创新 [4] - 大模型公司正推动框架适配新计算范式与跨硬件部署,试图摆脱对英伟达CUDA生态的依赖 [4] - 国产芯片定位越来越准确,从最初盲目追求与国际高性能算力比肩,转变为在追求性能的同时也追求极致成本 [5] - 国产算力正处于一个非常有利的位置 [1][5]
曦望发布新一代推理GPU芯片启望S3,单位Token推理成本降低90%
新浪财经· 2026-01-27 19:36
炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! (来源:智通财经) 启望S3为面向大模型推理的定制化GPGPU芯片。智通财经记者了解到,其在典型推理场景下的整体性 价比较上一代提升超10倍。算力与存储设计上,该芯片支持FP16至FP4精度切换,采用LPDDR6显存方 案,显存容量提升4倍。在DeepSeek V3/R1满血版等主流大模型推理中,单位Token成本较上一代降低约 90%。 1月27日,智通财经记者获悉,国产GPU厂商曦望(Sunrise)发布新一代推理GPU芯片启望S3。这是曦 望在近一年累计完成约30亿元战略融资后的首次集中公开亮相。2025年,曦望芯片交付量已突破万片。 ...