PhanthyCloud云服务平台
搜索文档
范式智能&曦望|推出“百万Token一分钱”计划 重构大模型推理成本边界
格隆汇· 2026-01-28 16:06
针对这些问题,范式智能与曦望通过技术合作推出"百万Token一分钱"计划。该计划基于曦望启望S3推理GPU芯片,通过原生支持FP8/FP4低精度推理和定制 化架构优化,在典型场景下实现单位Token成本降低约90%。范式智能的PhanthyCloud云服务平台则通过HAMi vGPU社区优化资源调度,提升GPU利用率; 依托"信创模盒 ModelHub XC"大模型社区,解决国产芯片与主流模型的兼容问题;结合先知平台,为金融、能源等领域提供业务导向的推理服务。 1月27日,在曦望2026 SGS产品发布会上,范式智能创始人戴文渊与国产GPU厂商曦望联席CEO王湛共同宣布,推出"百万Token一分钱"推理成本计划。双方 将以范式智能PhanthyCloud云服务与曦望新一代推理GPU芯片启望S3的深度融合,将大模型推理成本降至每百万Token仅需1分钱,为AI技术的规模化应用提 供更经济的解决方案。 当前,大模型推理成本是制约AI落地的重要因素。行业数据显示,主流大模型服务的输入Token价格约为0.4至2元/百万,输出Token价格约为1至4元/百万。 这使得处理长文档、高频交互等场景的成本压力显著,例如,1 ...