KernelCAT自动化计算加速平台 - 财报，业绩电话会，研报，新闻

KernelCAT自动化计算加速平台

搜索文档

机器之心· 2026-06-22 12:34

文章核心观点 - 计算效率的跃迁是科学和工业发展的关键驱动力，当前行业面临硬件扩张瓶颈，计算加速进入新阶段，即利用AI自动优化计算本身[1] - 智子芯元所处的“AI for Computing”赛道旨在通过AI接管计算优化与系统统筹，将芯片理论峰值转化为真实有效算力，是AI时代的计算加速基础设施[2][9] - 公司通过“大模型 + 运筹优化 + 算法自动发现”的技术范式，打造智能体以全面掌控复杂计算系统，解决因软硬件快速更迭、人才稀缺、任务复杂化带来的计算优化难题[2][7][8] - AI for Computing 的深层价值在于通过计算能力跃迁重构底层生产力，使过去受限于计算环节的高价值产业得以规模化落地[3] - 在国产算力生态中，公司扮演“精装修商”角色，解决多元硬件架构与分散需求带来的适配瓶颈，帮助产业链各方将“卡能用”做实[10][11] 公司融资与市场认可 - 智子芯元于近期完成数千万元天使+轮融资，由鼎峰科创（武岳峰创投）、英诺科创基金、首程资本领投，老股东同创伟业超额追投[4][5] - 不到两个月前，公司刚完成数千万元天使轮融资，两轮累计融资近亿元[4] - 资本市场关注不仅在于公司本身，更在于AI for Computing带来的持续算力提升将成为释放新科学、工业和智能化生产力的关键变量[28] 技术路线与核心产品 - 公司技术路线分为三步：1) 看清计算任务，拆解并分析性能瓶颈；2) 自动搜索与算法发现，在巨大实现空间中寻找最优路径；3) 硬件验证，通过真实硬件反馈完成优化闭环[13][14][15][18] - 核心产品为“KernelCAT 自动化计算加速平台”，其流程可概括为“分析 — 编码 — 上板调优 — 交付”，将计算加速环节串联成自动闭环[20][21] - 平台中的智能体系统“Kerminal”展现了强大的自动计算加速能力，将模型能力、工具调用、代码执行、硬件反馈和任务流程组织在一起[21] 产品性能与落地案例 - Kerminal 在多个主流基准测试中取得领先表现：在KernelBench中，正确率、平均加速比与几何平均加速比三项核心指标均位居榜首；在CANN-Bench总计53个任务中，50个完成性能剖析，35个完全通过，41个通过率超过95%[22] - Kerminal 具备用数学思维自主探索新实现路径的能力，例如在精度不达标时，能自主改用多项式逼近并迭代至达标[22] - 生成和优化的算子已合并至昇腾官方CANN算子库，其中reshape_and_cache_kernel_flash算子从vLLM CUDA版本迁移到昇腾后，性能从14微秒优化到2.58微秒，提升5.4倍[23] - 具体产业场景落地案例：在具身智能端侧场景，RDK S100开发板部署DeepSeek R1 1.5B模型，端到端2小时闭环完成，吞吐性能较基线提升1.5倍；在AI for Science场景，TorchFold长序列昇腾部署实现峰值内存降低70%、速度提升50%；DSDP分子盲对接模型迁移适配后，推理性能提升138倍[23] 行业背景与公司定位 - 计算需求因大模型、智能体、具身智能、科学计算等场景被推向新数量级，但受硬件制程、功耗和成本约束，单纯硬件扩张难以为继[1] - 行业过去关注芯片参数与理论峰值，但实际生产环境中，算力表现因模型、框架与业务负载不同而有巨大差异[7] - 国产AI芯片路线多元，客户需求分散（模型厂商关心CUDA性能、云厂商关心集群利用率、政企客户看重稳定交付），导致适配复杂，难以由芯片厂商独立完成[10] - 公司团队具备从模型训练、运筹优化到智能体系统的全栈技术积累，并依托深圳市大数据研究院与河套学院的孵化支持，聘请罗智泉院士担任学术指导[28] - 产业链各方（芯片厂商、云厂商、模型厂商、政企客户）均有为AI for Computing买单的动力，旨在将纸面算力转化为可交付的有效算力[28]