Workflow
KernelCAT自动化计算加速平台
icon
搜索文档
AI for Computing迎来破局者,国产黑马智子芯元两个月融了两轮!
机器之心· 2026-06-22 12:34
文章核心观点 - 计算效率的跃迁是科学和工业发展的关键驱动力,当前行业面临硬件扩张瓶颈,计算加速进入新阶段,即利用AI自动优化计算本身[1] - 智子芯元所处的“AI for Computing”赛道旨在通过AI接管计算优化与系统统筹,将芯片理论峰值转化为真实有效算力,是AI时代的计算加速基础设施[2][9] - 公司通过“大模型 + 运筹优化 + 算法自动发现”的技术范式,打造智能体以全面掌控复杂计算系统,解决因软硬件快速更迭、人才稀缺、任务复杂化带来的计算优化难题[2][7][8] - AI for Computing 的深层价值在于通过计算能力跃迁重构底层生产力,使过去受限于计算环节的高价值产业得以规模化落地[3] - 在国产算力生态中,公司扮演“精装修商”角色,解决多元硬件架构与分散需求带来的适配瓶颈,帮助产业链各方将“卡能用”做实[10][11] 公司融资与市场认可 - 智子芯元于近期完成数千万元天使+轮融资,由鼎峰科创(武岳峰创投)、英诺科创基金、首程资本领投,老股东同创伟业超额追投[4][5] - 不到两个月前,公司刚完成数千万元天使轮融资,两轮累计融资近亿元[4] - 资本市场关注不仅在于公司本身,更在于AI for Computing带来的持续算力提升将成为释放新科学、工业和智能化生产力的关键变量[28] 技术路线与核心产品 - 公司技术路线分为三步:1) 看清计算任务,拆解并分析性能瓶颈;2) 自动搜索与算法发现,在巨大实现空间中寻找最优路径;3) 硬件验证,通过真实硬件反馈完成优化闭环[13][14][15][18] - 核心产品为“KernelCAT 自动化计算加速平台”,其流程可概括为“分析 — 编码 — 上板调优 — 交付”,将计算加速环节串联成自动闭环[20][21] - 平台中的智能体系统“Kerminal”展现了强大的自动计算加速能力,将模型能力、工具调用、代码执行、硬件反馈和任务流程组织在一起[21] 产品性能与落地案例 - Kerminal 在多个主流基准测试中取得领先表现:在KernelBench中,正确率、平均加速比与几何平均加速比三项核心指标均位居榜首;在CANN-Bench总计53个任务中,50个完成性能剖析,35个完全通过,41个通过率超过95%[22] - Kerminal 具备用数学思维自主探索新实现路径的能力,例如在精度不达标时,能自主改用多项式逼近并迭代至达标[22] - 生成和优化的算子已合并至昇腾官方CANN算子库,其中reshape_and_cache_kernel_flash算子从vLLM CUDA版本迁移到昇腾后,性能从14微秒优化到2.58微秒,提升5.4倍[23] - 具体产业场景落地案例:在具身智能端侧场景,RDK S100开发板部署DeepSeek R1 1.5B模型,端到端2小时闭环完成,吞吐性能较基线提升1.5倍;在AI for Science场景,TorchFold长序列昇腾部署实现峰值内存降低70%、速度提升50%;DSDP分子盲对接模型迁移适配后,推理性能提升138倍[23] 行业背景与公司定位 - 计算需求因大模型、智能体、具身智能、科学计算等场景被推向新数量级,但受硬件制程、功耗和成本约束,单纯硬件扩张难以为继[1] - 行业过去关注芯片参数与理论峰值,但实际生产环境中,算力表现因模型、框架与业务负载不同而有巨大差异[7] - 国产AI芯片路线多元,客户需求分散(模型厂商关心CUDA性能、云厂商关心集群利用率、政企客户看重稳定交付),导致适配复杂,难以由芯片厂商独立完成[10] - 公司团队具备从模型训练、运筹优化到智能体系统的全栈技术积累,并依托深圳市大数据研究院与河套学院的孵化支持,聘请罗智泉院士担任学术指导[28] - 产业链各方(芯片厂商、云厂商、模型厂商、政企客户)均有为AI for Computing买单的动力,旨在将纸面算力转化为可交付的有效算力[28]