Workflow
底层架构创新
icon
搜索文档
刚拿 5 亿又揽 10 亿!AI 算力现最火 “吸金王”
是说芯语· 2026-03-11 16:00
公司融资与资本认可 - 公司在2025年12月完成Pre-A轮融资,金额超5亿元,投资方包括高瓴创投、京东科技、临港科创投等知名机构[2] - 2026年3月,公司完成Pre-A3轮融资,金额达10亿元,由蔚来资本、国开科创、三七互娱等8家机构联合注资,多维资本担任独家财务顾问[1] - 短短三个月内连续获得两轮大额融资,累计金额超15亿元,显示出资本对其核心技术方向的密集加注和高度押注[1][2] 核心技术:解耦式AI计算架构 - 公司瞄准大模型推理的效率痛点,其核心技术是“解耦式AI计算架构”[1] - 该架构将Transformer模型中的“注意力机制(Attention)”和“前馈神经网络(FNN)”拆分为两个独立模块,分别交由最适合的硬件进行分布式处理,而非传统上将两者绑定在同一层[2][4] - 这种架构创新旨在解决大模型推理中“算力吃紧、功耗居高不下”的问题,通过精准分配硬件资源,有望将算力利用率提升超50%,同时将功耗降低25%-30%[4] - 该技术思路被业内视为打破当前GPU主导格局的关键突破口,通过架构创新而非单纯堆叠芯片数量,实现更高效、更便宜的AI算力[4] 团队背景与领导力 - 公司CEO、法定代表人和实控人梁军拥有20余年芯片研发经验,是业内公认的“芯片架构师”[6] - 梁军早年曾在华为海思担任总架构师,主导麒麟SOC芯片研发,后加入寒武纪任CTO,推出了国内首款7nm AI训练芯片思元290[6] - 梁军于2024年8月正式加入公司,其深厚的工程化经验与产业背景,为公司的技术落地路径提供了清晰指引,从架构创新到芯片流片再到商业化落地均有成熟经验可依[6] 行业定位与发展愿景 - 公司聚焦于国产AI算力赛道,其技术路径选择了一条更底层的硬件架构创新路线[1][2] - 公司被视为国产AI算力赛道的新焦点,其融资不仅是资金注入,更被看作是产业对“底层架构创新”的认可[1][6] - 公司未来将继续以技术为核心,尝试改变现有的AI硬件设计逻辑,旨在为国产AI算力生态的多元化发展注入新的活力[6]
清华紧逼谷歌,AI顶会NeurIPS论文数第二,中国占半壁江山
36氪· 2025-12-10 09:31
全球AI研究格局剧变 - 在NeurIPS 2025接收的5526篇论文中,中国机构占据了全球半壁江山,总份额达48.68% [3][6] - 美国机构总份额为36.36%,亚洲其他地区(除中美)为8.48%,欧洲为5.35%,加拿大为1.14% [6] - 谷歌以4.84%的份额勉强维持全球第一,但清华大学以4.73%的份额紧随其后,两者差距仅0.11个百分点 [3][4] - 北京大学以3.63%的份额位列第三,中国科学院大学以3.24%的份额位列第四 [4][5] - 传统美国计算机顶尖名校份额被中国顶尖高校超越:斯坦福大学份额为2.58%,卡内基梅隆大学为2.55%,麻省理工学院为2.45%,加州大学伯克利分校为2.08% [3][5] 中美科研生态差异显著 - 美国AI创新高度集中在谷歌、Meta、微软等科技巨头手中,形成了算力与数据的垄断 [9] - 中国AI创新引擎广泛分布在清华大学、北京大学等顶尖高校与阿里巴巴、字节跳动等公司实验室之间,依靠高人才密度和政策驱动实现爆发 [9] - 全球AI研究正朝三个核心枢纽收敛:北京、上海和旧金山湾区 [9] 中国AI研究实现质变突破 - 中国AI研究完成了从数量堆叠向底层架构创新的「质变」突围 [1] - 阿里巴巴千问团队凭借对Transformer核心机制进行革新的论文《Gated Attention for Large Language Models》,获得NeurIPS 2025最佳论文奖之一,证明中国工业界在基础研究上已具备与DeepMind同台竞技的硬实力 [11][13] - 时间检验奖颁给了十年前的经典之作《Faster R-CNN》,作者包括任少卿、何恺明等中国研究者,表明中国研究者的崛起早有根基 [13][19] 地缘政治影响学术交流 - NeurIPS 2025因签证壁垒,在圣地亚哥主会场外,于墨西哥城设立了平行卫星会场,会议呈现「撕裂感」 [1][20] - 涉及「敏感技术」的中国学者难以获得美国签证,墨西哥城会场成为连接两个世界的驿站 [20] - 美国科研环境的不确定性促使顶尖华人人才回流,为清华大学等中国研究机构的爆发提供了重要助力 [20]