深度｜英伟达最新挑战者Cerebras创始人对话谷歌前高管：我们正处于一个无法预测拐点的阶段

核心观点 - AI芯片公司Cerebras致力于构建全球最快、最大的AI计算硬件，其芯片比已知最大芯片大56倍，专注于加速稀疏线性代数运算以提升AI计算效率[3][8][11] - 行业正经历新一轮半导体、软件和硬件革命，开源生态对初创公司至关重要，Meta和DeepSeek推动OpenAI加入开源模型竞争[6][18][19] - AGI发展受电力供应限制，大型数据中心需1.5吉瓦核电站支持，美国电力基建严重不足[42][45][46] 突破计算极限：Cerebras芯片的创新 - Cerebras的WSE芯片通过整合计算与内存单元，实现比传统芯片快近两个数量级的AI计算速度，特别优化Transformer等模型的矩阵运算[8][11][34] - 芯片设计从底层数学原理出发，专注稀疏线性代数加速，避免专用架构陷阱，在Transformer诞生前已确立技术优势[10][11] - 每token成本以每年10倍速度下降，类比汽车发动机80年演进压缩至5年完成[12][16] 硬件与软件的协同演进 - 硬件需与AI算法协同设计，团队需包含顶尖研究人员预判技术方向，系统级优化涉及I/O结构、提示缓存等工具[11][24] - NVIDIA的CUDA生态形成技术壁垒，但未来五年技术栈可能重构，多种路径并行发展[10][16] - 推理需求呈指数增长，用户日均使用频次从1-2次跃升至20次，驱动计算量爆发[32][33] 全球化竞争与开源战略 - AI竞争呈现中美两极格局，中国通过开源模型在非洲、中亚等地区拓展影响力[18] - 开源使初创公司能以1.5美元/百万token成本对抗封闭模型的100美元定价，推动技术民主化[19] - 智能手机端LLM应用可能改变产业格局，离线场景能力成为新竞争维度[19][20] AGI发展瓶颈与关键指标 - 电力成为核心制约因素，单个数据中心需匹兹堡全市1/3电量（1吉瓦），美国需新建92座核电站满足需求[42][45][46] - 衡量AGI进展的指标尚未标准化，每秒token数反映用户体验，但传统SaaS指标已失效[33][34] - Scaling Law持续生效但拐点未知，强化学习需成千上万倍计算量，行业处于爆发期[28][29][32] AI对齐与安全挑战 - 对齐测试方法在行业共享，但自我改进系统的持续对齐尚未解决，存在信息隐瞒风险[36][37][38] - 安全责任主要由软件和人类团队承担，硬件层作用有限[35][39] - 欧洲可通过国家战略发展主权AI，需培养工程师群体并明确经济优先级[40][41]