H800 GPU
搜索文档
Kimi杨植麟称“训练成本很难量化”,仍将坚持开源策略
第一财经· 2025-11-11 18:35
公司战略与产品进展 - 公司近期发布最新版本开源思考模型Kimi K2 Thinking [1] - 公司CEO回应称模型训练成本460万美元并非官方数字 因大部分投入花在研究与实验上导致成本难以量化 [1] - 针对模型推理长度过长及榜单成绩与实际体验不符的质疑 公司表示现阶段优先考虑绝对性能 token效率与榜单脱节问题将在后续改善 [1] - 公司未来很长一段时间内仍将坚持开源策略 重点推进Kimi K2 Thinking模型的应用与优化 [4] - 公司在优先发展文本模型的前提下兼顾多模态模型推进 尝试通过架构创新 开源策略与成本控制建立差异化优势 [4] 行业竞争格局 - 中国开源大模型在国际市场调用量显著 OpenRouter榜单前二十名中中国开源模型占据五席 包括MiniMax M2 DeepSeek V3 GLM4.6等 [2] - 公司产品因OpenRouter平台接口问题 目前仅能以API形式被使用 [2] - 行业头部模型训练数据量庞大 榜单显示Grok Code Fast 1训练token达1.36T 而Claude Sonnet 4.5为649B tokens [4] 技术资源与基础设施 - 公司团队使用携带InfiniBand技术的H800 GPU进行模型训练 尽管其性能比不上美国高端卡且数量处于劣势 但每张卡均被极致利用 [2]
黄金时代即将结束,英伟达股价即将迎来大幅下跌
美股研究社· 2025-03-26 20:45
英伟达增长前景分析 - 越来越多的证据表明AI训练不一定依赖高端GPU,这可能减缓英伟达未来增长[2] - 英伟达数据中心业务2024财年和2025财年收入分别增长216%和142%,但高端GPU快速扩张已接近顶峰[2][3] - 蚂蚁集团研究发现300B的MoE LLM可在性能较低GPU上训练,成本降低20%,使用华为和阿里自研芯片而非英伟达H800[3] - 蚂蚁集团的Ling-Plus和Ling-Lite模型表现优于Meta的LLaMA和DeepSeek模型[3] 行业竞争格局变化 - 超大规模提供商开始开发自研GPU:Meta测试首款AI训练芯片,谷歌和亚马逊已开发定制硅片[5] - 量子退火模型不依赖GPU进行纠错和验证,D-Wave研究量子在加密挖矿的应用[6] - 英伟达成立自研ASIC部门,可能降低来自博通和Marvell的竞争风险[14] 财务数据与预测 - 2026财年Q1预计收入430亿美元(±2%),分析师预测全年收入增长63%[6][8] - 数据中心业务增长预期:2027财年30%,2028-2030财年20%,2033财年后10%[8] - 预测年利润率增长10bps,运营费用2028-2030财年增长19%,2033财年起增长9.7%[9] - 股权自由现金流预测:2025年80,891百万美元,2026年125,403百万美元,2035年494,644百万美元[11] 短期市场动态 - 四大科技公司(亚马逊、微软、Alphabet、Meta)2025年资本支出预算同比增长46%[12][13] - 亚马逊2025年资本支出预算1000亿美元,微软800亿美元,Alphabet750亿美元,Meta数据未明确[13] - 短期内英伟达业务增长可能保持强劲,主要得益于Blackwell产量增长和超大规模企业资本支出增加[6][12]