Gemini 3 Flash Pre
搜索文档
想了一个token出海路径
小熊跑的快· 2026-03-09 08:28
文章核心观点 - 提出一种将人工智能推理算力基础设施布局于中国,以利用其成本优势,并通过网络技术优化全球服务体验的商业模式[1] - 核心逻辑在于利用中国在电力、土地、芯片及配套设施方面的低成本,将数据中心设在中国,使模型推理成本仅为海外的六分之一[1] - 通过在海外租赁少量算力进行营销展示,实际推理任务则调度回中国本土算力完成,利用AIGC长事务处理(1-4分钟)的特性来掩盖网络时延,使客户无感知[1] - 建议通过扩建海底光缆、增加带宽来保障网络连通性与稳定性,并认为该方案能解决成本、数据安全与地缘政治关切,促进全球AI应用普及[1] 行业竞争格局与市场动态 - 根据OpenRouter的LLM排行榜周度数据,迷你马克斯(Minimax)的M2.5模型以1.81万亿(1.81T)tokens的使用量位列第一,市场份额为19%[5][7] - 谷歌的Gemini 3 Flash Preview模型以1.05万亿(1.05T)tokens的使用量位列第二,市场份额为12%[7] - 深寻(DeepSeek)的V3.2模型以8090亿(809B)tokens的使用量位列第三,市场份额为11%[7] - 月之暗面(Moonshot AI)的Kimi K2.5模型使用量为7980亿(798B)tokens,市场份额为124%[7] - Anthropic的Claude Opus 4.6模型使用量为7650亿(765B)tokens,市场份额为120%[7] - 阶跃星辰(Stepfun)的Step 3.5 Flash (free)模型使用量为6700亿(670B)tokens,市场份额为153%[7] - x.ai的Grok 4.1 Fast模型使用量为5880亿(588B)tokens[7] - Arcee AI的模型使用量为5400亿(540B)tokens[8]