Workflow
Grok Code Fast 1
icon
搜索文档
AI数据继续上攻
小熊跑的快· 2026-01-26 07:07
行业模型调用量周度数据 - 统计周期内,行业主要大语言模型总调用量达到6.17万亿次,周度调用量增长1.57万亿次,环比增速显著 [2] - 在主要模型中,ChatGPT移动端数据环比上行明显,显示其用户活跃度或使用频率在提升 [4] - 第三方平台OpenRouter的调用数据继续创下新高,表明通过聚合平台分发模型的需求持续旺盛 [4] 主要模型市场份额与排名 - “Others”类别的模型合计调用量最高,达到2.84万亿次,占据显著市场份额 [2] - 国产模型MiMo-V2-Flash本周调用量达4620亿次,排名冲至行业第二,表现突出 [2][4] - 头部模型竞争激烈,Anthropic的Claude Sonnet 4.5以6110亿次调用量位居榜首,OpenAI的Claude Opus 4.5以3150亿次调用量位列第五 [2] - 谷歌系模型表现强劲,Gemini 3 Flash Preview、Gemini 2.5 Flash及Lite版合计调用量接近1万亿次 [2] - 其他重要参与者包括DeepSeek V3.2(3070亿次)、xAI的Grok Code Fast 1(4480亿次)与Grok 4.1 Fast(2240亿次) [2]
数据漂亮
小熊跑的快· 2026-01-18 21:21
AI大模型行业第三方API调用数据概览 - 统计周期内,第三方API平台上的AI大模型总调用量(Tokens)达到7.11万亿(7.11T)[2] - 统计周期内,行业总调用量的周度增长为5470亿(+547B),显示出强劲的扩张势头[2] 主要AI模型市场份额与排名 - “Others”类别以3.32万亿的调用量占据主导地位,远超其他单一模型[2] - Anthropic公司的Claude Opus 4.5模型以5990亿的调用量位列第二[2] - 国产模型MiMo-V2-Flash以5060亿的调用量在该第三方平台排名全球第三[2][3] - 紧随其后的模型包括:Claude Sonnet 4.5(5800亿)、Grok Code Fast 1(4320亿)、Gemini 3 Flash Preview(4140亿)、Gemini 2.5 Flash(3580亿)、DeepSeek V3.2(3330亿)、Gemini 2.5 Pro(3050亿)和Grok 4.1 Fast(2670亿)[2] 行业趋势与预测 - 第三方API调用数据创下新高,符合两周前的市场预测[3] - 国产AI模型MiMo-V2-Flash在全球第三方平台中取得领先的市场地位,位列第三[3]
圣诞节后 数据又新高
小熊跑的快· 2026-01-14 07:32
文章核心观点 - 第三方数据显示,在AI模型的API调用量排名中,小米公司的MiMo-V2-Flash模型表现突出,已超越谷歌的Gemini系列,位列第三,显示出强劲的增长势头 [2] - 马斯克旗下X公司的Grok模型以及中国的DeepSeek V3.2模型同样表现不俗,整体API调用数据增长迅速,预计下周将达到新高 [2] AI模型API调用量排名(截至2026年1月5日) - 总API调用量达到6.43万亿次 [4] - “Others”类别以3.15万亿次的调用量占据主导地位 [4] - 排名第二的是Anthropic的Claude Sonnet 4.5模型,调用量为5310亿次 [4] - 排名第三的是小米的MiMo-V2-Flash (免费版) 模型,调用量为3980亿次,超过了谷歌的Gemini 3 Flash Preview (3870亿次) [4] - 马斯克X公司的Grok Code Fast 1模型以4130亿次调用量位列第四 [4] - 谷歌的Gemini 2.5 Flash和Gemini 2.5 Flash Lite模型调用量分别为3650亿次和2540亿次 [4] - 中国的DeepSeek V3.2模型调用量为3120亿次 [4] - Anthropic的Claude Opus 4.5模型调用量为3700亿次 [4] - 马斯克X公司的Grok 4.1 Fast模型调用量为2420亿次 [4]
国家下场
小熊跑的快· 2025-12-23 08:57
美国AI国家战略启动 - 美国能源部联合OpenAI、谷歌等24家科技巨头,启动国家AI“创世纪计划”,参与方包括微软、谷歌、英伟达、OpenAI、DeepMind、Anthropic等 [1] - 该计划标志着美国科技战略从各自为战转向系统性集体攻关,AI模型和计算平台将首次全面应用于可控核聚变、能源材料发现、气候模拟、量子计算算法等重大科学研究 [1] - 美国能源部是AMD、英伟达等公司的重要客户 [2] 行业与公司动态 - 英伟达相关产业链出现反弹 [3] - 特斯拉Robotaxi的盈利逻辑正被海外投行所认知 [3] 主要AI模型参数规模 - 主要AI模型参数总规模达到5.16万亿(5.16T) [5] - 其中,Grok Code Fast 1模型参数为4630亿(463B),Gemini 2.5 Flash为3950亿(395B),Claude Sonnet 4.5为3780亿(378B) [5] - GPT-OSS-120B模型参数为2060亿(206B),Claude Opus 4.5为1790亿(179B),DeepSeek V3.2为1750亿(175B) [5] - 行业模型参数规模以每周8190亿(+819B)的速度增长 [5]
前GitLab首席执行官为Kilo募资 角逐竞争激烈的AI代码生成市场
新浪财经· 2025-12-10 23:02
公司概况与融资 - Kilo Code是一家专注于“氛围式编码”(AI辅助编码)的初创公司,于2025年年初成立 [4][8] - 公司联合创始人兼首席执行官为斯科特·布莱特诺瑟,联合创始人包括前GitLab首席执行官希德·西布兰迪伊 [3][10] - 公司于2025年10月宣布完成800万美元种子轮融资,投资方包括Breakers、Cota Capital、General Catalyst、Quiet Capital和Tokyo Black [3][4][8][10] 创始人背景与团队 - 联合创始人希德·西布兰迪伊是自学成才的开发者,曾助力GitLab普及其工具,GitLab于2021年上市,当前估值超60亿美元 [3][10] - 西布兰迪伊于2024年卸任GitLab CEO,但仍担任其董事会主席,并为Kilo Code提供了早期资金 [3][5][10][11] - 公司目前在全球多地拥有约34名员工,日常运营由布莱特诺瑟负责,其与西布兰迪伊保持每日多次沟通 [5][11] 产品与技术 - Kilo Code开发了一款“氛围式编码”插件,可适配微软Visual Studio Code及Cursor等编程应用 [4][8][12] - 该插件基于开源许可证,允许公众参与贡献,并支持调用包括xAI的Grok Code Fast 1在内的多款高端和经济型AI模型 [5][12][13] - 公司是初创公司OpenRouter API的最热门使用方,过去一个月内已通过该接口处理超3万亿个标记(一个标记约相当于0.75个单词) [5][12] 市场验证与用户反馈 - 荷兰电商初创公司Plug&Pay的软件工程师表示,在试用多家产品后,已持续使用Kilo Code数月,其公司约80%的开发者都在使用该工具 [5][6][13] - 用户举例称,借助Kilo Code完成一个复杂的SQL查询仅需一天,而原本可能需要数日 [6][13] - GitLab正在测试AI智能体任务处理平台,并对Kilo Code的技术表现出兴趣,已支付1000美元获得一项在2026年8月前的优先收购权(10个工作日优先洽谈期) [6][13] 行业趋势与竞争格局 - “氛围式编码”术语由OpenAI联合创始人于2025年2月首创,指利用大语言模型编写和更新软件 [4][10] - 行业并购与融资活跃:OpenAI曾考虑以约30亿美元收购Windsurf,谷歌随后以24亿美元交易挖走其核心员工;竞争对手Cursor在2025年11月完成23亿美元融资,估值达293亿美元 [4][11] - 微软首席执行官透露,“氛围式编码”生成的代码已占微软代码总量的30% [4][11] - 市场正快速向非技术人群扩展,设计软件公司Figma及一众初创企业已开始提供相关服务 [6][13] 发展战略与未来规划 - Kilo Code计划拓展至编程入门者市场,目前正在开发一款体验上接近Lovable或Bolt的应用构建器 [7][14] - 总部位于瑞典的Lovable在2025年7月完成融资,估值达到18亿美元,可作为市场潜力的参照 [7][14]
100万亿Token揭示今年AI趋势,硅谷的这份报告火了
36氪· 2025-12-09 11:21
开源与闭源模型格局演变 - 开源模型使用量稳步增长,预计到2025年底将达到总用量的约三分之一,与闭源模型形成互补关系而非零和博弈 [5][7] - 中国开源模型成为增长主要引擎,其每周Token使用量占比从2024年底的1.2%最高激增至30%,平均占比为13% [5][9] - 开源模型市场从高度集中转向多元化,2025年上半年DeepSeek V3和R1占开源用量一半以上,但预计到年底没有单一模型能持续占比超25%,市场将由5-7个模型均分 [12] 模型形态与市场偏好变化 - 中型模型(参数在150亿至700亿之间)更受市场青睐,小模型(参数少于150亿)正在失宠,市场分化为强大的中型模型类别或整合到最强大的单个大型模型上 [15] - 开源模型不再被视为闭源“平替”,而是找到了特定场景的首选定位,开发者往往同时使用两类模型 [7] 推理模型与工具调用成为新范式 - 模型正从“语言生成系统”转变为“推理执行系统”,使用推理的Token用量从年初可忽略不计增长至超过50% [5][18] - 在所有推理模型中,xAI的Grok Code Fast 1使用的推理流量份额最大,领先于Gemini 2.5 Pro和Gemini 2.5 Flash [19] - 模型调用工具的功能使用占比上升,从最初集中于GPT-4o-mini和Claude 3.5/3.7系列,发展到更多模型支持,Claude 4.5 Sonnet等新玩家取得显著进展 [24] AI主要应用场景与使用方式演变 - 编程和角色扮演是AI模型的主要使用方式,编程查询用量从年初的11%上涨至最近的超50% [6][33] - 在所有编程模型中,Claude系列长期占据主导地位,大部分时间占比超过60%,但其在2025年11月市场份额首次跌破60% [36] - 在开源模型中,角色扮演使用量占比高达52%,中国开源模型DeepSeek的流量中有超过三分之二用于角色扮演和闲聊 [40] - 用户使用模式变复杂,从“写短文”到“解难题”,平均每次提示词长度增加约4倍,完成任务所需Token用量增加近3倍 [26][27][30] - 模型正变成“自动Agent”,用户给出复杂目标后,模型能自行规划步骤、调用工具并在长对话中保持状态以完成任务 [33] 主要厂商模型的应用侧重 - Anthropic模型80%以上流量用于编程和技术任务 [43] - xAI模型同样专注于编程,其技术应用、角色扮演及学术用途在2025年11月下旬显著增长 [47] - Qwen模型主要发力编程端,角色扮演和科学类任务占比随时间波动 [51] - OpenAI模型的工作重点从娱乐休闲活动逐渐转向编程和技术类任务 [53] 用户留存呈现“水晶鞋效应” - 大部分用户会快速流失,但每一代前沿AI模型发布时,会锁定一小批任务需求与其新能力完美匹配的“天选用户”,形成高粘性 [57] - 典型案例如Claude 4 Sonnet和Gemini 2.5 Pro,发布5个月后用户留存率仍保持40%高水平 [57] - “水晶鞋效应”窗口期很短,基本只在模型刚发布被视为“最前沿”的那段时间,一旦竞品发布抹平能力差距,再吸引新用户将非常困难 [57][60] 区域市场与语言使用变化 - AI不再是硅谷独角戏,亚洲地区付费使用量占比从13%翻倍至31% [61] - 北美仍是最大市场,但份额已不足50% [61] - 英语以82%份额占据绝对主导,简体中文以近5%份额位居第二 [61] 模型定价与使用量的关系 - 模型价格下降对使用量的影响比想象中小,价格下降10%,使用量仅增加0.5%-0.7% [61] - 存在“杰文斯悖论”,当模型变得足够便宜且好用,人们会在更多地方、用更长上下文、更频繁地调用,导致总Token用量飙升,总支出可能并不降低 [61]
国证国际港股晨报-20251009
国证国际· 2025-10-09 13:03
国证视点:市场表现与重大事件 - 港股三大指数集体回调,恒生指数跌0.48%,国企指数跌0.52%,恒生科技指数跌0.55%,大市成交金额回升至1,738亿元,主板总卖空金额升至295亿元,占可卖空股票总成交额比率升至20.82% [2] - 地产股、果链概念股及大消费板块表现低迷,短视频、云办公、云计算、芯片等新经济板块承压,相关个股普遍下跌1%至4% [2] - 核电、电力设备及有色金属板块逆市走强,受国际原子能聚变能大会消息刺激 [3] - 汇丰控股提出私有化恒生银行,私有化作价每股155元,较恒生前收市价溢价约30.3%,恒生银行将保留独立品牌及运营 [3] - 美股标普500指数与纳斯达克综合指数创历史新高,受人工智能需求强劲提振,英伟达CEO确认参与xAI融资 [4] - 美国FOMC 9月会议纪要显示多数官员支持降息25个基点,但通胀前景存在上行风险,市场预期10月底再度降息概率超过90% [4] 行业点评:AI大模型动态与趋势 - 全球大模型调用量维持强劲增长,xAI模型日均调用量2,620亿token位列第一,Alphabet Gemini系列为1,320亿,OpenAI为820亿,中国模型DeepSeek为750亿,阿里Qwen为260亿 [6] - 阿里巴巴发布旗舰模型Qwen3-Max(参数超万亿)及多款升级模型,通义千问系列模型下载量已超6亿,衍生模型规模超17万 [6] - 快手发布可灵2.5 Turbo模型,视频生成可控性提升且定价下调30%,在文生视频和图生视频基准测试中位列第一 [7] - DeepSeek发布DeepSeek-V3.2-Exp模型,引入稀疏注意力机制,并下调API价格,百万tokens输出价格为3元,较前代降85%,展现适配国产算力芯片趋势 [7] - OpenAI发布视频生成模型Sora 2,可模拟现实物理规律并同步生成音效,同时推出AI社交软件Sora,2025年上半年收入43亿美元,较2024年全年高16%,估值约5,000亿美元,较2025年4月提升67% [8] - Anthropic发布Claude Sonnet 4.5模型,在软件编码基准测试中准确率达77.2%,估值达1,830亿美元 [9] - 投资建议关注阿里巴巴(受益于大模型+云计算+自研GPU芯片生态)和快手(受益于可灵AI技术迭代和商业化潜力) [9]
Nvidia砸千亿美元助力OpenAI,马斯克狂飙造全球最大AI集群 | Jinqiu Select
锦秋集· 2025-09-23 12:44
行业核心观点 - AI行业竞争从算法和产品层面进入基础设施和算力的硬核较量阶段 [2] - 模型层顶级玩家通过资本、算力和速度构建了难以撼动的护城河 [3] - 模型智能水平将持续提升,为非模型层创业者创造基于趋势设计业务的机会 [4] Nvidia与OpenAI合作 - Nvidia宣布向OpenAI投入高达1000亿美元的战略投资 [1] - 双方将携手打造至少10吉瓦的数据中心基础设施,用于支撑下一代模型的训练与部署 [1] xAI的算力基础设施布局 - xAI从2025年3月起迅速启动Colossus 2项目,半年内完成约200MW冷却能力和机架安装,速度远超业界平均水平 [5][11] - 为解决孟菲斯本地电力限制,xAI在密西西比州Southaven收购旧电厂并获临时许可运行燃气涡轮机,形成跨州供电方案 [5][14] - 与Solaris Energy Infrastructure合作,通过租赁和合资模式快速部署超过460MW涡轮发电机组,规划总装机规模扩大到1GW以上 [5][19][24] - 通过多层布局和高密度设计,将现有站点容量提升到超过1GW,增强单一相干集群优势 [5][27] xAI的财务状况与融资 - Colossus 2所需资本支出高达数百亿美元,xAI尚未产生有意义的外部收入 [29] - 传闻中的9位数年化经常性收入绝大部分是X.com到xAI的公司间转移 [29] - 正准备新一轮数百亿美元融资,公司估值接近2000亿美元,沙特公共投资基金将扮演重要角色 [31] - 未来两三年仍需持续投入数百亿美元资金,高度依赖外部融资及Elon Musk其他企业内部资金转移 [5] xAI的技术与产品 - Grok 4在技术指标上已达到一线AI实验室水平,但商业收入和企业客户接受程度表现不足 [5] - API产品存在性价比劣势,Grok 4定价与Claude Sonnet 4持平但编码能力稍逊 [5][45] - 发布蒸馏模型Grok Code Fast 1,以更小体积保留Grok 4部分性能,在OpenRouter上需求激增 [45][47] - 采用独特的强化学习路径Ani,通过人类情感与互动环境训练模型,而非仅局限于数字生产力领域 [5][53] xAI的人才与文化 - 从DeepMind、Meta、英伟达等公司成功引进大量顶尖人才,员工超过一千名并持续扩张 [41] - 公司文化以高压和极快工作节奏著称,人员流动性极高,长期组织稳定性面临风险 [5][42] - 前首席财务官加入后不到4个月离职,部分高级研究员也已离开 [42] xAI的市场策略与挑战 - 产品选择与Elon Musk旗下X深度融合的路线,消费者侧取得进展但企业端表现乏力 [5][50] - 在企业方面采用率非常低,部分由于模型幻觉问题及对特定话题的敏感行为 [49] - 与OpenAI、Anthropic等公司专注于代码和自动化应用的策略不同,xAI追求更通用的AGI路径 [52]
xAI 巨像 2 号——全球首个吉瓦级数据中心,独特强化学习方法论及融资计划——半导体分析 --- xAI’s Colossus 2 – First Gigawatt Datacenter In The World, Unique RL Methodology, Capital Raise – SemiAnalysis
2025-09-18 21:09
**纪要涉及的行业或公司** - 公司:xA(埃隆·马斯克旗下人工智能公司)[1][2][5] - 行业:人工智能、数据中心基础设施、云计算、大模型训练与推理[2][5][10] **核心观点与论据** **1 数据中心建设与算力扩张** - xA的Coossus 2数据中心在6个月内实现200兆瓦制冷能力,支持约11万台GB200 NVL72系统运转,建设速度远超行业平均(其他公司需15个月)[18][19] - 通过与Soaris Energy合作,xA在密西西比州南黑文市部署燃气轮机,总发电容量将达1.1吉瓦(2027年Q2前),未来可能扩展至1.5吉瓦[31][34][40] - 数据中心空间规划包括改造现有仓库(100万平方英尺)为双层结构、扩建地块或采用非标准布局,以支持1吉瓦以上算力[46][48] **2 融资与资金需求** - Coossus 2项目需数百亿美元资本开支,xA尚未产生实质性外部收入,主要依赖X.com内部转账[51] - 正筹备新一轮数百亿美元融资,估值近2000亿美元,沙特主权财富基金(PIF)可能主导投资,但估值合理性受质疑(部分投资者认为难以超过Anthropic)[58] - 中东扩张可能性高:沙特、阿联酋、卡塔尔此前已投资xA及X平台,潜在融资规模达60亿美元,或用于在沙特新建数据中心[56][59][62] **3 技术能力与商业模式** - 模型性能:Grok 1.5在某些评测中接近顶尖模型,但编程能力弱于Claude Sonnet 3.5,非编程应用逊于GPT-5[85] - 企业端采用率低:因幻觉问题(如“机械希特勒事件”)及埃隆对模型的干预导致企业禁用[93] - 消费者业务优势:与X平台深度集成,支持实时信息查询和“@Grok”提问功能,用户参与度提升[94][95] - 独特强化学习(RL)方法:通过Ani项目构建多样化RL环境,探索情感智能与共情能力,可能成为AGI突破路径[99][100][101] **4 人才与运营挑战** - 员工超1000人,但文化硬核(如007工作制),导致高管和资深研究员流失(如前CFO任职不足4个月离职)[79][81] - 依赖开源推理框架SG Lang而非自建栈,通过雇佣其维护者持续优化[83][84] **其他重要但易忽略的内容** - 电力基础设施创新:在密西西比州利用退役电厂部署涡轮机,获12个月无许可运营特批,通过特斯拉Megapack储能和中压线路输电[24][28] - 财务风险:训练支出远超推理收入,需依赖X平台广告整合(如将xA技术用于广告引擎)维持现金流[106][109] - 行业竞争:OpenA、Meta、Anthropic均建设千兆瓦级集群,xA需通过超常规速度(如6个月建成)保持算力领先[6][10][13] **数据与单位换算** - 制冷能力:200兆瓦(支持11万台GB200 NVL72)[18] - 涡轮机容量:7台×5兆瓦=35兆瓦(当前运营),总规划1.1吉瓦[31][40] - 资本开支:Soaris合资公司Q2 2025支出1.12亿美元[40] - 历史投资:沙特王国控股持有xA 8亿美元股份(合并前),阿联酋Vy Capital投资7亿美元支持Twitter收购[56] **引用文档索引** - 数据中心建设:[1][2][5][6][10][13][18][19][31][34][40][46][48] - 融资与资金:[51][56][58][59][62] - 技术与商业:[85][93][94][95][99][100][101] - 人才与运营:[79][81][83][84] - 其他细节:[24][28][106][109]
AI产业跟踪:x-AI发布智能编程模型GrokCodeFast1,持续关注模型迭代与商业化进展
长江证券· 2025-09-18 14:36
行业投资评级 - 看好 维持[6] 核心观点 - xAI于2025年8月29日推出智能编程模型Grok Code Fast 1 支持256K上下文 输入定价$0.2/M tokens 输出定价$1.5/M tokens 首周限时免费 可在多个编程平台和IDE中使用[2][4] - 模型专为开发人员日常真实任务设计 以极致性价比与高响应效率打造竞争优势 有望在Coding领域大规模落地[2][9] - 当前Agent投资核心逻辑强化 海内外模型加速迭代 模型能力持续提升 成本进一步下降 Coding等垂直场景Agent落地周期有望提前 看好Agent商业化元年及投资机遇[2][9] 模型性能优势 - SWE-Bench-Verified得分70.8% 接近Claude 4系列性能(Sonnet4得分72.7% Opus4得分72.5%)处于第一梯队[9] - 高速响应高吞吐率:网络实测思考时长基本在几秒内 指令缓存命中率超90% 输出效率196 TPS 遥遥领先Gemini-2.5 Pro(92TPS) Qwen3-Coder(80TPS) Claude Sonnet 4(79TPS) GPT-5(50TPS)[9] - 通用性强强调工具调用能力:256K上下文支持多种编程语言 从创建项目到debug仅需极少人工监督 最大请求token数480/min 每分钟可处理约200万tokens[9] - 极致性价比:输出定价$1.5/M tokens 远低于Gemini-2.5 Pro($10) GPT-5($10) Claude-Sonnet 4($15) Grok-4($15) 略高于Qwen3-Coder($0.8)[9] 技术架构特点 - 采用全新架构 预训练使用专门代码语料库 利用真实世界拉取请求与编码任务的高质量数据集进行微调 通过多项创新技术显著提升响应速度[9] - 与发布合作平台密切合作 基于真实短链路快速反馈不断完善优化模型 熟练掌握常用工具调用 用户读完AI思考轨迹第一段前模型已调用数十种工具[9] - 适用于多步骤工具调用密集的复杂自动化任务 是兼具速度和效率的AI代码助手 具备Agentic能力 有望进一步加速渗透[9] 商业化前景 - 低延迟高实时模型能力突破有望加速专业工作流Agent落地 模型以兼具速度和性价比为核心亮点 转向深耕反馈链路短高价值编程场景 不断完善产品分层和场景细分 商业化闭环有望加速[9] - 模型高速度和低成本为实现高频复杂AI Agent工作流打下基础 拓宽工业级别场景落地 有望变革未来软件开发范式[9] - Grok Code Fast 1在OpenRouter等平台反响热烈 未来团队将专注于持续更新 支持多模态输入并行工具调用和扩展上下文长度的新变体已在训练中[9] 投资建议关注领域 - AI Agent相关厂商[9] - 中国推理算力产业链[9] - CSP厂商关注推理需求推动[9] - IDC:与阿里等大厂合作的IDC[9]