Grok 4.1 Fast
搜索文档
IT员工抄公司量化代码赚8千万,被罚1.7亿;传毫末智行停工解散、赔偿不明;实习生抽中显卡被公司要求上交?回应来了 | AI周报
AI前线· 2025-11-23 13:33
IT员工窃取量化代码受罚 - 杭州某科技公司IT员工林艺平利用职务便利窃取公司量化交易代码 通过他人证券账户进行趋同交易 在2022年11月16日至2023年9月6日期间获利8857.69万元[3][4] - 浙江证监局对林艺平作出行政处罚 没收违法所得8857.69万元并处以等额罚款 合计罚没1.7715亿元 同时采取5年证券市场禁入措施[5] 自动驾驶公司运营动态 - 长城汽车旗下自动驾驶公司毫末智行被传已于11月22日通知员工停工解散 赔偿机制等后续安排尚未明确[6] - 毫末智行业务面临挑战 随着长城汽车向元戎启行等供应商倾斜 公司处境艰难 2025年曾出现技术副总裁艾锐等核心高管离职的人事动荡[7] 人工智能行业人才流动 - 字节跳动Seed大语言模型团队核心成员乔思远离职加入Meta 视觉模型研究团队核心成员蒋路和田值于今年中离职 蒋路加入苹果 今年该团队已有七位研究骨干离职[11] - TikTok主站视频推荐算法负责人宋洋离职加入Meta 将全面负责Instagram Reels推荐业务 据传Meta创始人扎克伯格亲自邀请并开出数千万美元年薪[14][15] 人工智能初创企业融资与技术进展 - 前百度副总裁景鲲创立的AI公司Genspark完成2.75亿美元B轮融资 融资后估值达12.5亿美元 跻身独角兽行列 同时发布全新平台Genspark AI Workspace[12] - Genspark创始团队背景豪华 CEO景鲲为前百度集团副总裁 CTO朱凯华曾在谷歌开创AI驱动搜索排序技术 COO桑文为MIT博士[13] AI硬件公司运营状况 - Rabbit公司被曝已连续数月拖欠员工工资 部分员工从10月起罢工 但公司仍声称计划在2026年推出下一代AI硬件[16] - Rabbit R1设备实际表现被用户指出远逊于发布会效果 例如实景拍摄需等待20秒才回应 被指如同低端安卓手机安装APK文件[16] 互联网公司AI产品发布与市场反应 - 阿里巴巴AI应用"千问"公测首日因用户涌入过载出现服务拥堵 "阿里巴巴千问崩了"话题登上微博热搜 公司回应称状态良好并计划推出国际版[20] - 蚂蚁集团全模态通用AI助手"灵光"上线两天下载量突破50万 冲上App Store总榜第七 但其闪应用功能因流量过大暂时无法使用[21][22] 人形机器人领域技术争议 - 优必选发布人形机器人Walker S2量产交付视频后 遭Figure创始人布雷特·阿德科克质疑视频造假 称机器人方阵为电脑特效[23] - 优必选回应质疑并发布一镜到底原速视频 公司CBO谭旻表示质疑源于对中国智能制造实力缺乏了解 并称公司公布的所有订单均向公众负责[24] 人工智能大模型技术突破 - 谷歌上线Gemini 3 Pro Image Preview图像模型 支持4K分辨率输出 在MathArena基准测试中达到23.4%正确率 远超其他模型1%左右水平[29][30] - OpenAI推出GPT-5.1-Codex-Max编程模型 专为长时间运行任务设计 采用压缩技术可处理百万级别Token 在SWE-Bench Verified任务中思考Token减少30%[32][33] AI智能体与专用工具发展 - 马斯克xAI公司推出Grok 4.1 Fast模型和Agent Tools API Grok 4.1 Fast拥有200万token上下文窗口 在智能体调用测评中以93.3%得分位居榜首[34][35] - 非营利研究机构FutureHouse发布AI科研系统Kosmos 单次12小时运行可阅读1500篇论文并生成4.2万行分析代码 工作量相当于人类团队半年产出[36] AI在教育与健康领域应用 - 斑马口语正式上线 号称全球首个AI外教一对一产品 基于猿力大模型打造 具备超人类教学能力 能实现低延迟实时对话和精准发音纠错[37] - Lumia公司推出智能耳环Lumia 2 重量不足1克 满电续航8天 可高精度追踪睡眠、体温、月经周期等健康数据 号称"全球最小可穿戴设备"[41] 企业AI应用与开源项目 - 微博发布自研开源大模型VibeThinker 拥有15亿参数 单次训练成本仅7800美元 在国际数学竞赛基准测试上击败DeepSeek R1模型[39] - OceanBase发布并开源首款AI数据库seekdb 开发者仅需三行代码即可构建知识库等AI应用 支持百亿级多模数据检索[40]
低成本叫板GPT-5.1!马斯克杀入智能体
搜狐财经· 2025-11-22 10:41
编辑 | 心缘 智东西11月20日报道,今日,马斯克的xAI公司推出xAI API的两大更新:快速、低成本、以智能体为中心的新模型Grok 4.1 Fast和智能体工具xAI Agent Tools API。 Grok 4.1 Fast是其迄今为止性能最佳的工具调用模型,拥有支持200万token上下文的窗口,它能够准确快速地进行推理并完成智能体任务,尤其擅长处理客 户支持和财务等复杂的实际应用场景。 ▲基于Grok 4.1 Fast搭建支持用户改预定的应用(图源:xAI) 该模型在人工智能分析智能指数(AII)中跃升4位,达到第六位,仅次于第五位的Grok 4。其中,其在智能体调用测评²-Bench Telecom排行榜上以93.3%的 得分位居榜首,以更低成本超越了GPT-5.1(high)、Gemini 3 Pro等模型的性能表现,比Grok 4 Fast提高了27分。xAI还提到,Grok 4.1 Fast在事实性方面更 准确,幻觉率比Grok 4 Fast降低了一半。 ▲AII指数情况(图源:Artificial Analysis) 智东西 作者 | 李水青 Agent Tools API使智能体能 ...
低成本叫板GPT-5.1,马斯克杀入智能体
36氪· 2025-11-20 16:56
产品发布与核心特性 - xAI公司推出新模型Grok 4.1 Fast及智能体工具xAI Agent Tools API两大更新[2] - Grok 4.1 Fast是公司迄今性能最佳的工具调用模型,支持200万token上下文窗口,擅长处理客户支持和财务等复杂应用场景[2] - 该模型在人工智能分析智能指数中跃升4位至第六位,在智能体调用测评Telecom排行榜以93.3%得分位居榜首,超越GPT-5.1等模型[3] - Grok 4.1 Fast幻觉率比Grok 4 Fast降低一半,事实性更准确[3] 性能表现与基准测试 - 在τ²-bench Telecom测试中,Grok 4.1 Fast以更低成本超越GPT-5.1、Gemini 3 Pro、Claude 4.5 Sonnet等模型性能[9] - 通过长时域强化学习训练,模型在长达200万token的上下文窗口中保持稳定性能[13] - 实测显示,Grok 4.1 Fast在实时信息检索效果上比Grok 4 Fast明显提升,但在经典编程案例上表现不如前代版本[7][14][17][19][21] - 在X Browse内部基准测试中,Grok 4.1 Fast得分56.3,平均成本0.091美元,优于GPT-5和Claude Sonnet 4.5[33] 工具功能与集成 - Agent Tools API使智能体能访问实时X数据、网络搜索、远程代码执行等功能[6] - 结合使用Grok 4.1 Fast和Agent Tools API,开发人员可构建生产级智能体,用于工具调用和智能体搜索[7] - API主要功能包括搜索工具、文件搜索、代码执行和MCP工具连接,所有工具运行在xAI基础架构上,简化开发流程[28][31] 定价策略与市场推广 - Grok 4.1 Fast输入定价为0.2美元/百万tokens,缓存输入0.05美元/百万tokens,输出价格0.5美元/百万tokens[8] - Agent Tools API调用价格5美元起/1000次成功调用,在12月3日前用户可免费体验以上服务[8][34] - xAI与OpenRouter合作,免费提供Grok 4.1 Fast,公司将在API上发布推理和非推理两个模型变体[34]
反超Gemini 3,马斯克放出Grok4.1快速推理版,还曝出了新一轮150亿美元融资
36氪· 2025-11-20 15:09
融资与估值动态 - xAI正计划进行新一轮150亿美元(约1067亿人民币)融资,公司估值或将达到2300亿美元(约1.6万亿人民币)[1] - 若融资属实,xAI估值在不到一年内从500亿美元增长至2000多亿美元,增幅超过四倍[12] - 与2025年3月xAI与X合并后的1130亿美元估值相比,传闻中的2300亿美元估值翻了一倍不止[3] 公司发展历程 - 马斯克于2023年7月正式官宣创立xAI,最初定位为公益性公司,并于2024年5月放弃该身份[9] - 2023年12月,xAI通过首轮大规模外部融资筹集约1.347亿美元[10] - 2024年,xAI完成B轮融资约60亿美元,半年后又完成60亿美元C轮融资,投后估值达500亿美元[10] - 2025年3月,xAI以全股票交易方式收购X,合并后公司估值达1130亿美元[10] - 2025年7月,xAI被曝进行50亿美元债务融资和50亿美元股权融资,其中SpaceX投资20亿美元[12] 产品与市场表现 - xAI核心产品为搭载自家模型的Grok聊天机器人,以及AI驱动的在线百科全书Grokipedia[10] - Grok产品深度捆绑在X生态内,其用户规模和商业影响力与OpenAI不在一个量级[5] - 作为对比,OpenAI旗下ChatGPT每月订阅费收入超过2亿美元[5] - Grok 4.1模型在发布后的人类盲选竞技场中败给了谷歌Gemini 3[9][15] 行业趋势 - 大模型公司正经历新一轮估值飞涨,xAI的竞争对手OpenAI在2025年10月的一次特殊交易中估值被推高至5000亿美元,较同年3月的3000亿美元增长近67%[13]
狙击Gemini 3!OpenAI发布GPT-5.1-Codex-Max
量子位· 2025-11-20 15:01
文章核心观点 - OpenAI发布GPT-5.1-Codex-Max新模型,在AI编程领域实现多项技术突破,包括突破上下文窗口限制、提升任务处理效率和延长连续工作时间,以应对来自Gemini 3等竞争对手的压力 [1][2][9][34] 模型性能提升 - 新模型在METR指标上达到新SOTA,有50%的概率能完成一项原本需要人类2小时42分钟完成的软件工程任务,比GPT-5对标的时间多出25分钟 [11][12] - 在SWE-bench Verified测试中,相同medium推理力度下,新模型性能优于GPT-5.1-Codex,且思考token使用量减少30% [18] - 针对非延迟敏感任务推出xhigh推理力度选项,通过更长的思考时间以获得更优答案 [20] 超长上下文处理能力 - 模型原生支持压缩功能,在接近上下文窗口限制时可自动压缩对话以获得新窗口,从而突破限制实现跨窗口连贯工作 [22][23] - 在内部评估中,模型能一次独立运行超过24小时,连贯处理数百万token的任务 [25] - 该能力使其能直接处理书籍、长文档分析等超长篇幅任务,避免信息割裂,并支撑高负载、长周期的持续工作 [26][27][28] 实际应用与部署 - 新模型在PR创建、代码审查等实际软件工程任务中训练,推理更快更有效,并且是OpenAI首个支持Windows环境的模型 [16] - 目前已在Codex中支持与CLI、IDE扩展、云端和代码审查工具结合使用,API接口即将上线 [30] 行业竞争格局 - 行业内在AI编程赛道竞争激烈,Claude Code在速度上具有优势,但Claude与Codex的组合可能更具竞争力 [31][32][33] - 同期多家公司发布新模型,包括Gemini 3和Grok 4.1 Fast,显示出行业快速迭代的趋势 [34] 其他产品发布 - OpenAI同时低调发布GPT-5.1 Pro版本,第三方测评显示其在指令遵循方面有更好表现 [36][37][38]