Workflow
智能体(Agentic AI)
icon
搜索文档
终于发布的GPT-5,和它改变世界的982天
36氪· 2025-08-08 08:07
模型发布与性能 - GPT-5采用多层级架构整合o3系列推理能力 重点提升智能体能力 未公布具体参数规模 [9] - 上线后迅速屠榜LMArena竞技场 所有细分类目均位列第一 [10][12] - 提供四个版本:标准版GPT-5 轻量版GPT-5 mini 高速版GPT-5 nano 以及ChatGPT专用版GPT-5 Chat [18] - 系统由三部分组成:基础模型 深度推理模型GPT-5 thinking 实时路由器real-time router [20] 技术架构创新 - 统一模型架构整合GPT系列语言模型与o系列推理模型 具备调度子模型能力 [19] - 开源两款MoE模型gpt-oss-20b(21B参数)和gpt-oss-120b(117B参数) 采用Apache 2.0许可协议 [52][53] - 开源模型专门为智能体设计 120B版本可在高端笔记本运行 20B版本适配手机端 [54] - 词表超过20万 支持多语种与代码混合输入 直接对标DeepSeek与阿里Qwen3 [54] 商业化策略 - API价格显著降低 GPT-5输入1.25美元/M Tokens 仅为o1-pro价格的1/120 [24][25] - 美国联邦政府机构可1美元订阅企业版 同时GitHub Copilot提供免费预览版 [31] - 年化收入达120亿美元 70%来自C端订阅 20%来自API调用 [84][85] - 微软Azure AI与Copilot带动云收入同比增39% Meta广告转化率提升5个百分点 [90][91] 行业竞争格局 - 7月中国开源模型占据OpenRouter趋势榜前10名中的9席 [6] - 开源闭源差距缩小 阿里Qwen3 月之暗面K2等中国模型引发硅谷关注 [95][99] - Anthropic创始人公开质疑开源AI价值 Meta考虑将旗舰模型Behemoth转向闭源 [100] - 全球AI数据中心投入预计达3万亿美元 半数用于GPU等加速芯片 [74] 用户与市场表现 - ChatGPT周活跃用户达7亿 占全球人口近10% 去年同期的4倍 [76][77] - 成为最快达到10亿下载量与5亿月活的应用 周末使用频率趋近工作日 [80][81] - 推出人格模式包含四种输出风格 语音多模态能力显著提升教育医疗场景体验 [39][46] - 现场演示生成带关卡音效的小游戏仅需几分钟 代码量达一两百行 [36][38]
杨植麟摸着DeepSeek过河
36氪· 2025-07-19 12:30
模型性能与技术突破 - Kimi K2是一款万亿参数MoE模型,包含1T总参数和32B激活参数,推出Kimi-Base和Kimi-instruct两个版本[1] - 在编程、智能体任务上表现突出,测评显示其自主编程、工具调用和数学推理能力超越开源模型DeepSeek-V3和阿里Qwen3[1] - 采用新型优化器Muon替代AdamW,算力需求降低至52%,实现万亿参数规模训练突破[13] 市场反响与开发者生态 - 开源一周Hugging Face下载量超10万,LMSYS竞技场排名第四,OpenRouter趋势榜全球第二[1][4] - API定价显著低于竞品,输入/输出tokens成本较Claude 4 Sonnet下降75%,推动AI编程普及[10] - 社区运营策略创新,通过工程师直接互动引发"自来水"传播,获Hugging Face联合创始人公开赞赏[4][17] 战略定位与行业影响 - 明确聚焦Agentic AI赛道,优化工具调用速度和任务完成质量,支持PPT/Excel/3D建模等场景[7][8] - 被《Nature》评价为"又一个DeepSeek时刻",验证其技术路线影响力[6] - 国内大模型初创分化明显,公司选择类似Anthropic的技术路径,与Minimax多模态、智谱ToB路线形成差异[16] 产品商业化表现 - Web端访问量6月环比增长30%,显示技术突破对产品反哺效应[20] - Cursor等AI编程公司ARR两个月增长60%至5亿美元,显示赛道爆发潜力[10] - 放弃C端投流转向模型研发,反映行业从用户增长向技术突破的范式转变[15][16] 技术应用案例 - 可快速生成3D场景(如昼夜变化山脉)和专业数据分析报告(含箱线图、回归模型等)[9] - 支持接入Owl/Cline等框架实现自主编程,处理13万行数据生成可视化分析[8][9]