神秘模型「Pony Alpha」火了,被曝是GLM-5
36氪·2026-02-09 15:02

神秘模型“Pony Alpha”上线与性能表现 - OpenRouter于2月6日悄然上线了一款名为“Pony Alpha”的免费隐身模型,引发社区广泛猜测其真实身份[1][6] - 该模型主打编码、推理和角色扮演能力,针对智能体工作流进行了优化,并具有很高的工具调用准确率[5][7] - 模型支持200K上下文长度,最大输出为131K,实测中仅靠单一提示词即可完成复杂任务,前端能力惊艳[6][7] 模型性能基准测试对比 - 在OpenRouter的基准测试中,Pony Alpha与Claude Opus系列模型表现最为接近,例如与Claude Opus 4.5 (no reasoning)的Closeness为6.223,Mean Difference为3.777[2] - 相比其他主流模型,Pony Alpha显示出显著优势,其与GPT-5 Pro的Closeness为3.365,Mean Difference为6.635,与Llama 4 Maverick的Closeness为3.132,Mean Difference为6.868[2] - 测试覆盖了包括Gemini、Mistral、DeepSeek、GLM、Qwen、Kimi在内的26款主流模型,进行了392至393对比较[2] 实际应用案例展示 - 有网友使用Pony Alpha构建了一个包含超过35个电台的全球收音机直播网站,该应用包含超过500行代码并在单个文件中实现[8] - 模型生成了功能完整、UI时尚的音乐播放器前端,包含“为你推荐”、查找、收藏夹、播放列表等模块[8] - 在3D内容生成方面,有网友在3小时内制作了一款可在浏览器运行的、类似《精灵宝可梦·红宝石》的3D游戏,并具备动画效果[10] - 模型还能生成如法拉利3D模型、复杂的SVG图形以及设计精美的workflow生成平台前端页面[9][13][14] 模型真实身份猜测与证据 - 多数网友基于即将到来的马年春节,猜测Pony Alpha很可能是一款中国模型[5][19] - 在众多猜测中,GLM-5成为呼声最高的选项,原因包括:模型在特定设置下回答“I‘m GLM”;PoC令牌测试显示其与GLM-4使用同一套分词器;生成的前端代码风格带有中国模型味道但更加干净精致[19][20][21] - 时间点与智谱AI在2月初官宣“计划在未来两周内发布新模型”的消息吻合,同时MiniMax、DeepSeek等国产大模型也计划在春节前后发布新版本[23] - 合作方Kilo Code暗示该模型来自“某个全球实验室最受欢迎的开源模型的专项进化版”[16]

神秘模型「Pony Alpha」火了,被曝是GLM-5 - Reportify