AI编程模型 - 财报，业绩电话会，研报，新闻

AI编程模型

搜索文档

智谱暴涨超20%！本周累计涨幅近140%，GLM Coding Plan官宣涨价30%+，连续包月、包季、包年套餐全部售罄

搜狐财经· 2026-02-13 10:36

股价与市场表现 - 公司股价早盘一度上涨超过20%，截至发稿时上涨18.16%，报475港元 [1] - 本周累计涨幅已接近140%，成交额达8.63亿港元，总市值为2118亿港元 [1] 核心产品发布与市场反响 - 公司于2月12日正式上线并开源其新一代旗舰模型GLM-5，该模型即此前在全球模型服务平台OpenRouter登顶热度榜首的神秘模型"Pony Alpha" [1] - 公司同日发布GLM Coding Plan价格调整函，因市场需求增长、用户规模与调用量提升，公司加大算力与模型优化投入，决定对套餐价格体系进行结构性调整 [1] - 价格调整包括取消首购优惠，保留按季按年订阅优惠，套餐价格整体涨幅自30%起，已订阅用户价格保持不变 [1] - GLM Coding Plan上线即售罄，国产AI编程模型的付费套餐被抢空，在行业中较为罕见 [1] 资本市场进展 - 继H股上市后，公司继续推进其A股上市计划 [2] - 公司撤回了其于2025年4月提交的辅导备案，并办理了新的辅导备案登记 [2] - 公司IPO辅导机构由原来的中金公司变更为国泰海通证券和中金公司两家 [2] - 新的辅导备案报告披露，公司拟冲刺上交所科创板 [2]

不怕Claude断供，豆包编程模型来了，5分钟造“我的世界”翻版，花费2毛钱

36氪· 2025-11-11 17:25

产品发布与定位 - 字节跳动旗下火山引擎发布豆包大模型家族首款编程模型Doubao-Seed-Code，该模型专门为Agentic Coding任务优化并在性价比上实现突破[1] - 模型在业内多个主流编程测评集中得分超过DeepSeek-V3.1、Kimi-K2、GLM-4.6等国产模型，整体表现仅次于顶级模型Claude Sonnet 4.5[1] - 该模型是国内首个支持视觉理解能力的编程模型，可参照UI设计稿、截图或手绘草图生成代码，或对生成页面进行视觉比对以完成样式和Bug修复[3] 性能与技术规格 - Doubao-Seed-Code拥有原生256K上下文，高于Claude Sonnet 4.5的200K上下文[1] - 模型与字节跳动AI原生IDE产品Trae中国版结合，在权威编程基准测试SWE-Bench-Verified中登顶SOTA，解决率达到78.80%[3][4] - 模型采用大规模Agent强化学习训练系统，使用覆盖10万容器镜像的数据集，并具备万级并发沙盒session能力和千卡GPU集群支持超大规模并行训练[27] 定价策略与成本优势 - 模型采用分层定价，在0-32K输入区间上输入价格为1.20元/百万Tokens，输出价格8.00元/百万Tokens[4] - 使用全量透明缓存后模型使用成本可降低80%，综合使用成本降低62.7%[4] - 实测复刻经典游戏《我的世界》成本不到2毛钱，相同tokens量下Claude Sonnet 4.5完成任务的成本超过3元[6] 功能特性与实测表现 - 模型原生兼容Anthropic API，可无缝接入Claude Code，降低开发者学习成本[7] - 在真实编程场景中能自主规划开发计划、快速搭建前端网页、深入数据库修改，并具备错误主动修复、补充注释和优化结构的能力[6][16] - 模型展现复杂代码修复能力，采取分步骤增量式修改策略，每次修改后立即验证，并能理解程序逻辑和业务需求以改进异常处理和输入验证[19][21] 生态整合与市场机遇 - 火山引擎同步发布Coding Plan，Lite套餐首购首月价格9.9元，Pro套餐首购首月价格49.9元，支持在Claude Code、veCLI、Cursor等主流智能编程环境中使用[31][32] - 国产编程模型的崛起正填补因海外AI编程模型断供风险带来的空白，为开发者提供稳定可控的替代方案[33]

超越GPT4.1，阿里开源AI编程模型Qwen3-Coder

快讯· 2025-07-23 08:29

阿里开源通义千问AI编程大模型Qwen3-Coder - 公司推出全新通义千问AI编程大模型Qwen3-Coder，该模型属于开源阵营 [1] - Qwen3-Coder在编程能力方面取得重大突破，代码能力及Agent调用能力显著提升 [1] - 该模型编程能力超越GPT4.1等闭源模型，与全球最强的编程模型Claude4相当 [1] Qwen3-Coder的性能表现 - 使用Qwen3-Coder可使初级程序员一天完成资深程序员一周的工作量 [1] - 生成一个品牌官网的最快时间缩短至5分钟 [1] - 该模型在编程能力方面登顶全球开源模型阵营 [1]

四大顶尖模型对决！6000 字测评带你看Deepseek R1有多强

歸藏的AI工具箱· 2025-05-29 22:54

DeepSeek-R1 0528模型性能表现 - 在LiveCodeBench上表现接近OpenAI的o3(high)水平在Aider多语言基准测试中与Claude Opus相当[1] - 前端开发能力测试中稍逊于Opus4 但全面超越Sonnet4和Gemini 2.5 Pro 部分任务完成度甚至超过Opus4[3] - 价格仅为竞品的1/30 性价比优势显著[51] 技术能力测试结果仓库管理系统 - 唯一完整实现商品管理/库存管理/看板三页面架构包含假数据生成功能其他模型均出现功能缺失或报错[11] - 采用专业SaaS平台侧边栏设计竞品界面简陋且存在保存失败等基础功能缺陷[11] 点阵动画编辑器 - 完美实现P5.js全屏互动点阵支持5种动画模式和5种点形状夜间模式切换正常[17] - 竞品普遍存在点阵不动/缺失等严重问题 Opus4夜间模式配色异常[17] 图片渐变色提取工具 - 美学设计最佳添加SEO优化内容和应用场景介绍但未实现核心取色功能[20] - Claude系列完成基础功能但界面简陋 Gemini完全报错[19][21] 白噪音日签网站 - 美学表现仅次于Opus4 存在音乐按钮扁平化/名言遮罩过度等问题[27] - Opus4在字体排版/动效细节上表现最优 Gemini加入图片切换动效[27][28] 睡眠监测APP - 单页面完成度最高实现响应式导航设计卡片和图标处理专业[34] - 仅Opus4完成多页面架构但移动端图标尺寸过小 Gemini生成四个无法交互的页面[34] 复杂俄罗斯方块 - 完整实现主题切换功能但遗漏特殊方块设计界面组件标准化程度高[48] - Claude系列完成特殊方块逻辑但缺少主题切换 Gemini存在落点判定Bug[48][49] 行业影响 - 开源模型性能突破30倍价格差距显著降低AI应用门槛[51] - 在多模态任务中展现差异化优势前端开发/创意设计领域潜力突出[3][17] - 持续迭代能力值得期待 R2版本可能带来更大技术跃升[4]