智谱GLM
搜索文档
Cursor“自研”模型套壳国产开源?网友:毕竟好用又便宜
量子位· 2025-11-02 12:23
事件概述 - 美国顶流AI编程应用Cursor和Windsurf发布的新模型,被网友发现其背后基础模型可能为中国公司智谱的GLM以及深度求索的DeepSeek [1][3][6] - 事件引发广泛关注,网友评论认为中国大模型技术已经达到领先水平 [2][19][20] Cursor新模型细节 - Cursor发布其首个编程智能体模型Composer-1,专为低延迟代理式编码打造,多数任务能在30秒内完成 [8][9] - 模型被发现会推理过程中使用中文,且与DeepSeek使用相同的分词器 [4][15] Windsurf新模型细节 - Windsurf新模型SWE-1.5与芯片厂商Cerebras合作,速度达每秒950个token,是Claude Haiku 4.5的6倍,Sonnet 4.5的13倍 [11] - 模型被直接套话自曝为由智谱开发的GLM [17] 中国开源模型行业地位 - 中国开源模型在各种开源性能榜单上占据TOP5甚至TOP10,下载量表现突出,如Qwen3是HuggingFace上最高下载量模型之一 [21] - 中国开源模型具备物美价廉的特点,成为全球初创公司的理性选择 [24][26][30] - 对于初创公司,从零开始训练模型需花费数百万至数千万美元,不符合商业逻辑 [29]
从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
硬AI· 2025-09-01 01:14
行业发展趋势 - AI行业从单纯追求模型能力转向追求计算效率 混合推理成为行业共识 [2][3][5] - 随着推理模式复杂化 完成任务所需token数量暴涨 导致实际成本不降反升 [2][8] - 顶尖模型厂商包括OpenAI DeepSeek Anthropic Google及国内阿里 快手 字节 智谱等均在探索混合推理方案 [13][14] 成本压力分析 - 虽然单个token价格下降 但复杂任务消耗token数量呈指数级增长 代码编写或法律分析需消耗数十万至百万token [8][9] - 最强模型价格保持稳定 99%需求转向SOTA模型 导致应用层公司利润率下降 Notion利润率下降约10个百分点 [7][10] - AI模型竞赛演变为成本竞赛 Theo Browne表示争夺最智能模型已成为争夺最昂贵模型的竞赛 [10] 技术解决方案 - 美团开源龙猫模型采用零计算专家机制 智能识别非关键内容直接返回 实现显著算力节省 [4] - OpenAI GPT-5采用路由器机制 根据问题复杂度自动选择模型 思考模式比前代少50-80%输出token [13] - DeepSeek V3.1推出单模型双模式架构 思考模式消耗减少25-50% token 保持相同答案质量 [13][14] 创新架构特点 - 混合推理模式让AI系统根据问题复杂度自动配置计算资源 避免简单任务浪费算力 [5][12] - 系统通过用户行为偏好反馈和正确率等真实信号持续训练路由机制 实现自我改进 [13] - 下一代混合推理将实现自我调节 让AI自主评估任务难度并以最低计算代价启动深度思考 [14]
从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
华尔街见闻· 2025-08-31 10:26
行业发展趋势 - AI行业的发展重点正从追求更高性能转向更聪明和更经济 通过混合推理和自适应计算实现算力节省 [1] - 混合推理模式成为行业共识 各大模型厂商采用不同路径但目标一致 让模型根据问题复杂度自动选择合适的计算资源配置 [1][3] - 顶尖玩家包括Anthropic的Claude系列 Google的Gemini系列 以及国内的阿里Qwen 快手KwaiCoder 字节豆包和智谱GLM等都在探索混合推理方案 [4] 技术突破与创新 - 美团开源的龙猫大模型(LongCat-Flash)采用创新的零计算专家机制 智能识别输入内容中的非关键部分 如常见词语和标点符号 交由特殊专家处理直接返回输入 实现惊人算力节省 [1] - OpenAI的GPT-5采用路由器机制 根据问题复杂程度自动选择合适模型处理 简单问题交给轻量级模型 复杂任务调用高算力模型 [3] - DeepSeek的V3.1版本推出单模型双模式架构 将对话和推理能力合并到单一模型中 开发者和用户可通过特定标记或按钮在思考与非思考模式间切换 [4] 成本与效率挑战 - AI应用成本快速上升 尽管单个token价格在下降 但完成复杂任务所需的token数量以前所未有的速度增长 复杂代码编写或法律文件分析任务可能消耗数十万甚至上百万个token [2] - 成本压力已传导至应用层公司 生产力软件公司Notion的利润率因此下降约10个百分点 AI编程辅助工具初创公司如Cursor和Replit不得不调整定价策略 [2] - 人类认知贪婪导致99%的需求转向SOTA模型 而最强模型价格始终差不多 形成最智能模型竞赛演变成最昂贵模型竞赛的局面 [2] 性能与成本平衡 - OpenAI内部评测显示GPT-5使用思考模式能以比前代模型少50-80%的输出token完成任务 达到相同或更好效果 [4] - DeepSeek思考模式在消耗减少25-50% token的情况下 达到与前代模型相当的答案质量 为企业提供高性价比开源选择 [4] - 混合推理的下一个前沿将是更智能的自我调节 让AI模型精准自我评估任务难度 在无人干预情况下以最低计算代价在最恰当时机启动深度思考 [4]
最新AI眼镜格局报告:百镜大战拉开序幕,阿里DeepSeek高通成幕后赢家
量子位· 2025-06-05 18:28
核心观点 - AI眼镜市场正处于快速成长期,产品从科技发烧友向大众用户扩展,但现货交付产品仍较少[1] - 大模型技术推动AI眼镜功能升级,使其具备语音交互、图像识别等能力[3] - 行业已进入"百镜大战"阶段,国内外十余款产品上市,更多产品即将发布[5] - 产品竞争力取决于设计、硬件、软件、模型和内容生态五大要素[19] 市场现状 - 当前AI眼镜主要作为手机功能补充,未来可能发展为集耳机、相机、显示设备于一体的智能穿戴方案[17] - 线上销量过万的产品包括AI音频眼镜、AI拍摄眼镜和AI+AR眼镜,其中拍摄类产品出货量领先[14][15] - 雷鸟创新与Rokid在XR公司中表现突出,具备多方面领先实力[32] 技术要素 - 主流底层大模型包括通义千问、DeepSeek、文心大模型等,增强语义理解和多模态交互能力[6] - 高通骁龙AR1芯片因成熟度高、AI算力强,被半数厂商采用[8][10] - 基础功能集中在AI语音交互与翻译,不同类型产品分化出不同升级功能[12] 产品趋势 - AI拍摄眼镜量产成熟,迭代重点在设计和续航[23] - AI+AR眼镜量产就绪,迭代关键在重量和软件[25] - 产品发展分为三个阶段:工具型(2024-2025)→服务型(2026-2027)→陪伴型(2028+)[22] 竞争格局 - 市场玩家分为互联网公司、手机公司、XR公司、其他硬件公司和创业公司五类[27] - 不同类型玩家基于原有业务积累,在五大竞争力要素上各具优势[29] - XR公司占据已发售产品半数以上,在市场中地位重要[31]