开源大模型
搜索文档
特朗普及其国安团队开会讨论伊朗新提案;英伟达涨4%创历史新高;以“与伊朗有联系”为由,美国宣布制裁中国炼油企业,中方回应丨每经早参
每日经济新闻· 2026-04-28 07:52
隔夜市场表现 - 美股三大指数涨跌不一,道指跌0.13%,纳指涨0.2%,标普500指数涨0.12%,纳指与标普500指数再创收盘新高 [1][3] - 热门科技股多数收涨,英伟达涨4%创新高,谷歌涨超1%,苹果、亚马逊、博通跌超1% [1][3] - 存储与锂矿概念股涨幅居前,Lithium Americas涨超13%,闪迪涨超8%,美国雅保涨近6%,美光科技涨超5% [3] - 半导体设备与材料、贵金属板块走低,康特科技跌近6%,AMD跌超3%,皇家黄金、科尔黛伦矿业跌超2% [3] - 纳斯达克金龙中国指数收跌1.20%至6868.78点,热门中概股多数下跌,爱奇艺跌超5%,阿里巴巴、哔哩哔哩跌超2% [3] - 美元指数跌0.07%至98.461点,离岸人民币兑美元报6.8262元,较上周五涨84点 [3] - 现货黄金跌0.62%至4680.23美元/盎司,COMEX黄金期货8月合约跌0.99%至4729.20美元/盎司 [4] - WTI 6月原油期货收涨1.97美元(涨幅2.09%)至96.37美元/桶,布伦特6月原油期货收涨2.90美元(涨幅2.75%)至108.23美元/桶 [5] - 欧洲主要股指多数下跌,德国DAX 30指数跌0.19%,法国CAC 40指数跌0.19%,英国富时100指数跌0.56% [5] 主权信用与政策法规 - 财政部表示赞赏穆迪维持中国主权信用评级并将展望上调至“稳定”,认为这体现了对中国宏观经济韧性及高质量发展新动能的认可 [5] - 《企业国有资产法》修订草案提请审议,草案修改71条、新增32条,共九章109条,主要修改内容包括完善中国特色现代企业制度、健全国有资本收益管理制度等 [6] - 《农业法》修订草案提请审议,旨在巩固农业基础地位,推动农业高质量发展,加快建设农业强国 [6] - 国家发展改革委对外资收购Manus项目依法作出禁止投资决定,要求当事人撤销该收购交易 [9] 中美外交与企业动态 - 美国白宫证实总统特朗普及其国家安全团队开会讨论伊朗提出的谈判新方案 [1][8] - 外交部回应美方以“与伊朗有联系”为由制裁一家中国民营炼油企业,表示反对非法单边制裁,敦促美方停止错误做法,并将坚决维护中国企业权益 [1][6] - 伊朗外交部称美方扣押伊朗油轮是“海盗行为”合法化,伊朗外长表示美方请求谈判,伊方正在考虑 [8] - 扬杰科技被欧盟列入制裁名单,公司回应称2025年对欧盟区域销售收入约2.55亿元,占营收比重3.58%,占比低,预计对整体经营业绩直接影响较小 [21] 人工智能与科技行业 - 国产开源大模型密集迭代升级,覆盖技术降本、工业级应用等多个方向,全球累计下载量突破100亿次,中国人工智能专利申请量全球占比达60% [7] - 马斯克起诉OpenAI案开庭,核心争议为OpenAI从非营利转向营利性公司的合法性,此案可能影响OpenAI的IPO计划及微软、英伟达等深度绑定的科技巨头 [10][11][12] - 微软宣布修订与OpenAI合作,将许可改为非排他性且不再向OpenAI支付收入分成,OpenAI向微软支付收入分成的安排将持续到2030年 [13] - 阿里巴巴ATH团队打造的HappyHorse 1.0视频生成模型开启灰测,支持多模态视频生成和视频编辑功能 [17] - 小米在投资者日活动上首次展示了新款人形机器人,并进行了现场互动演示 [23] - 小红书首次公布AI治理主张,将严格管控AI造假与AI侵权等行为,并采取梯度处置措施 [19] 新能源与电池技术 - 宁德时代与海博思创达成3年60GWh钠离子电池订单合作,标志着钠离子电池迎来产业化拐点,宁德时代已攻克其量产全链条难题 [13][14] 互联网平台与数字资产 - 阿里巴巴拟议分拆获香港联交所批准,可在深交所进行基础设施REIT的分拆,并获得相关豁免 [15] - 互联网公开募捐服务平台管理新规出台,明确募捐信息页面不得插入任何形式的商业广告,办法自5月1日起施行 [7] - 三部门联合推进旅游市场强迫购物全链条整治,严把旅行社“入口关”,压实在线旅游平台主体责任 [7] 电力市场与能源 - 南方电网回应电价波动,称4月以来南方区域电力现货交易均价较3月大幅上涨,但现货市场整体占比较小,对电力用户影响有限,居民及农业用户电价不受影响 [22] 消费与潮流产业 - 泡泡玛特发布首款家电产品LABUBU冰箱,售价5999元,全球限量发售,在正式发售前二手平台价格已飙至8999元,溢价幅度高达50% [27][28] - “i茅台”母公司茅台数科进行首次社会招聘,共计招聘35人,其中技术开发类岗位占比超80% [25] 农业科技突破 - 中国科研团队实现第二批克隆牦牛10头批量受孕并全部自然顺产,标志着自主研发的牦牛“全基因组选择+体细胞克隆复合技术”取得成功 [8]
RimeData周报:开源大模型端侧竞争深化,高端制造业凸显耐心资本 2026年第13周
深圳来觅数据信息科技· 2026-04-05 10:20
市场总体概览 - 2026年第13周共发生119起融资事件,较上周增加12起,融资总额约143.43亿元人民币,较上周增加42.76亿元[1] - 本周亿元及以上大额融资事件共40起,较上周增加7起[1] - 本周有236家机构参与一级市场投资,较上周增加56家,公开退出案例26个,其中IPO案例11个[1] 融资结构与行业分布 - 融资轮次以早期(A轮及以前)为主,事件数合计占比64.71%,但B轮融资在金额上居首,占比达50.48%[14] - 融资事件高度集中于前五大行业(装备制造、医药健康、信息技术、电子、电力设备与新能源),合计91起,占总数的76.47%[17] - 前五大行业(装备制造、医药健康、信息技术、电子、生物农业)融资金额合计133.31亿元,占融资总额的92.94%[19] 重点融资领域与案例 - **高端制造/硬科技**:装备制造行业融资额居首,受**星海图(人形机器人)20亿元B+轮**、**云遥宇航(气象大数据)超5亿元B+轮**等大额融资推动[19] - **医药健康**:行业融资额位居第二,受**元思生肽(多肽药物)1.5亿美元B轮**、**纽瑞特医疗(核药)10亿元E轮**等影响[19] - **半导体/AI芯片**:**悦芯科技(半导体后道设备)完成超12亿元Pre-IPO融资**,**此芯科技(通用CPU)完成近10亿元B轮融资**[10][11] - **人工智能/前沿科技**:**玻色量子(光量子芯片)完成10亿元B轮融资**,**模思智能(AI大模型)完成数亿元天使轮融资**[8][19] 区域与资本趋势 - 融资事件数量前五地区为广东(24起)、上海(22起)、北京(22起)、江苏(13起)、浙江(10起),合计占总数76.47%[25][27] - 融资金额前五地区为北京(44.49亿元)、广东(25.72亿元)、上海(23.61亿元)、安徽(15.00亿元)、四川(10.10亿元),合计占总额82.92%[27] - 市场趋势显示,资金持续流向**机器人、半导体、AI大模型等硬科技产业集群**,国资及长期资本(“耐心资本”)在支持底层技术突破中的作用凸显[21][22]
谷歌发布 Gemma 4 开源大模型,协议彻底放开商用
程序员的那些事· 2026-04-04 10:50
产品发布与技术规格 - 谷歌发布Gemma 4系列模型,是Gemma系列的迭代版本,与谷歌旗舰闭源模型Gemini 3共享底层技术 [2] - 一次性发布四款不同规格模型,包括E2B、E4B、26B MoE、31B Dense,覆盖从边缘设备到高性能服务器的全场景 [2] - 轻量化版本可在安卓手机、树莓派等硬件上离线运行,大幅降低了本地AI部署门槛 [2] - 31B稠密版模型的上下文窗口达到256K,推理能力逼近超大规模闭源模型 [2] - MoE混合专家模型能以更低算力消耗实现高效运算,普通消费级显卡即可完成部署 [2] - 全系模型优化了多语言能力,中文支持显著提升,并原生适配函数调用与智能体场景 [2] 开源策略与商业影响 - 谷歌全面改用Apache 2.0开源协议,支持无限制商用、修改与分发,彻底放开商业使用限制 [2] - 相比前代协议,这一改动让企业和开发者无需顾虑授权风险 [2] - 此举直接对标Llama、通义千问等主流开源模型 [2] 行业竞争格局与趋势 - Gemma 4的发布标志着谷歌正式加码开源赛道 [3] - 谷歌依靠宽松协议与端侧优势,有望重塑开源大模型竞争格局 [3] - 此次发布也让本地AI应用迎来新一轮普及浪潮 [3]
鲜猪肉竟是数个月前屠宰?山姆:是失误!网友称品质「不如菜市场」;马斯克宣布:进军2nm芯片制造!挑战台积电三星;OpenAI扩招至8000人
雷峰网· 2026-03-23 08:30
山姆会员商店食品安全与市场表现 - 深圳消费者反映所购山姆冷鲜黑猪瘦肉溯源信息显示屠宰日期为2025年11月9日,距离购买日已过去四个多月,山姆解释为“溯源码未更新”或“系统信息同步与校验失误”[4] - 山姆近期频现食品安全争议,包括三文鱼误导生食、有机冻干草莓被曝与镉超标14倍及含20余种农残的问题产品来自同一代工厂[5] - 2026财年沃尔玛中国净销售额达247亿美元(约1703亿元),同比增长21.67%,山姆会员商店是核心增长动力,已在国内32个城市开设63家门店[5] 东方甄选战略定位与业绩 - 公司CEO俞敏洪明确东方甄选定位为产品公司而非直播或MCN公司,核心是为用户提供好的产品和服务[8][9] - 截至2025年11月30日,公司已累计推出801款自营产品,自营产品GMV占总GMV约52.8%,成为增长核心引擎[9] 网约车平台责任界定 - 浙江海宁法院判决网约车平台公司作为承运人,应对乘客因司机操作不当受伤承担违约赔偿责任,赔偿乘客各项损失共计32万余元[11][12][13] AI模型与开源生态动态 - 美国AI编程工具Cursor发布的新模型Composer 2被质疑底层与Kimi K2.5高度重合,马斯克公开评论证实,Kimi官方回应称双方为合规商业合作[13][14] - 智谱公司针对其闭源模型GLM-5-Turbo引发外界对开源策略的担忧,其全球负责人回应称GLM-5.1将会开源[27][28] - 阿里巴巴蔡崇信指出中国AI发展三大驱动力:国家电力基础设施投资、开源信念以及“制造业+AI”,并强调AI潜力在于应用层[33][34] 科技公司高管变动与组织调整 - 原华为云新加坡总经理胡维琦将加入AI公司MiniMax,或将负责B端业务及中国区市场,向COO贠烨祎汇报[20] - 腾讯云AI业务调整,云产品三部(负责AI相关业务)将向腾讯云CTO王慧星汇报,原负责人吴运声将负责企业中台产品部[21][22] 消费电子与半导体产业 - 华为Mate 80系列累计销量突破453.01万台,随着麒麟9030系列芯片产能改善,供货已趋稳定,且多款机型起售价较上一代有所降低[23][24] - 小鹏汽车董事长何小鹏表示,自研图灵芯片累计出货已超20万片,全年出货量目标近100万片,并计划在2026年底将搭载该芯片的人形机器人月产能提升至超1000台[26][27] - 马斯克宣布特斯拉、SpaceX、xAI联合启动大规模芯片制造项目TeraFab,计划利用2nm制程年产1000亿~2000亿颗芯片,投资预计200亿~250亿美元[37][38][39] 国际科技巨头动态 - OpenAI计划大规模招聘,目标到2026年底将员工总数从约4500人提升至8000人,并计划将企业客户收入占比从40%提升至50%[36][37] - 苹果CEO库克表示,Mac mini销量因OpenClaw本地部署需求激增,并强调苹果十年前已在Mac中加入神经网络引擎以优化AI工作流[41][42] - 亚马逊据称正秘密开发一款整合AI能力的新智能手机项目“Transformer”,旨在深度整合服务并可能改变传统应用商店规则[48] 公司融资与IPO进展 - 人形机器人公司宇树科技科创板IPO获受理,拟募资42.02亿元,2025年1-9月扣非净利润4.31亿元,人形机器人2025年度出货量超5500台[53][54] - AI算力公司曦智科技计划赴港IPO,拟募资3-4亿美元,公司为光电混合算力提供商[56] - 字节跳动旗下懂车帝据称已选择花旗和高盛筹备香港IPO,可能筹资10亿至15亿美元[57] - 医学影像公司德适生物启动港股IPO招股,发售价区间每股95.6至112.5港元,有望成为“医学影像大模型第一股”[58] - 字节跳动以超60亿美元价格将游戏子公司沐瞳科技出售给沙特Savvy Games Group,被视为公司战略进一步向AI聚焦的信号[59][60]
Anthropic指控中国AI“抄袭”,背后有何资本算计?
搜狐财经· 2026-02-27 16:32
事件背景与指控 - 美国AI独角兽Anthropic于2026年2月开工日,突然指控DeepSeek、月之暗面(Kimi)等3家中国AI企业,通过“蒸馏攻击”抄袭其技术 [2] - 指控发出后一天,Anthropic宣布对其核心安全政策进行“软化”,表示一旦竞争对手发布“同类或更先进”的模型,将不再以模型“具有危险性”为由暂停开发 [2] - 埃隆·马斯克对此事件发表嘲讽评论:“他们怎么敢偷Anthropic从人类程序员那里偷来的东西?” [2] - “蒸馏”是全球部分AI公司训练大模型的常用手段,而Anthropic自身也是该技术的使用者,且存在更激进的数据抓取行为 [4] - 2025年9月,Anthropic在官方文件中明确封禁对中资企业的服务,成为人工智能领域对中国最不友好的公司之一 [4] - 2026年2月12日,OpenAI向美国国会提交内部备忘录,指控DeepSeek通过复杂手段绕过安全防护对GPT系列模型实施蒸馏行为 [4] 指控背后的市场与资本动因 - 进入2026年2月,美国AI概念股出现多轮明显下跌,资本市场对人工智能的未来产生了“颠覆传统商业模式”的担忧 [4] - CNN评论指出,不少所谓大模型,其实只是精心包装过的搜索引擎 [4] - 有观点认为,Anthropic面临估值承压,此时指控中国企业,本质是向资本市场传递“自身技术领先”的信号,以保住其高估值 [6] - 此举也暴露了市场对闭源AI系统越来越深的不信任 [6] - Anthropic等大模型也借此为自身的安全政策“松绑”,营造更宽松的政策氛围 [6] 中国AI企业的回应与发展路径 - 对于Anthropic的单方面指责,DeepSeek、月之暗面、MiniMax均未予以回应 [7] - 业内人士认为,中国企业的沉默源于对自身技术实力的自信,且不想陪美国舆论炒作 [7] - 中国AI企业已走出破局之路,其快速进步得益于国内庞大的工程师群体、丰富的数据资源、相对完善的产业链以及对开源开放路线的坚持 [9][10] - 月之暗面最新一轮估值超过40亿美元,由阿里、腾讯、五源、九安等机构联合领投 [9] - 中国的AI应用(如豆包、千问、元宝等)通过大规模补贴吸引新用户,完成了从“爆发式增长”向“规模投入换用户增长”的转型 [12] - 春节红包大战印证了这一趋势,中国市场强调用补贴+高速增长培育场景和用户习惯,与欧美更注重企业级付费或平台变现的策略形成对比 [12] - 中国企业在本土规模和应用场景拓展上形成强大生态推动力,从消费端App到行业级部署都在快速推进 [12] 全球AI产业竞争格局演变 - 随着英伟达对OpenAI的超大规模投资,资本在可预见的未来将围绕算力和平台生态形成新级别的“产业壁垒”,通过资本深化产业绑定 [12] - AI产业正从单纯的技术革命阶段,迈入“资本赋能+商业生态重构+全球竞争分化”的新阶段 [15] - 未来的赢家将不仅仅是技术最强者,更是能够构建持续变现生态和全球网络效应的平台型企业 [15] - 美国企业通过资本集中、算力布局、产品领导地位等方式强化全球优势 [12] - 中国AI从“技术秀”转向产业深耕,制造、医疗、消费三大领域规模化落地,开源+生态成为关键 [22] - 美国AI从“通用模型”走向专用智能体,在自动驾驶、企业服务、军事AI等领域寻求突破,以定制算力+垂直模型构建壁垒 [22] AI投资趋势与核心瓶颈转移 - 华尔街AI概念股大跌,折射出资本对新技术短期前景的疑虑,但对其作为商业基础设施的稳定增长已无质疑 [16] - 全球AI投资已从“押注技术不确定性”,进入“押注确定性扩张路径”的阶段 [16] - 随着算力资源日趋稀缺,AI的核心瓶颈已不在模型,而在于谁能长期、稳定、低成本地获得算力 [18] - GPU/AI专用芯片、算力租赁、算力云等相关板块,更具投资潜力 [18] - AI领域正经历从模型到智能体、再到平台的演进,未来行业核心竞争力在于对Agent调度的控制、工具接口的定义以及用户行为数据的沉淀 [18] 中国市场独特的AI投资机会 - 字节跳动豆包、阿里巴巴通义千问、腾讯元宝等产品通过大规模补贴拉新,本质是通过占领用户交互入口,获取真实世界的AI行为数据 [20] - AI时代,开放更多AI入口的目的是让更多人使用AI、迭代AI、通过AI协作形成行为记录,这类数据无法通过爬虫获取,只能依靠真实用户规模积累 [20] - 未来超级AI应用、AI与社交、内容、办公、搜索的结合,以及具备分发能力的平台型公司将具有一定的发展潜力 [20] - 这类投资短期会压制企业利润,但中长期有望培育出中国的AI平台型巨头 [20] - AI投资的兑现点还在于AI行业化应用,最早实现稳定盈利的往往是行业应用 [21] - 2026年2月,国内各大厂的AI应用进入爆发式发展 [21] - 字节跳动的Seedance 2.0:AI视频生成模型,支持文本、图像、音频多模态输入,视频音频同步生成,60秒出片,成本降至人工拍摄的1/10,海外创作者使用率破千万 [21] - 千问可以在对话框联动淘宝/支付宝,AI一句话即可激发下单近2亿次 [21] - 2026年1月,开源AI项目Clawdbot引爆全球技术圈,其核心突破在于将AI从“被动对话工具”转变为“主动执行的数字智能体” [22]
沙利文:中国企业级大模型日均调用量提升至37.0万亿tokens 阿里千问领先优势扩大占比第一
智通财经网· 2026-02-24 11:14
全球AI厂商发布策略分化 - 2025年下半年,全球AI厂商发布策略显著分化,中国厂商依托规模化投入在开源生态中占据主导地位,海外厂商则持续聚焦闭源主线,发布频次与覆盖广度相对有限,呈现出“少而影响力集中的闭源发布特征” [1][2] - 中国闭源基础模型赛道快速收敛,头部效应在2025年下半年集中显现,而开源模型全面爆发,中国成为全球开源大模型创新引擎 [2] 中国企业级大模型调用量跃迁 - 2025年下半年,中国企业级大模型日均调用量提升至37.00万亿tokens,较2025年上半年的10.19万亿tokens增长263%,实现阶段性跃迁 [1][4] - 调用量跃迁反映出AI在企业中的定位发生变化,正从零散辅助走向关键流程的深度嵌入,增长核心来自单个业务流程中AI调用频次与覆盖环节的提升,大模型逐步成为企业提升生产效率的重要通用能力 [4] - 增长的核心驱动来自Agent相关架构在企业侧加速落地,以及模型能力与工程化配套持续提升,2025年12月日均tokens达到阶段高点并显著高于下半年均值 [4] 开源与闭源模型调用格局变化 - 2025年下半年,开源模型和闭源模型的调用量均呈现显著提升,其中开源模型调用量占比反超闭源模型,成为企业级大模型的主流部署模式 [7] - 企业新增调用主要来自两类需求:面向核心系统与对外服务的扩容(优先选择闭源模型),以及内部效率工具与业务支撑应用的新增或快速扩张(更适合由开源模型承接),两类需求同步增长 [7] - 随着应用进入持续、高频的规模化使用,成本与可控性的重要性显著上升,开源模型通过本地化部署等方式降低单位tokens使用成本,推动其在新增调用中占比提升 [7] 企业模型迁移意愿与方向 - 企业级大模型调用流转意愿整体增强,且迁移结构仍明显偏向“闭源转向开源”,闭源用户向开源增配的意愿由22.6%升至48.5%,开源用户向闭源增配的意愿由5.0%升至7.5% [9] - 随着调用规模扩大,闭源模型按调用计费带来的成本压力被放大,促使企业将一部分可标准化、可替代的通用场景逐步迁移或增配到开源体系,以提升成本可控性 [9] 主要应用场景与增长方向 - 文本内容创作(19.4%)、问答助手(13.7%)、数据处理与分析(12.9%)、内部知识问答(12.6%)、代码生成与辅助(12.4%)是企业大模型应用占比最高的基础场景 [11] - 从增长维度看,多模态内容创作以+11.9%的增速位居首位,显著高于AI搜索(+4.7%)与智能客服(+4.4%),成为2025年下半年增长最快的业务场景 [11] 市场集中度与厂商格局 - 2025年下半年企业级大模型市场向头部厂商高度集中,企业在调用规模扩大阶段,对供应商的选择逐步收敛为两条路径:依托云平台的一体化能力,或在非核心场景中以更低成本承接部分流量作为补充 [14] - 随着模型嵌入关键业务流程,企业更倾向于压缩供应商数量以降低长期运维负担,在日均调用规模提升至万亿级tokens后,高并发、长周期场景下的新增流量通常优先投向已验证具备稳定承载能力的头部厂商 [14] - 以阿里云千问为代表的模型,凭借算力调控能力、生态适配能力与规模化成本优势,更容易在增量需求中获得持续导入,推动企业级市场份额进一步集中,其占比从2025年上半年的17.7%跃升至下半年的32.1%,几乎翻倍 [1][14]
还有高手?千问新模型压轴亮相
搜狐财经· 2026-02-17 00:25
阿里发布新一代大模型Qwen3.5 - 阿里在大年初一前发布了新一代大模型Qwen3.5 [1] - Qwen系列在开源阵营中通常“发布即登顶” [1] Qwen3.5-Plus的核心技术突破 - Qwen3.5-Plus总参数为3970亿,相比上一代旗舰Qwen3-Max的万亿参数不增反降 [2] - 该模型以不到前代模型40%的参数量,将性能做到了Gemini 3 Pro的级别 [2] - 每次响应的激活参数只有170亿,相当于只用5%的算力资源调动满血智能 [2] - 交付给用户的token成本只有Gemini 3 Pro的1/18 [2] - 模型引入了混合注意力模式,学会“有详有略的读” [2] - 其重大突破的门控技术,源自阿里在2025 NeurIPS上斩获最佳的论文,成果可供所有科技公司吸收 [3] 模型架构的演进路径 - 千问大模型持续死磕MoE架构 [2] - 从Qwen1.5启动细粒度专家模式开始,到Qwen3摒弃共享专家改用路由专家,再到Qwen3.5引入混合注意力模式 [2] - 历次更新都在推翻和重建,是开源大模型中前沿含量最高的一个 [1] 行业竞争格局与影响 - 中国厂商(Qwen、GLM、Kimi、DeepSeek等)已彻底领跑开源模型队列,并以无死角的交叉线路完成对闭源模型的全面包围 [3] - 阿里成为在全模态上100%对标谷歌的公司,从预训练第一天起就在文本和视觉的混合数据上联合学习,实现视觉与语言在统一参数空间内的深度融合 [3] - 国产大模型与地表最强SOTA之间的距离已缩短至3个月,超车的身位已经可以看到 [3]
GLM-5真够顶的:超24小时自己跑代码,700次工具调用、800次切上下文
36氪· 2026-02-12 18:40
模型性能突破 - GLM-5具备卓越的长任务处理与工程能力,能够连续运行代码超过24小时,期间稳定完成700次工具调用和800次上下文切换[2] - 模型在无并行、无参考代码、关闭网络搜索的严苛条件下,从零开始手写JavaScript代码,成功创建了一个功能完整的Game Boy Advance模拟器,该任务涉及处理500多条CPU指令集、内存分页、音频子系统和图形渲染时序等复杂工程[7] - 在长任务执行中展现出高度稳定性和可靠性,具体表现为:工具调用在语法、格式和准确度上从第1次到第700次无差异;即使经过800次上下文切换,仍能严格遵守元提示的规范和流程;能自主判断何时进行测试、记录信息或切换策略;每次上下文清空后,能准确从笔记和文件中恢复工作状态[7] 基准测试表现 - 在权威榜单Artificial Analysis的评测中,GLM-5达到了与Claude Opus 4.5比肩的水平[10] - 在业内主流基准测试中,GLM-5的编程能力实现了与Claude Opus 4.5对齐[12] - 在衡量模型经营能力的Vending Bench 2测试中,GLM-5取得了开源模型第一的成绩[18] 实际应用与开发潜力 - 模型能够从零生成复杂的3D游戏,例如3D版大富翁,并能根据更精细的提示实现如“龙虾版3D大富翁”对战等高级功能[22][24] - 已有用户利用GLM-5开发了学术版“抖音”应用,并已提交上架苹果App Store,另有10余款APP准备上架[24] - 模型能精准理解并实现复杂的物理规律描述和视觉效果需求,例如使用three.js创建具有多层玻璃壳和动态外观变化的十二面体[27] - 模型具备全栈开发能力,可以制作完整且有设计感的电商网站,以及手搓3D版可交互的《我的世界》[27] 行业影响与意义 - GLM-5标志着开源大模型完成了一次从“助手”到“独立工程师”的质变,能够接受目标后自主执行长任务,极大减少人工调试[29] - 其开源特性将原本属于闭源巨头的长任务和工程能力交到了所有开发者手中,可能对SaaS行业构成冲击,此前市场已因Claude Opus等闭源模型的长任务能力而出现恐慌,导致金融数据服务商FactSet盘中暴跌10%,以及S&P Global、穆迪等公司股价下跌[29] - 模型的出现可能重塑软件行业,引发投资者对年费软件模式的担忧,因为AI能够现场创建如CRM系统等复杂软件[29] 市场反响与公司动态 - GLM系列模型从4.5版本开始专注于AI编程,其“coding套餐”在国内外市场反响火爆[30] - GLM-5发布后,智谱公司采取了限售策略,导致外国网友出现“求”购状态[30] - 智谱公司大楼已成为一个打卡点,显示出产品的高关注度[30]
GLM-5真够顶的:超24小时自己跑代码,700次工具调用、800次切上下文!
量子位· 2026-02-12 15:52
GLM-5模型的技术突破与工程能力 - 模型在无并行、无参考代码、关闭网络搜索的条件下,连续运行超过24小时,完成了700次工具调用和800次上下文切换,成功从零手搓了一个Game Boy Advance模拟器[3][11] - 该模拟器工程任务复杂,涉及500多条CPU指令集、内存分页机制、音频子系统和图形渲染时序,对AI的指令遵循和工程稳定性要求极高[9][10] - 在长任务执行中,模型展现出稳定的工具调用能力,第700次与第一次调用在语法、格式和准确度上无差异,且能稳定进行工作判断和上下文状态恢复[12][17] GLM-5模型的性能与基准测试表现 - 在权威榜单Artificial Analysis中,GLM-5达到了与Claude Opus 4.5比肩的水平[15] - 在衡量模型经营能力的Vending Bench 2基准测试中,GLM-5取得了开源第一的成绩[23] - 在主流基准测试中,其编程能力与Claude Opus 4.5对齐,展现出持久的指令遵循能力,即使在800次上下文切换后仍能遵守规范[17] GLM-5模型的实际应用与产品化案例 - 模型能够从零生成复杂的3D版大富翁游戏,并有人已申请将其上架App Store[26][27] - 用户利用模型制作了学术版“抖音”并提交上架苹果App Store,另有10余款APP计划上架[28] - 模型成功完成了对复杂物理规律描述的理解任务,例如根据详细Prompt使用three.js创建了一个光影交错的玻璃十二面体[33] - 模型能够胜任全栈类型任务,如制作完整且有设计感的电商网站,以及手搓3D版可交互的《我的世界》[34][35] GLM-5模型对行业的影响与意义 - 开源大模型GLM-5的出现,标志着AI从助手到独立工程师的质变,能够独立完成长周期、复杂的目标任务[37] - 其能力可能对SaaS行业构成冲击,此前Claude Opus等闭源模型展现长任务能力时,已引发市场对SaaS软件类股票的抛售担忧[38][39][40] - GLM-5将原本属于闭源巨头的长任务能力开源化,为所有开发者提供了重塑工具和创造的可能性[40] - 智谱公司的GLM系列模型从4.5版本开始专注于AI编程,其“coding套餐”在国内外市场反响热烈,GLM-5发布后甚至出现限售和外国网友“求”购的情况[41]
GLM-5引爆行情!智谱大涨28%
第一财经资讯· 2026-02-12 12:29
智谱GLM-5模型发布与市场反应 - 智谱于2月12日正式上线并开源新模型GLM-5,首个交易日股价上涨28.68% [4] - 此前在全球模型服务平台OpenRouter登顶热度榜首的神秘模型“Pony Alpha”被官方确认为GLM-5 [4] - GLM-5更新重点强化编程与智能体能力,预训练数据从23T提升至28.5T [4] - 模型构建了全新的“Slime”框架以支持更大规模和更复杂的强化学习任务,并首次集成DeepSeek稀疏注意力机制以降低部署成本 [4] GLM-5的技术能力与行业定位 - GLM-5在编程与智能体能力上取得开源SOTA表现,在真实编程场景的使用体感逼近Claude Opus 4.5,擅长复杂系统工程与长程智能体任务 [5] - 其智能体工程典型应用场景包括端到端应用开发、通用智能体助手、全流程编程以及办公文档直接输出等 [5] - 近期热门的开源AI智能体系统OpenClaw可接入GLM-5,实现搜索、资讯整理、发布推文、编程等功能,智谱官方推出的AutoGLM版本支持一键完成OpenClaw与飞书机器人的配置 [5] 近期行业模型更新趋势 - 除智谱外,近期多家模型厂商在“春节档”发布更新,包括阶跃星辰Step 3.5 Flash、阿里Qwen3-Coder-Next、MiniMax的MiniMax-M2.5等 [6] - 行业更新动态显示模型发展更聚焦于推理效率、长上下文、多模态和低成本等方向 [6] - 具体技术进展包括DeepSeek的OCR 2和Engram架构优化算力效率,阿里与Kimi的模型强调推理与多模态融合,以及MoE架构和FP8精度等技术使模型单次调用成本从“元”级降至“分、厘”级 [6] - DeepSeek近期在网页端和APP端更新,支持最高1M Token的上下文长度,较其去年8月发布的DeepSeekV3.1的128K上下文长度大幅提升 [6]