Workflow
大语言模型
icon
搜索文档
赛道Hyper | 智谱GLM-4.5:技术突破成因与行业价值
华尔街见闻· 2025-08-01 08:41
核心观点 - 智谱AI发布旗舰模型GLM-4 5并开源 该模型专为智能体应用研发 在性能 成本控制与多能力融合等方面表现突出 [1] - GLM-4 5的突破是技术积累 路径选择与生态协同的综合结果 标志大模型竞争从单点参数规模转向系统效率与生态活力 [10] 技术迭代与架构优化 - GLM系列从GLM-1到GLM-4 5经历四年多迭代 早期GLM模型探索Transformer架构优化 GLM-130B采用DeepNorm和RoPE等技术 [2][3] - GLM-3采用多阶段增强预训练方法 推理速度提升2-3倍 成本降低1倍 为后续参数效率提升奠定基础 [4] - GLM-4 5坚持"高效参数"路线 总参数3550亿中激活参数占比9% 通过优化专家模块协同机制提升效率 [4][5] - GLM-4 5-Air总参数1060亿 激活参数占比11% 部分团队因担心架构复杂度仍选择密集型架构 [6] 性能与成本优势 - GLM-4 5激活参数占比较高 实现参数效率翻倍 API价格仅为Claude的1/10 速度超100tokens/秒 [7] - 训练数据采用"通用+垂直"双层结构 通用文本15万亿token 垂直领域数据8万亿token 按任务单独标注 [7] 多能力融合与生态协同 - GLM-4 5首次实现推理 代码 Agent等多能力原生融合 采用统一底层架构规划参数共享机制 [8] - 智谱AI是国内首批推进大模型开源的企业 GLM-2开源后积累庞大开发者社区 社区贡献轻量化部署方案 [8] - 公司经历11轮融资 资金压力较小 有耐心进行多能力协同专项优化 [9] 团队背景 - 核心团队主要来自清华大学KEG实验室 包括董事长刘德兵 CEO张鹏 总裁王绍兰 首席科学家唐杰曾任清华教授 [1]
GLM-4.5大模型杀出重围 “领跑者”智谱走上台前
北京商报· 2025-07-31 22:55
核心观点 - 智谱华章发布新一代旗舰大模型GLM-4.5,综合得分位列全球第三、国产第一,专为智能体应用打造,实现复杂推理、代码生成及智能体交互等能力融合与技术突破 [1][3] - GLM-4.5采用混合专家(MoE)架构,总参数量3550亿,激活参数320亿,在开源社区Hugging-Face榜单全球第二,创增速纪录 [3] - GLM-4.5在真实场景Agentic Coding测试中展现出竞争优势,API调用成本较低,输入0.8元/百万tokens、输出2元/百万tokens,被评价为"成本更低、性能更优" [4] - 公司已启动IPO上市辅导备案,由中金公司担任辅导机构,成为第一家启动IPO上市的"大模型六小虎",并获多地国资战略投资 [1][7] 技术能力 - GLM-4.5是首款原生融合模型,首次在单个模型中实现推理、编码和智能体能力原生融合,能够一键生成复杂应用、游戏、交互网页 [5] - 在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,GLM-4.5的综合得分位列全球第三,国产第一 [3] - 在真实代码智能体的人工对比评测中,GLM-4.5达到开源SOTA(当前最佳技术),实测国内最佳 [3] 市场表现与竞争 - GLM-4.5发布仅2小时就被X平台推荐上首页,12小时后位列Hugging-Face榜单全球第二,创增速纪录 [3] - OpenAI将智谱定义为全球竞争对手,GLM-4.5的发布早于OpenAI多次推迟的GPT-5 [1][6] - 在真实场景Agentic Coding测试中,GLM-4.5相比其他开源模型展现出竞争优势,特别在工具调用可靠性和任务完成度方面表现突出 [4] 商业模式与资本动向 - 公司已在北京证监局办理上市辅导备案,由中金公司担任辅导机构,8月将进入正式辅导期第二阶段 [1] - 公司获多地国资战略投资,股东背景多元,可同时获得应用场景、政务资源、国际市场等支持 [7] - 与具身智能相比,智谱专注通用大模型与智能体,商业模式相对成熟,直接竞争较少 [8] 行业趋势 - 大模型的下一个范式是将各种能力整合到一起,成为一个"全优生",GLM-4.5正是朝着这一目标努力 [5][7] - OpenAICEO山姆·奥特曼提到GPT-5将整合大量技术,包括o3,但发布时间多次推迟 [6] - 智谱与OpenAI相似之处在于双方都在各自国家较早地开始训练大模型,并探索不同方向的能力边界 [7]
AI令一些人失业,但也让一些人工资大涨
财富FORTUNE· 2025-07-31 21:05
AI对劳动力市场的重塑 - AI正在加速科技行业裁员 受影响员工数量高达8万人 仅微软就裁减1 5万个岗位 同时承诺向新AI项目投入800亿美元 [1] - 非技术岗位对AI技能需求激增 相关职位薪资平均增长28%(约1 8万美元/年) 传统技术岗位占比从2019年61%降至2024年49% [2] - 2024年超半数AI技能需求来自非科技行业 营销 人力资源 金融 教育 制造业等领域AI工具整合加速 [3] 非技术领域AI应用爆发 - 要求GenAI技能的非技术岗位数量暴增8倍 营销 设计 教育 人力资源成为增长最快领域 [3] - 2024年明确要求GenAI技能的职位达6 6万个 较前一年增长近4倍 大语言模型 ChatGPT 提示词工程为热门技能 [6][7] - 客户支持 销售 制造等行业AI人才薪酬涨幅最大 复合型AI技能可使薪资比招聘广告再高43% [5][8] AI技能的价值分化 - 艺术类岗位受AI冲击最大 但沟通 管理 创新等人类独有能力在AI时代价值凸显 [4][10] - 技术岗位更需高级机器学习专家 非技术岗位仅需基础AI应用能力即可获得升职加薪机会 [8][10] - 头部企业正将AI融入全业务链 提升营销 HR 财务等部门的AI技能以构建未来竞争力 [10] 劳动力市场结构性变化 - AI技能普及带来28%薪资增长 但可能伴随高薪技术岗淘汰与低薪岗小幅提薪的结构性压缩 [11] - 掌握两项以上AI技能者薪资溢价显著 人类判断力与AI技能结合的人才极度稀缺 [8][9] - 企业招聘AI岗位时十大核心能力包含技术基础与软技能 复合型人才最受青睐 [9]
新一代青年与新一代人工智能 | 两说
第一财经资讯· 2025-07-31 18:01
人工智能技术发展现状 - 以ChatGPT、DeepSeek为代表的大语言模型展现出革命性突破,具备惊人的理解、推理和创造能力,正在重塑人类社会的知识生产方式和价值创造模式 [1] - 人工智能技术已进入全新节点,大模型评测高考成绩理科达985水平,文科可冲击顶尖高校 [4] - 开源AI模型如DeepSeek通过开放技术大幅降低应用门槛,推动青年多元化成长 [15] 人工智能在教育领域的应用与挑战 - 全国高校纷纷开设AI通识课,但需警惕学生过度依赖AI完成作业而丧失独立思考能力 [4] - 人工智能使用可分为三个层次:先"用"以积累经验,然后"不用"以重建信心,最终达到"用与不用"的有无之境 [4] - 文科和理科的差异正在拉平,文科生利用AI可完成工科领域任务,如搭建LSTM时序分析模型和多模态微表情识别项目 [13] 人工智能的创造性与幻觉问题 - 大模型的幻觉现象是其将语料知识根据概率统计生成新内容的结果,完全消灭幻觉会同时消灭其创造性 [8] - 幻觉不能单纯视为技术问题,需要在试错过程中由个人辨别,而非在实验室完全解决 [6] 人工智能对行业结构的影响 - 人工智能打破了传统知识生产和学习的金字塔结构,如围棋领域从师承传递转变为普惠知识获取 [17] - 围棋行业在AI冲击后并未消亡,反而更加繁荣,表现为更多儿童学习围棋、围棋班增加和比赛竞争加剧 [17] - 开源精神体现为"功成不必在我,但成功一定有我"的理念,为青年创新创造多元土壤 [15] 青年与人工智能的未来发展 - "80后"、"90后"在AI技术创新中发挥重要作用,但青年需适应从封闭知识体系向开放结构的转变 [10] - 当科技创新进入"无人区"时,人类的主动性和创造性将变得至关重要 [10] - 在新知识结构下,教育体系需重新定义学习内容和知识结构,突破传统文理科划分 [12]
R2还没来,但DeepSeek的秘密武器已经“剧透”了
虎嗅· 2025-07-31 15:58
行业技术突破 - DeepSeek与北京大学联合研发的"原生稀疏注意力(NSA)"技术获ACL最佳论文奖 该会议被公认为自然语言处理领域顶级风向标 [2][3][4] - NSA技术首次实现稀疏注意力在完整训练流程的应用 突破仅能用于推理阶段的限制 在27B模型上实现训练前向计算加速9倍 反向传播加速6倍 [5][23][44] - 该技术显著提升长文本处理效率 在64k上下文长度下推理速度提升11.6倍 同时保持模型性能不降反升 [5][16][45][46] 技术原理创新 - NSA采用三重机制模拟人类阅读行为:Token Compression压缩早期文本为摘要块 Token Selection精准选择相关原文细节 Sliding Window保留最近上下文精细注意力 [26][27][28] - 通过门控机制动态平衡三种阅读策略 实现硬件对齐优化 兼容GQA架构和FlashAttention-2内核 基于Triton重写关键kernel [30][31][52] - 原生可训练特性使稀疏模式与模型协同优化 在MMLU、GSM8K等9项基准测试中7项超越全注意力模型 DROP测试推理能力提升显著 [32][33][35][37] 性能表现数据 - 在64k长度(约8万字)"大海捞针"测试中实现100%信息检索准确率 LongBench评测平均分0.469超越全注意力基线的0.437 [38][40][41] - 上下文长度与加速比呈正相关:8192长度加速4倍 16384长度加速6.4倍 32768长度加速9.1倍 65536长度加速11.6倍 [46] - 传统注意力机制在64k上下文长度下占据70%-80%推理延迟 NSA通过稀疏化计算有效降低延迟 [18][43] 行业应用前景 - 技术已通过27B及MoE架构完整预训练验证 具备商业化落地条件 将应用于下一代DeepSeek大模型 [51][52][53] - 突破性提升长文本处理能力 支持整本书籍、多份财报、完整代码库的直接分析 无需人工拆分 [49][54] - 计算效率提升将传导至API成本降低 加速AI应用生态发展 [55][58][59]
英美情报界如何使用AI模型?
观察者网· 2025-07-31 13:52
美国政府对AI的国家安全应用与投入 - 拜登政府下令情报机构、五角大楼及能源部更激进地试验尖端AI模型,并加强与Anthropic、谷歌DeepMind和OpenAI等前沿AI实验室的合作[1] - 五角大楼向Anthropic、谷歌、OpenAI以及埃隆·马斯克旗下的xAI等企业分别授予了最高达2亿美元的合同,以测试能够代替用户执行任务的“代理型”AI模型[1] - 特朗普政府下令五角大楼与情报机构定期评估美国在AI领域的应用速度是否赶得上中国等竞争对手,并要求制定持续适应的机制[8] AI公司在情报与国防领域的业务进展 - 微软公司表示其26款云计算产品已获准用于美国情报机构[2] - Anthropic宣布推出专为政府设计的Claude Gov模型,该模型已部署在拥有最高国家安全保密级别的情报机构中,并允许处理带有“机密”标识的文件[2] - AI公司会根据情报机构的需求对模型进行微调,例如加强对外语及方言的识别与理解能力,这些模型大多运行在与互联网隔离的安全服务器上[2] 欧洲及以色列的AI军事与情报应用 - 法国AI领军企业Mistral正与法国的国防人工智能局合作,其Saba模型专门训练了处理中东和南亚数据的能力,在阿拉伯语及泰米尔语等区域性语言上表现尤为出色[3] - 整个英国情报界都已接入了最高保密级别的大语言模型功能,并采用“检索增强生成”方法来降低模型的幻觉率[3][6] - 自加沙冲突爆发以来,以色列军方对OpenAI的GPT-4模型的使用频率增长了20倍[3] AI技术在国家安全应用中的挑战与局限性 - OpenAI负责人坦言AI在国家安全领域的应用还远没有达到期望的水平,许多情报机构仍在试图为现成的聊天机器人构建自己的“封装器”,这种做法使其大幅落后于公共领域中最先进的模型[4] - 美英情报机构希望实验室能显著降低现有大语言模型的“幻觉”率,情报界最需要的是模型的一致性、可靠性、透明度和可解释性[6] - OpenAI最新的代理型模型ChatGPT agent的幻觉率约为8%,甚至高于早前发布的o3模型,代理型模型因递归生成提示词而更难预测,错误可能层层累积[6] 关于AI未来发展方向与架构的争论 - 有观点认为如今的通用大语言模型架构并不适合“因果推理”,难以掌握真实世界运行的逻辑,主张情报机构的重点应转向开发具备推理能力的全新AI架构[7] - 有警告指出中国可能在该领域领先,其模型可能没有西方这样的“护栏”,因此可能更快地获得强大的洞察能力,但外界对中国如何及在多大程度上将DeepSeek应用于军事和情报领域仍不清楚[7] 美国对竞争对手AI进展的担忧 - 美国参议院情报委员会副主席马克·华纳直言,美国情报界在监测中国相关进展方面做得“一塌糊涂”,在获取中国技术、渗透中国科技企业方面的进展仍然相当有限[8] - 最大问题被指并非美国在风险不明的情况下贸然推进AI技术,而是国防部和情报界继续按老办法做事,担忧可能赢下通用人工智能的竞赛却输掉它的实际应用[8]
大厂不再重压ChatBot、“六小虎”声量分化、机器人不依赖绳索“吊着”|WAIC观察
财经网· 2025-07-31 11:53
WAIC展会核心观察 - 展会吸引约35万线下观众,800多家展商展示从大模型到机器人零部件的全产业链技术进展 [1] - 大模型应用从ChatBot转向Agent成为行业焦点,Agent市场规模已达50亿美元且年增长率40% [3][4] - 人形机器人实现从"被吊着"到实际场景复刻的跨越,展示娱乐表演/工厂作业/家庭服务三大类应用 [2][10] 大厂Agent布局 - 阿里推出无影AgentBay并展示三款开源大模型,夸克AI眼镜集成Qwen大模型支持导航/支付/比价功能 [3] - 百度GenFlow 2.0 Agent平台支持多智能体协作和主动干预,8月将全量上线 [3] - 蚂蚁数科基于Qwen3推出金融推理大模型Agentar-Fin-R1,联合金融机构推出超百个金融智能体解决方案 [6] 大模型"六小虎"动态 - 百川智能和零一万物未参展,后者战略转向ToB推出万智企业大模型平台2.0 [7] - 阶跃星辰发布Step3大模型并组建"模芯生态联盟",全年营收目标10亿元 [8] - 智谱AI展示AutoGLM模型可自主完成电商操作,月之暗面重点展示K2模型 [8] 人形机器人进展 - 宇树/智元/星动纪元等厂商展示舞蹈/搬运/服务等场景,核心零部件六维力传感器出货量年增2000+台 [10][12] - 蓝点触控六维力传感器占国内70%市场份额,订单排至9月并完成近亿元B轮融资 [12][14] - 非夕科技展示自适应机器人完成蛋雕/按摩等精细操作,结合具身智能大模型实现复杂任务 [11] 基础设施与算力 - 超云展示AI大模型一体机SuperCube R7000,强调高性价比和专业服务 [9] - 大模型一体机市场快速膨胀,超云通过联合生态伙伴打通应用落地"最后一公里" [10] 行业趋势 - 技术展示转向场景演练,AI应用从"技术炫技"进入产品化能力比拼阶段 [14] - 具身智能技术路线尚未收敛,软硬协同和生态组建成为竞争关键变量 [14]
刚刚,DeepSeek梁文锋NSA论文、北大杨耀东团队摘得ACL 2025最佳论文
机器之心· 2025-07-31 00:25
ACL 2025大会概况 - 本届ACL大会投稿数创历史新高,达8000多篇,较去年4407篇增长81% [3] - 主会论文接收率20.3%,Findings接收率16.7% [3] - 中国作者占比首次过半达51.3%,远超美国14.0% [4] - 共颁发4篇最佳论文、2篇最佳社会影响力论文、3篇最佳资源论文等多项奖项 [6] 最佳论文研究成果 - DeepSeek团队与北大杨耀东团队包揽4篇最佳论文中的2篇 [10] - 杨耀东团队论文揭示大模型存在"弹性机制",导致对齐困难且需与预训练相当的资源 [24][25] - DeepSeek提出NSA注意力机制,在27B参数模型上实现长上下文高效训练与推理 [33][40] - NSA通过分层token建模实现260B token预训练,性能媲美Full Attention但计算效率更高 [37][41] 技术创新方向 - 大模型安全领域突破:发现模型参数存在抵抗对齐的结构性惯性 [24] - 高效训练技术:NSA实现硬件对齐的稀疏注意力,解码速度随序列长度增加而提升 [36][41] - 数据质量评估:Meta-rater提出四维度数据选择方法提升预训练效率 [55] - 评估效率优化:SubLIME方法可将LLM评估成本降低80%-99% [56] 行业影响与趋势 - 华人团队学术影响力显著提升,包揽最佳论文半数奖项 [10] - 大模型基础架构创新持续涌现,注意力机制优化成为关键突破点 [33][37] - 模型安全与对齐挑战凸显,需重新评估现有技术路线 [24][25] - 高效训练与推理技术获重点关注,推动商业化应用落地 [40][41]
预见2025:《2025年中国人工智能代理行业全景图谱》(附市场现状、竞争格局和发展趋势等)
前瞻网· 2025-07-30 22:39
行业定义与演进 - 人工智能代理是由大语言模型驱动,整合MCP代理等插件,具备感知环境、自主决策、目标导向和学习能力的软件系统 [1] - 行业从Chatbot(2016-2020年)演进至Copilot(2021-2023年),再发展到当前具备自治决策和环境交互能力的Agent阶段(2023年至今) [8][10] - 技术演进路径为:从预定义规则机器人→具备基础推理的效率工具→拥有百万tokens记忆能力的多模态数字雇员 [10] 产业链结构 - 产业链形成基础层(云计算/AI芯片/算法框架)、技术层(大模型/多模态技术/知识图谱)和应用层(B/C/G端及硬件载体)的三层体系 [2][5] - 基础层由硬件与算力提供方支持大模型运行环境,技术层由模型提供方输出成熟大模型,应用层通过平台中台整合模型并对外提供服务 [2] - 行业在数据规模和应用创新上有优势,但面临高端芯片依赖和数据合规性挑战 [5] 政策环境 - 2015年《促进大数据发展行动纲要》首次推动大数据与AI结合,支持智能分析和自动化决策技术 [11] - 2017年《新一代人工智能发展规划》明确发展智能机器人、自然语言处理等技术,支持金融、医疗等领域代理应用 [11] - 2021年出台《数据安全法》和《个人信息保护法》,规范AI代理数据收集使用边界,要求获得用户授权 [11] - 2022年《"十四五"数字经济发展规划》提出发展智能客服、智能合约等代理技术,推动自动化服务 [11] 市场规模与增长 - 2023年中国AI Agent市场规模达554亿元,预计2028年增长至8520亿元,年均复合增长率72.7% [12] - 智能客服市场规模2023年超70亿元,预计2027年达181.3亿元,年均复合增长率超27% [13] - 智慧安防市场规模2023年达1226亿元,预计2028年达5598亿元,年均复合增长率35.5% [13] - 智能车载市场规模2023年达119亿元,预计2028年达640亿元,年均复合增长率40% [13] 应用场景与渗透率 - AI Agent使个人博主内容制作时间从20-30分钟缩短至5分钟,服务2000万-3000万网红博主群体 [13] - 2023年企业渗透率不足5%,预计2028年大型企业渗透率达25%,中小企业达15% [15] - 工业与医疗领域增长潜力显著,智能投顾市场预计2030年达1.5万亿元,年复合增长率超40% [27] 竞争格局 - 行业呈现"头部集中、生态分化、场景深耕"特征,阿里巴巴、腾讯、百度等头部企业主导大模型层 [21] - 百度构建AI基础设施,腾讯聚焦生态协同,阿里驱动业务重构,形成三种差异化战略路径 [21] - 科大讯飞2024年营收233.43亿元,医疗Agent覆盖4000家医院,教育Agent客单价2980元且毛利率85% [22][24] - 特斯联2024年营收18.43亿元,AI业务同比增长162.9%;智谱AI商业化收入增长超100%,C端产品年化收入破千万 [22] 技术创新与突破 - 多模态技术(GPT-4v、Gemini 2.0)实现文本、图像、语音及实时视频流融合 [30] - 强化学习微调和推理模型使医疗诊断误差率降至2.3%,金融尽调周期缩短80% [30] - 国产模型DeepSeek-R1通过架构优化降低推理成本,推动技术普惠化 [30] 企业动态与融资 - 初创企业Manus在GAIA测试性能超越OpenAI,支持92%准确率的简历筛选和17种数据源整合,获7500万美元融资后估值达5亿美元 [25] - 开源平台Dify成为GitHub最受欢迎国产智能体项目;Cluely成立2个月获a16z 1500万美元融资,估值1.2亿美元 [25] - 华为与科大讯飞联合开发"星火Agent云"获国家算力中心10000P优先调度权 [23] 未来发展趋势 - AI PC预计2025年全球出货量突破1亿台,占比40%,直接推动AI Agent装机量增长 [27] - 2026年82%的组织计划整合AI Agent,50%中国500强数据团队将应用相关技术 [28] - 行业竞争从技术竞赛转向"场景理解+生态协同"阶段,垂直领域市场规模潜力达传统SaaS十倍 [27][30]
大厂不再重压ChatBot、“六小虎”声量分化、机器人不依赖绳索“吊着”
财经网· 2025-07-30 22:13
展会规模与参与情况 - 2025年WAIC线下观众达35万人次 [1] - 超过800家展商参展 覆盖大模型、具身智能、AI基础设施及机器人核心零部件等领域 [1][2] 大模型厂商动态 - 百度、阿里、蚂蚁、腾讯等大厂重点展示AI应用 Agent成为竞争焦点 [1][3][6] - 大模型"六小虎"出现分化:百川智能和零一万物未参展 月之暗面与智谱展台规模缩减 阶跃星辰联合芯片厂商组建生态联盟并设10亿元年营收目标 [1][7][8] - 阿里发布三款开源大模型及Agent平台"无影AgentBay" 百度推出GenFlow 2.0 Agent平台支持多智能体协作 [3][6] - 零一万物战略转向to B 推出万智企业大模型平台2.0版本 [7] 智能体(Agent)技术进展 - 全球AI Agents市场规模突破50亿美元 年增长率达40% [4] - 蜜度推出"校对通"多模态智能体 可处理混合文件包并生成勘误报告 [4] - 蚂蚁数科基于Qwen3推出金融推理大模型Agentar-Fin-R1 联合金融机构推出超百个金融智能体解决方案 [6] - 智谱AutoGLM模型实现自主抢红包、淘宝下单等操作 [8] 人形机器人场景落地 - 机器人应用场景分为娱乐表演、工厂作业和家庭服务三大类 实现敲锣打鼓、搬箱子、叠衣服等实际任务 [2][10][11] - 宇树机器人设擂台表演 智元机器人展示跳舞送水等技能 数字华夏机器人表演《夜上海》 [10] - 非夕科技自适应机器人完成蛋雕、按摩、穿关东煮等精细操作 千寻智能机器人Moz1实现递送饮料及走珠任务 [11][12] - 星动纪元、擎朗科技、傅利叶等公司分别展示街舞、食品制作及互动功能 [11] 核心零部件与供应链 - 蓝点触控六维力传感器占国内人形机器人市场70%份额 订单排至9月 2024年工业机器人出货量超4万台 [12] - 传感器研发周期从2-3个月压缩至2-4周 公司完成近亿元B轮融资 计划2028年具备IPO条件 [12][13][14] 算力与基础设施 - 超云展示AI大模型一体机SuperCube R7000等产品 强调高性价比和专业服务 [8][9][10] - 大模型一体机市场快速膨胀 超云通过联合生态伙伴打造解决方案 [10] 技术趋势转变 - 行业从"技术炫技"转向"场景演练" ChatBot隐身 Agent成为主战场 [14] - 多模态、推理能力和低成本成为用户核心需求 [1]