AI前线
搜索文档
Python新版本去GIL刷屏,Karpathy 点赞敢死队,Python 之父:冷静,别神话并发
AI前线· 2025-10-19 13:33
编译 | 核子可乐、Tina 这周,Python 3.14 正式发布,把悬念了多年的"去 GIL(全局解释器锁)"写进官方发行版。 此次更新并非只是一项开关,而是一整套能力同步上线:自由线程支持、并发解释器、改进的调试器支持,以及一个可选的新解释器路径,官方预 估在默认单线程构建不变的前提下还能带来约 3%~5% 的性能提升。 Python 中的自由线程功能可禁用全局解释器锁(GIL),目前已在 PEP 703 中得到完整实现。它还配套了一个自适应解释器思路,源自 Mark Shannon 领衔的 Faster CPython 项目(尽管微软已在今年 5 月停止官方支持,相关成果已沉淀进实现)。 长期以来,GIL 既像安全网也像减速带:通过"同一时刻仅允许运行一个 Python 线程"来保障内存安全、避免许多棘手的并发 Bug,却也限制了 CPU 密集型多线程程序对多核的利用,除非借助繁琐的变通方案。如今,3.14 提供的自由线程(no-GIL)构建移除了这道栅栏,使多线程能够真 正并行,重计算场景下的性能收益尤为明显。当然,权衡也必须看见——单线程速度通常会略有回落,内存占用大约增加 10%。这意味着开发者 ...
谷歌 DeepMind 推出 CodeMender:自动修复代码的智能代理
AI前线· 2025-10-18 13:11
CodeMender技术特点 - 谷歌DeepMind推出由AI驱动的新型智能代理CodeMender,能够自动检测、修复并加固软件漏洞[1] - 该项目基于最新的推理模型与程序分析技术,结合大型推理模型、静态与动态分析、模糊测试以及符号求解器等多种技术来推理程序行为[1] - 系统检测到漏洞时会生成多个修复候选方案,并通过自动化测试验证补丁是否解决根本问题且不破坏现有功能,只有通过验证的修复方案才会提交人工最终审查[1] 实际应用成效 - 在过去六个月中,CodeMender已为开源项目贡献72个经过验证的补丁,其中一些项目的代码量超过400万行[1] - 早期修复案例包括修复XML栈处理错误相关的堆缓冲区溢出问题,以及通过复杂代码修改解决对象生命周期管理漏洞[2] - 系统支持主动防御机制,例如自动为广泛使用的libwebp图像库添加安全注解,防止特定类型的缓冲区溢出攻击在未来被利用[2] 行业反响与影响 - 社区反响普遍积极,认为自动化修复让AI从"发现风险"迈向"主动强化基础设施",验证层是关键信任因素[3] - 行业讨论认为未来黑客也会使用类似模型寻找漏洞,拥有最新模型和最强算力的一方将占据优势[4] - DeepMind强调所有CodeMender生成的补丁在正式合并前都会经过人工审核,可靠性"和"透明性"是项目核心原则[4]
沉痛悼念!杨振宁逝世,享年103岁;传智谱AI解散数十人产研中心,有人当天就走;李书福儿子创立具身智能公司被曝解散|AI周报
AI前线· 2025-10-18 13:11
行业热点事件 - 智谱AI在9月底进行组织调整,商业化部门旗下的产研中心约60人团队被整体解散,其中一半员工离职,另一半分流至交付部门,赔偿标准为N+1 [5][6] - 李书福之子李星星创立的具身智能公司一星机器人被曝解散,该公司于2025年5月成立,上个月刚完成数亿元种子轮融资,技术团队已遭哄抢 [8][10] - OpenAI CEO宣布ChatGPT将于2025年12月推出支持成人内容的版本,仅限于经过验证的成年用户使用 [17] - 甲骨文在AI World大会上宣布,30天内与四家公司签订了650亿美元新的云基础设施合同,公司预计到2030财年云基础设施收入将增长至1660亿美元 [18] - 大量用户反馈iPhone17新机出现无法激活问题,苹果客服回应为服务器问题正在维修,同时苹果宣布纯eSIM机型iPhone Air将于10月22日全面发售 [20][21] - 前滴滴高级副总裁付强正式加入蘑菇车联出任公司总裁,全面负责AI业务的战略落地与商业化布局 [22] - 蚂蚁集团宣布组织架构调整,将搜索、广告、推荐的工程与算法团队合并成立AIRS部门,全面承接短视频、短剧、直播等所有内容相关业务 [23] - 小米与北京大学联合署名论文发表于arXiv,曾被曝获雷军千万年薪招募的DeepSeek前核心开发者罗福莉出现在通讯作者之列 [24][25] - 成都警方通报小米SU7碰撞后爆燃事故,经检测当事人涉嫌酒后驾驶机动车,事故造成当事人死亡 [26] 大模型技术发布 - 百度正式发布并开源自研多模态文档解析模型PaddleOCR-VL,该模型参数仅0.9B,在OmniBenchDoc V1.5评测中以92.6分取得全球第一成绩 [28][29] - Manus发布通用AI代理系统Manus 1.5,平均任务完成时间从15分钟缩短至不足4分钟,效率提升近4倍,复杂任务质量提升约15% [30] - 阿里旗下通义千问正式推出Qwen Chat Memory功能,使模型能够在多轮对话中记住用户偏好、习惯及过往交流内容 [31] - 李飞飞团队发布实时生成世界模型RTFM,能够与用户交互时实时生成视频,单张H100 GPU即可运行 [32] - 火山引擎发布豆包大模型系列更新,截至2025年9月底,豆包大模型日均tokens调用量已突破30万亿,相比今年5月底增长超80% [33] - 甲骨文推出新一代云端AI超级计算机OCI Zettascale10,峰值性能可达16zettaFLOPS [34] - 智元机器人发布新一代工业级交互式具身作业机器人精灵G2,目前已获数亿元订单并开启首批商用交付 [35] - Anthropic推出小型AI模型Claude Haiku 4.5,编码性能与Sonnet 4基本持平,成本仅为后者三分之一,处理速度提升超过两倍 [37][38] - 英伟达宣布AI超级计算机DGX Spark正式交付,提供1 PFLOP AI性能和128GB统一内存,可本地运行最高2000亿参数的AI模型推理 [39] 企业应用与合作 - 微软宣布Windows 11的Copilot应用正式支持语音唤醒指令"Hey Copilot",同时在所有市场上线Copilot Vision功能 [42] - 影目科技发布新一代AI智能眼镜INMO GO3,并宣布打造AI+AR产业生态平台影目世界,携手腾讯、蚂蚁集团、智谱AI等公司共建原生内容生态 [42] - 华泰证券上线AI原生应用"AI涨乐",该应用为国内首个专注交易场景的AI原生应用,推出语言用户界面主打盯盘和选股功能 [42] - 沃尔玛宣布与OpenAI建立合作,消费者可在ChatGPT内直接购物并使用即时结账功能 [42] - 谷歌与世界银行宣布建立全新联盟,合作聚焦部署开放网络堆栈,整合谷歌云AI技术与世界银行发展专长 [42] - X旗下AI助手Grok正式推出即时语音搜索功能,用户可通过语音直接触发网页搜索并获取答案 [42]
“Claude Skills很棒,可能比 MCP 更重要”
AI前线· 2025-10-17 15:00
Claude Skills 产品概述 - Anthropic 发布 Claude Skills,这是一种让模型获取新功能的全新模式 [2] - Skill 是一个包含 SKILL.md 文件的目录,内含为代理提供附加功能的指令、脚本和资源 [4] - Claude 只会在 Skill 与当前任务相关时才会调用,使用后能更好地完成特定任务,例如使用 Excel 或遵循组织内部的品牌指南 [5] Skills 的技术实现机制 - 会话开始时,Claude 会扫描所有可用 Skill 文件,并从 Markdown 文件的前置 YAML 中读取简短说明,每 Skills 仅占用几十个额外 token,具有极高的成本效益 [6] - Skills 机制的实现依赖于模型能够访问文件系统、具备导航工具以及在该环境下执行命令的能力 [12] - Skills 将复杂部分交给大模型框架和计算机环境处理,本身更接近大模型的精髓——提供文本让模型自行解决问题 [27] Skills 的实际应用案例 - Claude 的全新文档生成功能完全通过 Skill 实现,现已被纳入 Anthropic 代码库,涵盖.pdf、.docx、xlsx 以及.pptx 文件 [4] - slack-gif-creator skill 示例可创建专为 Slack 优化的 GIF 动图,包含尺寸约束验证器,Slack GIF 的最大体积不会超过 2 MB [7][10] - 通过设置装满 Skills 的文件夹,可以构建"数据新闻智能体",实现从获取人口普查数据到发布可视化结论的全流程自动化 [16][19] Skills 与 MCP 的竞争优势 - 相比模型上下文协议(MCP),Skills 避免了 MCP 对 token 的大量消耗问题,GitHub 官方 MCP 本身就消耗了巨量上下文 token [18] - 几乎一切原本需要 MCP 实现的功能,现在都可以用 CLI 工具解决,大模型知道如何调用 cli-tool –help 并自行处理 [20] - Skills 非常易于共享,预计将有大量 Skills 以单文件形式实现,更复杂的则采取文件夹形式包含更多文件 [21] Skills 的跨模型兼容性与生态展望 - Skills 能与其他模型配合使用,例如将 Codex CLI 或 Gemini CLI 指向 Skills 文件夹,整个流程可以正常起效 [23] - 预计后续将迎来 Skills 生态的寒武纪大爆发,相比之下今年的 MCP 热潮都显得平淡无奇 [24] - Claude Code 不仅仅是一款编码工具,更是一款通用型计算机自动化工具,可视为一种通用智能体 [15]
智元精灵 G2 重磅发布,首批订单过亿,多场景作业能力拉满
AI前线· 2025-10-17 11:39
产品发布与市场表现 - 智元机器人于2025年10月16日正式发布新一代工业级交互式具身作业机器人智元精灵G2 [2] - 精灵G2在首发前已获得数亿元订单并开启首批商用交付 [3] - 公司将于10月16日下午与均普智能联合举办G2线下全球首发暨投产仪式并同步开启与均胜电子过亿元采购合同的首批交付 [18] 产品性能与技术升级 - 精灵G2在各项功能和参数上均较G1进行大幅升级搭载高性能关节执行器、多种传感器和高性能AI计算平台实现全场景全向避障和高精度力控作业 [5] - 产品腰部采用3自由度设计实现近似人类的弯腰、转腰和侧向摆动能力配置全球首款十字腕力控臂全臂搭载高精度关节扭矩传感器 [6] - 续航方面G2可自主回到充电站补能并拥有双电池热插拔换电能力满足24小时工厂产线节拍 [7] - 基于自研通用基座大模型GO-1和世界模型GE-1 G2处理复杂和长程任务能力得到全面提升 [10] - 得益于英伟达Jetson Thor T5000高达2070 TFLOPS的本地算力G2能够实时响应与决策本地处理多路传感器数据延迟低于10 ms [11] 交互与操作能力 - 精灵G2全面支持多人实时智能交互可基于知识库个性化定制讲解内容并根据语境切换讲解员人设和音色 [9] - 产品具备超低延迟遥操作功能在超视距遥操作情境下可实现高精度控制如精准射中飘动的气球 [11][13] - G2的力控臂反应柔顺工程师演示中用生鸡蛋推动臂膀以展示其柔顺反应 [9] 应用场景与商业落地 - 精灵G2具备工业、物流、导览等多场景通用能力 [2] - 在汽车零部件生产车间G2被应用于汽车安全带锁芯的生产流程完成压紧、物料搬运等操作 [14] - 在精密操作场景中G2基于真机强化学习算法仅耗时一小时即可学会内存条插接类精密柔性操作任务 [16] - 在物流分拣环节G2用于包裹供包上料其移动能力可适配95%以上的工厂地面 [16] - 在商业导览场景G2展现强大交互能力和拟人化肢体语言周身传感器使其具备全向感知和危险预判能力 [16] - 除已落地场景外公司还在积极探索安检、巡检、教育、科研等应用方向以拓宽客户群体和落地场景 [16]
程序员用AI写歌还赚钱了!用AI 批量生产“爆款”,这个副业“杀疯了”?
AI前线· 2025-10-17 11:39
AI音乐创作的发展现状 - AI参与创作的作品频繁出圈,例如原神玩家使用Suno作曲的《奥奇坎竟是我自己》在B站获得近640万播放量[2] - 程序员Yapie使用DeepSeek和Make Best Music工具创作的《七天爱人》上线网易云音乐后播放量迅速突破200万次,评论超4600条,并跻身主流榜单[3] - 该歌曲版权卖出数万元,实现了商业突破,为大众AI音乐变现带来启发[3] - 截至2023年,AI已生成超过一亿首乐曲,预计AI音乐市场收益将在2026年达到70亿美元,到2030年将占据50%的音乐市场份额[9] 创作者对AI态度的转变 - 创作者对AI的态度从2023年的担心被替代、充满不屑排斥,转变为2024年将AI作为助手和灵感来源,如今已不再争论"用不用"而是讨论"怎么用好AI"[8] - 网友Chaosprint表示,早期AI音乐音质较"糊",但现在扩散模型推动音质改善,人声合成和转换变得更为实用[6][7] - 当前AI创作工具已能生成"60分水平"的合格作品,保证有个人特色并满足基础创作需求[16] AI在音乐创作中的角色定位 - AI是执行者,人类负责定义问题与目标,通过不断反馈迭代、个性化记忆和设置创作边界来引导模型[10] - 技术能解决80%的工作,人类解决10%的错漏和10%的画龙点睛[10] - AI当前的核心价值是"补位":帮助普通人实现创作无需学习乐理,对专业创作者则是提升效率而非取代[10] - AI让创作大量内容变得容易,未来音乐创作趋势是"品味比技能更重要",能从海量内容中筛选好作品的人将更受认可[16] AI音乐技术进展与挑战 - 早期AI创作规则简单输出粗糙,如今大模型基于文本就能深刻理解情感与语义关系并生成完整音乐作品[11] - Suno采用Transformer架构,其竞争优势在于音频表征创新而非模型架构创新[11] - 生成速度是重要指标,10秒延迟比8秒差,会影响用户体验[12] - AI音乐在情感叙事、高端真人感、互动和实时方面还有优化空间,难以实现创新性词曲创造和复杂多曲风节拍设计[11][16] 未来发展方向 - 未来将出现"AI创作操作系统"或全能平台,特征包括统一创作者工作空间和全局理解与任务协作[12][15] - 工具提供方需要集成优质AI能力,优化工具流与工作流,降低成本,让创作流程简单高效[12] - GPU开销是很大支出项,厂商们希望GPU价格下降但大概率会使用更多GPU以持续进行高质量研究和技术迭代[13] - 人类创作者的壁垒在于"道"而非"术",包括如何理解世界、解构问题以及表达独特的生活感悟[15]
模力工场 015 周 AI 应用榜:学而思九章大模型登榜,科研人狂喜!AIspire一键帮你读文献
AI前线· 2025-10-16 12:37
模力工场秋季赛榜单概览 - 秋季赛进行中,公布周榜单,包括应用点赞榜、应用热评榜、应用传指榜、模力开发者榜、硕力推荐人榜、硕力体验官榜以及城市榜单[2][3] - 应用榜单排名前列的包括Ai好记、Lab4Al、LLIMA、DeepPath、Deep Innovation、AiPPTcn、Unicom Hunter等[3] - 城市榜单显示北京有41个应用,杭州有11个应用,深圳有13个应用[3] 第008周AI应用榜总览 - 本周共有7款AI应用上榜,覆盖科研、编程、办公、教育等多个场景,展现AI应用生态的多样性与深化趋势[6] - 上榜应用包括AIspire科研国际版、码上飞、凤希AI伴侣、办公小浣熊、学而思九章大模型、文心一言、讯飞星辰Agent开发平台[7] - 趋势显示科研与教育场景的AI助手正进入生产力阶段,而面向开发者与职场人群的AI平台则在完善底层能力,使其更“好用”[6] 榜首应用AIspire科研国际版深度分析 - AIspire是一款辅助论文阅读、管理、写作的AI助手,利用大模型技术在科研全生命周期为用户提供个性化辅助[7][10] - 开发者刘强为公司创始人&CEO,有16年大数据与AI实践经验,主导过日数据量10T+的C端产品AI平台建设[9] - 产品支持19种主流语言,提供个性化科研资讯推送、论文智能阅读、文献管理及论文写作等功能[10][12] - 公司使命是将人工智能与人类直觉融合,重新定义科学探索方式,愿景是构建全球领先的智能科研协作平台[13] 本周重点应用亮点 - 办公小浣熊定位为表格分析、对话式办公的AI数据助手,用户可通过一句话让Excel自动分析、算数、画图[15] - 凤希AI伴侣主打AI普惠生态与零门槛开发,帮助用户无需编程即可培养专属AI伙伴[16] - 学而思九章大模型能解决小初高各科学习问题,提供实时答疑[7] AI应用生态趋势解读 - 本周榜单关键词为“智能执行”,AI正从灵感助手进化为工作伙伴,真正接管日常工作流[17] - AIspire实现科研流程自动化,讯飞星辰打通开发到部署全链路,办公小浣熊让表格“听懂人话”,学而思九章推动教育AI个性化[17] - AI应用不再仅是想法的延伸,而是任务的执行者,标志着行业向深度生产力工具演进[17] 模力工场平台机制与合作机会 - 榜单权重维度以评论数为核心指标,代表社区真实反馈,收藏与点赞为次级指标[18] - 平台正在火热招募合伙人,联合多方资源打造开发者与用户的嘉年华,征集技术资源、品牌资源及资金宣传支持[3] - 极客邦科技将借助旗下品牌资源为上榜应用进行传播,触达千万级技术决策者与开发者[19]
最新版议程!12 场精品闭门会任你选|GTLC 成都站来袭
AI前线· 2025-10-16 12:37
大会核心信息 - 大会主题为“AI新‘蜀’光”,旨在展现AI区域发展的独特性和中国AI的探索突破状态 [2] - 大会将于2025年10月25日在成都菁蓉国际举办 [3][4] - 大会由TGO鲲鹏会主办,该平台拥有超2000位由科技背景创始人、CXO等组成的学员网络 [28] 议程与活动亮点 - 主议程包含多场高质量主题演讲,涵盖AI大模型应用场景展望、AI+智能硬件、AI+教育、传统企业转型等议题 [6][7][8][10][11] - 设置7场专题午餐闭门会、3场午餐饭团及2场主题闭门会,以促进深度交流 [4][17] - 演讲嘉宾来自飞表AI、安克创新、华润啤酒、元戎启行、万界数据、彩食鲜、百融AI、智绘未来、雾境网络等公司 [6][7][9][10][11] 参会规模与价值 - 预计汇聚300余位科技领导者 [12][23] - 普通门票价格为2999元/人,TGO鲲鹏会学员可免费参与 [25][27] - 据不完全统计,过往大会超半数参会者为科技公司技术一号位 [2]
Anthropic新模型杀疯了!成本直降 2/3、性能直逼GPT-5,用户实测:比“吹”的还强,速度超 Sonnet 3.5 倍
AI前线· 2025-10-16 12:37
Claude Haiku 4.5 产品发布与核心特性 - Anthropic 发布 Claude Haiku 4.5 版本并面向所有用户开放,该模型是其最小型模型的最新版本 [2] - 官方宣传其性能与 Sonnet 4 相近,但成本仅为后者的三分之一,速度却超过两倍 [2] - Haiku 4.5 是一款混合推理模型,能根据处理请求的需求灵活调整计算资源量,默认使用有限硬件资源,用户可开启“扩展思考”模式以生成更复杂但耗时更长的响应 [3] - 该模型能够处理包含多达 20 万个 token 信息的多模态提示词,每次响应最多可输出 6.4 万个 token,使其能处理大型商业文档 [3] - Haiku 4.5 已在全平台上线,开发者可通过 Claude API 调用,定价为每百万输入 tokens 1 美元,每百万输出 tokens 5 美元,而 Sonnet 4.5 的定价是其三倍 [9] 性能基准测试表现 - 在计算机使用能力上,Claude Haiku 4.5 优于该公司 5 月推出的中型模型 Claude Sonnet 4,在代码生成能力方面与 Claude Sonnet 4 以及 OpenAI 最新模型 GPT-5 相近 [4] - 在 SWE-Bench 验证基准测试中得分为 73%,在 Terminal-Bench 基准测试中得分为 41%,成绩低于 Sonnet 4.5,但与 Sonnet 4、GPT-5 以及 Gemini 2.5 持平 [4] - 在 OSWorld 基准测试中得分达 50.7%,显著超过 Sonnet 4 的 42.2% [7] - 借助 Python 工具支持时,该模型数学任务得分达 96.3%;即便不使用工具,也保持 80.7% 的表现 [7] - 在以终端为核心的编码任务中,Haiku 4.5 得分 41.0%,优于 Sonnet 4 的 36.4% [7] - 在多项基准测试中,Haiku 4.5 表现与主流模型相当,例如在 Agentic coding 任务中得分为 73.3%,接近 Sonnet 4 的 72.7% 和 GPT-5 的 72.8% [9] 安全性、成本优势与市场定位 - Haiku 4.5 的风险行为发生率较低,对齐表现显著优于前代产品 Haiku 3.5,在自动对齐评估中总体未对齐行为率显著低于 Sonnet 4.5 和 Opus 4.1,成为公司目前最安全的模型 [9] - 新版本对免费版本具备特殊吸引力,因能提供强大功能同时将服务器负载降至最低,意味着所有用户都能通过 Claude.ai 免费使用接近前沿水平的智能 [2] - 用户测试反馈显示,Haiku 4.5 速度大概是 Sonnet 的 3.5 倍,用户体验感更好 [10] - 公司明确其市场定位:Sonnet 4.5 仍是性能最强的模型,而 Haiku 4.5 为用户提供了在追求接近前沿性能时更高成本效益的理想选择 [12] 多模型协同与企业应用场景 - Haiku 4.5 的轻量级特性使其易于并行部署多个智能体,或与更复杂模型搭配使用,例如 Sonnet 4.5 可将复杂问题拆解,协调多个 Haiku 4.5 模型组成“团队”并行完成子任务 [13] - 企业可让 Haiku 监控金融数据流,因其体型更小、成本更低、速度更快能处理更大体量数据,随后将初步洞察移交 Sonnet 进行更深入分析 [13] - 分析师指出,Anthropic 设计 Haiku 的初衷是为了辅助 Sonnet,带来高得多的成本效益比,企业应通过混合使用大型与小型模型来提升 AI 工作流的成本效益 [14] - Haiku 4.5 最直接的应用场景可能出现在软件开发工具领域,因其低延迟特性,已有企业反馈其“解锁了一整套全新应用场景” [14] 企业客户反馈与性能验证 - 代码初创公司 Augment 的联合创始人表示,该模型达到了接近前沿水平的代码生成质量,兼具极快速度与成本效益,在内部测试中实现了 Sonnet 4.5 90% 的性能 [15] - 另一家代码初创公司 Windsurf 首席执行官称,Haiku 4.5 模糊了速度、成本与质量之间传统权衡的界限 [15] - 演示软件公司 Gamma 的联合创始人表示,Haiku 4.5 在幻灯片文本生成的指令遵循能力上准确率达 65%,优于其付费层级模型的 44%,这对单位经济效益是颠覆性改变 [16] Anthropic 业务增长与行业趋势 - Anthropic 业务呈爆发式增长,月度年化收入即将突破 70 亿美元,而 8 月公布的数据为 50 多亿美元,公司设定的 2026 年年化收入目标为 200 亿至 260 亿美元,较当前水平增幅将超过 200% [18] - 公司服务的企业客户已超 30 万家,企业级产品收入约占总营收的 80%,其代码生成工具 Claude Code 年化收入已接近 10 亿美元 [18] - 行业正从“AI 错失恐惧期”转向要求可量化的投资回报,企业考量聚焦于具体的生产力提升 [19] - 五个月内,AI 性能保持稳定但价格降了原先的三分之二,若趋势持续,如今先进的 AI 能力一年内可能变得常规且廉价,AI 的基本经济逻辑正以惊人速度转变 [19] - Anthropic 估值达 1830 亿美元,正紧追估值达 5000 亿美元的 OpenAI 等竞争对手 [20] - Anthropic 押注 AI 的未来不属于能打造单一最强模型的企业,而属于能以合适价格、速度提供合适智能并让所有人都能获取的企业 [21]
蚂蚁开源万亿参数思考模型 Ring-1T,综合能力逼近 GPT-5、数学能力对标 IMO 银牌
AI前线· 2025-10-15 15:45
模型发布与核心能力 - 蚂蚁集团正式推出并开源万亿参数思考模型Ring-1T [2] - 模型在IMO2025赛题解题中达到银牌水平 一次解出第1、3、4、5题 [2] - 在人类偏好对齐测试Arena-Hard V2中取得81.59%的成功率 位居开源模型榜首 [3] - 在医疗问答HealthBench测评中以最高分取得开源领域最佳成绩 [3] 技术创新与工程实现 - 采用自研"棒冰(icepop)"算法解决万亿参数模型训推精度差异难题 [5] - 自研高性能强化学习系统ASystem 实现单机显存碎片秒级回收和权重零冗余交换 [6] - 模型基于Ling 2.0架构 采用稀疏MoE、1/32专家激活比、FP8混合精度等技术 [8] - 通过LongCoT-SFT + RLVR + RLHF多阶段后训练提升复杂推理和通用能力 [8] 产品矩阵与战略发展 - 蚂蚁百灵大模型已发布18款模型 形成从160亿到1万亿参数的产品矩阵 [9] - 拥有两款万亿参数模型:通用大语言模型Ling-1T和思考模型Ring-1T [9] - 随着两款万亿模型发布 百灵大模型正式步入2.0阶段 [9]