ChatGPT框架Apps SDK
搜索文档
蚂蚁、OpenAI、DeepSeek卷疯了!国产最强万亿参数旗舰模型Ling-1T开源
钛媒体APP· 2025-10-09 12:14
蚂蚁集团Ling-1T模型发布 - 蚂蚁集团发布并开源万亿参数通用语言模型Ling-1T,该模型是百灵大模型Ling 2.0系列的首款旗舰模型,也是其规模最大、能力最强的非思考大模型[2][3] - 在有限输出Token条件下,Ling-1T于多项复杂推理基准中取得SOTA表现,在代码生成、软件开发、竞赛数学、专业数学、逻辑推理等高难度基准测试上多项指标位居开源模型榜首[3] - 以竞赛数学榜单AIME 25为例,Ling-1T以平均4000+ Token消耗达到70.42%的准确率,优于Gemini-2.5-Pro的5000+ Token消耗和70.10%准确率,展现出更高的性价比、推理精度和思考效率[3] - Ling-1T沿用Ling 2.0架构,在20T+ tokens高质量高推理浓度语料上完成预训练,支持最高128K上下文窗口,通过演进式思维链提升高效思考和精准推理能力[11] - 该模型全程采用FP8混合精度训练,为已知规模最大的使用FP8训练的基座模型,带来显著的显存节省、更灵活的并行切分策略和15%+的端到端加速[11] - 在强化学习阶段,团队创新性提出以句子为粒度的策略优化算法LPO和新的混合奖励机制,在ArtifactsBench前端能力基准上得分达59.31,在可视化和前端开发任务领域位居开源模型榜首[12] - 除了非思考模型Ling-1T,蚂蚁百灵团队还在训练万亿参数级的深度思考大模型Ring-1T,并于9月30日开源了preview版[14] 全球AI大模型竞争格局 - 国庆中秋假期前后,OpenAI、阿里、智谱、DeepSeek等中美AI大模型加速竞争[4] - 零一万物创始人李开复指出,底座基础模型是一场千亿级别公司的"军备竞赛"[5] - OpenAI发布AI视频模型Sora2,并公布GPT-5 Pro、ChatGPT框架Apps SDK等[9] - DeepSeek发布DeepSeek-V3.2-Exp,全面适配国产算力卡,训练推理提效且API同步降价[9] - 阿里通义发布新一代原生全模态大模型Qwen3-Omni,以及全开源通义DeepResearch模型、框架、方案等[9] - 智谱发布旗舰模型GLM-4.6,凭借SOTA的Agentic Coding能力登顶Hugging Face Trending全球第一、LMArena开源第一全球第四,与Qwen Max Preview并列国内第一[9] AI行业投资与基础设施趋势 - 英伟达CEO黄仁勋指出过去六个月AI计算需求大幅上升,新一代架构Blackwell芯片需求"非常非常高",标志着"新一轮工业革命"开始[6] - 英伟达计划未来十年向OpenAI共计投资1000亿美元,支持部署需要10千兆瓦电力的英伟达系统,相当于400万至500万个GPU[6] - OpenAI CEO奥尔特曼表示技术突破关键在于更聪明的模型、更长的上下文处理能力和更好的记忆系统,AGI的核心在于发现新知识并扩展人类知识边界[6] - 今年以来全球AI领域初创公司已吸引创纪录的1927亿美元风险投资,2025年有望成为首个逾一半风投资金流入AI行业的年份[15] - 最近一个季度,美国风险投资将62.7%的资金投向AI领域公司,全球风险投资该比例为53.2%;今年以来全球风投总额为3668亿美元,其中美国风投达2502亿美元[16] - OpenAI近期完成66亿美元融资,目前估值达5000亿美元,成为全球最有价值的初创公司;其今年前七个月收入大约翻了一番,预计年收入将达120亿美元,并已签下总额近1万亿美元的算力采购协议[16] 蚂蚁集团AI技术战略 - 蚂蚁AGI团队由集团副总裁、首席技术官何征宇负责,其拥有佐治亚理工学院计算机博士学位,曾就职于谷歌并创立开源项目gVisor[11] - 百灵大模型计划聚焦在生活服务、金融服务、医疗健康等场景[11] - 蚂蚁团队认为模型需要能在异构计算单元和分布式集群间切换的技术框架,目标为"不使用高级GPU"来扩展模型[10] - 今年3月,蚂蚁集团利用AI Infra技术开发了两个百灵系列开源MoE模型Ling-Lite和Ling-Plus,参数规模分别为168亿和2900亿,并公布了语音AI框架Ming‑UniAudio、新一代推理模型Ring-flash-2.0等产品[10]