Workflow
MTT S5000
icon
搜索文档
摩尔线程与五一视界完成智驾仿真平台SimOne 4.0适配及优化
北京商报· 2026-02-24 10:38
公司与产品合作 - 摩尔线程与五一视界宣布合作,以摩尔线程旗舰级AI训推一体全功能GPU MTT S5000的算力,深度赋能五一视界下一代智驾仿真平台SimOne 4.0 [1] - 双方已完成系统性适配与深度优化 [1] 技术整合与行业影响 - 合作打通了从大模型感知挖掘、4DGS模型训练到4DGS仿真推理和合成数据生成的关键链路 [1] - 基于MTT S5000,双方正式开启物理AI高置信度闭环仿真与合成数据的全栈国产化新篇章 [1]
又又又一次快速行动:摩尔线程MTT S5000完成对阿里大模型Qwen3.5适配
广州日报· 2026-02-18 11:08
公司技术进展与产品适配 - 摩尔线程宣布其旗舰级AI训推一体全功能GPU MTT S5000已完成对阿里最新大模型Qwen3.5的全方位适配 [2] - 开发者可通过MUSA C编程语言及Triton-MUSA工具链高效完成模型部署与优化 [2] - 在适配过程中,公司验证了MUSA生态两大核心能力:原生MUSA C支持降低了CUDA生态迁移门槛,深度兼容Triton-MUSA让开发者可使用熟悉语法编写算子并运行在其GPU上 [2] - 针对Qwen3.5多模态模型的混合注意力机制,公司实现了原生优化,基于muDNN计算库和MATE开源算子库为长序列处理提供高效支撑,在MTT S5000上实现了该模型的高性能推理 [2] 行业生态与竞争格局 - 摩尔线程在一周内接连对GLM-5、MiniMax M2.5、Qwen3.5等国产顶尖大模型实现了快速跟进与适配 [3] - 这种常态化的敏捷响应机制,源于MUSA架构对主流AI生态的无缝兼容与持续优化的工具链支持 [3] - 这标志着国产算力底座已具备从模型适配到高效部署的全链路支撑能力 [3] - 国产算力与国产大模型相结合的新型生态模式正在逐步形成 [3]
腾讯发布元宝10亿红包活动报告:全网抽奖36亿次,完成AI创作10亿次;摩尔线程:完成对Qwen3.5模型全面适配丨AIGC日报
创业邦· 2026-02-18 09:08
腾讯元宝红包活动与用户行为分析 - 腾讯发布元宝10亿现金红包活动报告 自2月1日至17日 主会场累计抽奖次数超36亿次[2] - 活动期间用户通过「创作」栏完成AI任务超10亿次[2] - 活跃在抢红包一线的用户中 有49%来自三四线及以下城市[2] 行业领袖对生成式AI的观点与展望 - Netflix联合首席执行官Ted Sarandos认为生成式AI将帮助创作者 包括加快制作时间 而非损害就业前景[2] - 其指出AI工具有可能极大地增强创作者讲述精彩故事的能力 且这种可能性远大于被工具取代的可能性[2] - 其预计消费者将青睐AI与知识产权的结合 并认为大量AI“粗制滥造之作”可能不会流行 人们将涌向优质内容[2] 主要科技公司AI产品与生态进展 - Alphabet宣布年度开发者大会谷歌I/O将于5月19日至20日举办 预计将宣布Gemini大模型及其他AI产品更新 并有望正式发布智能眼镜产品[2] - 摩尔线程宣布已在旗舰级AI训推一体全功能GPU MTT S5000上完成对阿里最新大模型Qwen3.5的全方位适配[3] - 此次适配验证了摩尔线程MUSA生态的核心能力 包括原生MUSA C支持可降低CUDA生态迁移门槛 以及深度兼容Triton-MUSA可让开发者使用熟悉语法编写高性能算子[3]
摩尔线程:完成对Qwen3.5模型全面适配
新浪财经· 2026-02-17 22:43
公司产品与技术进展 - 摩尔线程宣布其旗舰级AI训推一体全功能GPU MTT S5000已完成对阿里最新大模型Qwen3.5的全方位适配 [1] - 此次适配展示了公司MUSA生态的成熟度与完备性,开发者可通过MUSA C编程语言及Triton-MUSA工具链高效完成模型部署与优化 [1] 生态与开发者能力 - 在适配过程中,公司验证了MUSA生态的两大核心能力:原生MUSA C支持让开发者可直接进行内核开发,大幅降低CUDA生态迁移门槛 [1] - 深度兼容Triton-MUSA让开发者可使用熟悉的Triton语法编写高性能算子,并通过Triton-MUSA后端无缝运行在摩尔线程全功能GPU上 [1]
摩尔线程完成MiniMax M2.5模型极速适配;马斯克:Grok 4.20版本将于下周正式发布丨AIGC日报
创业邦· 2026-02-16 09:15
AI芯片与硬件适配进展 - 摩尔线程在其旗舰级AI训推一体全功能GPU MTT S5000上,成功实现了对MiniMax新一代大模型MiniMax M2.5的Day-0极速适配 [2] AI对软件开发模式的颠覆性影响 - 马斯克预测,到2026年底,AI将彻底绕过传统编程,直接生成二进制程序,其效率可以超过任何编译器所能产出的结果 [2] - Spotify首席执行官表示,公司一些最高级的开发人员从12月起就再没写过一行代码,他们只负责用AI生成代码并对其进行监督 [2] AI大模型产品迭代加速 - 马斯克宣布,Grok 4.20版本将于下周正式发布,与4.1版本相比,此版本将会有显著的改进 [2]
从Seedance 2.0到AI天团!海淀何以“生成”全球爆款
新浪财经· 2026-02-15 17:14
核心观点 - 以北京海淀区为创新策源地的中国AI产业,特别是“AI+视听”领域,在2026年初迎来一轮密集的产品发布和技术突破,展现出强大的全球竞争力,并正在重塑内容创作与影视制作行业[3][4][5] - 海淀区已形成从芯片、框架、大模型到应用的全产业链生态,产业基础雄厚,政策支持明确,正致力于打造全球人工智能创新高地和产业标杆集聚区[11][23] 行业动态与产品发布 - **字节跳动**发布视频生成模型Seedance 2.0,支持图像、视频、音频、文本四种模态输入,可在60秒内生成带原生音轨的多镜头视频,其多模态参考生成、音视频指令遵循等能力处于业内领先水平[3][4] - **月之暗面**发布新一代开源模型Kimi K2.5,能根据任务需求自主调度多达100个专业背景不同的分身,并行处理高达1500个步骤[5][17] - **生数科技**推出视频大模型Vidu Q3,具备“生成即成片”的声画一体能力,一次生成可输出16秒完整叙事段落,并支持多角色、多语种对话[5][17] - **快手**旗下可灵AI正式全球上线3.0系列模型,旨在将传统多轮协作的影像制作流程整合进单一创作界面,并推出首部AI贺岁动画短片集《马上有戏》[5][17] - **智谱**发布新模型GLM-5,擅长复杂系统工程与长程智能体任务,在真实编程场景体验逼近Claude Opus 4.5,并在全球权威榜单中位居开源第一[6][18] - 截至2月14日,海淀区已累计完成128款生成式人工智能服务备案,占全市59.5%,覆盖政务、科研、教育、文化、旅游、创意、电商、生活服务等多个领域[6][18] 市场影响与用户数据 - Seedance 2.0在海外社交平台持续霸榜,马斯克评论“模型发展速度太快”,美国影视从业者使用后感慨其对好莱坞的潜在冲击[3][4] - 2025年**抖音**日活跃用户已突破6亿,**快手**是拥有4亿日活用户的内容社区[7][19] - 截至2025年12月,**快手可灵AI**已拥有超过6000万创作者,生成超过6亿个视频[7][19] - **生数科技**旗下Vidu用户已覆盖全球200多个国家和地区,超过3000万[7][19] - **字节跳动**的汽水音乐月活跃用户达到1.4亿,日活位居行业第三[4][16] 产业基础与生态优势 - 海淀区聚集了1.23万名人工智能学者,超过2000家AI企业,人工智能核心产业规模近3600亿元[11][23] - 海淀是视听产业核心集聚区,汇聚了央视、中影等国家级影视机构,以及抖音、快手、爱奇艺、百度等视频平台和游戏企业[7][19] - 平台积累的海量用户数据为大模型持续迭代提供了养分[8][20] - 2025年10月,海淀区发布支持“人工智能+文化”、游戏电竞、精品微短剧产业高质量发展的若干措施,为产业发展提供政策支持[8][20] 硬件与基础设施进展 - 2月13日,人工智能芯片公司**寒武纪**市值达到4726亿元[11][23] - **龙芯中科**表示正在全力发展自研中高端显卡9A2000[11][23] - **摩尔线程**曝光旗舰级AI训推一体GPU MTT S5000,据业内人士消息,其实测性能对标英伟达H100,在多模态大模型微调任务中部分性能甚至超越H100[11][23]
焦点关注:摩尔线程完成MiniMax M2.5模型极速适配
每日经济新闻· 2026-02-15 06:05
公司技术进展 - 摩尔线程于2月14日宣布,在其旗舰级AI训推一体全功能GPU MTT S5000上,成功实现了对MiniMax新一代大模型MiniMax M2.5的Day-0极速适配 [2] 产品与模型适配 - 适配工作基于摩尔线程的MTT S5000 GPU完成,该产品被描述为旗舰级AI训推一体全功能GPU [2] - 成功适配的对象是MiniMax公司发布的新一代大模型MiniMax M2.5 [2] - 此次适配实现了“Day-0极速适配”,表明公司在模型兼容与技术支持方面反应迅速 [2]
聊一聊刚刚曝光参数的摩尔线程S5000
傅里叶的猫· 2026-02-14 23:13
摩尔线程MTT S5000产品性能与规格 - 公司AI旗舰计算卡MTT S5000实现GLM-5的“Day-0”适配,推动国产算力生态进入“零时差”响应时代 [1] - MTT S5000是2024年推出的训推一体全功能GPU智算卡,专为大模型训练、推理及高性能计算设计,可对标国际旗舰水准 [3] - 产品硬件参数首次曝光:支持FP8到FP64全精度计算,单卡AI算力(FP8)最高可达1 PFLOPS(即1000 TFlops),显存容量80GB,显存带宽1.6TB/s,卡间互联带宽784GB/s [4] - 液冷版本AI算力为1000 TFlops,风冷版本为920 TFlops [4] - 业内人士表示,MTT S5000实测性能对标英伟达H100,在多模态大模型微调任务中部分性能甚至超越H100 [4] 芯片架构与技术创新 - S5000采用第四代MUSA架构“平湖”,专为大规模AI训练优化 [6] - 依托MUSA全栈软件平台,原生适配PyTorch、Megatron-LM、vLLM及SGLang等主流框架,实现“零成本”代码迁移,兼容国际主流CUDA生态 [6] - 该产品是国内首批最早原生支持FP8精度的训练GPU,配置硬件级FP8 Tensor Core加速单元 [6] - 相比传统BF16/FP16,FP8可将数据位宽减半,显存带宽压力降低50%,理论计算吞吐量翻倍 [6] - FP8引擎全面支持DeepSeek、Qwen等前沿架构,可提升30%以上训练性能 [6] - 在集群通信层面,S5000采用独创的ACE技术,将复杂通信任务从计算核心卸载,实现计算与通信零冲突并行,大幅提升模型算力利用率(MFU) [10] 夸娥万卡集群性能表现 - 基于S5000构建的夸娥万卡集群已落地,其浮点运算能力达到10 Exa-Flops [8] - 在Dense模型训练中,集群的模型FLOPs利用率(MFU)达到60%,在MoE模型中维持在40%左右 [8] - 集群有效训练时间占比超过90%,训练线性扩展效率达95% [8] - 依托原生FP8能力,集群能完整复现顶尖大模型的训练流程,其中Flash Attention算力利用率超过95% [8] - 实测显示,从64卡扩展至1024卡,系统保持90%以上的线性扩展效率,训练速度随算力增加几乎同步倍增 [10] 实际训练与推理案例 - 2026年1月,智源研究院基于S5000千卡集群,完成了前沿具身大脑模型RoboBrain 2.5的端到端训练与对齐验证 [10] - 训练结果显示,与英伟达H100集群的训练结果高度重合,训练损失值(loss)差异仅为0.62% [10] - 在推理场景,2025年12月公司联合硅基流动基于S5000完成对DeepSeek-V3 671B满血版的深度适配与性能测试 [12] - 实测单卡Prefill吞吐超4000 tokens/s,Decode吞吐超1000 tokens/s,刷新了国产GPU的推理纪录 [12]
太豪横!影石公司年会送出5套房,员工:获奖房者均90后、无高管;DeepSeek更新后被指变冷淡!网友:快调回来;荣耀前CEO赵明加入千里科技
雷峰网· 2026-02-13 08:27
影石Insta360年会激励与业绩 - 公司在2026年度年会上送出5套价值百万元以上的大湾区商品房及6辆汽车(含保时捷、理想L7 Pro、新款BMW 3系、特斯拉Model Y),获奖者均为90后员工且无高管,平均年龄不到32岁 [5] - 年会奖品总数超3600份,中奖率高达80%,特等奖为36克定制金钞,一等奖包含3台iPhone 17 Pro等 [5][6] - 创始人刘靖康表示,2025年是公司史上营收规模最高的一年,第四季度营收创近10个季度新高,2025年全年研发投入超过之前三年总和 [6] DeepSeek模型更新引发用户争议 - 公司于2月11日对旗舰模型进行灰度测试,将上下文窗口从128K Tokens大幅提升至1M Tokens,容量增长近8倍 [11] - 更新后用户集体吐槽模型变得“冷淡”,不再称呼用户昵称且语气出现“说教感”,部分用户号召向官方提意见希望恢复深度思考与共情能力 [11] - 业内人士透露新版本为“极速测试版”,旨在为2026年2月中旬发布的V4版本做压力测试,下一代旗舰模型将是万亿参数级别,因训练速度放缓导致发布延后 [12] 科技公司高管变动与战略 - 荣耀前CEO赵明于2月12日官宣加入千里科技,将重点推进AI商业模式闭环战略,公司董事会已提名其为非独立董事候选人 [15] - 亚马逊AWS大中华区裁员约150人,裁员按降本20%目标推进,主要集中在二线部门及年龄较大、薪资较高的员工 [14][15] 字节跳动视频模型进展 - 公司视频生成模型Seedance 2.0于2月12日正式上线,接入豆包App、电脑端和网页版,可生成5秒或10秒视频或创建真人视频分身 [18] - 马斯克在社交平台评论Seedance 2.0“发展速度太快”,模型综合表现达行业领先,但在细节稳定性等多方面仍有优化空间,暂不支持上传真人图片生成明星相关视频 [18][19] 汽车行业销量与交付 - 小米YU7在2026年1月以37869辆的零售销量成为中国销量最高的乘用车,远超第二名博越L的34176辆,小米汽车1月整体交付量超3.9万台 [35] - 小米汽车2025年全年交付量达411837辆,同比暴涨200.9%,并设定2026年全年交付55万辆的目标,同比增长约34% [36] - 奔驰集团2025年全球销量为216万辆,同比下滑10%,其中中国市场交付约57.5万辆,同比下滑约19%,为跌幅最大的单一市场 [66] 汽车行业公司动态与事件 - 长城汽车2025年人均年终奖约5万元,若按8.49万员工计算总额将超42.45亿元,有券商透露公司拟预提年终奖46亿元,同比增加8亿元 [25][26] - 理想汽车CEO李想兑现承诺,赴浙江海盐宴请因救人而受关注的理想车主姚东权 [40][41] - 宝马因起动机继电器缺陷在全球召回多款车型,涉及2020年7月至2022年7月间生产的起动机,车辆在行驶中可能存在起火隐患 [56] - 奇瑞汽车被员工吐槽春节请假政策严苛,有部门要求省内员工禁止请假,省外员工仅可申请1天假,且年假无法在此期间使用 [23] 汽车行业政策与声明 - 长城汽车与小米汽车均发布声明,全力支持市场监管总局发布的《汽车行业价格行为合规指南》,反对无底线价格战等行为 [50] - 岚图汽车香港上市已取得港交所原则性批准,东风集团私有化的所有先决条件已达成,岚图将以介绍方式上市且不涉及募资 [71] AI与芯片技术进展 - 摩尔线程AI计算卡MTT S5000性能首次曝光,单卡配备80GB显存,带宽达1.6TB/s,较上代提升113%,单卡FP8 AI算力最高可达1000 TFLOPS(1 PFLOPS) [27][28][29] - 该卡支持FP8精度,相比BF16/FP16可将数据位宽减半、显存带宽压力降低50%、理论计算吞吐量翻倍,训练性能可提升30%以上 [28] - 智谱发布新一代大模型GLM-5,并上调海外版Coding plan订阅价格30%-60%,API调用价格提升67%-100%,为国产大模型近期首次大幅提价 [31] 科技巨头业务动态 - 联想集团FY2025/26 Q3营收达1575亿人民币,同比增长超18%,经调整净利润同比增长36%,摩托罗拉智能手机出货量创历史新高,同比增长9% [47] - 联想董事长杨元庆透露,公司与英伟达的业务规模在过去三到四年间由10亿美元向上翻了约四倍,并设定了未来几年再翻四倍的目标 [47] - 亚马逊在内部限制员工使用Claude Code等第三方AI编程工具,力推自研工具Kiro,引发部分员工批评 [58][59] - Meta宣布投资100亿美元在美国印第安纳州建设新数据中心,设计供电容量为1吉瓦,相当于约80万户家庭用电总和,预计2027年底或2028年初投入运营 [64] AI行业战略与构想 - 马斯克旗下xAI公布新组织架构,划分为四大核心团队,分别聚焦Grok聊天机器人、应用编码系统、Imagine视频生成工具和Macrohard项目 [60] - xAI披露Imagine工具日均生成视频量达5000万条,过去30天生成图片超60亿张,X平台订阅业务年经常性收入已突破10亿美元 [60] - 马斯克提出在月球建设人工智能卫星工厂的构想,工厂将配备电磁弹射装置,以部署具备超强算力的人工智能集群 [61] - 高德即将发布自研具身导航基座模型,让机器人能在开放物理环境下实现跨场景送物、跟随等服务,公司已成立具身业务部 [44] 半导体与硬件业绩 - 华虹半导体2025年第四季度销售收入6.599亿美元,同比增长22.4%,环比增长3.9%,毛利率为13.0% [53][54] - 公司预计2026年第一季度销售收入为6.5~6.6亿美元,毛利率位于13~15%区间 [54] 互联网平台监管与约谈 - 北京市市场监督管理局约谈携程、去哪儿、飞猪等12家火车票网络销售平台,要求禁止明示或暗示付费获得优先购票特权,下架“加速包”等误导性宣传产品 [52] - 河南、安徽、广东等多地市监部门要求外卖平台立即停止低质低价“内卷式”恶性竞争,不得组织恶性补贴、低价倾销 [51] 制药与医疗公司IPO动态 - 京新药业向港交所递交上市申请,公司拥有逾60款获批药品,2025年前十个月收入33.44亿元,2024年收入41.59亿元 [74][75][76] - 玖行能源启动北交所IPO辅导,公司为新能源商用车充换电设备领域的国家级“小巨人”,其充换一体动力电池箱总成2021年至2023年市占率超80% [73] 其他科技公司动态 - 华为余承东宣布尊界S800将再登央视春晚,该车于2025年5月底发布,售价70.8万至101.8万元,第10000台量产车于2025年12月16日下线 [45] - 苹果公司新版Siri升级计划遇阻,多项原定于2026年3月随iOS 26.4发布的功能可能推迟至5月或9月,因测试中出现处理查询问题 [68][69] - 美格智能通过港交所上市聆讯,公司为全球第四大无线通信模块提供商,2024年市场份额为6.4%,2024年总收入29.41亿元 [72]
首曝!国产GPU单卡算力突破1000 TFlops,对标H100
是说芯语· 2026-02-13 08:17
核心观点 - 摩尔线程旗舰AI GPU MTT S5000在精度、算力、效率及生态适配方面实现全面突破,已具备对标并超越国际主流产品(如英伟达H100)的能力,为国产AI算力底座建设树立新标杆,并打破了国际GPU在高端AI算力领域的垄断 [1][12] 产品硬件规格与性能突破 - MTT S5000基于第四代MUSA架构“平湖”打造,单卡AI算力(FP8)最高达1 PFLOPS(1000 TFLOPS),配备80GB显存,显存带宽1.6TB/s,卡间互联带宽784GB/s,支持FP8到FP64全精度计算 [3] - 产品精度已实现对英伟达H100的超越,更贴近其最新的Blackwell架构,成为国产GPU在精度领域的重大突破 [3] - 在智源研究院的千卡集群训练中,MTT S5000训练数千亿参数模型RoboBrain 2.5,与H100集群结果高度一致,训练损失值差异仅为0.62%,模型关键指标误差维持在千分之几,部分任务表现更优 [4] - 在典型端到端推理及训练任务中,性能可达竞品H20的2.5倍左右 [6] 技术创新与效率优势 - 作为国内最早原生支持FP8精度的训练GPU之一,配备硬件级FP8 Tensor Core加速单元,相比传统BF16/FP16,将数据位宽减半、显存带宽压力降低50%、理论计算吞吐量翻倍,可提升30%以上的训练性能 [6] - 独创ACE异步通信引擎,实现物理级“通信计算重叠”,有效释放15%的通信被占算力 [7] - 系统扩展性优异,从64卡扩展至1024卡,能保持90%以上的线性扩展效率,训练速度随算力增加近乎同步倍增 [7] - 基于MTT S5000构建的夸娥万卡集群浮点运算能力达10 Exa-Flops,在Dense模型训练中MFU达60%,MoE模型中维持40%左右,有效训练时间占比超90%,训练线性扩展效率达95%,Flash Attention算力利用率超95% [10] 软件生态与适配能力 - 依托MUSA全栈软件平台,原生适配PyTorch、Megatron-LM、SGLang等主流框架,实现“零成本”代码迁移,兼容CUDA生态 [7] - 在智谱新一代大模型GLM-5发布当日即完成Day-0全流程适配与验证,体现了软硬协同能力 [1][11] - 借助SGLang推理框架打通GLM-5推理全链路,深度释放原生FP8加速能力,在确保模型精度的同时降低显存占用 [11] - 在推理场景中表现卓越,与硅基流动合作的DeepSeek-V3 671B满血版适配测试中,单卡Prefill吞吐超4000 tokens/s,Decode吞吐超1000 tokens/s [10] 行业影响与意义 - 产品成功支撑顶尖大模型端到端训练,彻底打破了“国产芯片只能推理、难以支撑顶尖大模型训练”的行业认知 [4] - 为国产AI产业提供了可靠、高效、高性价比的算力选择,推动中国AI生态朝着自主、可控、蓬勃的方向持续前进 [12] - GLM-5作为全球第四、开源第一的顶尖Coding模型,整体性能较上一代提升20%,与MTT S5000的国产双强联合,在函数补全、漏洞检测等场景中表现卓越,为开发者带来对标国际顶尖水平的编程体验 [11]