Workflow
CogVideoX
icon
搜索文档
清华SageAttention3,FP4量化5倍加速!且首次支持8比特训练
机器之心· 2025-06-18 17:34
随着大型模型需要处理的序列长度不断增加,注意力运算(Attention)的时间开销逐渐成为主要开销。此前,清华大学陈键飞团队提出的即插即用的 SageAttention 和 SageAttention2 已经被业界及社区广泛的使用于各种开源及商业的大模型中,比如 Vidu,CogvideoX,Mochi,Wan,HunyuanVideo,Flux,Llama3,Qwen 等。 近日,清华大学陈键飞团队进一步提出了针对 BlackWell 架构的首个全 FP4 量化的即插即用注意力算子( SageAttention3 )。实现了 5 倍相比于 FlashAttention 的 即插即用的推理加速 (此前的 SageAttention V1/V2/V2++ 分别达到了 2.1,3,3.9 倍的加速效果),比如在 RTX 5090 上,SageAttention3 达到了 1040 TOPS 的速 度,甚至是比 RTX 5090 昂贵十几倍的 H100 上使用 Hopper 独有的 FlashAttention3 还要快 1.65 倍!SageAttention3 在多种视频和图像生成等大模型上(包括 Hunyua ...
AI生成视频总不符合物理规律?匹兹堡大学团队新作PhyT2V:不重训练模型也能让物理真实度狂飙2.3倍!
机器之心· 2025-05-19 12:03
本文由匹兹堡大学智能系统实验室(Intelligent Systems Laboratory)的研究团队完成。第一作者为匹兹堡大学的一年级博士生薛琪耀。 当前文本生成视频(T2V)技术正在从注重视觉质量与模型规模的扩展阶段,迈向更关注物理一致性与现实合理性的推理驱动阶段。 物理规律作为建模现实世界的基本知识体系,是实现高质量视频生成的关键约束。提升大模型对现实物理动态的理解与遵循能力,成为推动 T2V 技术落地 的重要突破方向。 为推动物理一致性驱动的 T2V 生成研究,来自匹兹堡大学的研究团队提出了 PhyT2V 框架,并在最新论文中系统阐述了该方法的核心机制,该论文已被 CVPR 2025 接收。 论文标题:PhyT2V: LLM-Guided Iterative Self-Refinement for Physics-Grounded Text-to-Video Generation 论文地址: https://arxiv.org/abs/2412.00596 该方法不依赖模型重训练或大规模外部数据,而是通过引入大型语言模型引导的链式推理与迭代自我修正机制,对文本提示进行多轮物理一致性分析与优 化,从而 ...
ICML 2025 | 视频生成模型无损加速两倍,秘诀竟然是「抓住attention的时空稀疏性」
机器之心· 2025-05-07 15:37
自 OpenAI 发布 Sora 以来,AI 视频生成技术进入快速爆发阶段。凭借扩散模型强大的生成能力,我们已经可以看到接近现实的视频生成效果。但在模型逼真度不 断提升的同时,速度瓶颈却成为横亘在大规模应用道路上的最大障碍。 当前最好的视频生成模型 Wan 2.1、HunyuanVideo 等,在单张 H100 GPU 上生成一个 5 秒的 720p 视频往往需要耗时 30 分钟以上。主要瓶颈出现在 3D Full Attention 模块,约占总推理时间的 80% 以上。 为了解决这个问题,来自加州伯克利和 MIT 的研究者们提出了联合提出了一种新颖的解决方案: Sparse VideoGen。 这是一种 完全无需重新训练模型 的视频生成加速方法。通过挖掘注意力机制中的 空间与时间稀疏性 ,配合 自适应稀疏选择与算子优化 ,成功将 推理时间减半 。令人惊讶的是,它生成的视频与 Dense Attention 方法相比, 几乎没有肉眼可见的差别 ,保持极高的像素保真度 (PSNR = 29)。Sparse VideoGen 也是第一个能够 达到这种级别的像素保真度的方法。 目前,Sparse VideoGen ...
智谱与生数科技达成战略合作:推进国产大模型的技术创新与产业落地
IPO早知道· 2025-04-27 20:38
清华系两家明星AI公司。 在联合研发方面,智谱自主研发 GLM大模型系列,在语言模型和多模态模型方面技术领先,其中开 源视频生成模型CogVideoX在github获得超过1万star。生数专注于自主研发多模态通用大模型, 提供领先的视频生成及多模态生成产品。 智谱与生数两家清华系中国 AI领军公司战略联合,基于双方在多模态领域的技术积累强强组合,不 仅能够进一步提升国产大模型的综合实力和领先水平,更能推动国产大模型行业生态良性的创新合力 与繁荣发展。 本文由公众号IPO早知道(ID:ipozaozhidao)原创撰写,如需转载请联系C叔↓↓↓ 本文为IPO早知道原创 作者| Stone Jin 微信公众号|ipozaozhidao 据 IPO早知道消息, 清华系两家明星 AI公司 日前达成 战略合作 —— 智谱 (Z.ai) 与生数科技 (shengshu.com)宣布将基于各自在大语言模型和多模态生成模型的技术积累和优势,在联合研 发、产品联动、解决方案整合、行业协同等多方面强强联合,共同推进国产大模型的技术创新与产业 落地。 根据战略协议,在产品合作方面,智谱 MaaS平台将接入生数科技Vidu API ...
智谱正式启动A股IPO:B、C两端业务齐发力,今日再开源性能顶尖模型
IPO早知道· 2025-04-15 09:18
公司IPO进程 - 公司于2025年3月31日同中金公司签署辅导协议,正式启动A股IPO进程,成为"大模型创业公司"中第一家正式启动上市流程的企业 [3][5] 技术研发与产品迭代 - 公司成立于2019年,致力于打造新一代认知智能大模型,2020年底研发GLM预训练架构,2021年训练完成百亿参数模型GLM-10B并利用MoE架构训练出万亿稀疏模型 [5] - 2022年研发中英双语千亿级预训练模型GLM-130B并开源,2023年推出千亿基座对话模型ChatGLM并两次升级,开源版本ChatGLM-6B支持本地微调和部署 [5] - 2024年1月推出GLM-4,性能大幅提升,6月开源GLM-4-9B及视觉模型GLM-4V-9B,多模态能力媲美GPT-4V,7月推出视频生成模型CogVideoX,推理速度提升6倍 [5] - 2024年8月升级GLM-4-Plus,10月发布GLM-4-Voice和AutoGLM,11月推出GLM-PC探索"无人驾驶"PC技术,12月发布GLM-Zero-Preview擅长数理逻辑和深度推理 [5] - 2025年1月发布GLM-Realtime支持清唱和2分钟记忆,3月推出AI Agent「AutoGLM 沉思」 [5] 产品矩阵与开源策略 - 公司打造对标OpenAI的完整产品矩阵,包括智谱清言、CodeGeeX、CogVLM、CogView等,清言App支持多模态互动 [5] - 践行MaaS理念,通过bigmodel.cn平台提供AI开发资源和企业级解决方案 [5] - 2025年4月15日宣布开源32B/9B系列GLM模型,涵盖基座、推理、沉思模型,推理模型GLM-Z1-32B-0414性能媲美DeepSeek-R1,推理速度达200 Tokens/秒,价格仅为DeepSeek-R1的1/30 [5] - 启用新域名Z.ai整合32B基座、推理、沉思模型,作为最新模型交互体验入口 [7] 融资与战略合作 - 2025年3月连续完成三笔融资:3月3日超10亿元人民币战略融资,3月13日获珠海华发集团5亿元战略投资,3月19日获成都高新区3亿元战略投资 [7] - 联合地方政府打造首个城市级GLM大模型空间和首个省级基座大模型,智能体已接入北京101等十余所学校 [7] - 投资方包括中科创星、达晨财智、君联资本等知名VC,美团、蚂蚁、腾讯等战略投资方,以及北京、杭州、珠海、成都等地国资 [7]
速递丨智谱完成新一轮超10亿元融资,京杭联手重仓押注下一个Deepseek!
Z Finance· 2025-03-03 09:41
图片来源:智谱 当全国目光聚焦于杭州"六小龙 " 的快速崛起时,这座数字经济重镇在生成式AI领域再落关键一子。 ZF获悉, 智谱AI近期完成了由杭州城投产业基金、上城资本等机构联合主导的超10亿元战略投资。 这是杭州国资体系首次在大模型赛道进行战略性布局,甚至早于杭州本土明星企业深度求索 (DeepSeek)。 为何是智谱?开源具有标杆意义 在人工智能技术迭代加速的背景下,开源模式正重构全球AI创新格局。DeepSeek的开源实践揭示了 国产AI技术突破的两大路径:一是通过算法创新降低算力依赖,其自研混合专家架构(MoE)使模型 推理成本降至行业平均水平的30%,二是构建开源生态形成技术反哺闭环,其开源策略吸引全球50万 开发者参与生态共建。这种"技术民主化"趋势正推动中国AI产业从应用层创新向底层技术攻坚跃迁。 开源战略的本质是重构技术壁垒。DeepSeek-R1模型以560万美元成本实现与百亿美元级模型相当性 能,打破了"算力=竞争力"的传统范式,印证了算法优化对硬件依赖的替代效应。这种突破不仅体现 在技术指标上,更反映在产业链话语权重构——通过与华为昇腾等国产硬件深度适配,中国AI企业正 逐步摆脱对CU ...
独家|清华大牛,刚刚融资30亿
投资界· 2024-12-17 08:39
作者 I 刘博 报道 I 投资界PEdaily 这可能是2 0 2 4年最后一笔超级融资。 投资界独家获悉,智谱AI近期完成新一轮3 0亿元人民币融资。据多位知情人透露,此次 新进投资方包括多家战投及国资机构,而君联资本等老股东继续跟投。 过去一年,国产AI融资历历在目。成立于2 01 9年的智谱AI,背后站着一群清华大牛—— CEO张鹏本硕博均毕业于清华,董事长刘德兵、总裁王绍兰同为清华校友。短短五年时 间,智谱AI已成为国产AI标志性企业之一,身后也集结了一支长长的投资人队伍。 尽管今年国内一级市场格外冷清,但AI融资却依旧轰轰烈烈,动辄数亿元的融资比比皆 是,诞生了一批AI超级独角兽:月之暗面、百川智能、Mi nima x、零一万物……这无疑 是中国AI时代最生动的一抹写照。 国产AI爆发。 清华校友联手 要打造中国版OpenAI 这是一家从清华实验室走出的独角兽。 时间回到2 0 0 6年,彼时清华计算机系知识工程实验室(KEG实验室)发布AMi n e r平台, 即利用人工智能的方法,去挖掘自然科学或技术发展的客观规律。其中,张鹏在2 002年 从清华本科毕业后,便作为硕士研究生进入KEG实验室深造 ...