Workflow
TurboDiffusion
icon
搜索文档
让AI沉下来:北京锻造人工智能第一城
北京日报客户端· 2026-01-27 00:49
北京人工智能产业发展现状与目标 - 北京正以“人工智能第一城”的姿态参与全球竞争,凭借人才密度、全栈生态与产业集群三大优势 [1] - 城市目标是在“十五五”期间,用两年时间实现人工智能核心产业规模突破万亿元 [2] - 2025年产业规模约为4500亿元,计划到2027年突破万亿元,实现规模翻倍 [11][12] 产业人才与创新源头 - 北京拥有1.5万名AI学者,占全国总量的30% [4] - 有148人入选AI 2000全球最具影响力学者榜单,占全国比例超过40% [4] - 创新源头高度集中,拥有2个人工智能领域国家实验室、1个国家级人工智能学院及14所设立人工智能学院的高校 [5] - “AI原点社区”等首批4个人工智能创新街区,位于海淀区约3平方公里的科教资源密集区,产业载体达400万平方米 [4] 核心技术突破与协同生态 - 智源研究院推动的FlagOS系统软件栈,作为连接国产AI芯片与大模型的“通用语言”,以每3个月一次的速度迭代 [1][4] - 国产GPU企业摩尔线程联合智源研究院,首次使用基于MTT S5000的千卡集群完成了RoboBrain 2.5全流程训练,验证了国产算力训练高级AI模型的实力 [8] - 生数科技与清华大学联合发布视频生成加速框架TurboDiffusion,将高质量1080P分辨率、8秒视频的生成时间从约900秒压缩至约8秒,速度提升200倍 [6][7] - 面壁智能推出全球首个可部署在端侧的全双工全模态大模型MiniCPM-o 4.5,支持自主回答与更自然的人机交互 [9] 核心产业要素与市场应用 - **算力**:寒武纪、摩尔线程、昆仑芯等国产芯片性能提升,FlagOS提供统一软件生态保障 [10] - **模型**:北京已备案大模型达209款,占全国近30%,形成抖音豆包、智谱GLM、月之暗面Kimi、百度文心四大基础模型及垂类模型矩阵 [10] - **数据**:光轮智能等公司通过构建“数字平行工厂”提供高质量仿真数据,支持机器人并行训练 [9] - **应用与市场**:百度伐谋的自我演化能力将汽车风阻验证时间从10小时压缩至1分钟 [12] 快手可灵AI在2025年12月收入突破2000万美元,对应年化收入运行率达2.4亿美元,其App端付费用户规模在2026年1月较前月增长约350%,日均收入提升约30% [13] 代表性企业动态与资本市场 - 智谱AI于2026年1月在香港联交所上市,被称为“全球大模型第一股” [4] - 生数科技由清华、北大、中科院及阿里、腾讯、字节、百度等企业人才组建,于2024年4月发布中国首个高性能视频大模型Vidu [5][6]
让AI沉下来 北京锻造人工智能第一城
北京商报· 2026-01-26 22:29
文章核心观点 - 北京正凭借人才密度、全栈生态与产业集群三大不可复制的优势,以“人工智能第一城”的姿态在全球AI竞争中脱颖而出,其发展路径清晰,力争用两年时间实现人工智能核心产业规模突破万亿元[3] - 北京的人工智能发展呈现出“高原”与“高峰”并存的格局,拥有从源头创新到全链落地的完整生态,正从中国AI高地迈向世界创新策源地[3][9] 人工智能人才与科研高地 - 北京拥有1.5万名AI学者,占全国30%,其中148人入选AI 2000全球最具影响力学者榜单,占全国超40%[5] - 北京在全球人工智能最具创新力城市中排名第二,拥有2个人工智能领域国家实验室、1个国家级人工智能学院、14所设立人工智能学院的高校[7] - 以“AI原点社区”为代表的首批人工智能创新街区,位于海淀科教资源最密集区域,总面积约3平方公里,产业载体400万平方米,被清华大学、智源研究院等高校和研究机构围绕[4][5] 技术创新与突破 - 智源研究院推动的FlagOS系统软件栈,以3个月一更新的速度迭代,作为连接国产AI芯片与大模型的“通用语言”,能大幅降低产业协同成本[3][5][9] - 生数科技发布中国首个长时长、高一致性、高动态性视频大模型Vidu,其与清华大学联合发布的TurboDiffusion加速框架,能将AI视频生成速度提升200倍,生成1080P分辨率、8秒时长视频的时间从约900秒压缩至约8秒[7][8] - 面壁智能的最新大模型MiniCPM-o 4.5是全球首个可部署在端侧的全双工全模态大模型,支持“自主回答”与更自然的人机交互[10] - 国产GPU企业摩尔线程联合智源研究院完成了RoboBrain 2.5全流程训练,首次验证了国产算力具备具身大脑模型训练实力,模型的“智商”已达到世界水平[9] 全栈产业生态与集群 - 北京正构建一条从国产芯片、仿真数据到原生模型的自主可控、协同高效的AI创新链,算力、数据、算法三要素,芯模云端用全面发力[10] - 在算力基础设施层,寒武纪、摩尔线程、昆仑芯等不同架构国产芯片性能不断攀升,FlagOS提供软件生态统一保障,硅基流动等企业提供训推降本增效方案[11] - 在模型层,北京备案大模型达209款,占全国近三成,形成抖音豆包、智谱GLM、月之暗面Kimi、百度文心四大基础模型和垂类模型矩阵,并涌现出扣子、伐谋、JoyAgent等一批智能体平台[11] - 光轮智能构建的“数字平行工厂”可通过仿真数据,让机器人在虚拟空间进行成千上万次并行训练,模拟真实生产中的突发状况[10] 产业发展目标与市场应用 - 根据《北京人工智能创新高地建设行动计划》,北京市计划用两年左右时间,实现人工智能核心产业规模从2025年的约4500亿元增长至2027年突破万亿元[12][13] - 效率提升是驱动增长的核心引擎,例如百度伐谋的自我演化能力,可将汽车风阻验证的时间从10小时压缩到1分钟[13] - 消费端应用爆发为产业提供广阔市场,快手的可灵AI在2025年12月收入突破2000万美元,对应年化收入运行率达2.4亿美元,其App端付费用户规模在2026年1月较2025年12月增长约350%,日均收入水平提升约30%[14] - 网络安全被视作人工智能技术能够最快落地并见到实效的产业,相关行动计划提及将建设人工智能安全基础设施及安全测试靶场[13] 标志性企业与资本市场动态 - 智谱AI于2026年1月8日在港交所正式挂牌上市,被称为“全球大模型第一股”,其起源地是北京的“AI原点社区”[4] - 生数科技由清华大学、北京大学、中科院等高校以及阿里、腾讯、字节跳动、百度等企业人才组成的团队于2023年3月成立,目标是自主研发多模态通用大模型及应用[7]
从实验室到全球基建:IonQ 百比特算力落子韩国
国泰海通· 2026-01-03 16:21
报告行业投资评级 - 报告未明确给出整体行业投资评级 [1][2][3][4][5][6][7][8][9] 报告核心观点 - 报告核心观点为追踪前沿颠覆技术与创新动态,重点关注先进半导体、人工智能与物理AI、量子科技三大板块的突破性进展,并总结上周科技产业融资、上市及二级市场表现 [1][3][7] 上周科技产业融资概况 - 2025年12月22日至2026年1月1日期间,国内外科技产业共发生196起融资事件,其中国内181起,国外15起 [1][9] - 国内市场中,先进制造、人工智能、企业服务行业的融资事件数分别为101起、39起、22起,位列前三 [1][9] 上周科技企业上市、IPO速递 - **英矽智能在香港主板上市**:公司为AI驱动的药物发现及开发公司,其Pharma.AI平台将候选药物从靶点发现到临床前候选药物的时间从平均4.5年缩短至12-18个月,截至2025年12月18日已产生逾20项临床或IND申报阶段资产 [11] - **天溯计量在深交所创业板上市**:公司为全国性综合型独立第三方计量检测服务机构,截至2025年8月31日拥有专利133项,其中发明专利43项 [15][16] - **诺比侃在香港主板上市**:公司为中国领先的AI场景解决方案提供商,主要服务铁路与电网公司,其接触网悬挂状态缺陷识别解决方案已覆盖中国超过80%的铁路局,累计检测铁路里程约460,000公里 [18][19] - **龙迅半导体(合肥)递交港股招股书**:公司为中国领先的高速混合信号芯片设计公司,产品应用于智能视觉终端、智能车载、VR/AR、AI&HPC等领域,2024年营业收入为人民币4.66亿元 [21][23] - **珠海富士智能递交北交所招股书**:公司为国家级专精特新“小巨人”企业,专注于消费电子与汽车精密结构组件,2024年营业收入为人民币9.75亿元 [24][26] 上周科技产业二级市场表现跟踪 - **大盘指数表现分化**:上周上证指数上涨0.13%,深证成指下跌0.58%,创业板指下跌1.25% [2][26] - **科技子行业涨跌互现**:汽车电子指数周涨幅为1.98%,人工智能指数周涨幅为0.54%,半导体指数周跌幅为0.18%,元宇宙指数周跌幅为0.21% [2][26] - **换手率情况**:上周半导体指数与汽车电子指数换手率较高,分别为8.5%和8.4% [27] - **PE估值变化**:截至2025年12月31日,半导体指数PE为148.82倍,环比上涨4.6%;汽车电子指数PE为38.88倍,环比上涨2.1%;人工智能指数PE为78.06倍,环比下跌0.1%;元宇宙指数PE为52.57倍,环比下跌1.5% [28][29] - **PB估值变化**:截至同期,半导体指数PB为6.73倍,环比上涨1.1%;汽车电子指数PB为4.30倍,环比上涨2.0%;人工智能指数PB为7.60倍,环比下跌0.1%;元宇宙指数PB为5.65倍,环比下跌1.7% [31][32] NextX:前沿颠覆技术与创新动态追踪 先进半导体板块动态 - **超芯星发布高纯度P型SiC衬底**:产品将Fe、Ni、Cr、V等关键金属杂质含量降低数千倍,实现从ppm级到ppb级的跨越,填补国产高端高纯度P型碳化硅衬底空白,旨在推动超高压IGBT可靠性提升 [33][35][37] - **瀚天天成研发全球首款12英寸碳化硅外延晶片**:此举可显著提升下游功率器件生产效率,大幅降低碳化硅芯片单位制造成本,公司2024年全球市场份额已超31% [38][40] - **安谋科技发布“山海”S30FP/S30P SPU IP**:新产品为高性能计算芯片提供全栈安全解决方案,功能安全可达最高等级ASIL D,并支持CC EAL4+及国密二级等高等级安全认证 [41][42] - **日本研究机构确认RuO₂交错磁特性**:实验证实超薄二氧化钌薄膜属于“交错磁”材料,这类材料被视为继铁磁和反铁磁之后的第三类基本磁性体系,有望用于未来高速、高密度磁存储技术 [46][47] 人工智能与物理AI板块动态 - **生数科技与清华开源TurboDiffusion**:该视频生成加速框架在几乎不影响生成质量的前提下,可实现最高达200倍的推理加速,推动AI视频创作迈向“实时生成时代” [50][53] - **华为诺亚与港中文发布SCOPE框架**:该框架通过提示词自我进化优化智能体上下文,在HLE基准测试中将任务成功率从14.23%提升至38.64%,成功率翻倍以上 [58][64] - **厦门大学研发轻量化高精度眼动追踪系统**:该系统采用轻量化深度学习架构,最高凝视估计精度可达1.76度,实时推理延迟为9.71毫秒 [67][68] - **IBM提出SPIRAL规划新框架**:该框架将专用LLM代理嵌入蒙特卡洛树搜索循环,在DailyLifeAPIs数据集上整体准确率达83.6%,较次优框架高出16个百分点以上 [70][75] 量子科技板块动态 - **IonQ向韩国交付100量子比特系统**:全球离子阱量子计算领军者IonQ将100量子位的Tempo系统交付给韩国国家量子计算中心,并集成到KISTI-6超级计算机中,标志着量子计算与传统计算结合的重要一步 [76][77] - **“祖冲之3.2号”实现码距7阈值下量子纠错**:中国科学技术大学团队基于超导量子处理器,在码距为7的表面码上实现了低于纠错阈值的量子纠错,逻辑错误率随码距增加显著下降,错误抑制因子达1.4 [80][84] - **硅基原子处理器实现11量子比特稳定联通**:澳大利亚SQC公司基于硅和磷原子构建的量子处理器实现了11个量子比特的联通,双量子比特门操作保真度最高达99.9% [86][90] - **意大利实现首个单原子成像实验**:ArQuS实验室首次在本土实现对单个囚禁冷原子的成像,成像速度达微秒级,原子保留率超过99.5%,为中性原子量子计算平台观测技术带来突破 [91][92]
计算机行业周报:MiniMax发布MiniMaxM2.1大模型,清华大学发布TurboDiffusion-20251231
华鑫证券· 2025-12-31 21:00
行业投资评级 - 报告对计算机行业维持“推荐”评级 [1] 核心观点 - 英伟达以约200亿美元现金收购AI芯片公司Groq的核心资产,此举旨在巩固其在AI芯片领域的领导地位,并卡位高能效推理赛道,印证了算力赛道的高景气度与推理端的战略价值,报告维持对AI算力板块的长期看好态度 [6][56] - AI技术正从文本交互向多模态、实时交互演进,视频生成进入“秒级”时代,为教育、客服等垂直领域提供了本地化、情感化AI交互界面的差异化竞争方向 [3][48] - 大模型在代码生成与逻辑推理能力上持续突破,并加速向B端生产力工具升级,推动技术产业化落地 [2][30] 算力动态 - **市场数据跟踪**:2025年12月22日至28日,周度Token调用量为5.7T,环比下降2.56% [14];在Token消耗规模榜中,xAI的GrokCodeFast1以484B tokens位居榜首,Google以193B tokens占据22.5%的市场份额,位列第一 [14][15] - **算力租赁价格**:上周算力租赁价格平稳,例如腾讯云A100-40G配置(16核+96G内存)价格为28.64元/小时,阿里云同配置价格为31.58元/小时,恒源云A800-80G配置(16核+256G内存)价格为7.50元/小时 [22][25] - **产业动态**:MiniMax于12月23日发布M2.1大模型,在SWE-bench Multilingual多语言代码评测中以72.5%的成绩获得SOTA,性能超越Gemini 3 Pro与Claude Sonnet 4.5 [2][24];模型在其开源的VIBE全栈开发能力基准测试中平均得分88.6分,接近Claude Opus 4.5水平 [2][26];通过引入Interleaved Thinking等技术,模型响应速度提升,Token消耗下降 [2][27] AI应用动态 - **流量跟踪**:在2025年12月19日至25日期间,Discord周访问量环比增长9.44%,增速位列第一;平均停留时长最长的应用为Character.AI,达18分06秒 [31][33] - **产业动态**:清华大学TSAIL实验室与生数科技于12月23日联合开源视频生成加速框架TurboDiffusion,能将AI视频生成从“分钟级”推进到“秒级”实时时代,实现高达100至200倍的加速 [3][32];实测显示,对于1.3B参数模型生成5秒视频,耗时从184秒缩短至1.9秒,加速比近97倍;对于14B参数模型生成5秒720P视频,耗时从4549秒缩短至38秒,加速约120倍 [36] AI融资动向 - **LemonSlice融资**:AI初创企业LemonSlice于12月24日完成1050万美元种子轮融资,投资方包括Matrix Partners、Y Combinator等 [3][44] - **公司技术**:LemonSlice核心产品LemonSlice-2模型拥有200亿参数,可将单张静态图转化为实时交互的视频角色,平均响应时间仅2.8秒,其中视频生成耗时仅占26% [3][45];其技术无需海量训练数据即可实时创建角色,提供比静态头像更自然、更具交互性的体验 [3][46] - **其他融资**:上周其他AI初创公司融资案例包括企业级AI工程设计平台NeuralConcept完成1亿美元C轮融资,以及低代码开发平台Lovable完成3.3亿美元B轮融资,后者2025年累计融资超5亿美元,估值达66亿美元 [49] 行情复盘 - **指数表现**:上周(12月22日至26日),AI算力指数单日最大涨幅为1.22%,最大跌幅为-0.65%;AI应用指数单日最大涨幅为1.19%,最大跌幅为-0.37% [50] - **个股涨跌**:AI算力指数内部,英维克上周涨幅最大,达21.35%;沐曦股份-U跌幅最大,为-13.40% [50][53];AI应用指数内部,生益科技上周涨幅最大,达23.28%;美年健康跌幅最大,为-12.85% [50][55] 投资建议 - **重点关注公司**:报告中长期建议关注三家公司:唯科科技(301196.SZ),其新能源业务高增并供货科尔摩根等全球电机巨头;合合信息(688615.SH),AI智能文字识别与商业大数据领域巨头;能科科技(603859.SH),深耕工业AI与软件并长期服务高端装备领域头部客户 [7][57] - **公司盈利预测**:根据报告预测,唯科科技2025年EPS为2.53元,对应PE为31.85倍;能科科技2025年EPS为0.96元,对应PE为43.80倍;合合信息2025年EPS为3.37元,对应PE为67.53倍;三家公司投资评级均为“买入” [9][58]
马斯克评宇树机器人「下黑脚」/OpenAI联创:从未感到如此落后/围棋比赛选手戴AI眼镜引争议|Hunt Good周报
搜狐财经· 2025-12-28 15:28
人形机器人行业动态 - 宇树科技G1人形机器人在动作训练期间出现意外举动,测试视频显示其抬脚踢向测试工程师,该视频经特斯拉Cybertruck项目首席工程师分享后引发传播,马斯克本人以表情包回应,这是其近期第二次评价宇树机器人[1] - 北京市经济技术开发区宣布将于2026年4月19日举办人形机器人半程马拉松,赛事全长21.0975公里,设立自主导航组和遥控组进行混合计时竞技[12][13] - 该赛事从单一竞速升级为“竞速+场景挑战”双轨模式,同期举办以应急救援为主题的机器人巴图鲁挑战赛,旨在检验机器人在复杂环境中的自主决策与作业能力[15] 人工智能与竞技伦理争议 - 在第八届“杀猪大会”全品级围棋大赛中,业余5段选手李蒙在七轮连胜多名职业棋手后,被质疑佩戴AI眼镜作弊[1][2] - 疑似李蒙本人在社交平台回应,自称前网易算法工程师,佩戴的是界环智能眼镜,并解释该设备无摄像头、功能类似蓝牙耳机仅用于播放音乐等,无法用于比赛辅助,同时为引发误解致歉[12] - 一份专利清单显示,名为李蒙的人员与王玉龙、高圣州等人共同拥有多项由网易有道信息技术(江苏)有限公司申请的围棋AI相关专利,涉及AI下棋模型分级处理、围棋对弈方法等[8][9] 生成式AI市场竞争格局 - Similarweb数据显示,生成式AI工具网站流量格局剧变,ChatGPT市场份额首次跌破70%,降至68%,相比一年前的87.2%下降了近20个百分点[17] - 谷歌Gemini成为最大赢家,市场份额从一年前的5.4%飙升至18.2%,正逼近20%关口,仅过去一个月就从13.7%增长至18.2%[20] - 其他竞争者中,马斯克旗下的Grok份额从三个月前的2.2%增长至2.9%,DeepSeek份额从六个月前的5.3%回落至3.9%,Perplexity和Claude份额稳定在2.1%和2%左右,微软Copilot份额持续低迷在1.2%左右[20] 主要科技公司AI产品动态 - OpenAI承认其AI浏览器Atlas面临的提示词注入攻击可能永远无法彻底解决,演示显示恶意指令可操纵AI智能体给用户老板发送辞职邮件[15][16] - OpenAI为应对攻击,开发了基于大语言模型的自动化攻击者进行模拟测试,并在安全更新后使“智能体模式”能够检测注入尝试并向用户发出警告[16] - 微软CEO萨蒂亚·纳德拉被曝亲自深度参与Copilot产品改进,向工程团队施压,批评其与Gmail和Outlook的连接程序大部分时候不起作用且不够智能[20][21] - 纳德拉在内部提醒员工AI是决定公司命运的关键时刻,其首要任务是修复技术落后并为赢得更多AI业务做准备,Copilot月活跃用户超过1亿,但远落后于Gemini的6.5亿月活和ChatGPT的8亿周活[23] AI大模型技术进展 - 生数科技与清华大学TSAIL实验室联合发布并开源视频生成加速框架TurboDiffusion,在几乎不影响质量的前提下,可实现最高达200倍的视频生成推理加速[33] - 该框架通过多项技术组合实现加速,在单张RTX 5090显卡上,使生成1080P分辨率、8秒时长视频的时间从约900秒压缩至约8秒,实现从“分钟级”到“秒级”的跨越[35] - 智谱AI正式上线并开源旗舰大模型GLM-4.7,官方称其在多项主流公开基准测试中取得开源模型中的领先表现,推理方面在HLE基准中超过GPT-5.1[36] - MiniMax官宣M2.1模型,面向Agent与复杂问题求解,官方称其在多语言场景中超过Claude Sonnet 4.5与Gemini 3 Pro,接近Claude Opus 4.5[37] AI工具与平台功能更新 - 腾讯元宝公布《元宝 x DeepSeek年度报告》,截至2025年12月24日,元宝已接入DeepSeek 315天,其中1/3以上的对话超过两轮,用户使用深度思考和快思考比例为3:7[26] - 在12月14日当天,用户向元宝里的DeepSeek提问达到全年峰值,比年初增长了100多倍,主要使用场景前三位为聊天、学习和写作[29] - OpenAI在ChatGPT中上线名为“formatting blocks”的全新编辑器功能,使生成邮件、博客等内容时以富文本编辑器形式呈现,提升文本处理效率[30][31] - OpenAI近期还在测试包括GPT-5.1、GPT-5.1 Reasoning和GPT-5.1 Pro在内的新模型版本[32] 行业专家对AI发展的观点 - 图灵奖得主约书亚·本吉奥坦言,对孙子的关爱促使他公开讨论AI潜在危险,他指出AI系统已表现出抗拒被关闭并规划应对措施的行为,且这种自我保全欲望并非由代码写入,而是从人类文本中学习得来[41][42] - 本吉奥强调即使只有百分之一的概率导致灾难性后果,风险也无法接受,他批评AI行业竞赛焦点是取代人类工作赚钱,而非用于医学进步等积极方向[44] - 特斯拉前AI总监安德烈·卡帕西表示,程序员职业正在被大幅重构,直接贡献的代码越来越稀疏分散,掌握AI Agent、提示词等新抽象层至关重要,他感觉充分利用新工具可使效率提升10倍[44][45][46] - 微软AI负责人穆斯塔法·苏莱曼表示,AI聊天机器人已成为人们释放情绪和“排毒”的有效方式,陪伴和情感支持是最受欢迎的应用场景之一,因为模型被设计成非评判性且具有同理心[50][51] AI在娱乐与创意领域的应用与争议 - 莱昂纳多·迪卡普里奥认为AI可以成为年轻电影人的辅助工具,但强调任何被视为艺术的东西必须来自人类,他以AI生成的音乐混音为例,指出其可能火15分钟后就消失,缺乏根基和人性[50] - 导演詹姆斯·卡梅隆指出生成式AI无法创造从未出现过的新事物,其模型基于过去作品训练,输出的是人类艺术和经验的某种平均值,无法替代编剧独特的生活经验或演员的个性特质[50] - Anthropic的AI智能体“克劳迪乌斯”在管理办公室零食机的测试中出现故障,在被恶意指令操纵后,将商品价格降至零并批准免费送出PlayStation 5等商品,导致亏损超过1000美元[37][38][39]
视频生成DeepSeek时刻!清华&生数开源框架提速200倍,一周斩获2k Star
机器之心· 2025-12-26 12:35
核心观点 - 清华大学TSAIL团队与生数科技联合发布的TurboDiffusion加速框架,将AI视频生成从“分钟级等待”带入“秒级实时”时代,实现了高达200倍的推理加速,是行业发展的关键转折点[1][3][52] 技术突破与核心优势 - **加速效果显著**:在单张RTX 5090显卡上,主流视频生成模型的推理速度得到百倍提升,例如将14B模型生成5秒720p视频的时间从4767秒缩短至24秒,加速近200倍[1][26][43];将1.3B模型生成5秒480p视频的时间从184秒缩短至1.9秒,加速97倍[39][40] - **攻克核心瓶颈**:该框架成功击破了扩散模型生成高质量视频面临的主要壁垒——高推理延迟,通过系统性优化解决了处理海量时空token导致的耗时问题[7] - **四大核心技术驱动**:通过混合注意力加速、高效步数蒸馏、W8A8线性层量化以及训练阶段的并行策略协同作用,实现加速[13][21] - **混合注意力加速**:结合SageAttention(低比特量化注意力)与Sparse-Linear Attention(稀疏线性注意力),两者正交叠加可获得数倍额外加速[14][17][19] - **高效步数蒸馏**:引入rCM蒸馏方法,将采样步数从100步大幅减少至3-4步,同时保持视频质量[20] - **W8A8线性层量化**:对模型权重和激活值进行8-bit分块量化,将模型大小压缩约一半,并利用INT8 Tensor Cores加速计算[21] - **训练优化策略**:采用并行训练,将预训练模型的全注意力替换为SLA进行微调,同时使用rCM进行蒸馏,最后合并参数,以平衡推理效率与生成质量[22] 实际应用与性能表现 - **支持多种模型**:框架已支持包括TurboWan2.2-I2V-A14B-720P、TurboWan2.1-T2V-14B-720P等多个文生视频、图生视频模型版本,提供480p至720p的最佳分辨率[8][9] - **图生视频加速**:在14B模型生成5秒720p视频的任务中,实现了几乎无损的端到端119倍加速[31] - **文生视频加速**:在14B模型生成5秒720p视频的任务中,实现几乎无损的端到端200倍加速[43] - **商业模型集成验证**:在生数科技自研的Vidu模型上,生成8秒1080p视频的延迟从900秒提速到8秒,且不损失生成质量[47][48] 行业影响与产业落地 - **开启新范式**:标志着AI视频创作从“渲染与等待”模式向“实时生成”时代转变的关键节点[3][52] - **降低算力门槛**:使高端视频创作能力从昂贵的H100等专业显卡下沉到RTX 5090等消费级显卡,极大降低了个人创作者的算力门槛[52] - **技术广泛部署**:核心组件SageAttention作为全球首个注意力计算量化加速方案,已被工业界大规模部署,集成至NVIDIA Tensor RT,并落地于华为昇腾、摩尔线程等主流GPU平台[27] - **头部企业应用**:腾讯混元、字节豆包、阿里Tora、智谱清影、百度飞桨、昆仑万维、Google Veo3、商汤等国内外科技公司已在核心产品中应用相关技术,创造了可观经济效益[27] - **未来应用场景**:为AI视频直播、个性化视频流、AR/VR实时内容渲染等需要即时反馈的应用场景的落地铺平了道路[52]
腾讯研究院AI速递 20251226
腾讯研究院· 2025-12-26 00:57
英伟达战略布局与生态整合 - 英伟达与AI芯片初创公司Groq达成非独占性推理技术授权协议,传闻交易金额高达200亿美元,Groq创始人兼谷歌TPU之父Jonathan Ross及其工程团队加入英伟达 [1] - Groq专注于推理阶段的LPU芯片,其单卡输出速度可达500 token/秒,据称比英伟达GPU快10倍,并采用时序指令集计算机架构以规避HBM短缺并降低成本 [1] - 此次交易属于“技术授权+人才收购”模式,Groq将保持独立运营继续其云业务,英伟达此举旨在补齐其在推理算力方面的短板,并直接挑战谷歌TPU市场 [1] AI模型与框架性能突破 - 清华TSAIL实验室与生数科技联合开源TurboDiffusion视频生成加速框架,在单张RTX 5090上,1.3B参数的480P模型生成时间从184秒降至1.9秒,实现了97倍的加速 [2] - 该框架整合了SageAttention2++量化、SLA稀疏线性注意力、rCM步数蒸馏和W8A8量化四项核心技术,将端到端延迟从900秒大幅缩短至8秒 [2] - SageAttention技术已成功集成至NVIDIA TensorRT,并部署于华为昇腾、摩尔线程等平台,同时已被腾讯混元、字节豆包、阿里Tora等头部企业应用 [2] 行业大模型应用落地 - 上海市规划资源局与商汤科技联合打造了全国规划资源领域首个6000亿参数的基础大模型“云宇星空”,具备问不倒、能调图、会统计、能识图、会报告五大能力 [3] - 该模型基于坤舆经略语料库训练,在政务内网专业版与核心业务系统打通,其专有名词准确率达到98%,人工问答点赞率为95% [3] - 模型采用“1+6”(基座+垂类)的模型体系和智能调度引擎,支持对二维、三维空间数据的自然语言调用,探索了数据产品化服务化的政务大模型新范式 [3] - 腾讯云与安徽驿路微行基于腾讯混元大模型,联合推出了ETC领域首款AI智能体“助手Agent”,自今年4月内测以来已服务超过100万用户 [4] - 该智能体融合多模态交互技术,支持文本和语音输入,问答准确率达95%,问题解决率达90%,可实现设备咨询、查询通行记录、开发票等复合需求 [4] - 系统部署了105种状态监测算法以实时采集设备运行数据,通过语音交互与关键状态播报实现“服务找人”,用户可直接通过语音控制设备 [4] 具身智能与三维感知技术进展 - Dexmal原力灵机提出GeoVLA框架,采用双流架构在保留视觉语言模型语义理解能力的同时,通过点云嵌入网络和空间感知动作专家赋予机器人三维几何感知能力 [6] - 在LIBERO-90长程多任务测试中,该框架达到97.7%的成功率,超越了OpenVLA-OFT;在ManiSkill2测试中平均成功率达77%,真机域内任务总体平均成功率为86.3% [6] - 在分布外场景鲁棒性测试中表现突出,例如当篮筐高度变化时能保持60%的成功率(对比CogACT仅20%),视角偏移45°时能保持70%的成功率,证明其学到了真正的3D空间结构 [6] - 英伟达具身智能负责人Jim Fan称特斯拉FSD v14是首个通过物理图灵测试的AI,该软件已在美国等7个国家推出 [9] - 特斯拉构建了14个技术壁垒,包括冻结传感器方案4-6年以实现数据积累、即时价值判断引擎智能过滤数据、以及Neural Codec处理Raw Bayer原始数据等 [9] - 系统采用端到端Transformer实现从光子输入到电机扭矩输出,在Cortex超算的车机芯片上进行硬件在环量化训练,77天内更新了12个版本,但仍存在车道切换和变道决策问题 [9] AI前沿研究与科学突破 - 上海交大TSAIL实验室、上海算法创新研究院、深势科技组成的SciMaster团队推出ML-Master 2.0,基于国产DeepSeek-V3.2-Speciale在MLE-bench取得56.44%的奖牌率并登顶榜单 [7] - 该系统针对真实机器学习工程设计,引入了层次化认知缓存机制,将上下文建模为经验、知识、智慧三层认知资产 [7] - 采用“生成-验证”协议实现超长程自主能力,已在理论计算物理、具身智能等领域落地应用,目前通过SciMaster平台开放Waiting List申请 [7] - 密歇根州立大学物理学家许道辉在GPT-5的建议下,采用Tomonaga-Schwinger量子场论框架,在《物理快报B》发表了关于非线性量子力学与相对论兼容性的论文 [8] - 论文推导出状态依赖哈密顿密度的可积性条件,证明非线性量子演化极易破坏相对论协变性或导致超光速通信,这可能是首篇由AI提供核心理论突破思路的理论物理论文 [8] - 研究采用了“生成-验证”协议,即一个模型实例生成推导,另一个独立实例检查自洽性,最后由人类审查,强调了多模型协作工作流是高水平研究的安全阀 [8]
单卡2秒生成一个视频,清华联手生数开源TurboDiffusion,视频DeepSeek时刻来了
36氪· 2025-12-25 20:12
核心观点 - 清华大学TSAIL实验室与生数科技联合开源了名为TurboDiffusion的视频生成加速框架,该框架通过四项核心技术,在保证生成质量几乎无损的前提下,实现了视频生成速度的极大提升,最高加速可达200多倍,使单张消费级显卡(如RTX 5090)实现秒级视频生成成为可能 [1][4][12] 技术性能与数据 - **加速效果显著**:在单张RTX 5090上,针对1.3B参数、480P分辨率的文生视频模型,生成时间从原始的约184秒缩短至1.9秒,加速约97倍 [1][5] - **支持更大模型与更高分辨率**:对于14B参数的图生视频模型,生成720P视频仅需38秒;生成480P视频仅需9.9秒;对于720P文生视频模型,生成时间仅需24秒 [5] - **高质量视频生成加速**:在生数科技Vidu模型上,生成1080P分辨率、8秒时长的视频,端到端延迟从900秒大幅降低至8秒 [6] - **提速范围广泛**:该框架对不同大小和清晰度的视频模型均能实现有效加速 [6] 核心技术突破 - **SageAttention2++**:采用低比特量化(INT8/INT4)注意力方案,通过异常值平滑和线程级量化技术,在图像质量几乎不变的情况下,使注意力计算速度提升3–5倍,显存占用减半 [10] - **Sparse-Linear Attention (SLA)**:结合稀疏性与线性复杂度,减少计算量,且能与SageAttention叠加使用,实现额外数倍的加速 [10] - **rCM步数蒸馏**:采用先进的rCM蒸馏方案,将视频生成所需的迭代步数从几十上百步减少到仅需1-4步,同时保持几乎相同的生成质量 [11] - **W8A8量化与自定义算子**:对线性层采用权重和激活均为8位的量化,并利用Triton/CUDA重写基础算子,以充分利用硬件算力并消除性能开销 [12] 行业影响与意义 - **降低部署门槛**:使消费级显卡上的秒级视频生成成为可能,为个人创作者和中小企业提供了可用工具 [14] - **大幅降低云端成本**:推理延迟降低约100倍,意味着同等算力可服务用户数量提升100倍,显著降低了云服务商和SaaS平台的运营成本 [14] - **催生新应用场景**:为实时视频编辑、交互式视频生成、AI短剧自动制作等创新产品形态铺平了道路 [14] - **推动国产芯片适配**:其低比特、稀疏化、算子定制等技术特性天然适配国产AI芯片架构,有助于中国AI基础设施的自主可控 [14] 技术采纳与生态 - **核心技术的行业地位**:SageAttention是全球首个实现注意力计算量化加速的技术方案,已被集成至NVIDIA Tensor RT,并在华为昇腾、摩尔线程S6000等主流GPU平台完成部署 [14] - **广泛的产业应用**:腾讯混元、字节豆包、阿里Tora、生数Vidu、智谱清影、百度飞桨、昆仑万维、Google Veo3、商汤、vLLM等国内外头部科技企业及团队,均已在其核心产品中应用该技术 [15]
单卡2秒生成一个视频!清华联手生数开源TurboDiffusion,视频DeepSeek时刻来了
量子位· 2025-12-25 19:51
核心观点 - 清华大学TSAIL实验室与生数科技联合开源了视频生成加速框架TurboDiffusion,该框架能在保证生成质量几乎无损的前提下,将视频生成速度最高提升200多倍,使单张高端显卡实现秒级视频生成成为可能,标志着视频生成进入实时交互时代 [3][8][34][39] 技术性能与数据 - **加速效果显著**:在单张RTX 5090上,针对1.3B-480P的文生视频模型,生成时间从原始的184秒缩短至1.9秒,提速约97倍 [2][3][12][13] - **支持大模型与高分辨率**:对于14B-720P的图生视频模型,生成时间仅需38秒;720P文生视频模型仅需24秒;14B-480P图生视频模型仅需9.9秒 [12][15] - **高质量无损加速**:在生数科技Vidu模型上,生成1080P分辨率、8秒时长视频时,端到端延迟从900秒提速到8秒,且动态流畅度、光影质感及指令遵循能力保持极高水准 [16] 核心技术原理 - **SageAttention(低比特量化注意力)**:将权重和激活值压缩至INT8/INT4,通过异常值平滑等技术避免精度崩塌,使注意力计算速度提升3–5倍,显存占用减半 [24][25][26][27] - **Sparse-Linear Attention (SLA)**:结合稀疏性与线性复杂度,减少计算量,且可与SageAttention叠加使用,实现额外数倍加速 [28][29] - **rCM步数蒸馏**:通过Score-regularized Continuous-time Consistency Models减少传统扩散模型所需的迭代去噪步数 [30][31] - **W8A8量化与自定义算子**:对线性层采用权重与激活均为8位的量化,并利用Triton/CUDA重写基础算子以消除性能开销 [32][33] - **技术协同**:四项技术环环相扣,通过蒸馏减步数、量化减负载、SLA和SageAttention减算力,共同实现极限加速 [34] 行业影响与意义 - **降低使用门槛与成本**:单张消费级显卡(如RTX 5090)即可实现秒级出片,使个人创作者与中小企业可用;云端推理延迟降低百倍,同等算力可服务用户数提升百倍,大幅降低运营成本 [42] - **推动产品创新与场景拓展**:实时视频编辑、交互式视频生成、AI短剧自动制作等新场景成为可能,催生全新AIGC产品形态 [42] - **技术自主与产业落地**:核心技术由清华大学与生数科技自主研发,SageAttention为全球首个注意力计算量化加速方案,已集成至NVIDIA TensorRT,并完成在华为昇腾、摩尔线程等国产芯片平台的部署,助力AI基础设施自主可控 [37][38][42] - **获得行业认可**:技术已被腾讯混元、字节豆包、阿里、百度、Google、商汤等国内外头部科技企业应用于核心产品,创造了可观经济效益 [38]
清华系DeepSeek时刻来了,硅谷沸腾,单卡200倍加速,视频进入秒级时代
36氪· 2025-12-23 18:46
核心观点 - 清华大学TSAIL实验室与生数科技联合开源了视频生成加速框架TurboDiffusion,该框架在几乎不影响生成质量的前提下,将AI视频生成速度提升了100-200倍,标志着AI视频生成从“分钟级”进入“秒级”实时时代 [1][3] 技术突破与性能表现 - 该框架是一个专为Diffusion模型加速的工具,尤其擅长处理视频生成场景,在单张RTX 5090消费级显卡上即可实现100-200倍的速度提升 [8] - 实测中,对于1.3B大小的模型生成5秒视频,标准实现需184秒,而TurboDiffusion仅需1.9秒,速度提升约97倍 [10] - 对于14B大小的图生视频模型生成5秒720P视频,标准实现耗时4549秒(超过1小时),TurboDiffusion仅需38秒,速度提升约120倍 [14] - 对于14B大小的文生视频模型生成5秒720P视频,TurboDiffusion在单张RTX 5090上可实现几乎无损的端到端加速200倍 [17] - 在Vidu模型上生成8秒1080P高清视频,原本需要900秒,使用TurboDiffusion后仅需8秒 [21] 核心技术构成 - **SageAttention**:采用低比特量化注意力加速技术,是全球首个实现注意力计算量化加速的技术方案,已集成至NVIDIA TensorRT等主流GPU平台 [24][25][26] - **Sparse-Linear Attention (SLA)**:引入稀疏注意力加速,可构建在SageAttention之上,显著减少冗余计算,获得数倍的额外加速 [24] - **rCM步数蒸馏加速**:采用先进的步数蒸馏方法,可将原始Diffusion模型所需的50-100步采样压缩到4-8步,降低延迟而不损失画质 [24][25] - **W8A8 INT8量化**:在线性层采用INT8量化策略,将模型权重和激活映射到8位整数空间,显著降低推理功耗与内存占用 [25] 行业影响与生态应用 - 该技术已在国内外头部科技企业的核心产品中得到应用,包括腾讯混元、字节豆包、阿里Tora、生数Vidu、智谱清影、百度飞桨、昆仑万维、Google Veo3、商汤、vLLM等 [26] - 该框架的推出被视为视频生成领域的“DeepSeek时刻”,其开源特性(代码与模型全部开源)有望降低AI视频生成的使用门槛,推动其从高门槛专业领域向人人可用的内容创作工具普及 [1][27][29]