StreamingVLM
搜索文档
MIT天才博士刚毕业,就被前OpenAI CTO抢走,年薪或300万起步
36氪· 2026-01-09 16:12
公司核心人事动态 - MIT博士肖光烜正式加盟由OpenAI前CTO Mira Murati创立的初创公司Thinking Machines,专注于大模型预训练工作[1] - 肖光烜拥有清华大学计算机科学与金融学双学位,并在MIT攻读博士学位,师从韩松教授,研究方向为深度学习的高效算法与系统,特别是大规模基础模型[6][8] - 其加盟获得了包括英伟达科学家、xAI研究员在内的行业顶尖人士的祝贺[3] 公司人才战略与薪酬竞争力 - Thinking Machines为吸引顶尖技术人才,提供了极具竞争力的薪酬,据2025年第一季度数据,其为四名技术员工提供的平均年薪高达462,500美元[25] - 具体而言,公司向两名技术员工支付了45万美元基础年薪,另一名员工年薪达50万美元,一名联合创始人/机器学习专家年薪也为45万美元[22][23] - 公司薪酬水平显著高于部分成熟竞争对手,例如OpenAI 29名技术员工的平均年薪为292,115美元,Anthropic 14名技术员工的平均年薪为387,500美元[25][27] 行业技术前沿与研发方向 - 肖光烜的博士论文《Efficient Algorithms and Systems for Large Language Models》系统性地解决了当前大模型面临的显存消耗大、推理速度慢、长上下文处理困难等核心工程挑战[18] - 其提出的SmoothQuant技术,通过数学变换将量化难点从激活值转移至权重,实现了在十亿级模型上W8A8无损量化,无需重新训练即可减少显存占用并加速推理[19] - 针对长上下文处理,其发现的“注意力汇点”现象及StreamingLLM框架,使模型能以常数内存进行流式推理,将上下文长度从数千token扩展至百万级,并已推广至多模态视频理解[19] - 为解决长上下文下的不同性能瓶颈,团队提出了DuoAttention(通过混合全局检索与局部关注来减少KVCache显存占用)和XAttention(利用反对角评分加速预填充阶段)等互补方案[19] - 论文进一步通过FlashMoBA定制化CUDA内核,使更小的注意力块架构在实践中可行,实现了最高可达9倍的速度提升,为下一代高效AGI系统奠定了基础[19][20] 个人背景与行业经验 - 肖光烜在MIT攻读博士期间,曾在Meta实习,研究方向为流式语言模型的高效注意力机制,相关成果已发表[10] - 他亦在英伟达实习,参与为长上下文大语言模型推理加速的研究,与团队共同提出了DuoAttention方法[12] - 其研究项目还包括XAttention、StreamingVLM、FlashMoBA等,均聚焦于提升大模型的效率与性能[15]
这届清华特奖机器人含量爆表!丘成桐(国内版)现身点评
量子位· 2025-11-14 20:10
清华大学特等奖学金评选趋势 - 2025年本科生特等奖学金前十名入围名单显示研究方向高度集中于人工智能领域,特别是具身智能成为主线剧情[1][5] - 候选人研究成果覆盖大模型视频理解、人形机器人全身控制、触觉模拟、自动驾驶智能决策等前沿方向[6] - 清华大学通过成立人工智能学院和扩大招生规模150人,战略布局人工智能与多学科交叉拔尖人才培养[37][39] 具身智能与机器人技术突破 - 交叉信息院李忆唐以第一作者在CVPR 2025发表论文,实现仅用简短行走参考数据让机器人推断全身协调动作[10][12] - 其提出的控制方法融合稳定性与柔性,在CoRL 2025发表成果,并担任顶会审稿人[13] - 行健书院陈博沅完成172学分和7门跨学科选修,研究成果覆盖单张图片重建可交互场景、灵巧手触觉视觉一体仿真[16][18] - 其Physgen3D和GaussTac项目分别发表于ICCV和CoRL,推动三维世界构建与触觉融合技术[19] 人工智能模型优化与部署 - 计算机系徐汝一提出Xattention注意力机制,在保持精度同时将处理速度提升13.5倍,成果发表于ICML 2025[25] - 其StreamingVLM技术实现视觉模型无限长度推理与实时延迟,在GitHub获600余星标[25] - 通过创建"新星OpenDay"讲座和培训课程,推动大模型、视频理解等技术向20余万观众普及[26] 跨学科人才培养模式 - 行健书院作为AI+工程科学家试验场,鼓励学生从A型向X型人才转型,结合力学基础与AI/机器人课程[15] - 求真书院实行3+2+3本博衔接制度,陈嘉熙在大三阶段通过8个方向的博士资格考核,远超3个方向的要求[32][33] - 丘成桐院士亲自为数学领军人才计划站台,体现学校对基础学科与人工智能交叉的重视[2][29]