美国对华AI芯片出口管制政策调整 - 美国商务部工业和安全局修改出口管制条例,将高性能芯片限制放宽至TPP低于21000和DRAM带宽低于6500GB/s,为英伟达H200和AMD MI325X对华出口创造了法律空间 [1] - 新规要求申请人证明美国市场有足够供应且对单一国家出口不超过美国总销量的50%,预计到2026年,H200芯片可为英伟达贡献超过476亿美元营收,其中中国市场贡献近160亿美元 [1] - 美国众议院以369票通过《远程访问安全法案》,限制通过云平台远程接入获取先进算力以训练AI模型,此举可能冲击海外合建数据中心项目 [1] 全球AI视频生成技术竞争加剧 - 谷歌Veo 3.1实现重大升级,新增“素材生视频”功能,通过上传图片和文本指令即可生成高质量视频,角色一致性达到新高度,并支持原生9:16竖屏输出及1080p、4K超分辨率技术,直接适配移动端平台 [2] - 爱诗科技发布全球首个支持最高1080P分辨率实时生成的世界模型PixVerse R1,用户可通过文字或语音实时干预视频生成过程,将视频生成从“固定片段”转变为“无限可视化流” [4] - Vidu AI开放平台推出“一键生成MV”功能,用户提交音乐、参考图像与文本指令后,系统可全自动输出叙事连贯、音画同步的MV,其“多图参考生视频”技术允许上传至多7张参考图,在长达五分钟的视频中精确复刻人物特征与美学风格 [5][6] 中国AI模型与算力自主化进展 - 智谱AI联合华为开源新一代图像生成模型GLM-Image,该模型基于昇腾Atlas 800T A2设备和昇思MindSpore框架完成全流程训练,是首个在国产芯片上完成的SOTA多模态模型,在相关榜单获得开源第一,中文文字渲染成绩达0.979 [3] - GLM-Image模型API调用生成一张图片成本仅需0.1元,特别擅长海报、PPT、科普图等知识密集型场景及汉字生成任务 [3] 具身智能与机器人技术突破 - 1X公司为其家用人形机器人NEO发布全新“大脑”1X World Model,该模型通过观看海量网络视频和人类第一视角实操录像来理解物理世界,基于140亿参数生成式视频模型,采用多阶段训练策略 [7] - 该模型的逆动力学模型在400小时未经过滤的机器人数据上训练,能从生成的视频中提取对应动作轨迹,官方推文浏览量已突破500万 [7] AI在游戏与医疗领域的应用与影响 - 《英雄联盟》韩服出现神秘玩家,在51小时内完成56局对局,取得52胜4败、综合胜率92%的战绩,登顶时胜率高达95%,该账号使用了22名不同英雄,对线胜率86%断层领先,引发关于其是否为AI的广泛猜测 [8] - 谷歌发布MedGemma 1.5 4B版本,首次支持CT和MRI三维体数据以及全切片数字病理图像等高维医学影像分析,将MRI疾病发现分类准确率从51%提升至65%,解剖结构定位精度从3%跃升至38% [9] - 同步推出的MedASR语音识别模型,在胸部X光报告口述场景中词错误率仅5.2%,比通用模型Whisper低82% [9] AI对软件工程行业的结构性冲击 - 谷歌Cloud AI总监提出AI时代软件工程面临的五个关键问题,涉及初级工程师需求、基本功价值、职业角色转变、专才风险及大学计算机专业必要性 [10] - 哈佛研究显示,公司引入生成式AI后,初级开发者岗位数量在六个季度内下降约9%-10%,而高级工程师就业几乎没有变化,大型科技公司招聘应届生数量减少50% [11] - 建议初级工程师构建AI集成作品集并手动编写关键算法,资深工程师需注重架构审查以适应“代理式”工程环境,通才将比专才更具竞争力 [11]
腾讯研究院AI速递 20260115
腾讯研究院·2026-01-15 00:03