Workflow
AI图景解码50关键词:快思考与慢思考
腾讯研究院·2025-01-09 11:29

行业投资评级 - 报告未明确给出具体的行业投资评级 [1][2][3] 核心观点 - 人工智能技术在过去一年迅猛发展,深刻重塑社会运行方式,AI已成为推动社会进步的重要力量 [4] - 腾讯研究院开发了AI每日速递、AI每周50关键词、科技九宫格等产品,帮助用户快速掌握AI领域的关键进展 [4] - 报告通过50个年度关键词,覆盖大模型技术的八大领域,并通过"快思考"与"慢思考"两种维度进行分析,形成50张AI技术图景卡片 [5][6] 技术演进 - Transformer从文本扩展至其它领域,DiT架构带来图像生成质的飞跃,Scaling Law在图像领域开始生效 [10] - 图像生成正从传统扩散模型走向序列化建模,Transformer不同模态的底层范式可以实现迁移 [12] - 视频生成相比图像生成难度提升百倍,Sora引领DiT架构成为主流方向,规模化训练是实现高质量视频生成的关键 [26] - 3D生成技术通过持续创新,推动3D生产效率与应用范围双提升,几何形态还原技术通过持续创新,推动3D生产效率与应用范围双提升 [42] 应用场景 - 生成式AI具有强大的技术能力和流量吸引力,但技术能力需要转化为有效商业闭环,AI企业被迫进行商业模式转型 [20] - 图像理解在医疗领域率先实现商业化,科技巨头深耕医疗AI研发,学术界取得突破性进展 [22] - AI视频生态正在从"工具提供"向"价值共创"演进,艺术家在生态中扮演双重角色:既是内容生产者,也是模型优化的关键贡献者 [31] - 生成式游戏通过AI生成技术动态创造游戏内容,实现无限可能的交互叙事与世界构建 [35] 技术突破 - 端侧模型发展出现双轨并行趋势:极限压缩与多模态,不同终端对多模态需求差异显著 [93] - 存算一体架构实现突破性提升,超快推理或将重构AI应用形态 [98] - 空间智能是具身智能的关键基础,3D数据获取是主要瓶颈,数据与算法双轨并进 [114] - Sim2Real是连接虚拟与现实的桥梁,游戏环境提供理想训练平台,训练方法需多层次协同 [123] 商业模式 - AI图像生成企业将"技术驱动"向"场景驱动"转变,通过产业整合获得商业生态位 [20] - 机器人产业发展需要找准市场切入点,通过场景应用积累数据与经验 [116] - 开源模型与开源软件有区别,大模型开源受到高度关注,商业可持续性面临挑战 [143]