腾讯研究院AI速递 20260128

核心观点文章汇总了近期人工智能领域在硬件、模型、应用及前沿研究方面的多项重要进展，核心观点是AI技术正沿着硬件性能突破、模型能力泛化与智能化、应用场景大规模落地以及向具身智能等前沿领域扩展的方向加速演进，行业竞争焦点从单一模型能力转向包括芯片、操作系统级平台、开源生态及垂直应用在内的全栈竞争 [1][2][3][4][5][6][7][8][9] 硬件与芯片 - 微软发布自研AI推理芯片Maia 200，采用台积电3nm工艺，单芯片晶体管数量超1400亿，FP4性能超过10 PetaFLOPS，是第三代Amazon Trainium芯片性能的三倍 [1] - Maia 200配备216GB HBM3e内存和7TB/s带宽，每美元性能比当前最新硬件提升30%，专为AI推理打造，将为OpenAI GPT-5.2等大模型提供支持，并已开始部署 [1] 大模型与平台能力 - Anthropic为Claude推出MCP服务，整合Figma、GitHub、Canva等生产力工具，使其从聊天机器人转变为可调度外部资源的智能体平台，用户可用自然语言指挥跨应用工作流 [2] - 月之暗面开源Kimi K2.5模型，该模型原生支持视觉与文本输入，并首次引入Agent集群能力，可自主创建最多100个分身并行处理1500个步骤的任务，实际运行时间最高缩短4.5倍 [4] - 阿里发布千问旗舰推理模型Qwen3-Max-Thinking，具备自适应工具调用能力，可自动调用搜索引擎和代码解释器，采用经验累积式测试时扩展策略以优化推理效果 [5] - DeepSeek开源OCR专用模型DeepSeek-OCR 2，采用新型解码器让模型按结构顺序阅读，在OmniDocBench v1.5测试中得分达91.09%，较前代提升3.73% [3] 应用落地与商业化 - 腾讯搜狗输入法全面AI化，接入混元大模型，AI用户规模破亿，日均语音使用近20亿次，AI语音大模型识别流畅性提升40%、准确率达98% [6] - Hyper3D发布Rodin Gen-2 Edit，推出基于自然语言的3D模型局部编辑功能，是业内首个将3D生成与编辑整合为完整工作流的商用产品，支持导入任意现有模型进行编辑 [7] 前沿技术与研究 - 蚂蚁灵波科技开源高精度空间感知模型LingBot-Depth，采用掩码深度建模方法，无需更换硬件即可提升对透明、反光等复杂材质的深度感知质量，实测中灵巧手可成功抓取透明玻璃杯 [8] - Anthropic CEO Dario Amodei发布长文预警，预测最早2027年可能出现诺奖级别的AI，并可能形成拥有5000万“国民”的“数据中心天才国家”，同时剖析了AI可能带来的五大危机 [9]