Workflow
Context学习
icon
搜索文档
腾讯研究院AI速递 20260204
腾讯研究院· 2026-02-04 00:03
OpenAI发布桌面版Codex并调整访问策略 - OpenAI发布macOS桌面版Codex应用,定位为“AI智能体指挥中心”,支持多Agent并行工作,通过“工作树”模式隔离不同任务的代码变更 [1] - 该应用支持异步后台运行、技能系统和定时自动化任务,内置沙箱控制精确管理AI权限,公司CEO称“仅凭Codex就完成了一个完整项目” [1] - OpenAI同时为所有付费用户临时加倍速率限制两个月,并首次向免费用户开放Codex访问权限,正面迎战Anthropic和Cursor [1] 智谱发布并开源小参数高性能OCR模型 - 智谱发布并开源GLM-OCR模型,仅0.9B参数在OmniDocBench V1.5以94.6分登顶SOTA,性能接近Gemini-3-Pro [2] - 模型专攻手写体、复杂表格、代码文档及印章等高难场景,支持vLLM、SGLang和Ollama部署,API价格仅0.2元/百万Tokens [2] - 技术上采用自研CogViT视觉编码器,首次将多Token预测损失引入OCR训练,支持批量处理和RAG检索增强生成 [2] 腾讯混元发布研究揭示模型上下文学习能力短板 - 腾讯混元技术博客正式上线,发布姚顺雨团队研究成果CL-bench,揭示当前前沿模型从上下文学习的能力严重不足 [3] - 评测显示十个SOTA模型平均仅解决17.2%任务,最好的GPT-5.1也仅达23.7%,68.5%的候选解存在根本性错误 [3] - 研究指出AI竞争焦点将从模型能力转向“谁能提供最丰富Context”,记忆机制可能成为2026年另一核心研究主题 [3] xAI发布免费视频生成模型并取得高使用量 - xAI正式发布Grok Imagine 1.0视频生成模型,支持文生视频和图生视频,单次生成10秒720P视频,音频效果大幅提升 [4] - 模型具备电影级运镜理解、多主体自然互动能力,在Artificial Analysis文生视频排名综合第一,延迟和成本指标最优 [4] - 测试期30天内已生成12.45亿条视频,API已发布,官网免费开放体验 [4] 腾讯ima接入混元图像模型支持多场景创作 - 腾讯ima接入混元图像3.0图生图模型,支持上传照片生成旅游图、家装效果图、四格漫画等多场景创意内容 [5] - 产品可用于娱乐玩梗、家庭写真定制、设计稿快速生成、医疗科普配图等工作生活场景 [5] - 用户只需上传图片并输入指令,即可获得符合创意的生成图片,支持绘本故事定制和家装布置预览 [6] Adobe关停传统动画软件全面转向AI战略 - Adobe宣布3月1日停售拥有25年历史的Animate软件,企业客户三年支持、其他用户仅一年,之后将无法访问任何文件 [7] - Adobe未提供像样替代方案,仅建议用After Effects和Adobe Express部分替代,被批评为“用滑板替代汽车” [7] - 此举被视为Adobe全面转向AI战略的信号,用户质疑被逼使用尚未成熟的技术,历史上Flash曾推动互联网多媒体革命 [7] SpaceX收购xAI并计划部署太空数据中心 - 马斯克宣布SpaceX完成收购xAI,合并后估值达1.25万亿美元,xAI将成为SpaceX全资子公司 [8] - SpaceX计划推进太空数据中心部署,马斯克称每年可通过百万吨级卫星发射新增100GW AI算力,长期目标达1TW [8] - 合并让xAI获得稳定资金支持,此前xAI每月烧钱约10亿美元,SpaceX被认为是马斯克旗下“最成功最稳健”的企业 [8] 谷歌研究揭示AI辅助数学研究的实际挑战 - 谷歌用Gemini对700个Erdős未解数学问题进行系统攻关,推进13个问题,其中5个是模型自主新解,8个是从文献中挖出被遗漏的解答 [9] - 研究显示68.5%候选解存在根本性错误,真正有意义的正确解仅6.5%,大量时间消耗在核验、纠错和文献排查上 [9] - 谷歌坦言这些问题任何领域专家都能轻松完成,AI辅助数学研究的真实成本远超想象,需警惕AI“潜意识抄袭”文献的风险 [9] a16z报告阐述AI时代软件护城河的重要性 - a16z AI应用团队认为AI时代是所有技术周期的叠加,传统软件正全面走向AI native,greenfield机会大于brownfield [10] - 软件正在“吃掉”劳动力市场,但真正价值不在于省钱而在于增收,如Salient通过AI让回款率提升50%而非单纯降低成本 [10] - 围墙花园类公司因掌握专有数据而价值倍增,护城河在软件可快速构建的时代比以往任何时候都更重要 [10]