腾讯研究院AI速递 20251126
腾讯研究院·2025-11-26 00:01
- API定价为每百万Token 5/25美元(输入/输出),相比上代Opus 4.1降低2/3,在SWE-bench Verified中等 effort设定下输出token使用量减少76%; 3. 模型在居家测试中得分超过所有人类候选人,在抵御提示注入攻击方面显著增强,是目前最不容易被欺骗的前沿模 型之一。 https://mp.weixin.qq.com/s/cTD-vqtuQXiC6AxBmnYOzQ 二、OpenAI 推出新入口,让 ChatGPT 直接替我们做「购物研究」 生成式AI 一、智能体&编程新王Claude Opus 4.5更新登场,定价大降2/3 1. Anthropic正式发布Claude Opus 4.5,在编程、智能体及计算机操作方面表现卓越,真实世界软件工程测试达行 业SOTA,超越GPT-5.1-Codex-Max和Gemini 3 Pro; 1. OpenAI向所有登录用户开放"购物研究"功能,由经过强化学习训练的GPT-5 mini版本支持,准确率达64%,改 变传统搜索逻辑让AI替用户做购物功课; 2. 该功能通过追问预算、用途、期待功能等问题生成深度买家指南,支持图片 ...