Workflow
AGI失控
icon
搜索文档
腾讯研究院AI速递 20250506
腾讯研究院· 2025-05-05 18:05
生成式AI - DeepSeek-Prover-V2推出671B和7B模型,采用递归+强化学习提升数学推理能力,创造多项新纪录 [1] - 采用DeepSeek-V3分解定理+GRPO算法优化,结合冷启动训练实现非形式化与形式化推理统一 [1] - 7B模型在本科级测试表现优异,展现独特基数处理能力 [1] - Anthropic发布Claude整合功能(Integrations),基于MCP协议实现与Jira等10个热门服务的无缝连接 [1] - Claude新增研究能力,可在5-45分钟内完成复杂调研,支持多数据源查询并标明出处 [1] - 新功能目前在Max、Team和Enterprise计划测试,全球付费用户已可使用Web搜索 [1] AI语音与播客 - Google NotebookLM支持50种语言生成播客,语音地道,擅长模拟京腔等本地口音 [2] - 产品将文本转化为轻松对谈,摆脱AI语音生硬感,由Google产品经理Martin和编辑Johnson主导 [2] - 具备资料溯源功能,可处理2500万字内容,标注引用来源并加入音频水印 [2] 社交与AI整合 - Meta推出独立AI应用对标ChatGPT,可通过用户社交数据实现个性化服务,包含发现信息流功能 [3] - 应用与Meta社交产品矩阵打通,支持语音交互和图像生成,在美加等地区首批开放 [3] - 软件与Meta AI眼镜深度整合,扎克伯格预测未来眼镜将全面智能化,全息影像将取代实体屏幕 [3] AI编程与开发 - 苹果与Anthropic合作开发"氛围编程"软件平台,基于Claude Sonnet模型,用于代码编写和测试 [4] - 该平台为Xcode新版本,目前仅计划内部使用,此前苹果自研AI编程工具因精度不足未发布 [4] - 苹果正构建AI合作网络,此前已与OpenAI合作整合ChatGPT,并考虑引入谷歌Gemini作为备选 [4] 图像生成与一致性 - Midjourney推出Omni-Reference全向参考功能,通过--oref和--ow参数实现人物、物体、场景的超高一致性 [5] - 相比4o和Lora模型,Omni-Reference只需一张参考图即可保持细节迁移和风格统一 [5] - 新功能支持真人写实、动漫风格,还能实现机械体、装置物等复杂物体的多角度一致性呈现 [5] - Runway参考功能支持多角色参考、风格迁移等广泛应用,无需反复调参即可实现角色一致性生成 [5] - Gen-4模型支持类ChatGPT的自然语言提示,能理解复杂语义,可用于黑白照片着色、室内设计等12种创意应用 [5] AI科研与智能体 - FutureHouse推出四个AI科研智能体(Crow、Falcon、Owl、Phoenix),在文献搜索精度和准确性方面超越GPT-4.5及人类博士 [6] - 这些AI智能体可访问完整科学文献全文,具备信息质量评估能力,能透明展示推理过程,提供API集成 [6] - AI科学家团队已应用于疾病机制研究、文献矛盾梳理、实验方法分析等领域,可显著提升科研效率 [6] AGI与失控风险 - MIT研究显示:即使采用最理想的监督机制,人类成功控制超级智能的概率仅为52%,AI失控风险可能超过90% [6] - 研究提出"康普顿常数"概念,通过四种博弈场景验证了嵌套可扩展监督机制的有效性与局限性 [6] - 随着AI智能水平提升,监督难度增大,Guard获胜概率持续下降,人类最终可能难以控制超级智能AI系统 [6] 具身智能与机器人 - Physical Intelligence创始人强调收集多样化机器人数据的重要性,认为机器人需具备适应不同环境的能力 [7] - 专家低估了运动控制中蕴含的智能,机器人需要从自身物理体验中学习,而不仅仅依靠观察数据 [7] - 未来机器人形态可能呈现"寒武纪大爆发"式的多样化,针对不同场景可能出现专门的机器人设计 [7]