Workflow
智能体(Agent)
icon
搜索文档
腾讯研究院AI速递 20250427
腾讯研究院· 2025-04-26 23:50
OpenAI GPT-4o模型升级 - 优化记忆存储机制,提升对话信息记忆和回忆能力 [1] - STEM领域推理能力显著提升,更好解决数学、科学、工程等复杂问题 [1] - 对话风格更加主动自然,擅长引导对话方向,回复更贴近真实交谈 [1] DeepResearch轻量版发布 - 基于o4-mini的轻量版DeepResearch免费开放使用,付费用户获额外额度 [2] - 轻量版用时更短、内容更精简,但保持相近智能水平 [2] - 实测显示轻量版更注重梳理重点脉络,适合快速了解概况的场景 [2] Kimi开源音频基础模型 - Kimi-Audio开源模型支持多种音频任务,在十多个基准测试中实现SOTA性能 [3] - 采用音频分词器、大模型、去分词器三大核心组件的集成式架构 [3] - 预训练数据集规模达1300万小时,通过三阶段训练方法显著提升性能 [3] DeepWiki代码理解工具 - 为GitHub仓库提供AI驱动的实时交互式文档,免费免注册 [4] - 通过层级化分解和提交历史分析理解代码全局结构,已索引3万个仓库 [4] - 处理超40亿行代码,使用方式简单只需替换域名即可访问AI文档 [4] 百度开发者大会发布 - 文心4.5 Turbo和X1 Turbo两款新模型发布,价格最高降80% [6] - 发布高说服力数字人、多智能体协作APP"心响"、内容操作系统"沧舟OS" [6] - 推出"AI开放计划",发布首个支持电商交易的MCP服务 [6] Perplexity浏览器追踪计划 - 计划推出浏览器"彗星",追踪用户全部在线行为以销售超个性化广告 [7] - 已与摩托罗拉达成合作预装应用,正与三星洽谈合作 [7] - 未来有意收购Chrome浏览器业务 [7] 软体机器手研发 - 清北团队研发两款新型软体机器手,一款基于肌电控制可达10Hz点击频率 [8] - 首款软体假肢手重405.8克,30分钟即可掌握,满足日常办公需求 [8] - 成本控制在千元级,将应用于康复医疗、电竞等领域 [8] 美国政府AI行动计划 - OpenAI和Anthropic呼吁加强对中国AI封锁,建议限制高端GPU芯片输出 [9][10] - Meta和谷歌认为开源AI是美国竞争优势,过度管制会让美国失去主导权 [9] - 美国政府收到超1万份AI行动计划建议 [10] 大模型推理能力研究 - 清华研究表明强化学习未真正提升大模型推理能力,答案来自基座模型分布 [11] - 在数学、代码和视觉推理三大领域,基座模型大量采样后超越RL模型表现 [11] - RL只能优化现有能力而难以创造新能力,真正突破需基础架构创新 [11] Agent系统科普 - Agent核心是LLM与工具的循环交替调用,LLM负责决策,工具负责执行 [12] - 协作式Agent比完全自主Agent更有现实价值,可让用户实时观察和纠正AI行为 [12] - 评估Agent系统需关注多个维度而非盲目使用Agent解决所有问题 [12]