Office Agent
搜索文档
认知偏差、落地断层、体验割裂是目前AI产品的三大痛点|百度王颖@MEET2026
量子位· 2025-12-19 09:01
编辑部 整理自 MEET2026 量子位 | 公众号 QbitAI 当AI从"能说会道"的聊天伙伴,演进为"能想会做"的行动助手,一个关键问题却日益凸显: 为什么AI能力越强,用户完成复杂任务反而越"累"?认知偏差、落地断层与体验割裂,正成为横亘在AI普惠面前的三大鸿沟。 对此, 百度集团副总裁,文库事业部、网盘事业部负责人 王 颖 在量子位MEET2026智能未来大会上,分享了 AI时 代 下的"超级个 人 智 能体" 。AI超越问答与生成,转向深度融合个人记忆、理解复杂意图、自主调度多能力协同执行的综合性智能伙伴。 她系统阐释了百度如何通过核心调度中枢GenFlow及全新智能体生态,将百度文库与百度网盘重塑为 " 最懂你、 能搜索、会干活"的超级个 人助手 ,并披露了其全球化进展。 MEET2026智能未来大会是由量子位主办的行业峰会,近30位产业代表与会讨论。线下参会观众近1500人,线上直播观众350万+,获得了主 流媒体的广泛关注与报道。 核心观点梳理 …… 以下为王颖演讲全文: 为完整呈现王颖的思考,在不改变原意的基础上,量子位对演讲内容进行了整理编辑,希望能给你带来更多启发。 认知偏差、落地断层 ...
OpenAI发布GPT-5.1模型 更具“温暖感” 并提供更多个性化选项
凤凰网· 2025-11-14 17:05
产品更新 - 公司宣布旗舰AI模型升级至GPT-5 1 本周开始向ChatGPT用户推送新版本 [1] - 新模型被官方称为让ChatGPT更加聪明和有趣 带来诸多改进和新功能 [1] - 模型分为Instant和Thinking两个版本 Instant在温度 智能程度和指令理解力方面优于前代 Thinking在应对复杂问题时更高效持久 简单任务反应速度提升 系统自动为用户匹配模型 [3] - 原有GPT-5模型仍可以遗留模型形式使用三个月 之后将被下线 [3] 功能特性 - 公司极大丰富了对话风格个性预设选项 用户可在默认 专业 友好 坦率 古怪 高效 书呆子和愤世嫉俗等多种个性间切换 [3] - 公司将试验允许部分用户直接在设置中微调ChatGPT的语言风格 [3] - 公司首席执行官表示ChatGPT已拥有超过8亿用户 远超一个标准模式可应对的范畴 [3] 历史背景与市场反应 - 今年八月公司首度推出GPT-5时炒作和期待颇高 但实际表现未能让部分用户满意 许多人认为升级幅度有限 [3] - 公司最终在发布仅一天后重新开放GPT-4o选项以回应用户需求 [3] 行业合作与产品整合 - 公司战略伙伴微软在GPT-5未能取得突破后 开始寻求与Anthropic等其他AI公司合作 [4] - 相关模型已应用于Copilot Researcher GitHub Copilot Copilot Studio以及可通过聊天界面制作Word和PowerPoint文档的Office Agent等产品线 [4] 公司近期动态 - GPT-5 1问世仅几周前 公司刚刚发布了AI驱动的网络浏览器ChatGPT Atlas [4] - ChatGPT Atlas目前仅向ChatGPT高级订阅用户开放代理模式 能直接在浏览器中代表用户执行操作 [4]
Office Agent:新一代多智能体系统
搜狐财经· 2025-10-15 12:29
产品发布与核心功能 - 微软正式推出基于开源技术栈和Anthropic Claude模型的多智能体系统Office Agent,采用全新的"品味驱动开发"范式构建[1] - 该系统旨在帮助用户快速生成高质量内容,包括精致的PowerPoint演示文稿、可直接使用的Word文档以及即将推出的动态Excel表格[1] - Office Agent通过多个专用智能体的协同合作,实现了从规划、撰写到完善的全流程自动化,全方位提升Office内容生产效率[1] 技术架构与性能表现 - 系统基于通用型智能体架构,已通过行业领先基准测试GAIA认证,在处理复杂工作流时兼具可靠性与精细度[1] - 在GAIA基准测试中,Office Agent在L1难度获得88.7分,L2难度获得76.7分,L3难度获得60.0分,表现优于Genspark、Manus和OpenAI Deep Research等竞争对手[2] - 架构由多智能体编排引擎驱动,包含中央规划智能体、专用智能体(涵盖代码、金融、搜索等领域)和安全工具层[3][5] 品味驱动开发创新 - Office Agent引入品味驱动开发方法,通过分析海量高质量演示文稿样本提取核心品味设计蓝图,直接影响生成的版式、风格与内容[6] - 工作流采用迭代循环,每则生成内容均通过"内容自验证模块"进行审校,评估质量与美感,驱动自我迭代与优化[6] - 系统提供转换工具,可将HTML5自动转换为PowerPoint格式,方便用户在Microsoft PowerPoint中进一步编辑[6] 自动主题与风格规则 - 微软设计自动主题功能,直接读取内容本身并生成与之自然契合的设计,而非让用户从预设模板中挑选[12] - 微软设计师通过审视和打磨示例案例,提炼出风格规则,由智能体在运行时应用,保证生成结果既呼应核心指令,又能规模化输出精致内容[14] 质量评估体系 - 微软团队开发TDDEval基准测试,专门评估TDD在PowerPoint、Excel和Word中的表现,涵盖多种测试任务和边界场景[16] - 质量评估采用双重视角框架:内容质量(事实与结构完整性)和品味评分(美学与体验维度)[17][20] - 评估指标包括主题相关性、覆盖完整性、逻辑结构、视觉吸引力、布局组织、字体排版质量等具体维度[20] 技术实现经验 - Office Agent采用"code-first"方法,允许模型编写并执行代码,而非依赖任务专用工具,提升智能体的灵活性和泛化能力[19] - 系统通过自我验证提升准确率,鼓励模型重述原始问题并与当前输出比对,插入中间检查点提升可靠性[20][21] - 智能体具备类人浏览能力,支持点击链接、翻页、滚动等操作,将所有中间观察纳入上下文以提升推理能力[24] 市场部署与生态整合 - Office Agent已通过Frontier计划向Microsoft全球版个人和家庭订阅用户开放,面向商业用户的支持也即将到来[22] - 领驭科技作为微软中国南区核心合作伙伴,正积极整合Azure OpenAI的强大功能到其产品和行业解决方案中[23] - 微软团队正在推进智能体的编排能力,丰富审美风格库,并进一步扩展其在微软生态系统中的集成[22]