Shortcut

搜索文档
腾讯研究院AI速递 20250707
腾讯研究院· 2025-07-06 22:05
Grok 4性能突破 - Grok 4在HLE测试中得分45%,超越Gemini 2.5 Pro和Claude 4 Opus [1] - 采用"第一性原理"构建推理机制,从基本公理层面分析问题 [1] - 将分Grok 4和Grok 4 Code两个版本,强化编码能力,预计7月4日后发布 [1] Gemini CLI功能升级 - 新增音视频输入功能扩展多模态交互能力,目前支持文本/图片/PDF处理 [2] - 增强Markdown功能并集成VSCodium/Neovim编辑器,提升开发体验 [2] - 技术栈升级至Ink 6和React 19,优化历史记录压缩算法提高性能 [2] 昆仑万维奖励模型 - Skywork-Reward-V2系列刷新七大评测榜单,参数规模6亿至80亿 [3] - 采用两阶段迭代数据甄选流水线,从4000万样本筛选2600万高质量数据 [3] - 1.7B小参数模型性能接近70B大模型,证明高质量数据可抵消参数限制 [3] DeepSeek R1开源进展 - 德国TNG开源DeepSeek-TNG-R1T2-Chimera模型,基于三大模型混合开发 [4] - 推理效率比R1-0528提升200%,降低推理成本且主流测试表现更优 [5] - 创新AoE架构利用MoE细粒度结构,通过权重插值优化子模型性能 [5] Excel Agent技术突破 - Shortcut成为首个超越人类的Excel Agent,10分钟解决世锦赛难题 [6] - 功能兼容性近乎完美,可处理金融建模/数据分析/像素艺术等复杂任务 [6] - 早期预览阶段存在格式化弱/长对话不佳/复杂数据易宕机等局限 [6] Sekai视频数据集 - 上海AI Lab开源5000+小时第一人称视频,覆盖101国750城 [7] - 分为真实世界Sekai-Real和虚拟场景Sekai-Game,含多维标签 [7] - 基于数据训练Yume模型支持键鼠控制视频生成,助力视频研究 [7] 医疗AI突破 - ChatGPT识别MTHFR A1298C基因突变,被称为医疗界AlphaGo时刻 [8] - 微软MAI-DxO系统诊断NEJM病例准确率85%,是医生的四倍 [8] - 医疗AI正成为全流程解决方案,开启AI+医生共治模式 [8] 上下文工程兴起 - 上下文工程取代提示工程成为AI智能体成功关键因素 [9] - 关注为LLM提供完整系统包括指令/历史/工具等全方位信息 [9] - 智能体失败多因上下文问题而非模型本身 [9] AI重塑市场调研 - 生成式AI将1400亿美元传统调研转变为持续动态竞争优势 [10] - AI原生公司构建"虚拟社会"模拟用户行为,实现实时低成本调研 [10] - CMO认为70%准确率+实时更新比传统方式更具商业价值 [10] 企业AI创业趋势 - 企业级AI需解决真实环境中用户行为不可预测等"最后一公里"问题 [11] - 顶尖AI公司年增长率达10倍以上,受益于采购行为变革 [11] - 通过数据权威/工作流锁定/垂直整合等方式构建竞争壁垒 [11]
10分钟搞定Excel世锦赛难题!首个超越人类Excel Agent,网友:想给它磕一个
机器之心· 2025-07-04 10:36
机器之心报道 编辑:杨文 这个AI让打工人「磕头」致谢。 前段时间,我们报道了 5 款大模型参加了今年山东高考 的事儿,为了弄清楚各大模型在 9 个科目中的具体表现,我们对着测评明细表挨个儿分析,搞得狼狈又崩 溃。要是哪个 AI 能一键分析表格,我当场就能给它磕一个。 现在,终于有 AI 来整顿 Excel 表格了! 这款 AI 工具名为 Shortcut,号称是「第一个超越人类的 Excel Agent」。它能够一次性完成大多数 Excel 知识工作任务,甚至在大约 10 分钟内就解决了 Excel 世界 锦标赛的复杂案例,准确率超过 80%,这比人类快 10 倍。 (冷知识: Excel 世界锦标赛( MEWC )是由金融建模世界杯( FMWC )团队组织、微软官方支持的全球性电子竞技赛事,参赛者需通过 Excel 解决复杂场景化题目, 2024 年决赛以《魔兽世界》为模拟场 景,冠军奖金 5000 美元。) Shortcut 目前处于早期预览阶段,大家可以在 X 上评论以获取邀请码。 Shortcut 具有与 Excel 近乎完美的功能兼容性,可以直接编辑、导入和导出文件,它不仅限于基础 Excel 操 ...
AI生成快捷指令,苹果AI最有用的一集来了,然并卵?
36氪· 2025-06-06 12:22
彭博社记者 Mark Gurman 在稍早前的一次报道中就披露,苹果计划在 WWDC 2025 上宣布为「快捷指令(Shortcuts)」引入 Apple Intelligence 实现 AI 生成 快捷指令,用户只需用一句自然语言,就能自动生成包含复杂自动化流程的快捷指令。 图/苹果 这意味着,不再需要拖拉模块、配置变量、苦读社区教程,手机可以直接听懂你的「意图」,并转化为系统级的执行链路和快捷指令。 一年一度的 WWDC 大会,即将拉开序幕。 按照苹果的时间表,WWDC 2025 首场主题演讲将于北京时间 6 月 10 日凌晨 1 点开始。根据多方爆料的信息,今年 WWDC 苹果在系统层面的一大重点是 视觉设计大改,从 iOS 到 watchOS 在向 VisionOS 的风格迭代,同时话题当然也离不开 AI。 没错,尽管 Apple Intelligence 去年发布以来跳票不断,至今都没能完整上线,甚至已经被用户集体上诉,但在 AI 这件事,苹果终究还是要继续踏步向前。 相比 AI 智能体完全替代人类操作手机,这或许不够性感,但在今天的技术条件下更容易落地,也可能与智能体相互配合,实现真正的 AI 工 ...
下周的WWDC,苹果AI依旧不会有“惊喜”
硬AI· 2025-06-03 23:26
图 点击 上方 硬AI 关注我们 万众期待的年度开发者大会或未能展示苹果在AI领域的追赶决心,反而还可能凸显其短板。分析指出,苹果核心AI功能 (如新版Siri)持续跳票,其发布内容多为品牌包装,重磅技术仅开放30亿参数小模型给开发者,远逊于竞争对手。 作者 | 龙 玥 编辑 | 硬 AI 这并不是说苹果最近在人工智能方面没有取得进展。在内部,它拥有各种复杂程度的模型。目前,拥有30 亿、70亿、330亿和1500亿个参数的版本正在积极使用中。这个1500亿参数的模型依赖云计算,比苹果的 设备端技术强大得多,能进行更为微妙的推理。 硬·AI 内部基准测试表明,该模型的质量接近近期推出的ChatGPT。但由于担心幻觉以及公司高管之间的理念差 异,该公司暂缓使用该技术来推出自己的聊天机器人。 不过,目前尚无公开发布的计划。 02 在科技巨头们激烈争夺AI领导权的战场上,苹果正陷入一场尴尬的延迟游戏。下周一(6月9日)开幕的苹 果全球开发者大会(WWDC)或将不会扭转这一局面。 据彭博最新报道, 苹果公司内部人士对此次大会AI展示部分已做好"令人失望"的心理准备,外界观察人士 则担忧此次发布会可能会让苹果在AI领域 ...