Agent技术
搜索文档
头部大模型公司去年欠华南大厂上亿训练费;某大厂数采业务,实际上大部分靠外包;硬件公司老板和神秘大佬吃饭后,风格大变|AI情报局VOL.4
雷峰网· 2026-04-09 20:11
独立大模型公司的财务困境与转机 - 某头部独立大模型公司在去年曾一度拖欠华南某云厂商上亿元的训练费,后随着收入跑通才逐步偿还 [2] - 独立大模型公司普遍面临现金流紧张,另一家公司曾有两三个月发不出工资,前一年的年终奖也未发放,导致销售离职 [2] - 转机出现,随着Agent和多模态技术在今年真正落地,独立厂商在海外的影响力逐渐扩大,财务窘迫状况有望缓解 [2] 大厂新业务的实际运营状况 - 北京某大厂高调进军具身智能数据采集业务,声称一年内采集100万小时本体数据,但实际仅部署30台机器人本体,远低于行业通常所需的千台规模,令客户失望 [2] - 该大厂的数采业务实质以“众包”为主,将项目外包给第三方公司,自身主要提供场景资源,目的是最大化利用其原有的数据标注团队 [3] 小家电企业的战略转向 - 一家靠创始人IP突围的知名小家电企业,其创始人近期主动减少曝光,婉拒多家媒体采访,风格发生显著变化 [3] - 创始人风格转变据传源于与一位极少露面的互联网大佬共进晚餐后心态发生变化 [3] - 企业对外发声已转向几位联合创始人,但品牌早期增长高度依赖创始人IP,其“撤火”可能带来后续流量缺口问题 [4] AI算力公司的人力与增长困境 - 一家从H厂剥离、正冲刺IPO的AI算力公司,成立初期以“H厂退休标准”(保留原分红、股票,年薪与年终奖不变)吸引员工,快速搭建团队 [4] - 因运营压力增大,公司承诺正在松动,计划降薪并引入对标行业标准的新人,逐步替代高成本的老员工 [4] - 为冲刺IPO,公司向软件领域探索以寻找新增长故事,但当前软件项目更多是为增厚营收流水,实质性软件能力尚未落地 [4] 割草机器人赛道的融资热潮 - 割草机器人公司来牟科技正以约1亿美金估值进行融资,拟募资7000万至8000万美元,已进入投决阶段,多家机构有投资意向 [5][6] - 由于赛道关注度高,机构担心错过窗口期,出现“抢项目”氛围,但业内人士认为该项目本质上只能赌,考验长期判断与执行能力 [6] - 公司产品采用履带式方案具备差异化,2026年出货目标从3-4万台理性调整至约2万台,并以Sell out(实销)为主,销售数据更具参考价值 [6] 具身智能公司的内部管理问题 - 深圳某采用绳驱方案的具身智能公司(约50多名员工)内部发生派系斗争,高管H排挤其他技术负责人,导致大量技术人员离职,甚至整个运控团队跳槽至竞对公司 [6] - 公司过去一年更换了三拨HR,且新HR多为应届生,能力薄弱,导致人才难以补齐 [7] HR SaaS厂商的AI收费策略 - 一家头部HR SaaS厂商与飞书深化生态绑定,将其全量AI能力接入飞书平台,并实现统一点值计费与跨平台收益结算 [7] - 该厂商明确表示现阶段不考虑按Token收费,认为那样纯属给大模型厂商打工,需将Token价格翻两倍才可能盈利 [8] - 因此,厂商选择将服务打包按会话收费,定价比原Token价高出好几倍,以覆盖销售和研发成本 [8] 国产AI芯片公司的资本路径 - 过去三年间,多家国产AI芯片公司为解决经营与融资压力,曾主动寻求被国内某头部信创整机企业收购,谈判一度深入(有员工以“同事”相称),但最终均告失败 [9] - 在产业收购路径被阻断后,这些公司转而选择并已完成公开上市,目前均已登陆科创板或港交所 [9]
顶会论文抢先看!机器之心ICLR 2026论文分享会,下周六北京见
机器之心· 2026-04-09 19:40
AI领域前沿发展趋势 - 2026年AI浪潮以前所未有的速度重塑技术边界,核心进展包括大模型训练效率持续突破、具身智能加速从实验室走向现实场景落地、多模态融合技术日趋成熟 [2] - Agent技术的崛起正在重新定义人机协作的可能性,如何让智能体具备持续学习与自主决策能力成为学界与产业界共同追逐的核心命题 [2] ICLR 2026学术会议概况 - ICLR 2026将于4月23日至27日在巴西里约热内卢举行,是洞察全球AI研究最前沿动向的重要窗口 [2] - 本届大会共收到有效投稿超1.9万篇,总录取率约为28% [2] 机器之心ICLR 2026论文分享会概览 - 机器之心将于2026年4月18日在北京举办ICLR 2026论文分享会,旨在让国内研究者和从业者第一时间深入解读前沿成果 [4] - 活动时间为北京时间4月18日09:00-17:30,地点为北京中关村皇冠假日酒店3F [4][5] - 活动设置Keynote演讲、论文分享、圆桌对话、Poster及企业展位交流等多个环节 [4] - 活动将围绕Agent、大模型训练、具身智能等业界热门方向展开 [4] - 分享会将在机器之心视频号及黄大年茶思屋科技网站等平台进行直播 [30] 分享会议程与核心内容 - **上午议程**:包含开场、Keynote演讲及多场论文分享,主题涵盖结构化上下文泛化、大模型预训练学习率调度、物理无关的神经算子预训练框架、一步动作生成的流策略、稀疏CUDA生成的强化学习、不完整多模态分类的动态模态选择等 [6][8][12] - **下午议程**:包含Keynote演讲、圆桌对话、论文分享及Poster交流,主题涵盖可持续学习智能体、低精度Transformer训练分析、无监督RLVR扩展LLM训练、信息塑造Koopman表示等 [8][9][10][13] - **圆桌对话主题**为“OpenClaw后,Agent何去何从” [9] - **Poster及企业展台交流**时间为16:20至17:30 [13] Keynote演讲嘉宾与主题 - **姚权铭(清华大学电子工程系副教授)**:演讲主题为“结构化上下文:有限监督泛化的新路径” [15] - 姚权铭研究方向为机器学习与科学智能,聚焦基座模型泛化机理与高效智能体决策,发表论文120余篇,被引1.5万余次 [17] - 其报告将探讨在少样本、弱反馈及分布变化条件下,如何通过结构化上下文机制,将学习从“依赖标签”转向“依赖结构”,以实现有限监督下的泛化与扩展 [18][19] - **张宁豫(浙江大学副教授)**:演讲主题为“迈向可持续学习的智能体现状与趋势——以OpenClaw为例” [20] - 张宁豫研究方向为自然语言处理、大模型、知识图谱等,多次入选斯坦福全球前2%顶尖科学家榜单 [20] - 其报告将介绍大规模智能体发展的三个核心方向:边界感知、技能编排以及记忆演化,指出智能体正从简单工具调用系统迈向具备长期任务执行与环境交互能力的复杂系统 [21] Poster展示论文与研究 - 分享会设有多篇Poster论文展示,涉及大模型安全对齐、长视野智能体、推理微调、多模态模型知识演化、自动驾驶轨迹规划、参数高效训练、空间记忆模型、持续学习、测试用例生成、临床基准、时间序列预测、可验证角色意识、自动形式化、脉冲神经网络稳定、安全策略迭代、车辆控制命令澄清等多个前沿方向 [25][27] 活动合作伙伴 - **独家战略合作伙伴**:黄大年茶思屋科技网站,一个致力于推动科学与技术交流的开放平台 [32] - **生态合作伙伴**:博世集团,全球领先的技术和服务供应商 [33]
GenAI系列报告之72:OpenClaw会引领Agent元年吗?
申万宏源证券· 2026-03-17 22:53
报告行业投资评级 - 看好 [1] 报告的核心观点 - 2026年将成为Agent(智能体)商业化关键分水岭,标志着AI从“对话式助手”转向“数字员工” [3][4] - Agent技术的成熟是软件系统的全面革新,推动AI从单一“工具”向全面“执行系统”转型 [3][5] - Agent技术并未“吞噬软件”,而是通过优化任务执行和流程自动化,重新定义了软件的价值分配,为嵌入企业核心流程的B端软件平台创造了结构性增量机会 [3][6] 根据相关目录分别进行总结 1. Agent在2026年的变化 - **产品演变**:从“工具”到“数字员工”。以OpenClaw和Claude Cowork为代表的产品实现了AI从“对话式助手”向“执行式代理”的转变 [14]。OpenClaw作为开源“数字员工”,通过Headless架构在用户日常通讯工具(如微信、WhatsApp)中无缝执行高频任务 [26][27]。Claude Cowork则作为商业化“桌面任务执行引擎”,能在0代码环境下处理复杂的跨平台任务 [15][20] - **技术基础**:打造高效、可靠的Agent基础。过去三年,Agent所需的Brain(推理与规划)、Memory(上下文与记忆)、Action(工具调用与执行)三类底层能力已逐步闭环 [37]。技术演进路径为:2023年Reasoning(推理)突破,模型开始具备复杂任务规划能力 [38];2024年Memory(记忆)突破,长上下文与外部记忆体系成熟 [45];2025年Action(行动)突破,工具调用能力实现标准化和平台化 [51];2026年Agent技术进入系统化阶段,竞争重心转向多Agent协作、任务调度等系统级能力 [56] - **交付标准化**:关注成功率、可审计性与风险管理。企业部署Agent的核心约束包括端到端任务成功率、过程可审计与可复盘性、单位任务成本可预测性以及明确的风险边界 [60]。通过能力模块化、标准化工具栈、强约束工作对象来提升任务闭环稳定性 [61];通过对象级、过程级和动作级证据链实现可审计 [63][64];通过上下文成本治理和试错成本约束实现成本可控 [65];通过关键动作许可机制、执行环境隔离和最小权限原则控制风险边界 [66] 2. 模型会吞噬软件吗? - **市场讨论**:Claude Cowork等产品的出现引发了市场对“模型吞噬软件”的担忧,认为大模型可能从提供API能力转向直接切入应用层,冲击现有软件价值 [69] - **实际影响**:Agent实际带来了软件的价值分化,而非吞噬。模型将一部分通用能力(如写作、总结)标准化,降低了为单点功能使用独立软件的需求 [74]。但企业真正持续付费的价值在于数据合规访问、流程稳定执行、结果核验追溯和风险控制,这部分价值不会被模型吞噬,反而会在Agent放量时被重新定价 [74]。低切换成本、弱客户接触的软件形态易被替代,而深度嵌入企业核心流程、管理数据和任务执行的软件则因Agent技术加持实现价值扩展 [3][75]。在中国市场,软件行业具有更强的定制化特色和行业know-how壁垒,大模型难以完全取代应用 [77][78] 3. Agent利好的方向 - **办公软件与协同套件**:成为Agent的“核心入口”。它们占据高频入口、业务对象承载和组织级权限控制面的关键位置 [83]。例如,Microsoft 365 Copilot、Claude in Excel将Agent能力内嵌于工作流,实现“入口即产品”和“对象级可交付变更” [83][86]。协同与会议系统(如Zoom AI Companion)将沟通内容转化为可执行任务 [90] - **企业安全与“沙箱”需求**:Agent的广泛部署拉动了对轻量级、快速启动沙箱技术的需求,以提供安全隔离的执行环境 [95]。沙箱模式(启动速度约150毫秒)相比传统虚拟机更适合高频、短生命周期的Agent任务 [95][99]。头部云厂商(如阿里云、腾讯云、Google Cloud、AWS)均已推出包含沙箱功能的Agent Infra产品 [102][103] - **B端SaaS平台**:成为模型能力交付的“最后一步”,迎来结构性增量。CRM、ERP等平台掌握业务对象、流程引擎和数据语义,能够将行业know-how固化为可调用的actions(动作) [106]。例如,Salesforce的Agentforce、SAP的Joule Agents将Agent产品化为“数字劳动力”,并强调可见性、控制与流程专长 [107][110] - **Token消耗与云计算**:Agent的推理范式(如“思考->行动->观察”循环)推动Token消耗量爆发式增长 [117]。自2026年1月初起,Token调用量已连续2–4周保持高速增长 [119]。IDC预测Agent将带动Token数据爆发 [121]。云厂商通过提供Agent托管服务,吸引用户并增加云资源消耗,直接受益 [123]。边缘计算和网络安全基础设施(如Cloudflare)同样因满足AI代理的低延迟和安全连接需求而受益 [123] - **To C大入口与复杂场景**:复杂Agent入口的竞争向拥有资金、技术和生态优势的头部互联网平台集中 [124]。在中国,腾讯(微信)、阿里巴巴(千问)、字节跳动(豆包)凭借高频入口和丰富的服务生态占据优势 [126]。例如,豆包DAU已破亿,并接入抖音商城和本地生活 [130];千问在2026年1月上线Agent功能,可实现点外卖、行程规划等端到端动作 [136];“对话即交易”可能重塑互联网竞争格局 [139]
给龙虾定MBTI、发工牌,还让龙虾偷技能…打工人得适应新环境了
量子位· 2026-03-10 16:00
文章核心观点 - AI智能体技术正从单兵作战的聊天机器人阶段,迈向能够深度融入真实业务场景、具备感知与执行能力的“智能体”阶段,其关键在于为AI大脑配备传感器、手脚和记忆系统[31][32][33] - 智能体要在真实商业环境中有效工作,必须解决三大组织管理命题:理解组织结构与权限、拥有稳定身份、具备分层的记忆系统[36][39][43] - 当前行业最缺乏的是一个能让智能体“安家落户”的合适工作台,该平台需具备通畅的通信能力、结构化的业务数据流和丰富的协作上下文[46][47] - 飞书平台因其API模块化、天然承载企业通信与业务数据、以及低门槛部署等优势,成为众多开发者将智能体接入真实生产环境的首选平台[47][48][49][50] 智能体技术发展现状与案例 - 行业动态:近期多家公司发布新的AI模型,旨在降低本地部署门槛,例如智谱和腾讯的模型最快可在1分钟内完成部署[1] - 创意应用案例:开发者利用智能体技术创造了嵌入语音识别芯片的“赛博小马”,可通过语音指令操作电脑完成打开网页、生成视频、创建文件夹等任务[2][3][6] - 管理可视化创新:有项目为智能体开发了RPG风格的可视化面板,可实时查看AI状态(休息、工作、同步数据、修复Bug),并能实现“搬家”、探索新地图、自动生成技能树及联机共享技能[7][9][10][11][12] - 实用工作场景案例: - **视频自动剪辑**:智能体可根据指令自动对视频进行静音检测、语音转录和切片剪辑,例如将一段9分钟的视频精剪至39秒,并能处理多段素材的自动选取与拼接[16][17][18][19] - **电子班主任**:在教辅场景中,智能体可读取学生文档并给出评分与修改建议,辅助复试、搜索资料、评价文献综述,在一周内被调用超过**2万次**API,能实现规模化个性培养[22][23] - **MCN海外营销**:采用多智能体协同的“蜂巢虾群”系统,为不同智能体设定MBTI性格以增强拟人化协同,精准解决传统MCN依赖人力堆叠的痛点[28][29][30] 智能体融入生产环境的核心挑战 - **挑战一:理解组织结构与权限**:智能体必须融入企业现有权限体系,明确自身角色、服务对象及数据访问权限,否则无法进行有效的数据查询或自动化审批[36] - **挑战二:需要稳定的身份**:如同员工拥有工牌,智能体需要一个绝对唯一的标识,这是建立长期信任、实现多智能体及人机协作的基础[39][40][41] - **挑战三:需要分层的记忆系统**:智能体需具备短期记忆处理即时指令,以及通过长期记忆(如向量数据库)沉淀项目背景、用户偏好和历史记录的能力,以做出符合上下文的决策[43][44] 平台的关键作用与飞书的优势 - **平台的核心价值**:一个开放、包容、数据结构化且具备协作基因的底层平台,决定了智能体在实际应用中的表现上限[54] - **飞书平台的具体优势**: - **API模块化**:将云文档、日历、多维表格等核心办公组件进行了API封装,简化了开发流程[48] - **天然的业务数据承载**:平台本身已承载企业通信和业务数据,智能体可直接接入,无需额外导入历史数据[49] - **低门槛部署**:已实现一键在飞书上部署智能体,大幅降低了使用门槛[50] - **本土化普及优势**:其普及速度体现了中国式优势,是国外软件难以比拟的[51] - **行业影响**:智能体技术已走出实验室,正在飞书等平台上经历真实生产环境的大考,先行者们正在重塑未来的工作与协作方式[52][55][56]
氪星晚报|马斯克:人形机器人领域最大竞争对手将来自中国;黄仁勋:英伟达正与英特尔合作开发一款定制的X86处理器
36氪· 2026-01-29 17:17
汽车行业 - 吉利汽车在沈阳成立新公司,注册资本1亿元人民币,经营范围包括汽车零部件及配件制造、研发等,由旗下浙江吉润汽车有限公司全资持股 [1] - 现代汽车2025年销售额达186.25万亿韩元(约合人民币9065亿元),同比增长6.3%创历史新高,但营业利润同比下降19.5%至11.47万亿韩元,全年总销量413.84万辆,其中电动车与混合动力车合计销量96.18万辆,同比增长27% [3] - 宝马公司已成功注册多枚“BMW”商标,并计划自2026年2月起在所有车型上启用新的品牌Logo [4] - 小鹏汽车一项名为“一种机械手及机器人”的发明专利公布,旨在降低机械手驱动件损伤风险和使用成本 [10] 工业自动化与机器人 - 埃夫特机器人宣布对部分工业机器人整机产品售价进行优化调整,调价幅度区间为5%—12%,主要因原材料成本显著攀升,自去年年初至今铜价上涨38%以上,铝价上涨25%以上,存储类芯片价格上涨300%左右 [2] - 特斯拉首席执行官马斯克表示,人形机器人领域最大的竞争对手将来自中国,并指出中国在制造领域实力雄厚,机器人技术已达到全新高度 [13] 消费与零售 - 菜鸟全球供应链食品行业订单量同比增长超35%,其中好想来零食连锁门店、梅见青梅酒、乐事薯片及西麦、健力宝和良品铺子等品牌领涨 [5] - VF威富集团2026财年第三季度营收达28.76亿美元,同比增长1%(按固定汇率计算下降1%),在剔除Dickies业务后营收同比增长4%(按固定汇率计算增长2%) [6] - MINISO名创优品成为2026总台春晚潮玩合作伙伴 [3] 科技与人工智能 - 阿里巴巴将与泽洛斯(zelos)合并自动驾驶业务,并将获得泽洛斯的股份 [7] - 字节已于2025年底开启豆包手机助手正式版项目,新机预计将于2026年Q2中晚期发布,将继续与中兴努比亚合作,由中兴负责硬件,豆包负责AI [9] - 歌尔股份一项名为“一种AR眼镜的校准方法、系统、电子设备及存储介质”的发明专利获授权,旨在提高AR眼镜的图像显示质量 [11] - 英伟达正与英特尔合作开发一款定制的X86处理器 [13] 投融资与资本市场 - 马来西亚最大的连锁便利店之一KK Super Mart正计划进行首次公开募股,市值预计约7.5亿美元,IPO可能占其股权价值的25%以上,计划于2025年下半年上市 [7] - TTC(北京才多对信息技术有限公司)完成A轮千万美元级融资,由厚雪资本领投,百度战略投资,资金将用于强化AI大模型与Agent技术研发及升级“小麦招聘”产品 [7] - 德意志银行第四季度归属于股东的净利润13亿欧元(市场预期11.2亿欧元),固定收益及货币业务收入增长6%,信贷损失风险拨备3.95亿欧元,并批准了10亿欧元的股票回购计划 [8] 物流与供应链 - 九识智能与菜鸟无人车达成深度战略整合,菜鸟以自身无人车业务注入及现金投资成为九识股东,双方将共建RoboVan超级航母并开启双品牌运营 [8] 宏观经济与政策 - 德国联邦政府下调2026年经济增长预期至1%,较去年秋季预测值下调0.3个百分点,主要因2025年下半年经济复苏弱于预期及财政支出拉动效果不及预期 [14] - 人民银行上海总部表示将推动临港新片区离岸贸易金融服务综合改革试点扩围,持续推进人民币国际化及外汇管理改革试点政策落地 [13]
吉利控股发布2030战略目标:销量突破650万 营收破万亿并冲击全球前五
央视网· 2026-01-23 17:53
2030战略目标 - 公司发布“一个吉利,全面领先”2030战略目标,旨在通过强化顶层统筹与全球协同,实现全球“一盘棋”的战略格局,并打造“六位一体”的核心能力体系,推动关键指标达到全球车企领先水平 [1] - 2030年关键指标包括:全球总销量突破650万辆(乘用车+商用车),营收超1万亿元,跻身全球车企销量前五,其中新能源销量占比约75%,海外销量占比超三分之一 [4] - 公司将开发覆盖A到E级车型的全球领先新能源架构,基于全新架构的平均单车型研发周期和综合成本下降30%以上 [4] 近期业绩与品牌战略 - 2025年,公司全年总销量达411.6万辆,同比增长26%,连续五年快速增长,其中新能源汽车销量达229.3万辆,同比增长58%,新能源渗透率达56%,全球销量排名升至第七位 [7] - 为实现2030目标,公司将构建“六位一体”战略能力体系,聚焦品牌、技术、整车、生态、人才和可持续发展六个方面 [7] - 品牌战略以“强化吉利母品牌”为核心,打造全球品牌矩阵,发挥吉利中国星、吉利银河、领克、极氪的品牌优势,并全面释放沃尔沃、极星、莲花跑车等国际品牌在欧美市场的“主场优势”,同时携手雷诺等国际伙伴打造合作新范式 [7] 技术发展规划 - 技术层面,公司将提升以智能驾驶、智能座舱、电子架构、整车架构、电池、电驱、超级电混为核心的“七纵”全域技术体系竞争力 [8] - 智能驾驶方面,将“千里浩瀚”打造为全球先进技术平台,实现L2级辅助驾驶全覆盖,快速推进L3产业化试点,加速L4技术和Robotaxi商业化落地 [8] - 智能座舱方面,以AGI和Agent技术为核心构建AIOS操作系统,将智能汽车打造成超级智慧生命体 [8] - 超级电混技术将向超高压、超性能、超安全方向演进,雷神AI电混发动机热效率有望突破50% [8] - 安全是公司造车第一优先级,将构建沃尔沃汽车和吉利汽车的“世界安全双极”格局,实现从单车安全到人、车、路、云、星生态安全的全方位升级,并致力于使“神盾金砖电池”安全标准成为行业标杆,逐步实现半固态与固态电池产业化应用 [10] 生态布局 - 生态布局将重点聚焦用户服务、未来出行与醇氢电动三大生态 [10] - 用户服务方面,将构建全生命周期服务体系,启动“吉利无界”生态,提升服务满意度与口碑 [10] - 未来出行生态方面,将加快布局天地一体化未来立体出行生态,目标到2030年投放10万辆定制化Robotaxi并开展全球运营 [10] - 醇氢电动生态已形成全产业链布局,醇氢电动汽车已经运营超5万台,累计行驶里程超230亿公里,形成核心专利400余项,未来将拓展至船舶、工程机械等多领域,并加快甲醇加注网络建设 [10] 人才与可持续发展 - 人才与组织方面,公司将继续深化“人才森林”战略,通过产教融合定向培育新能源、人工智能等领域专业人才,推动干部年轻化和全球化 [12] - 2026年起,公司将首期投入5000万元,未来陆续投入3亿元,启动青年创新创业激励计划,并积极探索人工智能时代“三个校园组合”人才培养新模式 [12] - 可持续发展方面,公司将绿色低碳理念贯穿产品全生命周期,推广环保材料,降低产品碳足迹,推动标杆工厂实现碳中和,并带动供应链合作伙伴共同制定碳减排路线图 [12] 2026年发展规划 - 2026年是公司创业40周年,吉利汽车集团将围绕AI科技化、能源多元化、产品高端化与国际化四个方向推进技术创新与高质量发展 [13] - 即将推出的技术包括全域AI 2.0系统、新一代千里浩瀚辅助驾驶系统G-ASD,以及全球首款应用“AI云动力”的油电混动系统i-HEV智能双擎 [13] - 新产品方面,极氪8X将陆续上市 [13]
谷歌深夜重磅开源,深度研究Agent拿下SOTA,比GPT-5 pro便宜90%
36氪· 2025-12-12 08:49
核心观点 - 谷歌发布三项Agent相关重大更新,包括升级并向开发者开放Deep Research Agent、开源基准测试DeepSearchQA以及推出交互API,旨在强化其Gemini生态并简化Agent开发流程 [1][5][16] Deep Research Agent功能更新 - 该Agent基于Gemini 3 Pro模型构建,专为长期上下文和复杂信息综合任务优化,通过迭代式提问、搜索和识别知识空白来运行 [3][7] - 新版本功能更新包括:针对特定数据进行更深入的网页搜索、以更低成本生成深度研究报告 [3][7][9] - 在性能基准测试中,新Gemini Deep Research Agent在完整HLE测试中得分46.4%,优于Gemini 3 Pro的43.2%和GPT-5 Pro的38.9% [7] - 在成本方面,该Agent在BrowseComp基准上与GPT-5 Pro性能相当,但价格约为后者的十分之一 [3] - 该Agent已应用于金融服务、生物技术和市场调研等需要高精度的复杂领域,帮助完成初步调研任务 [9] - 为开发者提供的核心能力包括:统一信息综合(支持文件上传、网络数据分析和长上下文处理)、报告可控性(用户可定义结构和格式)、提供详细引用来源、支持JSON结构化输出以便下游应用解析 [9] - 该Agent将很快在谷歌搜索、笔记本、谷歌金融中提供,并在Gemini应用中升级 [5] DeepSearchQA基准测试 - DeepSearchQA是一个新开源的网络研究Agent基准,旨在测试Agent在复杂、多步查询任务中的全面性 [5][11] - 该基准包含900个手工设计的“因果链”任务,涵盖17个不同领域 [5][12] - 与传统的基于事实的测试不同,它衡量的是生成详尽答案集的全面性,评估研究的准确性和检索的记忆能力 [12] - 该基准还可作为衡量“思考时长”效率的工具,谷歌内部评估发现,允许Agent执行更多搜索与推理步骤时,其性能会显著提升 [12] 交互API (Interactions API) - 交互API是一个与Gemini模型和Agent交互的统一界面,通过Google AI Studio中的Gemini API公开测试版向开发者开放 [5][14] - 它原生集成了专为Agent应用开发设计的接口,可高效处理交错式消息、思维链、工具调用及状态信息等复杂上下文管理工作 [14] - 该API提供了首个内置Agent,即Gemini Deep Research Agent,未来将扩展更多内置Agent并支持开发者引入定制Agent [14] - 核心扩展功能包括:可选的服务器端状态(简化客户端代码并可能降低成本)、可解释和可组合的数据模型(便于调试和分析)、背景执行(支持长期运行的推理环路)、远程MCP工具支持(模型可直接调用MCP服务器) [15] - 它提供了一个单一的RESTful端点用于交互 [14] 战略与生态影响 - 此次更新是谷歌Gemini生态的再次扩容,通过发布交互API简化了与Gemini模型和Agent的交互流程,旨在构建更易用的开发生态 [16] - 公司未来的更新将聚焦于更丰富的输出(如原生生成图表以支持可视化分析报告)、通过MCP支持扩展连接性以更轻松访问自定义数据源,并努力将Gemini Deep Research引入企业用的Vertex AI平台 [16]
大模型开始“点击”屏幕!智谱、字节抢滩“手机操作”,AI超级入口争夺战升级
每日经济新闻· 2025-12-10 22:52
文章核心观点 - 2025年末,AI行业围绕终端入口的争夺战显著提速,焦点从云端大模型转向对手机等终端设备的直接操作与控制,旨在重构移动互联网的流量分发权和交互逻辑 [1] - 科技巨头通过不同技术路径(如开源模型、系统级嵌入)竞逐“AI超级入口”,竞争范围已从手机扩展至穿戴设备和原生App,试图把握下一代流量入口并可能引发行业格局变革 [1][5][6] 行业动态与竞争格局 - 行业竞争在2025年末突然提速,巨头们不约而同地将目光锁定在“Phone Use”(手机操作),目标是从被动问答升级为主动执行,重构移动互联网流量分发权和交互逻辑 [1] - AI超级入口的争夺是战略层面的生死之战,在移动互联网红利见顶的背景下,大模型厂商试图通过Agent技术将分散的App功能收敛到一个统一入口 [5] - 竞争已不仅限于手机,科技巨头正试探新的硬件形态以求弯道超车,例如AI眼镜,行业正押注下一代流量入口,可能颠覆手机的统治地位 [6][7] - 另一条竞争路径是将App本身进化为超级AI应用,例如阿里巴巴基于性能领先的AI模型和自身生态优势,打造面向C端用户的AI超级原生应用 [8] 主要参与者的战略与产品 - **智谱**:于12月9日正式宣布开源其自主研发的AutoGLM模型,口号是“让每台手机都能成为AI手机” [1]。其战略是通过开源核心模型和Phone Use能力框架,降低行业门槛,旨在将相关能力变为行业可共同打磨的公共底座 [2] - **字节跳动(豆包)**:于12月1日发布豆包手机助手技术预览版,选择与手机厂商在操作系统层面进行深度合作的系统级嵌入路径 [1][2]。官方演示展示了“所见即可问”和“所言即可为”的能力,能完成查票订票、商品下单等任务 [2]。公司明确表示目前没有自行开发手机的计划,而是选择生态共建 [3] - **小米**:于今年6月推出售价1999元的AI眼镜,雷军将其定义为随身AI入口,试图通过摄像头和语音交互成为连接人与数字世界的轻量化中介 [6] - **阿里**:旗下夸克于11月正式发布AI眼镜,试图将搜索场景从手机屏幕延伸至视觉场景 [6]。阿里在11月相继推出千问与灵光两大App,在AI to C领域,基于性能领先的AI模型和自身生态优势,打造面向C端用户的AI超级原生应用 [8] 技术发展现状与挑战 - **技术能力现状**:大模型开始能够点击手机屏幕、理解UI并执行任务,但距离完美仍有很长的路要走 [1][3]。智谱指出,行业希望Agent能完成数十分钟甚至数小时的长距离任务,但当前模型仍难以充分实现这一目标 [3]。豆包团队也提示,受限于大模型技术的不确定性,相关场景无法保证百分百复现,产品实际可用性与预期有差距 [3] - **核心挑战(智商瓶颈)**:智谱认为最大的问题在于模型本身的“智商”,需要算法和模型公司的持续努力 [3] - **工程与应用挑战**:如何为AI手机提供所需的操作系统和产品,以及建立Agent身份认证,需要行业共同协作 [3] 安全、隐私与部署模式 - **安全与隐私挑战**:当AI具备操作微信、支付软件等权限时,如何防止其随意操作是悬在行业头顶的达摩克利斯之剑 [3]。用户隐私是行业共同的关注点 [3] - **部署模式趋势**:出于对用户隐私、响应及时程度和云端使用成本等因素的考虑,轻量化本地部署是手机大模型的一个重要趋势 [3]。这意味着大模型将直接部署到手机内,并由手机芯片承担模型推理工作,这需要使用更少的数据量和计算资源 [4] - **智谱的安全策略**:采取了较为保守的云手机与强隔离策略,在算法和工程开发早期就融入了敏感操作和安全栅栏的设计理念,将可控性和隐私放在最优先位置考虑 [5] 对产业链的影响与未来展望 - **对手机厂商的影响**:AI技术可能带来一轮新的换机潮,但也可能让手机沦为大模型的躯壳 [6]。与国内领先的大模型厂商相比,手机厂商在算力基础设施上的储备往往不够充足,研发常遇算力受限,且投入巨大并面临技术挑战 [6] - **流量与生态变化**:智谱提出了“Agent流量”的概念,即由Agent自主执行带来的流量,为移动互联网注入新流量 [5]。Agent带来的生产力改变和更好的个性化服务能力,被认为是对整个生态的新流量和红利注入 [6] - **商业利益与开放问题**:当AI Agent成为超级入口,可能改写App开屏广告、推荐流广告的价值。但在商业利益分配机制理顺之前,拥有海量数据的头部App(如微信、美团、抖音等)是否愿意向Agent开放核心接口或数据,仍是巨大问号 [8] - **未来合作与参与方式**:智谱表示希望看到更多Agent应用、AI原生手机及硬件问世,未来的参与方式将是多种多样且超出当前想象的 [6]
AI入局,在re:Invent见证体育圈变天
创业邦· 2025-12-05 19:15
亚马逊云科技与NBA达成战略合作 - 2025年10月,美国职业篮球联盟宣布与亚马逊云科技达成多年合作伙伴关系,后者正式成为NBA及其附属联赛的官方云服务与云AI合作伙伴 [2] - 在2025年亚马逊云科技re:Invent大会上,双方合作的技术内涵得到全面展示,AI将彻底改写体育运动领域 [2] re:Invent大会设立体育科技专区 - 2025年亚马逊云科技re:Invent大会首次设立Sports Forum专区,该展区被打造为一座“未来体育馆” [3][4] - 整个Sports Forum像一个微缩的全球体育版图,全球顶尖的体育赛事和联盟在此汇聚,被亚马逊云科技的AI串联成一个完整的叙事 [8] NBA:AI驱动数据革命与价值量化 - AI通过每秒60帧捕捉球员身上29个身体点位,实时追踪并量化球员每一个动作,计算投篮难度系数,并识别传统数据无法体现的顶级防守贡献 [6] - 在2025-26赛季,NBA将推出三项革命性数据创新:防守数据统计、投篮难度指数和引力指标 [11] - 以“引力指标”为例,通过每秒60次的光学追踪和海量历史数据分析,将球员(如库里)通过无球跑动吸引防守、为队友创造机会的“引力”能力量化成具体数值 [11] - NBA将上线“战术探索”功能,该系统基于AI机器学习模型,能追踪进攻回合中五名球员和篮球的全部移动轨迹,并在历史数据中搜索相似战术,支持解说员实时调取案例或球迷用自然语言搜索特定战术 [11] 德甲:AI赋能全球内容生产与本地化 - 德甲与亚马逊云科技合作,利用Amazon Nova模型将解说自动转换成英语、日语、西班牙语等多种语言,让全球球迷以母语享受比赛 [6][20] - 双方打造的智能内容生产系统基于Amazon Nova系列模型,具备自动生成比赛报告、制作短视频内容及提供视频本地化方案的能力 [15] - 该系统将赛后报告生成时间从数小时缩减到几分钟,并通过分析观众音量变化智能判断比赛高潮以制作精彩集锦 [15] - Nova模型将内容制作效率提升90%,字幕处理速度提高60%,同时将成本降低70% [15] - 在用户体验层面,该技术使App停留时间延长40%,互动频率提升70%,周回访率增加20% [15] PGA Tour:AI实现自动化内容生成 - PGA Tour与亚马逊云科技合作,构建了一个智能化的内容生产系统,能够在赛事结束后5-10分钟内产出专业赛况文章 [13] - 该系统每周产出800篇专业文章,为全球数十亿球迷提供及时、专业的赛事报道 [13] - 系统采用Amazon Bedrock AgentCore作为运行环境,通过多个专门化的Agent协同工作,分别负责数据收集、内容生成、编辑校对、事实核查和图片选择 [12] NFL:快速开发AI教练辅助决策 - NFL与亚马逊云科技合作,在8周内打造出一位“AI教练”,旨在帮助NFL梦幻联盟玩家更好地理解比赛数据并做出决策 [16] - 该AI教练能在5秒内给出球员首发建议,并在30秒内完成深度战术分析,其准确率获得了90%以上分析师的认可 [16] - 该系统基于Amazon Bedrock提供大模型能力,通过MCP协议连接NFL Next Gen Stats等多个数据源,并采用Strands Agent框架构建 [18] F1:高性能计算突破物理极限 - F1与亚马逊云科技于2022年合作打造“数字风洞”,通过高性能计算模拟空气动力学下的新设计 [6] - 该技术将尾流下压力损失从50%降低到15%,并最终在2022赛季实现超车次数增加30% [6] 行业趋势:AI重塑体育多维度体验 - AI对体育的变革正在多个层次同时展开,涵盖内容生成、数据洞察和物理极限突破 [20] - 亚马逊云科技利用领先的AI与机器学习模型,将海量、混沌的数据提炼为清晰、可执行的“智慧” [21] - 通过极致的实时性技术,攻克延迟壁垒,让数据智慧在胜负毫秒间的赛场上产生价值 [22] - 顶级体育品牌的深度实践正在重塑运动员训练方式、教练决策模式,并将全球粉丝从“观赛者”转变为“洞察者” [22] - 亚马逊云科技首席执行官Matt Garman预测,未来Agent技术将带来10亿级别的应用机会,而单个Agent就能实现10倍的效能提升 [2]