生成式AI
搜索文档
Gemini 3.5来了!今夜,谷歌亲手淘汰谷歌
猿大侠· 2026-05-20 12:11
Gemini Omni:全能多模态视频生成模型 - 核心定位为真正「全能」的大模型,可接收任意形式的输入(图片、音频、视频、文字)并生成任意内容,首发支持高质量视频输出 [4][16] - 实现了对物理世界的深度理解,在模拟重力、动能等概念上实现「阶跃变化」,能够生成科学准确且具有语义连贯性的视频内容 [17][18] - 具备强大的视频编辑与交互能力,用户可通过聊天方式编辑视频,生成的角色、场景和物理逻辑能保持一致性和连贯性 [30][31][32] - 输入高度灵活,允许混合多种模态的参考物,并可创建个人Avatar,让AI形象出现在任何场景中 [37][38] - 已正式上线,首发接入Gemini App、Google Flow和YouTube Shorts,YouTube Shorts用户可免费使用 [40] Gemini 3.5 Flash:性能与速度的旗舰模型 - 被定义为迄今最强的编码和智能体模型,在几乎所有基准测试中全面超越前代旗舰Gemini 3.1 Pro [42][44] - 在关键基准测试中表现突出:Terminal-Bench 2.1(编码)达76.2%,GDPval-AA(真实世界Agent任务)达1656 Elo,MCP Atlas(大规模工具使用)达83.6%,CharXiv Reasoning(多模态理解)达84.2% [46][47][52] - 输出速度达到289 tokens/秒,比GPT-5.5和Claude Opus 4.7等前沿模型快4倍有余 [8][48][50] - 具备强大的实际应用能力,可瞬间消化学术论文并生成交互式网站,或通过Agent完成复杂的多步工作流 [54][56] - 已成为Gemini App和Google搜索AI Mode的默认模型,面向全球用户开放 [72] Antigravity 2.0与Agent能力突破 - Antigravity从IDE进化为独立的Agent开发平台,采用Agent-first设计,成为实现复杂AI能力的关键框架 [12][58] - 展示了强大的Agent协同能力:93个子Agent并行工作,处理26亿个token,在12小时内从零构建出功能完整的操作系统内核,API成本低于1000美元 [60][62] - 核心升级包括:支持动态生成子Agent并行执行任务、异步任务管理、定时任务功能以及新的斜杠命令(如/goal, /grill-me)以优化工作流 [67] - 谷歌内部使用Antigravity处理token的速度从3月份的每天5000亿飙升至每天3万亿,实现了12倍加速 [69][70] Gemini Spark:全天候个人AI特工 - 定位为用户的个人AI Agent,基于Gemini 3.5和Antigravity框架驱动,可7×24小时在云端专用虚拟机上运行 [75][76][78] - 深度整合谷歌办公套件,能自动执行跨应用任务,如从Gmail、Docs等抓取信息起草邮件,或创建并管理Google Sheets、Slides等 [79][80][83][85] - 支持自定义技能,可学习用户的个人语气、偏好和工作方式 [82] - 具备强大的语音输入与任务拆解能力,可将连续语音指令自动拆分为多个独立任务线程并行执行 [87][88][89] - Beta版将于下周对美国AI Ultra订阅用户开放,AI Ultra最高档月费从250美元降至200美元 [91][92] 产品生态与行业影响 - 谷歌搜索迎来25年最大升级,接入Gemini 3.5 Flash,新增智能搜索框、自动生成mini应用等功能 [12] - Gemini App进行改版,代号Neural Expressive,并改为算力计费模式 [12] - 公司通过本次发布,将全模态理解、全模态生成和全天候在线Agent三大能力拼图整合到位,展示了通向更高级AI(ASI)路径上的工程化部署能力 [95][96][101] - 行业进展迅速,半年前还在讨论AGI可能性,如今已能用Agent编写操作系统,发展速度超出人类直觉感知范围 [102][103]
英伟达“数十亿美元级业务”走向落地
上海证券报· 2026-05-20 08:31
文章核心观点 - 英伟达新一代专为代理式AI设计的Vera CPU已完成首批交付,标志着其“下一个数十亿美元级业务”从概念验证进入商业化落地阶段[2] - Vera CPU通过提升系统性能与效率,旨在满足代理式AI执行复杂任务对高性能CPU协同能力的极高要求[4] - 首批客户甲骨文计划从2026年起部署数十万颗Vera CPU,表明代理式AI的CPU需求是能转化为实际商业订单的真实市场需求[5] - Vera是英伟达下一代AI基础设施(AI工厂)的核心组成部分,其交付意味着公司AI硬件产品的落地兑现已从GPU扩展至CPU[5][6] 产品技术与性能 - Vera CPU专为强化学习和代理式AI设计,支持模型之外的代码、工具和数据工作流[4] - 作为加速系统中的主机CPU,Vera与英伟达GPU无缝协作,负责指导数据搬运、管理内存和编排系统控制[4] - Vera搭载88个英伟达自研Olympus核心,拥有1.2 TB/s的内存带宽,单核性能提升50%[4] - 该CPU使软件环境运行速度提升高达50%,效率是传统架构CPU的两倍[4] - 在Vera Rubin NVL72系统中,Vera通过第二代NVLink-C2C与Rubin GPU相连,形成统一内存架构,大幅改善GPU数据供给效率与整体计算效能[5] 市场与客户进展 - 首批交付客户包括Anthropic、OpenAI、SpaceX AI及甲骨文云[2] - 甲骨文云基础设施计划从2026年起部署数十万颗英伟达Vera CPU,以满足其下一代企业级AI发展对效率、密度和空间占用的需求[5] - 甲骨文的承诺表明,代理式AI对CPU的需求是可直接兑现为商业订单、拉动业绩增长的真实市场需求[5] 战略与行业影响 - Vera是英伟达AI工厂中的重要组成部分,将与Rubin GPU、BlueField 4 DPU、Spectrum-X以太网平台及MGX机架共同构成下一代人工智能基础设施核心[5] - Vera的交付意味着英伟达新一代AI硬件产品的落地兑现已从GPU扩展到CPU,未来可能进一步扩展至网络和机架系统[6] - 伴随行业资本开支维持高增长态势,英伟达作为生成式AI与代理式AI最大受益者的市场地位或将被进一步巩固[6]
腾讯研究院AI速递 20260520
腾讯研究院· 2026-05-20 00:03
AI 编程与模型进展 - Cursor 发布 Composer 2.5 编程模型,性能逼近 Claude 4.7 Opus 和 GPT-5.5,运行效率提升 10 倍,百万输出 Token 成本为 2.5 美元 [1] - Cursor 采用定向文本反馈强化学习技术,合成任务数量较前代暴增 25 倍 [1] - Cursor 通过分片 Muon 优化器实现 1T 参数模型单步耗时在 0.2 秒以内,并与 SpaceXAI 合作调用 100 万张 H100 等效算力训练下一代模型 [1] - 摩尔线程发布全栈国产化具身智能仿真平台 MT Lambda,机器狗“小飞”在仿真世界训练后可无损迁移至物理世界 [4] - MT Lambda 平台基于 MUSA 架构,仿真吞吐效率提升约 30 倍,光线追踪渲染性能提升 2.7 倍 [5] - 摩尔线程夸娥智算集群训练 RoboBrain 2.5 与 H100 集群的 Loss 差异仅 0.62%,其 1024 卡线性扩展效率超 90% [5] AI 行业人才与法律动态 - AI 专家 Andrej Karpathy 宣布加入 Anthropic,其履历包括 OpenAI 创始研究员和 Tesla AI 总监 [2] - Andrej Karpathy 创立的 AI 教育公司 Eureka Labs 的 YouTube 课程观看量超 2000 万次,其创建的 CLAUDE.md 配置文件在 GitHub 累计获得超 22 万 star [2] - 加州联邦法院陪审团认定马斯克起诉 OpenAI 超时效,驳回其 1800 亿美元索赔 [3] - 庭审披露 OpenAI 部分股权情况:布罗克曼约 300 亿美元、苏茨克维尔约 70 亿美元、微软持股市值 1350 亿美元 [3] - 五名证人指认 OpenAI 首席执行官奥特曼撒谎,前董事会曾接触 Anthropic 讨论合并事宜 [3] AI 基础设施与能源需求 - NextEra Energy 以 670 亿美元收购 Dominion Energy,创美国公用事业最大并购纪录,核心驱动力是 AI 数据中心对电力的需求 [2] - Dominion Energy 握有 51GW 数据中心电力合同,其所在的弗吉尼亚“数据中心走廊”承载全球 70% 互联网流量 [2] - PJM 电力市场电价已“不可逆转”地上涨 76% [2] - 据 PowerLines 测算,住宅消费者将通过电费上涨承担约 7000 亿美元 AI 基础设施成本 [2] - 黄仁勋指出 AI 基础设施将建设十年甚至更久,AI 正从“生成内容”走向“完成工作” [8] - HBM 内存与先进制程是产业链最大瓶颈,AI 基础设施需 CoWoS 封装、HBM、硅光网络协同扩张 [8] AI 应用与平台发展 - 腾讯云发布大数据智能体工作台 DataBuddy,用户可通过自然语言对话完成数据全链路任务,数仓建设从原本 1-2 周压缩至小时级交付 [6] - 微信读书 Skill 激活个人阅读数据,提供查阅书架、书籍搜索、阅读统计等六大类功能 [7] - AMD 首席执行官苏姿丰表示 AMD 正深度融入中国 AI 生态,其 ROCm 已支持超 300 万模型,并对多家中国主流模型做到 Day0 支持 [9] - AMD 推出免费 AMD AI 开发者云,阶跃星辰 1960 亿参数模型在 AMD Ryzen AI Max+ 395 笔记本上解码速度接近每秒 100 Token [10] - 企业 AI 部署呈现从云端转向本地化趋势,戴尔季度新增 1000 家 AI 服务器客户,礼来公司已部署 1000 块 GPU [8]
2025年金融智能体行业:智能体AIAgent的创新和应用
头豹研究院· 2026-05-19 21:12
报告核心观点与投资评级 - 报告未明确给出行业整体投资评级,但通过分析全球智能体(AI Agent)的演进、竞争格局及在金融领域的应用实践,描绘了该技术从技术探索走向规模化落地、并驱动行业系统性重构的积极前景[3][6][9] - 报告核心观点认为,智能体正从辅助工具演进为能自主执行复杂任务的通用自动化生产单元,加速渗透至金融等多个行业[9][16];全球金融智能体的发展已从“单点实验”进入“系统性重构”阶段,其价值创造始于降本增效,深化于风险管理,最终指向核心业务革新[9][26][27][32];受顶层战略、技术路径与市场结构差异影响,中美金融智能体发展呈现出差异化道路[7][34][37][42] 智能体产业创新与应用全景 - **产业演进**:智能体角色正由传统分析型AI与生成式AI的辅助工具,逐步演进为能够自主拆解目标、调度资源并执行复杂任务的通用型自动化生产单元[9][16] - **应用全景**:智能体加速渗透至金融、医疗、教育、通信、零售、制造、农业等多个行业,在金融领域的核心职能包括决策支持和预测分析、风险合规监控、客户服务、内容创作及运营自动化等[16] - **竞争格局**:全球智能体赛道已形成“科技巨头建生态,独角兽企业创革新,传统厂商谋转型”的多元化竞争格局[9][17][19] - **科技巨头**:如微软、谷歌、OpenAI,凭借“大模型基座+云计算+场景生态系统”引领生态建设[17][18] - 微软将智能体系统性嵌入企业级操作与治理环境框架,使其具备在组织中长期运行的可行性,并通过Microsoft 365 Copilot等产品集成到其庞大生态中[18] - 谷歌设计A2A(Agent to Agent)协议以构建可协作的智能体网络,并深度整合Chrome生态[18] - OpenAI构建了从“语言模型”到“通用执行系统”的范式跃迁,为开发者和用户提供Agent开发工具及ChatGPT Agent[18] - **AI独角兽企业**:如Anthropic,以“技术突破+垂直场景深耕”进行差异化竞争,研发出Model Context Protocol (MCP)模型上下文协议,明确Generative AI与Agentic AI的分界线[19][20] - **传统厂商**:如Salesforce,以“AI+现有功能”融合模式转型,将智能体深度嵌入其CRM系统与企业业务流程中,成为业务流程的原生组成部分[21][22] 金融智能体的应用实践 - **发展阶段**:金融智能体发展已从“单点实验”进入“系统性重构”阶段,价值创造路径始于降本增效,深化于风险管理,最终指向核心业务革新[9][26][27][32] - **分业实践案例**: - **银行业**:实践覆盖降本增效(如智能客服)、风险管理(如信贷审批、合规审计)及核心业务革新(如财富管理)三阶段[26] - 摩根大通使用COiN智能体自动解析商业贷款合同,将每年36万小时的人工审阅工作压缩至秒级[26] - 摩根大通使用IndexGPT帮助快速创建新的主题投资产品[26] - Capital One银行使用Eno智能助手提供账户查询、欺诈预警等服务[26] - **证券与投资银行业**:实践案例包括招商银行的AI投资伴侣“小招”、花旗银行的异常交易检测系统,以及高盛的做市系统Agent(Marquee Execution Agent)用于优化算法交易参数[26] - **保险业**:实践涵盖客户服务、合规监控及智能理赔等,例如AXA、Tokio Marine等使用Tractable AI Claims智能体进行车险损伤识别与理赔流程自动化[27][28] - **资产管理机构**:应用包括运营自动化、风险监测及投资策略生成,例如贝莱德集团使用Aladdin Copilot监控风险敞口并提供投资组合调整建议[28] - **交易所与监管机构**:应用侧重于风险管理与市场监控,如深交所的“内幕交易智能化发现技术系统”和美国纳斯达克的Nasdaq Trade Surveillance系统[31][32] - **当前局限**:金融智能体目前仍处于“受控自治”阶段,作为“人类主导下的副驾驶系统”提升效率、降低风险,而非取代人类决策权;完全自治的智能体因金融行业对责任、可解释性及零容错的刚性要求而难以进入核心业务流程[33] 中美金融智能体差异化发展路径 - **宏观政策与战略路径**: - **美国**:采取以市场为核心的“无为而治”路径,对内宽松监管(如AI行政命令更似报备制),对外通过法案(如《芯片与科学法案》提供约527亿美元补贴并限制对手国)确保算力可控,目标是激发原创技术突破,定义能力边界[34][37] - **中国**:采用“顶层设计、规划引导”模式,将AI发展上升为国家战略(如《新一代人工智能发展规划》),通过“AI+行动”设定量化目标(如2027/2030年智能体应用普及率超70%/90%),核心目标是加速规模化复制与产业赋能[37][47] - **技术发展路线**: - **美国**:强调通用模型能力上限扩展与模块化协议架构(如A2A、MCP),追求平台级扩展,技术路线更偏“平台工程”[38][40][41] - **中国**:侧重场景驱动的工程化落地与一体化闭环架构,优先提升特定行业下的可用性与性价比,技术路线更偏“交付工程”[38][40][41] - **市场规模结构与用户**: - **美国**:以B端企业用户为主,付费意愿高,2024年私人对人工智能投资额达1,091亿美元,约为中国(93亿美元)的12倍;技术供给(基础模型、云服务、API)构成护城河[44][45][48] - **中国**:以C端用户为主,辅以企业用户;市场规模增长由用户基数、平台生态和政策加持“三驾马车”驱动,通过生态内交易间接体现智能体价值[46]
2025年金融智能体行业:智能体AI Agent的创新和应用
头豹研究院· 2026-05-19 20:24
报告行业投资评级 - 报告未明确提供对金融智能体行业的整体投资评级 报告核心观点 - 人工智能体(AI Agent)正加速渗透至金融、医疗、教育等多个行业,角色从辅助工具演进为能自主拆解目标、调度资源并执行复杂任务的通用型自动化生产单元 [9][16] - 全球智能体赛道已形成“科技巨头建生态,独角兽企业创革新,传统厂商谋转型”的多元化竞争格局 [9][17][26] - 金融智能体的发展已从“单点实验”进入“系统性重构”阶段,其价值创造路径始于降本增效,深化于风险管理,最终指向核心业务革新 [9][33][34][39] - 受顶层战略、技术路径与市场结构差异影响,中美两国金融智能体的发展呈现出差异化模式 [7][41][42][49] - 目前金融行业落地的智能体仍处于“受控自治”阶段,是“人类主导下的副驾驶系统”,未来将循序渐进扩大自治边界 [40] 智能体产业应用全景 - **金融行业**:核心职能包括决策支持和预测分析、风险合规与安全监控、客户服务与体验、销售与财富管理、内容创作及运营自动化,应用场景涵盖风险审计、AI投顾、财务报告生成等 [16] - **医疗行业**:核心职能包括运营自动化、风险监控、患者支持,应用场景涉及流程自动化、远程病人监测、诊断辅助等 [16] - **教育行业**:核心职能包括教学辅导支持、内容生成、决策支持,应用场景如个性化学习辅助、学术研究助手等 [16] - **信息技术服务业**:核心职能包括内容创作、人力资源系统管理、决策支持,应用场景有自动写作、视频编辑、社交媒体内容生成等 [16] - **批发零售业**:核心职能包括市场营销、客户体验管理、销售管理、供应链管理,应用场景如个性化商品推荐、动态定价、库存预测等 [16] - **交通运输与物流业**:核心职能包括资源调度、仓储管理、订单配送自主性、战略决策自主化,应用场景涉及车队路线优化、自主化运输流程、预测性维护等 [16] - **租赁和商务服务业**:核心职能包括内容创作、人力资源系统管理、决策支持,应用场景如广告投放、招聘筛选、企业咨询分析等 [16] - **制造业和建筑业**:核心职能包括自主质量监测、工厂调度、设计创意生成、预测性维护、供应链管理,应用场景有产品自主研发设计、车间预测性自主维护等 [16] - **农业**:核心职能包括决策支持和预测分析、资源调度和资产优化、运营自动化,应用场景涵盖种植决策优化、精准施肥、农业机器人自动化等 [16] 智能体产业主要竞争者的创新和应用 - **科技巨头(生态建设者)**: - **微软**:将智能体系统性地嵌入企业级操作与治理环境框架,通过Microsoft 365 Copilot等产品将智能体集成到Bing、Edge、Windows等生态系统中,使AI智能体具备在组织中长期运行的可行性 [17][18][19][24] - **谷歌**:为开发者及企业提供Vertex AI Agent以降低智能体投用门槛,为消费级用户提供具备实时感知、长时记忆能力的多模态通用智能体Project Astra [21][22] - **OpenAI**:为开发者提供包含Responses API及Agents SDK的Agent Kit开发包,为消费级用户提供结合了Deep Research与ChatGPT对话能力的CHATGPT Agent,旨在完成从“语言模型”到“通用执行系统”的范式跃迁 [23] - **AI独角兽企业(技术创新者)**: - **Anthropic**:研发出Model Context Protocol(MCP)模型上下文协议,明确了Generative AI与Agentic AI的分界线,为消费级用户提供Claude Cowork,为企业级用户提供Claude Agent SDK [26][27] - **传统AI厂商(转型者)**: - **Salesforce**:凭借在CRM领域的优势,将智能体深度嵌入企业数据与业务流程,为企业级用户提供Einstein Service Agent,可自动访问CRM数据、执行更新任务,并支持多智能体协作模式 [28][29] 全球金融智能体的分业实践和典型案例 - **银行业**: - **降本增效阶段**:Capital One银行使用Eno智能助手提供账户查询、欺诈预警等服务;摩根大通使用COiN合同智能分析系统,将每年36万小时的人工合同审阅工作压缩至秒级 [33] - **风险管理阶段**:花旗银行与Feedzai合作开发Citi Payment Outliers Detection系统,利用机器学习识别异常交易 [33] - **核心业务革新阶段**:摩根大通使用IndexGPT帮助快速创建新的主题投资产品;招商银行推出AI投资伴侣“小招”提供投资全流程智能陪伴 [33] - **证券与投资银行业**: - **核心业务革新阶段**:高盛利用Marquee Execution Agent实时监控市场流动性,自主拆分和调整订单以优化算法交易 [33] - **保险业**: - **降本增效阶段**:中国人寿(海外)与网易智企合作推出用于保单满期及退保咨询的服务性Agent [34][35] - **风险管理阶段**:Fenergo科技企业研发合规监控平台,监控反洗钱等行为 [35] - **核心业务革新阶段**:AXA、Tokio Marine等多家车险企业使用Tractable AI Claims智能体进行自动损伤识别与理赔估算 [35] - **资产管理机构**: - **降本增效阶段**:使用SS&C Blue Prism + AI Reporting Agent自动生成NAV报告与绩效归因说明,并提供个性化投资方案推荐 [35] - **风险管理阶段**:Snowflake企业研发的智能体用于持续监测市场数据与组合风险 [35] - **核心业务革新阶段**:贝莱德集团使用Aladdin Copilot实时监控风险敞口并自动模拟不同投资组合方案的收益 [35] - **交易所、监管及清算机构**: - **风险管理阶段**:深交所牵头研发内幕交易智能化发现技术系统;美国纳斯达克使用Nasdaq Trade Surveillance系统识别市场操纵与异常交易 [38][39] - **核心业务革新阶段**:相关机构应用智能体进行市场操作与滥用检测 [38] 中美金融智能体的差异化发展路径 - **宏观政策与战略路径**: - **美国**:采取以市场为核心的“无为而治”路径,对内宽松监管,对外通过《芯片与科学法案》等政策确保算力可控并形成供应链遏制,目标是激发原创技术突破 [42][44] - **中国**:采用“顶层设计、规划引导”模式,通过《新一代人工智能发展规划》及“AI+行动”等政策将智能体发展上升为国家战略,设定了到2027年智能体应用普及率超过70%等量化目标,核心是加速规模化落地与产业赋能 [42][44][54] 1. **技术发展路线**: - **美国**:强调“通用智能优先”,通过模块化协议架构(如A2A、MCP)和架构创新(如MoE、多模态统一建模)扩展模型能力边界,追求平台级扩展 [45][47][48] - **中国**:侧重“场景驱动的工程化创新”,采用场景驱动的一体化闭环架构,结合行业模型微调(如蚂蚁数科结合LangChain、DeepSeek-V3等),优先实现稳定、可复制的行业应用 [45][47][48] - **市场规模结构与用户特征**: - **美国**:以B端企业用户为主,2024年私人对人工智能投资额达1,091亿美元,约为中国的12倍,市场由技术供给(基础模型、云服务、API)和市场需求双轮驱动 [51][52][55] - **中国**:用户结构更偏向C端/零售,市场扩张由用户基数、平台生态和政策加持“三驾马车”驱动,智能体价值更多体现在提升整体业务效率与风险控制能力 [53][55]