多模态智能体
搜索文档
榜单更新,字节Seed2.0表现亮眼,我们还测了爆火的龙虾 |xbench 月报
红杉汇· 2026-03-04 10:49
xBench评测体系更新与行业采用 - 春节期间,xBench对多家公司发布的最新模型进行了评测,并更新了Leaderboard榜单 [1] - xBench最新发布的多模态理解评测集BabyVision,已被近期发布的多款模型产品纳入评测体系,包括Seed-2.0、Qwen3.5、Kimi K2.5等,在其公开发布的技术报告中均有引用,体现了社区对该评测集的广泛关注与采用 [1][14] - xBench采用长青评估机制,持续汇报最新模型的能力表现,更多榜单将陆续更新 [1] ScienceQA榜单模型表现 - 在ScienceQA榜单上,头部模型竞争激烈,分差相对紧凑 [5] - **字节跳动Doubao-Seed-2.0-pro (high)**:以69.2的平均分位列国产模型第一,仅次于Google的Gemini 3 Pro(71.6分),其BoN(Best of N,N=5)分数为85.0分 [3][5] - 该模型输出token成本为每百万token 2.28美元,仅为Gemini 3 Pro(12美元)的约四分之一,性价比突出 [3][5] - 其BoN分数(85.0)与平均分(69.2)的差距在2.0阶段明显缩小,表明模型单次推理稳定性提升,高分不再主要依赖多次采样 [5] - **阿里巴巴Qwen3.5-plus**:以65.6分位列第三,较其上一代模型Qwen3-235B-A22B-Thinking-2507的55.0分提升了10.6分,BoN分数保持在77.0,显示出平均表现上的明显跃升 [3][7] - **智谱AI GLM-5**:以65.0分位列第六,较上一版本GLM-4.7的60.8分提升了4.2分,在提升表现的同时,平均响应时间没有明显变化,保持了较高的推理效率 [3][8][9] DeepSearch榜单模型表现 - 在DeepSearch榜单中,**Google Gemini Pro**以53分位列第二,同时每道题平均耗时约1.8分钟,在头部产品中响应效率突出,但token成本也极高,完成100题的成本约为249.99美元 [11] - **OpenAI ChatGPT-5-Pro**以79分位列第一,完成100题的成本约为8.5美元,平均每道题耗时约6.1分钟 [11] BabyVision榜单模型表现 - 在BabyVision多模态理解榜单中,**字节跳动Doubao-Seed-2.0-pro**以62.60%的得分位列第一,大幅领先第二名Google Gemini 3.1 Pro(51.50%)11.10个百分点 [13] - **Google Gemini 3.1 Pro**以51.50%位列第二,较Gemini 3 Pro(49.70%)有小幅提升 [13] - **阿里巴巴Qwen3.5-397B-A17B**以43.3%位列第三,较其上一代模型Qwen3-VL-235B-Thinking(22.20%)显著提升了21.1个百分点 [13] - 该模型采用原生多模态路线,通过早期文本-视觉融合以及扩展的视觉/视频数据训练,实现了更强的多模态理解能力 [13] 重点模型能力与产品迭代方向 - 近期模型迭代呈现出三个清晰方向:全训练阶段的多模态增强、竞争从单点基准测试扩展到更真实长程的Agent任务、构建高效稳定的异步Agent强化学习基础设施 [28] - **字节跳动Seed2.0**:在VLMsAreBiased、VLMsAreBlind、BabyVision等多个多模态基准测试中取得了业界最高分,表明其面对不同类型视觉输入时,能保持准确且可信的感知和判断能力 [15][16] - 其视觉感知能力进一步升级,对复杂文档、表格、图形、视频内容的解析水平显著提升 [29][30] - **阿里巴巴Qwen3.5**:引入混合注意力机制和极致稀疏的MoE架构,以Qwen3.5-Plus为例,总参数量高达3970亿,但推理时仅激活最相关的170亿参数,相比此前的万亿参数Qwen3-Max,部署显存占用降低60%,最大推理吞吐量提升至19倍 [33] - **智谱AI GLM-5**:支持200K长上下文,其突破在于引领AI从Vibe Coding演进到Agentic Engineering,具备极强的全自动代码生成和复杂系统重构能力,能够在极少人工干预下自主完成跨越多个阶段的复杂任务 [34] OpenClaw生态与云端产品化趋势 - OpenClaw在年初迅速出圈,其核心是一套完整的结构化交互范式,用户通过一组可维护的文本文件持续塑造Agent的人格、偏好、工具配置与长期记忆 [21] - 围绕OpenClaw的扩展生态(如ClawHub技能库,包含5000+ skills)进一步放大了其吸引力 [20][21] - **月之暗面Kimi Claw**与**MiniMax MaxClaw**的主要贡献是将OpenClaw从本地极客玩具推向云端产品化,降低了普通用户的技术门槛 [21] - Kimi Claw基于Kimi K2.5模型,定价199元/月,MaxClaw基于MiniMax M2.5模型,定价39元/月 [20] - 当前阶段,云端Claw产品的实际体验差异更多来自产品策略和底层模型能力,而非Claw架构本身 [23] - 评测发现,当前OpenClaw生态在安全架构、权限确认机制、回滚和错误隔离等方面仍存在缺口,更像是一个被舆论放大的新交互范式演示,而非成熟的生产力基础设施 [24] - 安全测试案例显示,不同Claw产品在应对Prompt注入攻击时表现不一,底座模型的安全对齐和平台的结构化防护策略需同时建立以确保安全 [25][26][27]
中国儒意涨超5% 公司与爱诗科技战略合作并对其战投 布局影视游戏智能化
智通财经· 2026-02-10 10:18
公司股价与交易表现 - 中国儒意早盘股价上涨超过5%,截至发稿时涨幅为5.16%,报2.24港元 [1] - 成交额达到5438.32万港元 [1] 战略合作与投资 - 公司宣布与爱诗科技达成战略合作,并对其进行1420万美元的战略投资 [1] - 合作将基于爱诗科技的视频生成大模型技术与中国儒意的IP资源及产业经验,共同探索“AI+内容”的下一代文娱生态 [1] 合作具体内容 - 爱诗科技将获得中国儒意的优质版权授权,包括《唐探1900》等作品,双方将共同开发针对专业影视制作的AI工具 [1] - 合作将推动中国儒意旗下的“南瓜电影”在内容创作与运营上进行智能化升级 [1] - 双方将联手“景秀游戏”探索AI视频生成技术在游戏玩法与互动体验上的创新应用 [1] - 双方将重点开展多模态智能体的联合研发,致力于在实时交互与情感化交互等前沿方向取得突破 [1]
港股异动 | 中国儒意(00136)涨超5% 公司与爱诗科技战略合作并对其战投 布局影视游戏智能化
智通财经网· 2026-02-10 10:18
公司股价与交易表现 - 中国儒意早盘股价上涨超过5%,截至发稿时涨幅为5.16%,报2.24港元,成交额为5438.32万港元 [1] 战略合作与投资 - 公司宣布与爱诗科技达成战略合作,并对其进行1420万美元的战略投资 [1] - 双方将基于爱诗科技的视频生成大模型技术与中国儒意的IP资源及产业经验,共同探索“AI+内容”的下一代文娱生态 [1] 合作具体内容 - 爱诗科技将获得中国儒意(拥有《唐探1900》等作品)的优质版权授权,共同开发针对专业影视制作的AI工具 [1] - 合作将推动中国儒意旗下的“南瓜电影”在内容创作与运营上进行智能化升级 [1] - 双方将联手“景秀游戏”探索AI视频生成技术在游戏玩法与互动体验上的创新应用 [1] - 双方还将重点开展多模态智能体(Agent)的联合研发,致力于在实时交互与情感化交互等前沿方向取得突破 [1]
AI市场将扩容10倍?多模态Agent需求逐步爆发
21世纪经济报道· 2025-12-19 15:16
豆包大模型与火山引擎的发展轨迹 - 公司走出独特路径,以“模型即服务”为基座,向企业级应用和终端设备双向渗透,构建覆盖“云-管-端”的全栈AI能力体系 [1] - 截至2025年12月,豆包大模型日均Tokens使用量已突破50万亿,位居中国第一、全球第三 [1] - 超过100家企业在其平台上累计调用量超一万亿Tokens [1] 技术演进与战略重心 - 早期通过字节系产品验证技术可行性并打磨基础能力 [2] - 2024年战略重心向两个方向倾斜:一是模型能力深度拓展,坚定迈向多模态;二是服务模式范式创新 [2] - 多模态方面,Seed系列模型单次视频理解帧数从640帧跃升至1280帧,并针对工业场景优化能力 [2] - 服务模式上,推出“按输入长度区间定价”、“智能模型路由”等策略,以解决企业成本痛点 [2] 架构升级与市场展望 - 2025年提出“以模型为中心的AI云原生架构”,技术叙事从提供强大模型升级为提供整套部署和管理AI智能体的架构与方法论 [3] - 发布豆包大模型1.8、视频生成模型Seedance1.5Pro以及AgentKit、HiAgent“1+N+X”体系等基础设施 [3] - AgentKit平台据称可使代码量减少96% [3] - 公司认为AI市场将大幅扩容,预计明年市场将再增长10倍 [3] 业务模式与市场策略 - 公司拥有字节跳动全系产品的“内需市场”作为试验田,模型迭代带有强烈的应用导向和场景驱动特征 [4] - 在稳固内部基本盘后,以B2B模式将能力通过云服务向外输出,精准瞄准高价值行业 [4] - 市场策略聚焦于智能化需求迫切、支付能力强且具有标杆效应的行业 [4] 行业渗透与商业成果 - 在金融行业,已服务超过八成的系统重要性银行和主流券商,提供智能投顾、投研、合规等应用 [5] - 在汽车行业,覆盖九成主流车企,全面渗透从智能座舱到自动驾驶的全流程 [5] - 在教育领域,与超过七成的985高校合作,切入教学、科研、管理等场景 [5] - 通过服务头部客户获取前沿需求与数据,反哺模型优化,形成正向循环 [5] 市场认知与成本策略 - 公司认为不同行业增长特征不同,模型最大价值在于帮助人成长,如教育、医疗、科研等领域天花板极高 [5] - 公司透露,云时代企业客户与个人客户比例约为8.5比1.5,AI时代可能为7.5比2.5,并预计个人开发者占比未来会更高 [5] - 推出的“AI节省计划”通过阶梯式折扣最高可节省47%的使用成本,旨在降低AI规模化应用门槛 [5]
起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”
量子位· 2025-12-09 15:37
豆包手机市场热度与产品定位 - 首批3万台备货被一抢而空,二手市场价格翻番,显示产品市场热度极高 [1] - 产品被用户评价为“全球第一款真正的AI手机”,其核心在于将手机操作变为操作系统级的原生能力 [69][76] - 产品形态为搭载在工程样机nubia M153上的“豆包手机助手技术预览版”,能跨应用自动化执行复杂任务 [3][4] 核心技术:UI-TARS模型演进 - 豆包手机助手的图形界面操作能力建立在字节自研的UI-TARS模型基础上,该模型闭源版本针对移动端进行了大量优化 [7][8] - UI-TARS模型发展历经多个版本:今年1月开源初代模型;3个月后推出强化学习驱动的UI-TARS-1.5;今年9月发布能力更强的UI-TARS-2,为豆包手机提供关键技术支撑 [11][23][32] - 模型旨在构建具备感知、动作、推理、记忆四大核心能力的系统级AI Agent [13] 技术细节与创新 - **初代UI-TARS四大创新**:1) 使用大规模GUI截图数据集和五大感知任务增强感知精度;2) 定义了涵盖点击、滚动、输入等跨平台(Web、Mobile、Desktop)的原子动作集;3) 融入600万高质量GUI教程和多种推理模式注入深度推理能力;4) 借助数百台虚拟机自动收集交互轨迹,通过多阶段过滤和直接偏好优化解决数据瓶颈 [16][18][20] - **UI-TARS-1.5的进步**:新增强化学习驱动的推理机制,在执行前进行思考,显著提升性能与推理扩展性 [25] - **UI-TARS-2的四大突破**:1) 设计可扩展的数据飞轮实现数据与模型协同进化;2) 设计在长时序设定中稳定优化的训练框架;3) 构建混合GUI中心环境,通过SDK接入文件系统、终端等,打破纯GUI操作局限;4) 开发统一的沙盒平台管理异构环境,支撑数百万次交互的大规模训练 [35][37][39][42] 模型性能表现 - **UI-TARS-1.5基准测试成绩**:在计算机使用基准OSworld(100步)得分42.5,优于OpenAI CUA的36.4;在Windows Agent Arena(50步)得分42.1;在手机使用基准Android World得分64.2 [27] - **UI-TARS-1.5 GUI定位任务**:在ScreenSpot-V2得分94.2,在ScreenSpotPro得分61.6,均刷新SOTA [28] - **UI-TARS-1.5游戏测试**:在14款游戏测试中,UI-TARS-1.5在11款游戏上得分达到100,全面优于OpenAI CUA和Claude 3.7 [31][32] - **UI-TARS-2游戏性能**:在15款游戏的平均标准化得分为59.77,更接近人类水平(100),显著高于OpenAI CUA的24.73和Claude Computer Use的21.61 [46] - **UI-TARS-2在LMGame基准**:与前沿模型竞争,例如在Super Mario Bros得分1783.2,高于GPT-4o的1028.3,接近GPT-4.1的1991.3 [47] - 该项目在GitHub已获得8.3k Star,成为最受欢迎的开源多模态智能体之一 [47][48] 产品工程设计与隐私安全 - **权限与安全**:豆包手机助手使用INJECT_EVENTS系统级权限,需用户主动授权;遇到支付、身份验证等敏感操作会暂停任务交由人工接管 [50][51][52] - **隐私保护设计**:视觉管道经过过滤,截屏只包含目标应用界面,基于Activity Hierarchy抓取,物理上无法监控视频通话等悬浮窗内容 [56] - **后台运行机制**:Agent在后台执行长链任务时,即使前台接电话或切换App也不会被挂起,推测在OS层做了并行运行的虚拟化设计,拥有独立的Virtual Display [57] - **双模式技术栈**:豆包手机助手分为标准模式和Pro模式两套完全不同的Pipeline,标准模式依赖浅层视觉响应极快,Pro模式则进行深度推理和工具使用 [58][59][61] 实际应用体验与行业影响 - **用户体验案例**:用户可用英语直接下达复杂指令(如找人代排队、呼叫无人车),助手能自主选择应用并完成操作,无需预先设置手机语言 [69][72][75] - **能力限制**:官方已主动限制部分能力,包括限制刷分、刷激励场景,部分游戏类场景,并暂时下线操作银行、互联网支付等金融类APP的能力 [68] - **行业评价**:被评价为定义了下一代AI原生手机,展现了手机从被动操作工具向能主动理解意图、独立完成任务伙伴转变的可能性 [76][85]
大湾区智能算力与大模型智能体论坛在深圳举办
中国新闻网· 2025-12-05 10:41
论坛概况与核心主题 - 论坛主题为“智能算力引领大模型创新,多模态智能体驱动产业赋能”,聚焦智能算力基础设施、大模型技术创新、多模态智能体应用等前沿议题 [1] - 论坛旨在搭建交流研讨与开放合作平台,探索人工智能赋能实体经济的创新路径,并期待汇聚真知灼见与产业投资应用 [3] 区域产业发展现状 - 深圳市光明区已集聚人工智能优质企业近百家,相关产业规模超过300亿人民币 [3] 关键基础设施与项目进展 - “鹏城云脑Ⅲ”大科学装置在光明科学城加速推进建设,其落成将助力科学创新与产业技术升级 [1] - 鹏城实验室正发起并推进“中国算力网”计划 [1] 发布的创新科技成果 - 鹏城实验室发布鹏城脑海2.1-开元全开源模型,开源内容包括模型权重、训练数据集及数据处理工具 [5] - 鹏城实验室与深圳市气象局联合发布人工智能预报员助手“阿福”智能体,基于超智数融合体系结构,已为第十五届全国运动会提供气象服务保障 [5] - 琶洲实验室(黄埔)发布国产万卡大模型推理引擎—FenixCOS [5] - 工商银行联创发布基于国产全生命周期大模型工具集的金融智能体等示范应用成果 [5] 合作签约与参与机构 - 鹏城实验室分别与深圳市气象局、琶洲实验室(黄埔)、国家超级计算无锡中心签署合作协议 [7] - 论坛汇聚了鹏城实验室、清华大学、香港大学、琶洲实验室(黄埔)、香港中文大学、上海人工智能实验室等机构的专家学者进行主旨演讲 [7] - 论坛由深圳市发展改革委员会、市科技创新局、市工业和信息化局、光明区人民政府指导,鹏城实验室、深圳河套学院联合主办 [7]
Grok: xAI引领Agent加速落地:计算机行业深度研究报告
华创证券· 2025-09-23 11:41
报告行业投资评级 - 计算机行业评级为"推荐(维持)" [3] 报告核心观点 - Grok系列模型由xAI公司开发 通过快速迭代实现多模态与智能体能力突破 最新版本Grok-4在学术测试和多场景应用中建立技术壁垒 [6][8][29] - 海外大模型(OpenAI GPT-5、Google Gemini 2.5 Pro、Anthropic Claude 4)与国产模型(Kimi K2、DeepSeek-V3.1、阿里Qwen3)形成多极竞争格局 国产模型以成本效率优势(如Kimi K2输入成本仅为GPT-4.1的1/3)实现性能追平 [6][8][73] - AI Agent商业化落地加速 推动企业级服务与行业场景应用需求增长 涵盖办公、编程、金融、教育、医疗等细分领域 [6][8][83] 模型技术迭代与性能 Grok系列演进 - Grok-1(2024年3月):开源MoE架构 3140亿参数 在HumanEval编码测试达63.2% MMLU任务达73% 优于ChatGPT-3.5 [13][14][15] - Grok-1.5V(2024年4月):新增图像理解功能 在Mathvista测试准确率52.8% TextVQA达78.1% [17][18] - Grok-2(2024年8月):整合实时检索与图像生成 在MATH测试追平GPT-4o DocVQA测试领先同期模型 [19][21] - Grok-3(2025年2月):参数规模2.7万亿 引入Think分步推理和DeepSearch联网检索 在AIME、GPQA测试超越GPT-4o等旗舰模型 [20][24][25] - Grok-4(2025年7月):上下文窗口256K tokens 计算资源投入较Grok-2增加100倍 在HLE测试以44.4%准确率刷新纪录 在AIME、SAT、GRE测试超越GPT-4o等模型 [29][30][35] 海外大模型进展 - OpenAI GPT-5:在SWE-bench Verified测试达74.9% Aider Polyglot测试达88% [59][61] - Anthropic Claude 4:在SWE-bench Verified测试中Claude Sonnet 4达80.2% Claude Opus 4达79.4% 超越GPT-4.1和Gemini 2.5 Pro [64][66] - Google Gemini 2.5 Pro:在LiveCodeBench测试达74.2% Aider Polyglot达82.2% 多模态与推理能力领先 [68][71] 国产模型突破 - Kimi K2:在SWE-bench Multilingual和Tau2测试接近Claude 4 输入成本仅为GPT-4.1的1/3 [73][77] - DeepSeek-V3.1:通过Post-Training优化增强Agent能力 工具调用效率提升 [6][74][76] - 阿里Qwen3 Coder:编码基准测试媲美Claude Sonnet 4 中文语义任务保持优势 [79][80] 算力与生态布局 - xAI计划五年内实现5000万块H100等效算力规模 支撑Grok系列迭代 [30][50][53] - 国产模型累计备案服务439款 登记应用233款 商业化进程加速 [6][73] 投资应用方向 企业级服务 - 办公:金山办公、合合信息、福昕软件、三六零 [6][84] - 编程:卓易信息、普元信息 [6][84] - ERP:金蝶国际、用友网络 [6][84] - 多模态:万兴科技、美图公司、虹软科技、当虹科技 [6][84] 行业场景 - 金融:大智慧、同花顺、恒生电子、京北方、宇信科技 [6][84] - 教育:科大讯飞、视源股份、新开普、佳发教育 [6][84] - 医疗:阿里健康、卫宁健康、讯飞医疗科技 [6][84] - 工业:华大九天、中控技术、中望软件、索辰科技 [6][84] [6][8][83][84]
更懂国内APP的开源智能体!感知/定位/推理/中文能力全面提升,还能自己学会操作
量子位· 2025-08-31 12:25
多模态智能体UItron技术突破 - 开源多模态智能体UItron具备自动操作手机、电脑、浏览器的能力 通过多模态学习和多步执行轨迹数据实现人类化交互如点击、滑动和输入 [1] - 在中文APP场景下表现优异 适用于复杂多步任务 显著提升中文场景交互效率 [3] - 由浙江大学和美团联合开发 具备先进GUI内容感知、任务定位和推理规划能力 弥补操作轨迹稀缺性和智能体交互基建可用性不足 [4] 数据工程与交互基建 - 构建系统性数据工程缓解操作轨迹缺乏问题 包括感知数据、规划数据和蒸馏数据 整合OCR、VQA、Caption等多任务数据提升页面理解能力 [8] - 搭建连接移动和PC设备的交互环境基建 支持自动记录截图和坐标 简化手动标注难度 显著提高中文场景操作轨迹收集效率 [10] - 交互环境同时支持英文和中文国内App 为在线强化学习提供训练基础 实现动作执行与界面更新的交替循环 [10] 训练方法与性能表现 - 采用三阶段训练策略 包括感知任务SFT阶段、规划任务SFT阶段和课程强化学习RL阶段 涵盖从离线步骤级到在线任务级的强化学习 [12][14] - 在开源榜单ScreenspotV2上取得92.0平均分 优于现有方法 体现强大GUI内容理解和任务定位能力 [16] - 在Android-Control和GUI-Odyssey离线规划榜单中实现92.9最高平均分 显著超越其他工作 展示卓越任务规划与执行能力 [18] - 在OSWorld评测中取得24.9分(15 Steps) 为所有GUI Agent中性能最佳 但弱于专注于compute-use场景的CUA方法 [19] - 针对国内月活前100的Apps构建中文本地化评测环境 UItron在中文场景下取得明显性能优势 通过中文轨迹收集和交互基建提升智能体水平 [19] 行业影响与应用前景 - 在主流多模态智能体评测榜单中全面领先 提供更强开源基础模型 推动未来技术发展 [20] - 强调多模态智能体可用性和可信度研究 聚焦中文App交互真实应用诉求 提升人机交互效率与应用价值 [20]
早报李强:采取有力措施巩固房地产市场止跌回稳态势;A股市值历史首次突破100万亿元大关
搜狐财经· 2025-08-19 16:19
宏观政策 - 国务院会议强调巩固经济回升势头 激发消费潜力并采取措施稳定房地产市场[2] - 商务部决定延长对欧盟进口乳制品反补贴调查期限至2026年2月21日[2] - 中方支持俄美接触改善关系以推动乌克兰危机政治解决进程[2] 资本市场表现 - A股总市值首次突破100万亿元 年内新增14.5万亿元市值[3] - 券商开户数量普遍增长30%-50% 部分机构单日开户量创8月新高[3] - 美股三大指数基本平收 纳指微涨0.03% 热门中概股多数上涨[6] 汽车产业动态 - 汽车经销商上半年仅30.3%完成销售目标 40.7%经销商完成率在70%-100%之间[3] - 巴兰仕新股申购发行价10.15元 市盈率15.78倍 总市值13.39亿元[1] - 上海至昆山低空航线正式通航 支持20分钟跨省直达和夜间飞行[3] 科技与创新 - 中国信通院启动多模态智能体评估 联合40余家单位推进技术标准[7] - 头部大模型迭代加速 开源/低成本/多模态成为主要发展趋势[7] - 2025中国算力大会将在大同举行 当前智能算力规模达748 EFLOPS[8] 消费与制造业 - 自行车行业价格普遍下调 部分进口车型跌幅超50%[4] - 广电总局推出措施丰富电视内容 优化电视剧审查和播出政策[4] - 深交所调研两融账户网络投票机制 拟增设专用投票通道[4] 企业运营与战略 - 骄成超声上半年净利润同比大幅增长1005%[10] - 智飞生物上半年亏损5.97亿元 同比由盈转亏[5] - 景嘉微拟投资2.2亿元增资控股诚恒微 进军AI边端侧芯片领域[10] 新兴技术领域 - OpenAI考虑投资脑机接口公司Merge Labs 探索基因疗法改造脑细胞[9] - 全球脑机接口医疗应用潜在市场规模2030-2040年达400-1450亿美元[9] - 鸿蒙5终端突破1000万台 已有超3万个鸿蒙应用和元服务在开发中[10]
关注黑色、农业上游价格波动
华泰期货· 2025-08-19 11:22
报告行业投资评级 未提及 报告的核心观点 关注黑色、农业上游价格波动,生产行业关注人工智能技术要求,服务行业关注地产新政推行,需全面辩证把握经济形势,巩固房地产市场止跌回稳态势 [1] 各部分总结 中观事件总览 - 生产行业关注人工智能技术要求,中国信通院联合四十余家单位编制《多模态智能体技术要求》 [1] - 服务行业关注地产新政推行,国务院要求巩固房地产市场止跌回稳态势,释放改善性需求 [1] 行业总览 上游 - 黑色行业玻璃价格同比回落较多 [2] - 农业行业鸡蛋、棕榈油价格上行 [2] 中游 - 化工行业PX开工率上行 [3] 下游 - 地产行业一、二线城市商品房销售回落 [4] - 服务行业国内航班班次上升幅度缓和 [4] 重点行业价格指标跟踪 - 农业行业中,鸡蛋现货价6.7元/公斤,同比涨5.02%;棕榈油现货价9626.0元/吨,同比涨6.39% [47] - 有色金属行业中,铜现货价79310.0元/吨,同比涨0.19%;铝现货价20726.7元/吨,同比涨0.37% [47] - 黑色金属行业中,螺纹钢现货价3267.0元/吨,同比降2.55%;铁矿石现货价786.7元/吨,同比降0.45% [47] - 非金属行业中,玻璃现货价14.3元/平方米,同比降5.12%;天然橡胶现货价14891.7元/吨,同比涨0.51% [47] - 能源行业中,WTI原油现货价62.8美元/桶,同比降1.69%;Brent原油现货价65.9美元/桶,同比降1.11% [47] - 化工行业中,PTA现货价4720.3元/吨,同比降0.63%;聚乙烯现货价7448.3元/吨,同比涨0.09% [47] - 地产行业中,水泥价格指数全国值130.0,同比涨1.56%;建材综合指数116.0,同比降0.42% [47]