“领导30万、员工1万”,质疑年终奖分配不公,申万期货一员工被停职
经济观察报· 2026-01-09 12:08
申 万 期 货 员 工 在 公 司 群 里 对 年 终 奖 分 配 提 出 质 疑 , 他 认 为"30:1的分配比例毫无说服力"。1月8日,该员工对记者 表示,其在群里发送质疑是为了解"30万元与1万元差异"的数 据真实性,但截至目前仍未收到回应。 作者:牛钰 封图:图虫创意 近日,一张显示与申银万国期货有限公司(下称"申万期货")年终奖相关的截图在网络上流传。 截图顶端一行字为"申万期货移动工作站",下方主要内容为,一名员工在有531人的企信工作群 内发言,针对2025年度年终奖分配质疑:"2025年度年终奖发放后,一级部门领导30万元、普通 员工1万元的巨大差距,让我们全体普通员工深感不公与困惑。" 据了解,申万期货为申万宏源集团股份有限公司(下称"申万宏源",000166.SZ)的控股子公 司。 资料显示,申万期货成立于2007年12月11日,注册资本金7.76亿元,经营范围包括:商品期货 经纪、金融期货经纪、期货投资咨询、资产管理。申万期货官网公布的组织架构图显示,共设有财 富管理部、机构客户部、网络金融部、金融产品中心等14个一级部门。 图片来源:网络 经济观察报记者联系到了上述发文员工,该员工表 ...
大模型如何泛化出多智能体推理能力?清华提出策略游戏自博弈方案MARSHAL
机器之心· 2026-01-09 12:08
文章核心观点 - 清华大学研究团队提出的MARSHAL框架,通过在多智能体策略游戏中进行自博弈强化学习,有效提升了大型语言模型在多轮、多智能体交互场景中的博弈决策与推理能力,并且该能力能够显著泛化至通用的多智能体系统,在数学竞赛和专家级问答等一般推理任务中提升整体表现 [2][7][13][19] 背景与挑战 - 尽管可验证奖励强化学习在单轮、单智能体场景中已证明价值,但在多智能体系统的多轮交互场景中应用仍处探索阶段 [5] - 将RLVR拓展至多智能体领域面临两大核心技术挑战:多轮交互的信用分配困难,以及不同智能体因高度异构性导致优势估计基准差异大、训练难以收敛 [5][7] MARSHAL方法介绍 - 框架基于Group-Relative Policy Optimization架构,提出了两项关键算法改进以应对多轮次、多智能体训练的挑战 [12] - **轮次级优势估计器**:针对信用分配问题,摒弃粗糙的轨迹级评估,引入精细的轮次级奖励机制,并采用“先求累计和再归一化”方法进行稳定优势计算 [14] - **分角色的优势归一化**:针对角色异构性,实施严格区分角色的归一化策略,根据角色不同将数据分组计算优势,以解决回报分布差异问题 [14] - 研究团队挑选了六款涵盖从简单到复杂、从竞争到合作多种类型的策略游戏用于训练和测试 [12] 核心实验 - **实验设置**:以Qwen3-4B为基线模型,在三款训练游戏中训练了专家智能体和通用智能体两种类型 [16][18] - **游戏策略能力泛化**:MARSHAL训练出的智能体在测试游戏中展现出出色的泛化性,通用智能体取得了高达**28.7%**的胜率提升,表明模型掌握了通用的博弈逻辑 [13][16] - **通用推理能力泛化**:将MARSHAL模型集成到主流多智能体框架中测试,在一般推理任务中表现显著提升 [18] - 在竞争性多智能体系统MAD中,综合表现最强的MARSHAL通用智能体在数学测试AIME准确率提升**10.0%**,在问答测试GPQA-Diamond准确率提升**7.6%** [13][19] - 在所有基准测试中平均提升**3.5%** [13] - **能力泛化领域对齐**:在竞争性系统MAD中,竞争性游戏训练的模型表现更优;在合作性系统AutoGen中,合作性游戏训练的模型表现更优 [19] - **可扩展性验证**:在扩展到8B模型的实验中,MARSHAL方法依然保持了强劲的增长势头 [20] 推理模式分析 - **定性分析**:游戏训练激发了模型两项关键的涌现能力 [22] - **角色意识**:模型能根据自身角色调整决策策略 [22] - **意图识别**:模型能在不确定信息场景中根据其他智能体的动作判断其意图 [22] - **定量分析**:失败模式分析显示,MARSHAL将**智能体间未对齐**的情况减少了**11.5%**,显著提升了跨智能体的沟通效率和理解能力 [24] 消融实验 - **自博弈 vs 固定对手**:与固定专家对手训练相比,自博弈展现出不可替代的优势,针对固定对手训练的模型容易过拟合,在测试游戏中性能急剧下降 [26][27] - **优势估计算法设计**:逐步移除核心算法组件的实验验证了MARSHAL算法设计的必要性 [28] - **轮次级优势估计**是处理长序列决策的关键 [28] - **分角色归一化**在角色回报差异大的竞争性游戏中影响巨大,而在合作游戏中影响相对较小 [28]
Agent 2.0时代来了,首批「工业级智能体」正在核心位置上岗
机器之心· 2026-01-09 12:08
AI智能体工业化趋势与效率提升 - 整个科技圈感叹AI工具带来显著效率提升,硅谷工程师表示项目完成时长被大幅压缩[2] - 行业观点认为,若在读博时就有Claude Code、Gemini和ChatGPT等工具,毕业时间可能缩短至一年[5] - 围绕AI智能体技术,全新的工作范式正在形成,开发、数据分析等领域的工作流程已被AI彻底改变[5] 阿里云百炼平台升级概览 - 阿里云百炼在1月7日的发布中,完成了面向智能体开发范式的全面升级,标志着智能体从“手工作坊”时代进入“工业化流水线”时代[6] - 平台升级了“1+2+N”蓝图:底层是模型与云服务,中间层是高代码与低代码开发范式,上层是面向不同任务的开发组件,覆盖生产级智能体构建全生命周期[6] 开发组件与低门槛应用 - 百炼应用广场已出现超过10类聚合主题,包含146个开箱即用模板(如子弹时间特效、会议图文纪要、AI换装等)[10] - 模板在支持即开即用、二次开发基础上,进一步升级支持免登录体验、一键API调用,降低上手门槛[10] - 升级多模态知识库RAG能力,支持文档、图片、音频、视频等数十种文件类型的高精度解析与语义检索[12] - 提供Connector企业级数据连接器,能一键对接钉钉、飞书、语雀等文档系统,以及MySQL、OSS等数据库,通过数十种内置工具让智能体安全检索调用企业内部实时数据[15] 智能体开发框架与架构演进 - 百炼平台提供双模式开发能力,首次实现高代码与低代码并行,使用统一的开发框架和运行时[23] - 专业开发者可用高代码框架灵活定制智能体逻辑,业务人员可通过低代码界面快速配置模型、提示词、知识库与工具,可视化搭建智能体[23] - 两种方式构建的智能体未来将支持双向导出与部署,低代码成果可转换成高代码[25] - 智能体应用能力已升级至Agent 2.0架构,从底层重塑开发逻辑,完成从“简单对话”向“目标导向的自主执行”升级[25] - Agent 2.0引入“规划-执行-反思”链路,实现AI从意图理解到自我优化的全流程可视化[26] - 技术底座AgentScope提供模型能力集成、多智能体编排、智能上下文管理和工具管理四大核心功能[27] 模型服务与云基础设施 - 百炼模型广场已有130余款模型,新增包括Qwen-Image-Max、GLM-4.7、Wan2.6视频生成系列、Qwen3-ASR-Flash多语种识别等[35] - 提供模型单元独占部署选项,为高并发、低延迟业务提供专属算力,相比自建集群使用vLLM、SGLang等开源推理引擎,可实现超过1.3倍的推理能力提升,以及1.5倍以上的并发能力提升[36] - 提供全链路的可观测体系,支持调用审计、推理日志、全周期用量统计与多维度性能指标集成[36] - 提供基于通义全系列模型的原生训练微调能力,支持全阶段Checkpoint、混合数据训练与GRPO/GSPO强化学习算法,实现评测驱动的训练迭代[36] - 机密推理服务基于CPU/GPU TEE可信执行环境,提供高安全等级的模型推理能力[37] 成本优化与任务执行能力 - 面向大模型推理、长视频生成等耗时任务,推出异步调用API,打破同步接口调用5分钟的超时限制,可延长到超过24小时[18] - 结合实时、闲时资源请求动态调度能力,系统可实现任务动态启停,满足不同推理需求[18] - 闲时调度能让AI的推理成本降低50%以上[19] 企业级部署与行业应用 - 发布Agent平台企业版,支持智能体在专有云、本地化与VPC的开发与部署[40] - 新增通用型智能体平台Alias构建数字化助手,AgentZoo提供金融、数据科学、语音、问答等领域的智能体应用[31] - 平台升级让智能体构建变得严谨可靠、可持续迭代,同时降低开发门槛,使新技术能进入更多行业[43]
谁家更新日志那么长啊?Claude Code版本更新引围观,1096次提交一口气上线
机器之心· 2026-01-09 12:08
Claude Code 2.1.0版本更新概览 - 核心观点:Claude Code近期进行了从2.0.76到2.1.0的重大版本更新,更新内容异常丰富,引发了开发者社区的广泛关注和讨论[1][4] - 更新规模巨大:此次版本更新共合入了1096个提交,更新日志需要翻好几屏才能看完[2][10] - 社区反应:快速的更新节奏让网友感到惊讶,有人调侃“照这个速度,我们周五早上就能用上新操作系统了”,并建议团队采用滚动发布模式[4][5] 主要新增功能与优化 - 核心功能增强:包括开箱即用的Shift+Enter换行、在agents和skills的前置配置中直接添加钩子、以及支持分叉上下文、热重载和自定义代理的Skills增强[10] - Agent行为与多语言支持:优化了Agent行为,使其在拒绝使用某个工具后不会停止,而是尝试其他方案;增加了可配置模型以指定语言回复的功能[14] - 工具与会话管理:支持工具权限通配符匹配;新增了使用`/teleport`命令将会话转移到claude.ai/code的功能[14] 快速迭代与后续更新 - 持续快速发布:在2.1.0版本发布后,团队又迅速推出了2.1.1和2.1.2版本,修复了bug和安全问题,并增加了一些小改进,呈现“一天一波新发布”的节奏[17] - 后续更新细节:2.1.2版本包含了22项CLI、2项flag和1项提示变更,具体包括为拖拽到终端的图像添加源路径元数据、在支持OSC 8的终端中为工具输出的文件路径添加可点击超链接、支持Windows Package Manager安装、新增计划模式下的Shift+Tab快捷键以快速选择“自动接受编辑”选项等[18] - 问题修复:修复了bash命令处理中的命令注入漏洞、tree-sitter解析树未释放导致WASM内存泄漏的问题,以及在使用`@include`指令时意外将二进制文件包含到内存中的问题[18] 开发方法论与生产力 - 内部深度使用:公司坚持将Claude Code作为内部真正的生产力工具,包括研发模型在内的所有员工都是其重度用户,这有助于快速发现bug并在产品和模型层面进行改进[21] - AI驱动的高效开发:开发负责人Boris Cherny曾提到,在之前的一个月,他提交了259个PR,包含497次提交、4万行代码增加和3.8万行删除,所有这些代码均由AI编写[19] - 开发者反馈:尽管更新频繁且功能丰富,但也有开发者指出更新多但bug也多,且许多新功能不够简洁[21]
异动盘点0109 |锂电池概念股早盘普涨,理士国际重挫逾60%;虎牙涨14.47%,芯片概念股全线走低
贝塔投资智库· 2026-01-09 12:02
港股市场动态 - 万国数据-SW旗下国际业务平台DayOne数据中心完成C轮融资,募资规模达20亿美元[1] - 智谱在港交所挂牌上市,成为“全球大模型第一股”,上市次日最高涨超24%,较招股价涨超四成[1] - 禾赛-W在CES 2026展示最新激光雷达技术成果,并更新交付量、产能规划、战略合作等经营情况[1] - 锂电池概念股早盘普涨,工信部等四部门联合召开动力和储能电池行业座谈会,研究部署规范产业竞争秩序工作[1] - 快手-W旗下可灵AI在去年12月完成模式升级与新功能上线,料将推动海外市场用户认可及营收,可能抬升2026财年营收预期[2] - 佳鑫国际资源附属公司与CCECC哈萨克斯坦分公司订立采矿服务采购协议,总合约价格为149亿坚戈(约2.27亿港元)[2] - 黄金股多数走高,近期地缘风险与降息预期支撑金价[2] - 九方智投控股公告收购目标公司JF Financial Company Limited全部股权及核心信息系统[3] - 凌雄科技近两日股价实现翻倍,公司董事会主席表示我国DaaS市场渗透率将在未来5年内迎来拐点[3][4] - 理士国际股东大会投票通过分拆美股上市议案,股价重挫逾60%[4] 美股市场动态 - Buda Juice登陆美股市场,开盘股价走高,涨8.13%,公司专注生产与销售鲜榨果汁、柑橘类饮品、柠檬水和健康功能性饮品[5] - 虎牙股价创下五个半月新高,涨14.47%,公司与金山世游联合发行的《鹅鸭杀》手游公测上线24小时新增注册用户突破500万,并登顶iOS免费榜[5] - 加密矿企概念上扬,Applied Digital 2026财年第二季度营收1.266亿美元,同比增长250%,普通股股东应占基本及稀释每股净亏损0.11美元,同比收窄82%,调整后净利润10万美元[5] - 稀土概念股Critical Metals年内五个交易日累计大涨超110%,公司董事会批准在格陵兰启动建设符合北极环境标准的多用途设施,以加速推进Tanbreez稀土项目[6] - 中概股哔哩哔哩涨6.51%,摩根士丹利认为其广告业务表现稳健,但游戏业务前景未明朗[6] - 存储概念股普跌,投资者质疑AI相关资本支出能否在未见显著回报迹象的情况下继续保持当前速度,从而推动存储芯片股巨大涨幅[6] - 美股太空概念普涨,L3Harris Technologies同意以8.45亿美元企业价值出售空间推进与电力系统业务60%控股权给AE Industrial Partners,保留40%股权[7] - 芯片概念股全线走低,英伟达跌2.15%,AMD跌2.54%,美光科技跌3.69%等[7] - 黄金、白银股开盘普跌,现货白银大跌超4%至74.48美元,现货黄金跌0.5%至4433.37美元,贵金属市场正经历由指数再平衡引发的流动性冲击[7][8] - 美国铝业公司股价走低,跌2.63%,摩根大通分析师下调其评级至“卖出”,但将目标价从45美元上调至50美元,指出关税政策存在不确定性且相对估值偏高[8]
3批214个国家生态监测站名单发布,网友:这得买多少仪器?
仪器信息网· 2026-01-09 12:02
摘要 :生态环境部公布第三批43个生态质量综合监测站名单,构建"天空地一体化"监测体系,前三批共 214个生态站。 生态站监测内容 :包括大气环境(SO ₂ 、PM 2.5 等)、土壤理化指标、植被生长参数(叶 面 积 指 数 、 NDVI ) 、 野 生 动 物 种 群 、 水 文 水 质 ( 浊 度 、 流 速 ) 及 温 室 气 体 通 量 等 8 大 类 指 标。 第三批生态质量综合监测站名单 | 序号 | 省级 | 地市级 | 生态站名称 | 建设单位 | 所在重点监管区 | | --- | --- | --- | --- | --- | --- | | | 行政区 | 行政区 | | | | | | 北京市 | 大兴区 | 只雄平原城市站 (城市) | 中国环境科学研究院、北京经济技术开发区生态环境建 设局、河北省生态环境科学研究院、中国气象局气象探 | 其他重要生态区 | | | | | | 测中心 | | | 2 | 河北省 | 水德市 | 河北塞罕坝站 (森林) | 北京大学、河北省塞罕坝机械林场、河北省生态环境监测 中心(河北省机动车排污监控信息中心)、承德市环境监 | 坝上草原防风固沙区 ...
8004万元。南方医科大学公布两批2026年仪器采购计划
仪器信息网· 2026-01-09 12:02
摘要 : 近日,南方医科大学发布多批政府采购意向,仪器信息网特对其中的仪器设备品目进行梳理,统 计出25项仪器设备采购意向,预算总额达8004万元。 特别提示 微信机制调整,点击顶部"仪器信息网" → 右上方"…" → 设为 ★ 星标,否则很可能无法看到我 们的推送。 近日, 南方医科大学发布 25 项仪器设备采购意向,预算总额达 8004万 元,涉及荧光定量 PCR仪、液相色谱-电感耦合等离子体质谱仪、离子色谱仪、高效 液相色谱仪、激光共聚焦显 微镜等,预计采购时间为2025年 8月 ~ 2026年3 月。 详细采购清单: 南方医科大学2 0 2 5年 8 月~ 2 0 2 6年3月 仪器设备采购 意向汇总表 | 采购 | | 预算 | 采购 | | --- | --- | --- | --- | | | 需求概况 | | | | 项目 | | 万元 | 时间 | | 南方医院荧光定量 | 标的名称:荧光定量 PCR 仪、梯度 PCR 仪模 | | 202 | | | 块 标的数量:2 主要功能或目标:满足医院临床/ | | | | PCR 仪、梯度 PCR 仪 | 科研需求 需满足的要求:满足医院临床/科 ...
中铁五局被停业整顿180日
券商中国· 2026-01-09 11:59
来源:经济参考网 日前,全国建筑市场监管公共服务平台信息显示,中铁五局集团有限公司(以下简称"中铁五局")被住房和城 乡建设部实施停业整顿180日,决定时间为2025年12月16日,有效期至2026年6月14日。停业整顿期间,不得以 建筑工程施工总承包特级资质承揽新的工程项目,涉及的具体事由未公开。 这并非公司近年来首次被通报。2024年10月,中铁五局下属的中铁五局集团机械化工程有限公司,在格库铁路 七个泉站铁路线路安全保护区内施工作业过程中,不遵守保证铁路安全的施工安全规范,导致挖断电缆,构成 铁路交通一般事故。2025年4月10日,兰州铁路监督管理局给予该公司罚款60000元的行政处罚。 2025年10月,海口市住建局发布建筑工地文明施工红黑榜,中铁五局因其负责施工的项目现场未能较好地落 实"六个百分百"要求,施工现场(美玉村碎石厂)未保持整洁、未采取有效设施防止尘土污染环境上了黑榜。 官网信息显示,中铁五局是世界500强企业中国中铁股份有限公司骨干成员企业,始建于1950年,原为铁道部 第五工程局,1999年改制为中铁五局集团有限公司;下辖18个实体性子分公司、7个区域总部、33个经营性分 公司、18 ...
规模跃升源自“翻石头”!浩坤昇发李佳佳:交易要“做精做细”,研究要“看深看远”
券商中国· 2026-01-09 11:59
过去两年,在权益市场波动加大、风格快速切换背景下,私募行业对于"真实Alpha"的检验也愈发严苛。 值得一提的是,在这一轮行业洗礼中,同样也有不少机构"脱颖而出",实现规模和业绩的成长,引来业内关 注。浩坤昇发就是这其中具有代表性的例子之一。 对于其在管产品2025年优异的收益表现,李佳佳将捕捉机会的方法总结为三点: 一是前瞻产业方向,通过政策文件、宏观数据与产业趋势,筛选高景气、广前景、厚壁垒、低估值的赛道;二 是挖掘价值洼地,通过调研、财务分析和产业链对比,形成个股核心池;三是持续动态跟踪,在方向确认后, 对交易拥挤度、基本面变化进行反复校验,及时调整标的。"方向判断只是起点,持续验证才决定结果。" 近日,浩坤昇发资产合伙人、基金经理李佳佳在接受证券时报· 券商中国记者采访时,系统阐述了近年来浩坤 昇发获得规模业绩"双丰收"的背后逻辑,同时作为业内不多的女性私募基金经理,她也通过独特的视角谈及对 于长期投资及行业中女性力量的一些思考。 规模跃升源自"翻石头" 采访中,李佳佳首先以"我行其野,芃芃其麦"向记者抒发了她向往的一种生活与工作态度。她解释称,所 谓"我行其野"是一种生命状态,即在公司调研中扎根,在 ...
刚刚,利好突现!A50,异动!
券商中国· 2026-01-09 11:59
利好来了! 如果今天继续收阳线,A股上证指数的表现将继续创造历史。而与此同时,融资余额持续增长,截至1月8日, 上交所融资余额报13060.06亿元,较前一交易日增加77.92亿元;深交所融资余额报12887.61亿元,较前一交易 日增加79.91亿元;两市合计25947.67亿元,较前一交易日增加157.83亿元。 那么,跨年行情是否一马平川?据中信建投研报,过去两年市场开年下跌有一个共性原因是全球流动性变化和 人民币的贬值压力。今年元旦市场面临的流动性环境和汇率环境明显好于前两年。人民币汇率保持强劲,有利 的外部环境或将推动A股元旦后迎来"开门红"行情。同时国内流动性环境整体宽松,也有利于跨年行情的展 开。人民币升值、科技板块利好集中释放、宏观经济预期改善及资金面积极信号等多重利好共同推动港股开年 大涨,这些利好也同样有望推动A股跨年行情的继续演绎。 天风证券研报认为,2026年上半年或迎降准降息窗口,政策宽松预期升温。复盘2020年—2025年央行操作,降 息集中于Q2至Q3,仅2020年、2022年因疫情冲击在Q1落地;降准则多发生于Q1与Q3,9月、12月为高频时 点。当前DR007升至1.52%、 ...