Workflow
机器学习
icon
搜索文档
李彦宏接受《时代》专访:AGI可能不存在,中国模型落后的不太多
凤凰网· 2026-01-27 12:39
公司发展历程与战略 - 公司创始人李彦宏于2000年在北京创立公司,目前公司市值达500亿美元 [2] - 公司早期重点为巩固其中国领先搜索引擎的地位,对AI的兴趣始于大学时期,但直到2010年左右才开始将机器学习用于搜索排名,并于2012年左右开始对AI进行实质性大规模投资,当时认识到深度学习的重要性 [2][4] - 公司如今已成为中国领先的全栈式AI企业之一,提供从芯片、云基础设施到模型、智能体、应用和消费产品的全套服务 [3] AI行业观点与趋势 - 2023年全球AI市场规模估计已达2440亿美元,AI芯片公司英伟达市值超过4万亿美元 [3] - 公司CEO认为不存在所谓的通用人工智能(AGI),没有一个模型能够“面面俱到” [2] - 在模型发展上,中国落后的没那么多,但在GPU或AI加速器方面,可能落后美国两到三代 [9] - 基础模型领域最终会像桌面互联网和移动互联网一样进行整合,只剩下少数几个佼佼者,但应用层将会有许多成功的参与者 [7] - 当前行业处于模型爆发期,但终将趋于稳定并走向成熟,当更多模型开发者转向应用层开发智能体时,生态系统便会真正成熟起来 [8] 公司AI模型与产品策略 - 公司发布了文心一言5.0模型,在多个指标上可与ChatGPT、DeepSeek等模型竞争,在创意写作方面甚至被评为第一 [5] - 开发基础模型采取以应用为驱动的策略,不试图“面面俱到”,而是专注于搜索、数字人等特定应用领域并优化模型性能 [5] - 公司认为未来没有任何基础模型能在每个方面都做到最好,但会优化模型使其在最关心的应用方向上表现更好 [5] - 公司积极拥抱开源,其飞桨开源深度学习平台有数千万开发者使用,影响力可与TensorFlow和PyTorch媲美 [8] 公司业务与应用层布局 - 公司认为当前AI价值格局呈金字塔型:大部分价值在芯片层,模型层可能只实现十分之一,应用层实现价值更少,这种结构不健康,必须在应用层创造更多价值以支撑底层技术投入 [7] - 在自动驾驶领域,萝卜快跑自动驾驶出租车已在约22个中国城市运营,并正在中东和欧洲推进国际化扩张 [8] - 自动驾驶技术已到达临界点,具备在拥堵城区大规模部署的能力,且凭借中国有竞争力的供应链,能以低于西方车辆的成本制造自动驾驶出租车,在全球多数城市能实现独特且健康的经济效益 [8] - 公司帮助许多城市建立数据标注中心,雇佣了成千上万的人,以创造新的就业机会 [13] 中美AI发展路径与监管差异 - 美国政策讨论倾向于以“曼哈顿计划”式力量推动AGI领先,而中国政策框架更关注将AI技术普及到社会各领域 [9] - 中国在制造业方面非常强大,AI被用来解决工厂高效率、低成本生产的问题 [9] - 在监管方面,中国采取“事先许可”模式,而美国在部分地区如得州或佐治亚州对自动驾驶出租车运营尚无监管 [11] - 公司CEO认为制定AI监管规则时应非常小心,避免伤害创新节奏,监管者不应走在技术路线图的前面 [12] 行业效率与成本 - 在模型效率方面,中国能够开发出推理成本是美国同行十分之一甚至百分之一的模型 [14] - 中国公司因购买力较弱、竞争更激烈,总是不得不降低推理成本,顺带也节约了能源 [14] - 像DeepSeek这样的中国公司只花了600万美元就做出了V3模型,而Meta在AI上投入了数十亿美元,这代表了两条不同的发展路径 [14] - 公司很早就关注数据中心能效,其在中国数据中心可能是能效最高的,通过让模型更小、推理成本更低来减少电力需求 [14]
企业数据备份和恢复软件行业分析:市场规模及增长趋势(by QYResearch)
搜狐财经· 2026-01-27 12:15
行业定义与核心功能 - 企业数据备份和恢复软件是为企业提供数据保护、备份、恢复与灾难恢复解决方案的软件系统,通过定期或实时备份关键数据,确保在突发事件后能迅速恢复业务连续性与数据完整性 [1] - 该软件支持多种存储方式,包括本地、远程、云端和混合云模式,并集成了自动化恢复功能以最小化系统停机时间 [1] - 软件提供高级安全功能,如加密、防勒索软件保护和自动合规检查,帮助企业满足法规要求 [1] - 2025年全球企业数据备份和恢复软件毛利率约60%-80% [1] 市场规模与增长预测 - 2025年全球企业数据备份和恢复软件市场销售额达到76.30亿美元 [5] - 预计到2032年,市场规模将达到118.33亿美元 [5] - 2026年至2032年期间的年复合增长率预计为6.2% [5] 市场竞争格局与主要厂商 - 全球市场的主要开发商包括Veeam、Veritas Technologies、Commvault、Acronis、Kaseya(Unitrends)、Datto、Netapp、Code42等 [2] - 市场前10名厂商在2025年占据了全球市场份额的55% [2] - 其他业内重要企业还包括Cohesity、Arcserve、IBM、Dell、Carbonite (OpenText)、Hitachi Vantara等 [7] 区域市场分布 - 美国是全球最大的区域市场,2025年约占全球市场的43% [2] - 欧洲市场占比约为25.7% [2] - 中国市场占比约为6.7% [2] 产品类型细分 - 就产品类型而言,本地部署是最主要的细分产品,占据大约71.0%的市场份额 [11] 市场驱动因素 - 数字化转型浪潮下,数据成为企业核心资产,数据备份和恢复软件的重要性持续提升 [2] - 企业业务系统、云应用与边缘计算环境快速扩展,导致数据量呈指数级增长,传统手工备份方式难以满足需求 [2] - 网络勒索软件和数据泄露事件频发,加强了企业对自动化、端到端备份与灾难恢复能力的重视 [2] - 云计算、混合云与多云战略的采用拉动了对云备份、灾难恢复即服务与备份即服务解决方案的需求 [2] - 大数据、云计算与物联网的快速发展导致企业数据量急剧增加,对解决方案的数据处理能力和多元化部署提出更高要求 [2] - 云备份和混合云解决方案因灵活的付费模式和便捷的扩展性,在中小企业中日益流行并成为主流选择 [2] 行业应用与需求变化 - 金融、医疗和政府部门对业务连续性和灾难恢复策略要求更高,倾向于引入高级别的自动化恢复与异常检测功能 [2] - 制造业和零售业在数字化供应链中引入实时数据保护平台,以降低业务中断风险 [2] - 云原生企业与SaaS平台用户更青睐基于云的备份服务,因其易于扩展和按需付费模式 [2] 技术发展趋势 - 随着人工智能和机器学习技术的引入,智能预测备份与恢复策略将成为下一个增长点,帮助企业优化存储资源与恢复时间 [2] 市场挑战 - 不同规模企业对解决方案的需求差异显著,中小企业对成本敏感,而企业级软件的部署、整合与培训开销较高,阻碍了全面普及 [2] - 数据主权与隐私法律对跨境数据存储提出严格要求,使得跨区域服务提供商需投入更多资源保障合规性 [2] - 备份与恢复生态持续演进,竞争加剧,厂商需不断提升产品智能化、自动化与性能优化能力以保持差异化竞争力 [2]
鲁比尼:欧洲的真正生存威胁在于经济和科技的落后
第一财经· 2026-01-25 20:48
文章核心观点 - 欧盟面临的核心生存威胁并非移民或文化政治,而是其日益落后的经济与科技竞争力,这导致了与美国巨大的增长差距,并使其在决定未来的关键产业竞赛中处于劣势 [1] 欧洲经济表现与差距 - 2008至2023年间,美国GDP增长87%,而欧盟仅增长13.5% [1] - 同期,欧盟人均GDP相对于美国的水平从76.5%下降至50% [1] - 美国最贫困的密西西比州人均收入也高于法国、意大利等欧洲主要经济体及欧盟平均水平 [1] - 差距根源在于美国更强劲的生产力增长,主要得益于技术创新和更高的全要素生产率 [1] 科技与产业竞争力现状 - 全球50大科技企业中,约半数来自美国,欧洲仅占4席 [1] - 过去五十年,美国有241家初创企业成长为市值超100亿美元的巨头,欧洲同期仅有14家 [1] - 在人工智能、半导体、量子计算等未来产业的技术领导权之争中,欧洲处于明显劣势 [2] - 全球创新活动主要集中在美国、中国、日本、韩国、印度和以色列,欧洲的创新活动基本局限于英国、德国、法国和瑞士 [2] 造成差距的核心原因 - **融资生态**:美国拥有更深厚活跃的初创企业融资生态系统,欧洲因缺乏真正的资本市场联盟而限制了新企业的成长规模与速度 [2] - **监管环境**:欧盟被分割为27个国家监管体系,内部市场壁垒对商品和服务的实际阻碍分别相当于44%和110%的关税,远高于美国关税水平 [3] - **风险文化**:欧洲对创业失败的文化容忍度低,而美国则更接受失败 [3] - **创新体系**:美国受益于深度融合的学术-军事-工业复合体系,欧洲国防投入长期不足削弱了其创新能力 [3] 潜在路径与改革动向 - 欧洲拥有高素质人力资本、卓越教育体系和世界级研究机构等优势 [5] - 通过监管改革和更好创业环境,欧洲的高人均收入、庞大内需市场及高储蓄率可释放投资浪潮 [5] - 即使无法引领尖端技术,欧洲也可通过引进并改造美中创新成果来显著提升生产力 [5] - 政策制定者已开始推进实质性改革,例如2024年发布的聚焦欧盟竞争力与单一市场建设的重要报告 [4] - 要达到北约新设定的国防开支占GDP 3.5%的目标,加大国防投入对维持欧洲社会模式和创新至关重要 [4] 面临的长期风险 - 如果技术差距持续扩大,欧洲将面临长期停滞风险,相对美中两国的经济衰退态势也将持续 [4] - 当前缓慢的技术衰退可能演变为一场骤然且不可逆的经济地位跌落 [5]
万事达卡申请预测区块链数字货币交易欺诈性专利,可预测交易是否为欺诈性
搜狐财经· 2026-01-24 16:50
公司动态 - 万事达卡国际公司于2024年5月在中国国家知识产权局申请了一项关于预测区块链数字货币交易欺诈性的专利,公开号为CN121399638A [1] - 该专利涉及一种计算机实现的方法,通过机器学习模型预测存储在区块链中的数字货币交易是否为欺诈 [1] - 方法包括获取数字货币第一笔资金的第一笔交易的交易数据,该数据包含此交易发生前该资金的第二笔交易相关信息 [1] - 方法还包括根据第一笔交易是否欺诈对其交易数据进行标注,并使用这些带标注的交易数据作为训练数据来训练机器学习模型 [1] 行业技术发展 - 支付与金融科技行业正积极探索将人工智能和机器学习技术应用于区块链与数字货币领域,以增强交易安全 [1] - 行业技术研发方向包括利用历史交易链数据(如前序交易信息)来构建更精准的欺诈预测模型 [1]
刚刚, 2025 ACM Fellow公布!陈宝权、贾佳亚、梅涛、朱军等多位华人入选
机器之心· 2026-01-22 11:13
ACM 2025年度会士评选概况 - 美国计算机协会ACM公布了2025年度会士名单,共有71位科学家新入选,其贡献覆盖计算机图形学、网络安全、人机交互、数据管理、机器学习、人工智能、算法、可视化等多个领域[3] - ACM主席表示,入选名单代表了计算机领域当前发展的快照,既表彰了在计算机架构、软件工程等成熟学科的成员,也表彰了在群体智能、场景识别等新兴学科的创新者[3] 入选华人学者及其贡献 - **Pei Cao**:现任YouTube工程副总裁,因在网络缓存、搜索引擎效率和信息质量方面的贡献入选[5][8] - **陈宝权**:北京大学教授、智能学院副院长,因在大规模场景重建、离散几何处理和制造形状设计方面的贡献入选,已发表论文200余篇[9][10] - **陈德铭**:伊利诺伊大学厄巴纳-香槟分校终身正教授,因对可重构计算的贡献,包括综合算法和可定制人工智能加速器设计方法入选[13][16] - **郑光廷**:香港科技大学副校长(研究及发展),因在电子电路与计算系统的设计自动化以及软硬件协同设计方面的贡献入选[17][21] - **付昀**:美国东北大学双聘杰出教授,因在表征学习、计算机视觉、面部和手势识别方面的贡献入选,其提出的RDN与RCAN网络被引用逾1.3万次,总引用逾5.8万次,H-index超过107[20][22] - **黄教授**:澳大利亚昆士兰大学数据科学学科负责人,因对大规模多媒体内容理解、索引和检索的贡献入选,已发表200多篇论文[24][27] - **贾佳亚**:思谋科技创始人、香港科技大学讲座教授,因在计算机视觉领域的图像分割、场景解析和纹理分析方面的贡献入选,其论文被引用超过10万次[25][28][29] - **贾小华**:香港城市大学讲座教授,因在数据安全和分布式计算系统领域的杰出贡献入选[32][36] - **金海**:华中科技大学教授,因在高效的数据中心处理、内存管理以及分布式系统架构方面的贡献入选[35] - **马坚**:卡内基梅隆大学教授,因在计算生物学算法和机器学习方面的贡献入选[38][42] - **梅涛**:智象未来创始人兼CEO,因在多媒体分析、检索及应用方面的贡献入选,已发表200余篇学术论文[41][43] - **陈建利**:新加坡国立大学教授,因在高级数据库应用的查询优化与处理方面的贡献入选,已发表论文300余篇[46][49] - **童行行**:伊利诺伊大学厄巴纳香槟分校教授,因对大规模图挖掘理论、算法和应用的贡献入选[50][51] - **熊辉**:香港科技大学(广州)协理副校长,因在人工智能和移动计算领域研究方面的贡献入选,已发表论文400余篇[54][55] - **Li Xiong**:埃默里大学教授,因在编程语言静态类型系统和机械化数学方面的贡献入选,已发表200多篇论文[57][59] - **杨俊峰**:哥伦比亚大学教授,因其在可信软件和人工智能系统方面的领导力和贡献入选[60][61] - **易珂**:香港科技大学教授,因在查询处理理论与实践方面的贡献入选[64][65] - **郑宇**:京东集团副总裁、京东科技首席数据科学家,因在时空数据挖掘和城市计算领域的贡献入选,总引用逾6.2万次[67][70] - **朱军**:清华大学教授,因在概率机器学习的理论和方法方面的贡献入选[71]
中国石油申请沉积旋回识别模型构建专利,提高储集体预测精度
搜狐财经· 2026-01-20 14:03
公司技术研发动态 - 中国石油天然气股份有限公司于2024年7月申请了一项名为“一种沉积旋回识别模型构建、储集体预测方法和装置”的专利,公开号为CN121350605A [1] - 该专利旨在通过机器学习模型,利用单井各层段的地层特征数据与沉积旋回标签(包括自旋回和它旋回)进行训练和验证,构建沉积旋回识别模型 [1] - 该技术能够对地层中的自旋回和它旋回进行准确识别,进而提高储集体(即油气储层)的预测精度 [1] 公司基本情况 - 中国石油天然气股份有限公司成立于1999年,总部位于北京市,是一家以从事石油和天然气开采业为主的企业 [2] - 公司注册资本为1830.2097亿人民币 [2] - 公司对外投资了1296家企业,并参与了443次招投标项目 [2] 公司知识产权与资质 - 公司拥有商标信息38条,专利信息5000条,并拥有行政许可168个 [2]
机器学习中的数据投毒:人们为何以及如何操纵训练数据
36氪· 2026-01-19 09:56
文章核心观点 - 生成式人工智能公司对训练数据的海量需求,与数据安全、知识产权保护及传统营销模式之间产生了根本性冲突,这种冲突集中体现为“数据投毒”现象 [1] - “数据投毒”通过有意篡改机器学习模型的训练数据,以达成犯罪牟利、防止知识产权被盗或进行隐蔽营销等目的,对模型行为产生不可逆的影响 [2] - 应对数据投毒需要行业在数据来源、数据监控、训练过程管理和模型测试等方面采取系统性措施,但面临成本与可行性的挑战 [18][19] 数据投毒的定义与特性 - 数据投毒指通过改变用于构建机器学习模型的训练数据,从而系统性地改变模型行为,其影响在模型训练完成后不可逆转,唯一解决方法是使用干净数据重新训练 [2] - 数据投毒攻击非常隐蔽,对训练数据的更改通常对普通观察者不可见,例如一项研究中,当特定概念的数据被掺假0.001%时,有害内容增加了4.8% [2] - 尝试对被污染的数据进行逆向工程和清除大多失败,即使从模型架构中移除痕迹也难以有效消除损害 [2] 数据投毒的动机与运作方式:犯罪活动 - 犯罪分子通过数据投毒获取或篡改高度敏感或极具价值的数据以牟利,例如访问银行软件或医疗建议模型中的数据 [3] - 此类攻击会在输入数据中引入难以察觉的扰动,导致模型做出置信度很高的错误预测,且所需数据量不大,研究表明250份文档就足以针对不同规模的文本模型实施投毒攻击 [6] - 攻击后果包括削弱模型性能(如使网络安全模型无法识别入侵)或进行虚假预测(如操纵贷款审批模型),只要行为偏差微妙,就难以被发现 [7] 数据投毒的动机与运作方式:防止知识产权盗窃 - 内容创作者将数据投毒作为一种防御机制,旨在使未经授权使用其作品训练的模型失败或无法使用,而非改变特定模型行为 [8] - 通过使用Nightshade等工具,创作者可在作品中添加肉眼难辨但能干扰神经网络训练的效果,研究表明该方法只需少量训练图像即可奏效 [9] - 类似技术可应用于其他媒体,如AntiFake工具可改变录音声波防止声音被模仿,或通过有意改变文本语义来扭曲文本生成模型的学习过程 [10] - 其目标是使基于被盗知识产权训练的模型变得无用,从而让侵权行为无利可图,并让相关公司在计算能力、电力和数据收集方面的投入面临损失风险 [12] 数据投毒的动机与运作方式:营销(人工智能优化) - 在营销领域,数据投毒是搜索引擎优化(SEO)的新演变,旨在通过创建特定内容来影响生成式人工智能模型的训练数据 [13] - 营销人员创建会被抓取用于模型训练的内容,通过向训练数据池中添加对客户品牌有利的内容,使模型可能偏袒该品牌或以微妙方式偏见竞争对手 [15] - 利用语言学习模型(LLM)可以便捷且低成本地生成海量看似真人撰写的文本内容,使得大规模生成营销内容在经济上可行 [15] - 关键追求一种微妙但具有统计学意义的品牌偏好,这种偏好会在用户使用模型时逐渐显现,同时避免被模型提供商察觉和纠正 [16] - 部分营销人员还通过定制网络内容来影响集成了网络搜索功能的LLM的回复,这更接近于提示工程,但效果同样是使回复带有品牌倾向 [17] 应对数据投毒的行业措施 - 首要措施是避免使用未经授权或窃取的数据进行训练,因为无法保证其未被篡改,且事后发现问题将导致资源浪费 [18] - 需要对数据收集进行监控和控制,并对训练数据进行审核与清理,即使对于流行的开源免费数据也需保持谨慎,养成良好的数据卫生习惯 [18] - 在训练过程中需进行管理和观察,如果模型自动重新训练,应对训练数据进行测试,并运用科学方法识别模型是否受到“毒害” [18] - 必须在接近真实世界的场景中对模型进行评估和测试,以发现生成式人工智能可能出现的异常行为 [18] - 更广泛的机器学习社区正在探索创建授权数据集和寻找数据可用性的方法,但所有解决方案都需要成本投入和权衡取舍 [19]
量化专题报告:“机器学习”选股模型系列研究(一):量价指纹模型的构建与应用初探
国盛证券· 2026-01-16 21:34
量化模型与构建方式 1. 量价指纹生成模型 * **模型名称**:量价指纹生成模型[1][8] * **模型构建思路**:借鉴大语言模型的语义理解思想,将市场分钟级交易数据视为一种特殊“语言”,通过自监督学习框架,迫使模型理解日内量价行为中蕴含的动态语义与因果结构,最终生成一个低维、高信息密度的日度语义表征向量(即“量价指纹”)[1][8][9]。 * **模型具体构建过程**: 1. **输入数据**:每只股票每日的分钟级特征序列 $X \in \mathbb{R}^{T \times D}$,其中 $T=237$(交易分钟数),$D=32$(特征维度,包括4维价格特征和28维交易特征)[16]。 2. **特征预处理**: * **价格特征标准化**:除价格位置外,其余价格特征用当日开盘价进行标准化。$$ \tilde{p}_{t,d} = \frac{p_{t,d}}{p_{\mathrm{open}}} - 1 $$[16] * **交易特征标准化**:将每分钟特征值除以该特征过去20日所有分钟数值之和的均值。$$ {\tilde{f}}_{t,d} = {\frac{f_{t,d}}{S_{d}}}, \quad S_{d} = {\frac{1}{N_{\mathrm{hist}}}} \sum_{i=1}^{N_{\mathrm{hist}}} \sum_{t=1}^{T} f_{t,d}^{(i)} $$[17] 3. **模型架构**:采用编码器-双分支解码器架构的因果Transformer模型[26]。 * **固定正交投影层**:将输入 $X$ 投影到隐藏维度 $d_{\mathrm{model}}=128$,投影权重 $W_p$ 正交初始化并永久冻结。$$ H^{(0)} = X W_{p}, \quad W_{p}^{T}W_{p}=I $$[27][28] * **因果Transformer编码器**:共4层($L=4$),每层包含带因果掩码的多头自注意力机制和前馈网络[30][33]。 * 多头注意力($h=4$头):$$ \mathrm{MultiHead}(Q,K,V) = \mathrm{Concat}(\mathrm{head}_{1}, \mathrm{head}_{2}, \ldots, \mathrm{head}_{h}) W_{O} $$ $$ \mathrm{head}_{i} = \mathrm{softmax}\left( \frac{Q_{i}K_{i}^{T}}{\sqrt{d_{k}}} + M \right) V_{i} $$ 其中因果掩码矩阵 $M$ 确保只能关注过去信息[30][31]。 * 前馈网络:$$ \mathrm{FFN}(x) = \mathrm{GELU}(xW_1 + b_1)W_2 + b_2 $$[33] * **双分支输出**: * **日度指纹生成分支**:提取编码器最后一层最后一个时间步的输出作为128维日度指纹向量 $e$。$$ e = H_{:,T}^{(L)} \in \mathbb{R}^{B \times d_{\mathrm{model}}} $$[35] * **序列重建分支**:对编码器输出进行层归一化后,通过线性层重建原始输入序列 $\widehat{X}$[37]。 4. **损失函数设计**:采用双任务自监督学习损失与防坍缩正则项相结合的总损失函数[42][47]。 * **前向损失(价格特征因果预测)**:$$ {\mathcal{L}}_{\mathrm{forward}} = {\frac{1}{N_{forward}}} \sum_{b=1}^{B} \sum_{t=1}^{T} \sum_{k=1}^{D_{r}} M_{f}[b,t,k] \cdot {\frac{(r_{b,t,k} - {\hat{r}}_{b,t,k})^{2}}{\sigma_{k}^{2}}} $$[42] * **后向损失(交易特征重建)**:$$ {\mathcal{L}}_{\mathrm{backward}} = {\frac{1}{N_{backward}}} \sum_{b=1}^{B} \sum_{t=1}^{T} \sum_{k=1}^{D_{f}} M_{b}[b,t,k] \cdot {\frac{(x_{b,t,k} - {\hat{x}}_{b,t,k})^{2}}{\sigma_{k}^{2}}} $$[42] * **防坍缩正则化**: * **多样性损失**:鼓励嵌入向量在特征空间中分散。$$ {\mathcal{L}}_{\mathrm{diversity}} = \lambda_{d} \cdot \mathbb{I}(\sigma_{e} < 0.1) \cdot (-\mathrm{log}(\sigma_{e} + \epsilon)) $$[44] * **正交性约束**:防止特征维度间冗余。$$ \mathcal{L}_{\mathrm{orthogonality}} = \lambda_{o} \cdot \parallel C - I \parallel_{F} $$[45] * **均匀性损失**:避免嵌入向量过度相似。$$ \mathcal{L}_{\mathrm{uniformity}} = \lambda_{u} \cdot \mathbb{I}(\bar{s} > \tau) \cdot \bar{s} $$[46] * **总损失**:$$ {\mathcal{L}}_{\mathrm{total}} = \lambda_{f}{\mathcal{L}}_{\mathrm{forward}} + \lambda_{b}{\mathcal{L}}_{\mathrm{backward}} + {\mathcal{L}}_{\mathrm{diversity}} + {\mathcal{L}}_{\mathrm{orthogonality}} + {\mathcal{L}}_{\mathrm{uniformity}} $$[47] 5. **训练细节**:采用滚动训练框架,每年年初使用过去三年的数据对模型进行微调,以维持嵌入空间的连续性[48]。具体参数如batch_size=512,学习率1e-4,使用Adam优化器等[49]。 2. 单流GRU预测模型 (模型1与模型2) * **模型名称**:单流GRU预测模型[51] * **模型构建思路**:使用过去20个交易日的日频特征(基础价量特征+量价因子或量价指纹),通过双层GRU网络捕捉时序依赖,预测股票未来5日的收益率,以生成选股因子[51][52]。 * **模型具体构建过程**: 1. **输入特征**: * **模型1(量价因子)**:过去20个交易日的每日高开低收、成交量、成交额(共6个基础特征)以及137个量价因子[51][52]。 * **模型2(量价指纹)**:过去20个交易日的每日高开低收、成交量、成交额(共6个基础特征)以及128维量价指纹[52]。 2. **特征预处理**: * **价格类特征**:采用对数变化率的时序标准化(样本内每个价格除以最新价格取对数)[52]。 * **成交量/额**:每日值除以20日均值[52]。 * **量价因子**:进行时序标准化、MAD去极值、截面zscore标准化[52]。 * **量价指纹**:作为预训练生成的语义表征,无需标准化[52]。 3. **模型结构**:双层GRU + 全连接层 + LayerNorm + ReLU激活 + dropout + 全连接输出层[53]。 4. **训练细节**:使用可微分RankIC作为损失函数,每年年初使用过去数据训练,并行训练3个不同随机种子的模型并集成预测,以提升稳健性[53]。 3. 双流GRU融合预测模型 (模型3) * **模型名称**:双流GRU融合预测模型[67] * **模型构建思路**:为了融合量价因子和量价指纹两类异构特征,采用双流GRU设计,让两个GRU流分别处理各自擅长的特征,最后将两个流的隐藏状态进行加权融合,再通过全连接层预测收益率,以充分利用信息的互补性[67]。 * **模型具体构建过程**: 1. **输入特征**:两个独立的数据流,一流输入基础特征+量价因子,另一流输入基础特征+量价指纹[67]。 2. **模型结构**:两个独立的单流GRU模块(结构与上述单流GRU相同)并行处理两个特征流,将两个GRU的最终隐藏状态通过可配置的权重进行融合,然后将融合后的特征输入全连接预测层[67][69]。 3. **训练与集成**:训练策略与单流GRU模型一致,每年训练3个集成模型[68]。 量化因子与构建方式 1. 模型1因子 * **因子名称**:基于量价因子的GRU预测因子[51] * **因子构建思路**:将预处理后的历史量价因子序列输入单流GRU预测模型,模型输出的预测值即为该因子[51][52]。 * **因子具体构建过程**:如上述“单流GRU预测模型 (模型1)”所述,模型每日根据过去20日数据生成的预测信号即为因子值[52]。 2. 模型2因子 * **因子名称**:基于量价指纹的GRU预测因子[52] * **因子构建思路**:将历史量价指纹序列输入单流GRU预测模型,模型输出的预测值即为该因子[52]。 * **因子具体构建过程**:如上述“单流GRU预测模型 (模型2)”所述,模型每日根据过去20日数据生成的预测信号即为因子值[52]。 * **因子评价**:该因子与市值风格因子的相关性极低,表明其捕捉的市场语义信息与传统市值维度存在差异,可能更多与日内资金节奏、多空博弈等动态特征相关[54][55]。 3. 模型3因子 (融合因子) * **因子名称**:量价因子与量价指纹融合预测因子[67] * **因子构建思路**:将量价因子和量价指纹分别输入双流GRU融合模型,模型融合两类信息后输出的预测值即为该因子[67]。 * **因子具体构建过程**:如上述“双流GRU融合预测模型 (模型3)”所述,模型每日生成的预测信号即为因子值[67]。 * **因子评价**:融合因子结合了量价因子的显式统计规律与量价指纹的隐式语义模式,提升了预测能力和模型稳定性[68][86]。 模型的回测效果 (回测期:2017/01/01-2025/12/31,全市场A股,周度换仓,暂不考虑交易费用)[59][68] | 模型 | 周度RankIC均值 | 年化RankICIR | 多空对冲年化收益 | 多空对冲年化波动率 | 多空对冲IR | 多空对冲周度胜率 | 多空对冲最大回撤率 | 多头超额年化收益 | 多头超额年化波动率 | 多头超额IR | 多头超额周度胜率 | 多头超额最大回撤率 | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | **模型1 (量价因子)** | 0.106[65] | 6.64[65] | 81.23%[65] | 15.25%[65] | 5.33[65] | 74.95%[65] | 12.66%[65] | 19.00%[65] | 8.46%[65] | 2.24[65] | 65.01%[65] | 15.09%[65] | | **模型2 (量价指纹)** | 0.106[65] | 6.62[65] | 83.88%[65] | 15.50%[65] | 5.41[65] | 73.87%[65] | 11.65%[65] | 21.35%[65] | 7.45%[65] | 2.87[65] | 69.76%[65] | 12.09%[65] | | **模型3 (融合因子)** | 0.109[68] | 6.85[68] | 90.89%[68] | 15.27%[68] | 5.95[68] | 76.46%[68] | 11.54%[68] | 28.09%[74] | 不适用 | 不适用 | 不适用 | 不适用 | 因子的回测效果 (回测期:2017/01/01-2025/12/31,全市场A股,周度换仓,暂不考虑交易费用)[59][68] | 因子 | 周度RankIC均值 | 年化RankICIR | 多空对冲年化收益 | 多空对冲年化波动率 | 多空对冲IR | 多空对冲周度胜率 | 多空对冲最大回撤率 | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | **模型3融合因子** | 0.109[68] | 6.85[68] | 90.89%[68] | 15.27%[68] | 5.95[68] | 76.46%[68] | 11.54%[68] | 指数增强组合表现 (基于模型3融合因子构建,回测期:2017/01/01-2025/12/31)[75][78][82] | 指数增强组合 | 超额年化收益 | 跟踪误差 | IR | 月度胜率 | 最大回撤 | | :--- | :--- | :--- | :--- | :--- | :--- | | **沪深300指数增强** | 7.12%[75] | 1.74%[75] | 4.10[75] | 86.11%[75] | 1.85%[75] | | **中证500指数增强** | 11.38%[78] | 3.47%[78] | 3.28[78] | 83.33%[78] | 4.76%[78] | | **中证1000指数增强** | 14.84%[82] | 3.45%[82] | 4.30[82] | 83.33%[82] | 2.95%[82] |
全球首座储能电池“灯塔工厂”来了
行家说储能· 2026-01-16 18:19
全球灯塔工厂与储能行业标杆 - 在全球制造业数字化转型加速背景下,“灯塔工厂”成为衡量企业智能制造与可持续发展水平的重要标志,储能电池作为高增长赛道,建设领先的“灯塔工厂”是头部企业的战略方向[2] - 世界经济论坛公布的2026年新晋全球“灯塔工厂”名单中,海辰储能重庆基地成功入选,该基地是全球首座专注于储能电池的“灯塔工厂”,也是全球首款千安时长时储能专用电池的量产基地[2] - “灯塔工厂”由世界经济论坛与麦肯锡咨询公司于2018年共同发起评选,旨在从全球范围内甄选在第四次工业革命中具备领先示范意义的智能制造标杆,代表全球工业数字化与智能化的最高水平[3] - 截至目前,全球共有灯塔工厂224座,储能电池领域此前从未有工厂入选,海辰储能重庆基地作为全球23个新入选基地之一,填补了这一空白,标志着中国储能电池在智能制造与数字化升级方面迈入世界领先行列[3] 海辰储能重庆基地的智能制造实践 - 锂电池储能是提升绿电消纳、增强电网稳定性的关键支撑,行业面临市场需求高增长、产品价格下行压力大、电芯质量一致性要求提升三大挑战,传统制造模式已难以适配[4] - 海辰储能重庆基地以近零缺陷制造、系统性降本增效、全流程智能化运营三大维度入手,全面推进数字化与智能化升级,探索精益生产与极限制造,实现了优品率、产能、设备综合效率等大幅提升[4] - 重庆基地部署40余个数字化解决方案,深度融合生成式人工智能、机器学习及人工智能物联网(AIoT)等前沿技术,构建起覆盖研发、材料遴选、生产制造到成品检测的全链条智能管控体系[5] - 公司将进一步发挥“灯塔工厂”在智能研发、智能制造以及敏捷韧性供应链网络等方面的示范引领作用,持续提升储能智能制造与数字化水平[10] 长时储能技术突破与产业化进展 - 海辰储能在世界能源峰会展示了面向多场景的系统化解决方案,重点呈现了为全天候绿电而生的∞Power 6.9MWh 8小时长时储能系统及其核心支撑——∞Cell 1300Ah 8h专用电芯,这是其8h长时储能方案在国际展会首次亮相[6] - 重庆基地已建成全球首条长时储能专用电池产线,2025年6月,∞Cell 1175Ah 长时储能电池实现量产下线;同年10月,搭载该电池的∞Power 6.25MWh 4h长时储能系统开启全球交付[10] - 2025年12月,∞Power 6.25MWh 4h长时储能系统作为储能行业唯一代表,入选中国制造“十四五”成就展,获得国家级认可[10] - 在重庆基地智能制造体系成熟的基础上,公司高效推进面向长时储能场景的前瞻性产线布局,拓展智能制造能力在不同技术路线和应用场景中的适配边界[6] 行业引领与生态构建 - 海辰储能将以行业“链主”身份,带动上下游产业链数字化升级,构建高效产业协同生态[10] - 公司计划通过持续输出可复制的智能制造经验与产业化能力,助力长时储能电池与系统实现大规模、高质量、高安全、高效率生产与应用,为全球能源绿色、可持续发展贡献中国方案[10]
凌晨点外卖次数过多,银行卡被风控冻结,银行反诈系统引争议
每日经济新闻· 2026-01-16 11:36
文章核心观点 - 银行基于机器学习的风控系统为防范电信诈骗和反洗钱,会拦截具有“深夜交易”、“小额高频”等特征的可疑交易,但该模型存在局限性,难以精准区分正常消费与欺诈行为,导致部分用户的合理交易被“误伤” [1][7][9] 风控系统“误伤”消费者的现象与案例 - 有用户因凌晨点外卖次数较多,银行卡被风控冻结,需持反诈中心盖章证明解封 [1] - 有用户因一笔0.01元的小额验证转账发生在晚上九点半左右,导致银行卡被限制非柜面交易 [3] - 社交平台上存在大量用户分享的“误伤”案例,包括因长期同一时间点同一家外卖、半夜进行多笔几十元购物、支付笔数过多导致相同金额划扣频繁、半夜多次支付0.01元等行为导致账户被冻结或管控 [3] 容易触发银行风控的交易行为特征 - 交易发生在非常规时段,如深夜至凌晨 [5][7] - 连续多笔小额交易 [5][7] - 资金快进快出 [5] - 交易行为同时触发多个风险指标,如“小额且高频”附加“在凌晨用卡” [7] 导致“误伤”现象的系统性与结构性原因 - 银行面临严厉的监管与问责压力,在“谁开户、谁负责”原则下,倾向于采取“防御性风控”策略,调高风险拦截阈值,以最大限度避免漏报诈骗账户 [9] - 风控模型主要基于历史涉案数据训练,其识别逻辑(如“夜间多频小额交易”)与部分正常消费模式(如夜班工作者、自由职业者夜间活动)存在重叠 [7][9] - 系统自动化判断,无法人工逐一核实每张银行卡交易的真实性 [7] 行业降低“误伤”概率的演进方向 - **规则细化**:推动风控从“粗放管控”转向“精准画像”,结合多维数据区分用户类型,并对长期信用良好的账户给予更多信任空间,避免“一刀切” [12][14] - **技术升级**:将传统规则引擎与机器学习、图计算等先进技术融合,通过分析复杂的资金关联网络更准确地识别欺诈链条,减少对孤立“形似”交易的误判 [12][15] 给金融消费者的建议 - 维持稳定合理的交易习惯,避免短时间多笔固定金额转账,大额划转优先选择工作日白天,夜间消费保持合理频率 [15] - 确保银行预留的手机号、身份证件、地址等信息完整有效 [15] - 审慎进行陌生账户往来,避免参与可能涉及非法资金链条的活动 [15] - 妥善保留消费合同、订单截图等交易凭证,以备证明交易真实性 [16] - 若账户被限,保持冷静,通过官方渠道了解原因并按指引补充信息或提交证明材料 [16]