机器学习

搜索文档
用AI打破超材料设计天花板,上海交大新成果为新材料井喷提供可能
第一财经资讯· 2025-07-04 17:36
人工智能驱动的热辐射超材料设计突破 - 上海交通大学团队在《Nature》发表重大原创成果,构建热辐射超材料逆向设计AI模型,突破传统设计方法的性能上限,能批量生成并筛选最优设计方案[1][3] - AI模型从5万组数据样本中筛选出1500组接近理论极限性能的方案,并实验验证4种典型材料在航天器热控、建筑节能等场景的优异表现[4][5] - 该技术将传统设计周期从数年缩短至三个月,且材料制备采用低成本溶液法,可像涂料般应用于砖墙、金属等多种基底表面[3][4] 超材料应用场景与产业化潜力 - 双波段选择性超材料具备零能耗辐射冷却特性,可应用于建筑外墙、电子产品、户外设施及随身衣物,实测显示其自降温效果显著[3][5] - 已验证的4类材料包括宽带/单双波段选择性热辐射超材料,应用形式涵盖柔性薄膜、涂料、贴片等,适配不同环境需求[5] - AI设计的新材料结构机理均为首次报道,为材料产业带来井喷式创新机会,已申请发明专利并获得软件著作权[5][7] 技术突破的行业影响 - 该AI模型能自主发明自然界不存在的超材料,并优先筛选适合大规模量产的低成本方案,推动高科技降温技术普及化[3][5] - 审稿人评价该研究标志着机器学习驱动超材料设计取得重大进展,实验数据扎实且具备重要产业影响力[7] - 跨国合作团队包括中美新三国院士专家,获得国家自然科学基金等多项资助,凸显技术的前沿性与战略价值[7]
第45届国际预测大会在京落幕 预测研究“中国力量”引全球瞩目
搜狐财经· 2025-07-04 15:10
大会概况 - 第45届国际预测大会(ISF 2025)在北京举办,规模创历史新高,吸引全球35个国家和地区的580位顶尖学者、行业领袖及政策制定者参会 [1] - 大会主题为"预测科学的前沿与创新",聚焦人工智能、大数据、经济管理、能源环境、气候变化等领域 [1] - 设置13场主旨报告、5场工作坊、12个平行论坛及106个专题分论坛,累计开展348场学术报告 [1] - 国际预测者协会主席Laurent Ferrara评价本次大会为"ISF历史上参会人数最多、规模最大、组织程度空前的盛会" [1] 学术交流内容 - 专家学者围绕贝叶斯预测、机器学习、大语言模型、预测不确定性、预测组合等热点议题展开讨论 [1] - 探讨预测科学在宏观经济、金融、供应链、能源、医疗、灾害防控等领域的应用 [1] - 大会促进全球预测科学前沿成果分享,推动国际科研合作与交流 [1] 承办单位与组织 - 大会由国际预测者协会组织,中国科学院数学与系统科学研究院预测科学研究中心联合国内顶尖学术机构共同承办 [2] - 大会主席由中国科学院数学与系统科学研究院预测科学研究中心主任洪永淼教授担任 [2] - 中国科学院数学与系统科学研究院预测科学研究中心在预测科学理论创新及应用方面取得显著成就,国际影响力获认可 [2] 未来安排 - 下一届国际预测大会(ISF 2026)将于明年在加拿大举行 [3]
从实物资产到数据资产:数字化如何重新定义新时代企业价值
36氪· 2025-07-04 10:15
从有形价值到无形价值的转变 - 企业实力衡量标准从实体资产(工厂规模、机车数量、原材料加工量)转变为数据管道、数字生态系统和算法控制回路 [2] - 无形资产成为新资本 初创公司通过SaaS平台无需房地产即可在一年内颠覆传统行业 [2] - 典型案例:Uber无汽车主宰交通 Airbnb非酒店改变酒店业 Netflix无DVD商店重塑娱乐业 [3][4][5] 数字孪生与能力重构 - 物理世界被数字孪生实时映射 包括建筑物、发动机和业务流程 [6] - 数字时代能力体现为:机器学习模型、自动化脚本、实时供应商平台 [6] - 企业战略从"拥有"转向"协调" 董事会关注API可扩展性而非工厂数量 [7] 数字化核心要素 - 数字化本质是将感知、记忆和智能嵌入价值链 包括传感器实时监控(物流、制造、零售) [9][10] - 第二波浪潮引入AI/ML决策 动态定价模型、AI医疗诊断、自适应聊天机器人 [12][13][14][15] - 数字化增强企业认知 通过反馈循环和数字线程实现端到端可追溯性 [16][17][19] 数字化四大力量 - 新颖性:数字系统自我生成新事物 如金融科技应用3周开发获百万用户 [22] - 波动性:技术环境变化快于组织适应 TikTok趋势和供应链数小时内改变 [23][24] - 颠覆性:遗留优势成负担 柯达坚持胶片 Netflix改写交付模式 [26][27] - 范围性:数字化影响全部门 HR行为分析、财务实时预测、合规AI审计 [28] 企业治理与架构转型 - 战略架构需实时更新、分层桥接策略与技术、易于跨层级沟通 [31][32] - 以能力为中心规划 跟踪客户洞察等持久能力 避免跨部门重复 [33][34][35][37] - 治理转向支持性措施:策略即代码、AI可观察性、联邦治理 [38][39][40] 数字神经系统应用 - 组织数字孪生(DTO)实现情景规划、实时可见性和决策预演 [43] - 治理成为无形过滤层 每个决策实时验证调整 [43]
上海交通大学发表最新Nature论文
生物世界· 2025-07-03 17:38
热纳米光子学与机器学习结合的研究突破 - 热纳米光子学在能源技术和信息处理等领域实现了根本性突破 但光谱工程长期受限于反复试验的方法 而机器学习在纳米光子学和超材料设计中展现出强大能力 [2] - 开发通用设计方法面临重大挑战 包括预定义几何形状和材料的限制 局部优化陷阱以及传统算法的局限性 [3] 研究团队与论文发表 - 上海交通大学周涵教授、张荻教授 新加坡国立大学仇成伟教授 德克萨斯大学奥斯汀分校郑跃兵教授作为通讯作者 上海交通大学Chengyu Xiao为第一作者 于2025年7月2日在《Nature》发表相关研究论文 [3] - 论文标题为《Ultrabroadband and band-selective thermal meta-emitters by machine learning》 提出基于机器学习的通用框架设计超宽带和带选择性热元辐射源 [3] 机器学习框架的创新性 - 研究团队提出非传统机器学习范式 利用稀疏数据覆盖三维结构复杂性和材料多样性 实现多参数优化 [5] - 框架具备双重设计能力:1)自动逆向设计超结构和材料组合以实现光谱定制 2)通过三平面建模方法设计三维元辐射源 突破传统平面二维结构限制 [6] - 展示了七种概念验证型元辐射源 在光学和辐射冷却性能上超越当前最先进设计 [6] 研究意义与通用框架 - 提供了设计制造三维纳米光子材料的通用框架 通过扩展几何自由度和维度以及全面材料数据库促进全局优化 [7] - 论文链接:https://www.nature.com/articles/s41586-025-09102-y [8]
诺安基金孔宪政:以哲学思维理解金融市场,以科学手段获取超额收益
点拾投资· 2025-07-03 07:16
量化投资哲学与方法论 - 量化投资本质是用科学方法对证券市场建模,寻求可证伪且未来可复现的规律[6] - 遵循波普尔"猜想-反驳"科学发现方式,在不确定世界中寻找规律并规则化[7][16] - 将量化视为思维方式而非工具,适用于各类资产投资[16] - 通过机器学习捕捉非线性规律,突破人类线性思维局限[3][30] 投资策略与业绩表现 - 微盘股策略超额收益源自"注意力价值"而非小市值因子,诺安多策略混合A类过去一年收益率达100.74%[3][26][34] - 沪深300指数增强策略严控跟踪误差,过去一年收益率15.42%,跑赢基准2.06%[3] - 采用端到端神经网络构建模型,在沪深300增强产品中实现行业领先信息比率[33] - 淡化业绩增速预期,严格衡量风格因子性价比以提高收益稳定性[19] 模型构建与技术应用 - 从多因子策略迭代至机器学习,利用AI捕捉非线性规律[3][30] - 模型注重超额收益来源本质,避免对历史规律的简单归纳[45][46] - 在微盘股投资中通过选股产生超额收益,弥补公募交易限制[28] - 神经网络模型已超越主观判断能力,投资决策完全交由模型执行[43] 市场认知与差异化优势 - A股市场存在投资者注意力轮换特征,形成显著统计规律[26][27] - 科学化系统化思维方式能发现不拥挤的超额收益领域[11][45] - 微盘股长期超额收益不会收敛,与市值因子无关[34][35] - 坚持客观规律认知,避免"思想钢印"和预设历史终局[47] 团队管理与持续进步 - 团队核心方向是深度学习模型架构改进,基金经理需参与研究[49] - 通过记录和验证保持科学态度,聚焦重要问题[52][53] - 学习人类学心理学知识,克服大脑天然不客观性[61][62] - 坚持概率正确决策,在压力下保持清醒判断[50][51]
指数复制及指数增强方法概述
长江证券· 2025-07-02 19:07
根据提供的研报内容,以下是量化模型和因子的详细总结: 量化模型与构建方式 1. **优化复制模型** - **构建思路**:通过数学优化方法最小化跟踪误差,复制目标指数的收益[31] - **具体构建过程**: 1. 定义资产组合收益率: $${\tilde{R}}_{t}=\Sigma_{i=1}^{M}{\widetilde{W}}_{i,t}\cdot Y_{i,t}=Y_{t}\cdot{\overline{{W}}}_{t}$$ 其中${\widetilde{W}}_{i,t}$为持仓权重,$Y_{i,t}$为资产收益[31] 2. 目标函数为跟踪误差最小化: $$w=a r g\,m i n\;\;\;T E$$ 其中$TE=\sqrt{\frac{1}{T}\Sigma_{t=1}^{T}(\tilde{R}_t-R_t)^2}$[32] 3. 添加约束条件: 权重和为1:$$\Sigma_{i=1}^{N}w_{i}=1$$[33] 非负约束:$$0\leq w_{i}\leq1$$[35] 行业/风格中性约束: $$z_{l o w}\leq\frac{X_{s}^{T}w-X_{s}^{T}\tilde{w}}{s_{b}}\leq z_{u p}$$ $$w_{l o w}^{I}\leq X_{I}^{T}w-X_{I}^{T}\bar{w}\leq w_{u p}^{I}$$[36] - **评价**:灵活平衡成本与精度,但依赖历史数据可能产生模型风险[30] 2. **Barra多因子模型** - **构建思路**:基于CAPM和Fama-French三因子模型扩展,解释个股收益来源[47] - **具体构建过程**: 因子收益方程: $${\begin{bmatrix}r_{1}\\ r_{2}\\ \vdots\\ r_{n}\end{bmatrix}}={\begin{bmatrix}x_{11}\\ x_{21}\\ \vdots\\ x_{n1}\end{bmatrix}}f_{1}+{\begin{bmatrix}x_{12}\\ x_{22}\\ \vdots\\ x_{n2}\end{bmatrix}}f_{2}+\cdots+{\begin{bmatrix}x_{1m}\\ x_{2m}\\ \vdots\\ x_{n m}\end{bmatrix}}f_{m}+{\begin{bmatrix}u_{1}\\ u_{2}\\ \vdots\\ u_{n}\end{bmatrix}}$$ 其中$x_{ij}$为股票i对因子j的暴露,$f_j$为因子收益[46] 3. **TCN神经网络因子挖掘模型** - **构建思路**:通过时序卷积网络挖掘高频量价Alpha因子[52] - **评价**:相比遗传规划算法能发现更复杂的非线性关系[51] 量化因子与构建方式 1. **波动类因子** - 特异率:1减Fama-French三因子模型拟合优度[48] - 残差波动率:Fama-French三因子回归残差的标准差[48] - 换手率变异系数:换手率标准差/均值[48] 2. **空头意愿因子** - 每笔成交额:总成交额/成交笔数[48] - 高量每笔成交:高成交量区间的每笔成交额占比[48] 3. **交易拥挤度因子** - 量价相关性:成交量与价格的秩相关系数[48] - 高量交易成本:最高20%价格区间的成交量占比[48] 4. **质量因子** - 盈利因子:扣非ROE与资产报酬率的均值[48] 5. **成长因子** - 绝对净利润增长:单季度扣非净利润时间序列回归斜率[48] 模型的回测效果 1. **沪深300指数增强基金** - 年化超额收益:3.74%[23] - 信息比率(IR):1.51[23] - 跟踪误差:2.22%[23] - 超额胜率:72%[23] 因子的回测效果 1. **打新增强** - 2025年打新收益:2.13%(科创板4.34%,创业板2.52%)[67] 2. **股指期货增强** - 2025年基差:沪深300(-6.75%)、中证500(-13.60%)[72] 3. **大宗交易增强** - 历史折价率中位数:5.38%(2025年8.23%)[74] 4. **定向增发增强** - 历史折价率中位数:14.55%(2025年11.87%)[77]
极智嘉 全栈技术筑壁垒掘金仓储自动化黄金赛道
搜狐财经· 2025-07-02 17:30
公司上市与募资 - 极智嘉计划于2025年7月9日在港交所主板挂牌上市,发行140,353,000股H股,其中香港公开发售14,035,400股,国际发售126,317,600股 [2] - 发行价为每股16.80港元,预计募集资金23.58亿港元 [2] - 引入4名基石投资者,累计认购9130万美元(约7.167亿港元),包括雄安机器人、Arc Avenue、保诚旗下Eastspring Investments和纵腾集团持有的亿格 [2] 核心技术 - 公司构建了覆盖硬件、软件、算法的全栈技术体系,形成显著技术护城河 [3] - 激光视觉融合SLAM技术定位精度平均低于±10mm(±1°),处于行业领先地位 [4] - Hyper+核心算法平台支持25种仓储任务算法,单仓可协调超5000台机器人协同作业,拣选效率达每工位每小时400件(货架到人)和300件(货箱到人) [5] - 全球首个机器人通用技术平台Robot Matrix支持全品类机器人开发,研发效率提升30%以上 [6][7] - 全栈软件系统包括仓库执行系统(WES)、机器人管理系统(RMS)和智能运营平台(IOP),系统可用率99.99%,故障恢复时间<10分钟 [8] 专利与技术积累 - 截至2024年累计申请专利超2000项,覆盖路径规划、多机调度、传感器融合等关键领域 [8] - PopPick货箱到人拣选方案可降低客户50%仓储成本,分拣准确率达99.9987% [8] 行业前景 - 全球AMR市场规模预计从2024年的387亿元增至2029年的1621亿元,年复合增长率33.1% [10] - AMR在仓储自动化中的渗透率将从2020年的4.4%提升至2029年的20.2% [10] - 电商、3PL及制造业升级是主要增长动力 [13] - 中国"十四五"规划明确提出"智能制造"战略,地方政府对自动化仓储项目提供补贴 [15] 竞争优势 - 连续6年全球仓储履约AMR市占率第一(2024年:9.0%),收入超国内最大竞品海柔创新(2023年极智嘉营收21.4亿元vs海柔约10亿元) [23] - 2021-2024年营收从7.9亿元增至24.1亿元,复合增长率45% [23] - 2024年订单金额31.4亿元,同比增长16.6% [23] - 毛利率提升至34.8%(仓储履约AMR毛利率39.2%,海外业务毛利率46.5%) [23] - 全球48个服务站点+13个备件中心,7×24小时响应,客户复购率74.6%(关键客户84.3%) [24] - 覆盖63家财富500强企业,包括沃尔玛、西门子、顺丰等 [24]
专家的社会预测,为何总是不准?
虎嗅· 2025-07-01 21:34
社会科学的核心使命,是发现、描述并解释人类社会的运行规律与历史变迁。然而,对未来的好奇与关切几乎与解释同样强烈。 过去,由于数据和模型的约束,社会科学家往往只能在宏观社会趋势上给出谨慎的推断。如今,随着机器学习和人工智能的发展,如何 利用大数据做出准确的社会预测成为了社会科学的前沿议题(陈云松等,2020;Lundberg et al.2022)。 然而,在讨论算法与数据能给社会预测带来多大突破之前,还有一个更基础的问题有待检验:在不倚赖数据的情况下,单凭专业知识和 经验,社会科学家究竟能否对未来的社会变迁做出相对准确的判断?由于专家意见经常用于辅助政策制定,并在公共舆论中发挥影响, 评估他们预测的准确性便显得尤为关键。 针对这一研究问题,The Forecasting Collaborative团队在2022年发表于《自然:人类行为》的文章"Insights into the Accuracy of Social Scientists'Forecasts of Societal Change"中展开了一项实验,得出了非常有意思的结论。 The Forecasting Collaborative是一个专注于评 ...
Sebastian Raschka著作免费开放!《机器学习与AI核心30问》,新手专家皆宜
机器之心· 2025-07-01 13:01
书籍免费开放 - 知名AI技术博主Sebastian Raschka宣布其著作《机器学习Q与AI:30个必备问答》的全部30章内容免费开放,旨在帮助夏季实习和技术面试的读者 [1] - 该书纸质版+电子版原价49.99美元(约358元),电子版原价39.9美元(约286元) [2] 书籍背景与特点 - 机器学习和AI领域发展迅速,从业者常疲于追赶新技术,该书提供从新手到专家的碎片化知识精华 [6][7] - 书籍内容写于2022年11月ChatGPT发布前,可能曾是ChatGPT的训练数据 [11] - 作者强调书籍内容并非AI生成,这违背其个人伦理 [12] 行业专家评价 - 《Designing Machine Learning Systems》作者Chip Huyen称赞该书融合学术深度、工程敏捷性和简化能力,是机器学习之旅的理想向导 [16] - 《How AI Works》作者Ronald T. Kneusel认为该书是关于关键AI主题的一站式指南,为已进入AI世界的读者提供下一阶段所需知识 [16] 书籍内容结构 第一部分:神经网络和机器学习 - 涵盖嵌入、隐空间与表征(第1章)、自监督学习(第2-3章)、彩票假设(第4章)、过拟合解决方案(第5-6章)、多GPU训练(第7章)、Transformers架构(第8章)、生成式AI模型(第9章)和随机性来源(第10章) [22][23][24][25][26][27][28][29][31][32][33][34][35][36][37][38] 第二部分:计算机视觉 - 包括CNN参数量计算(第11章)、全连接层与卷积层替代(第12章)、视觉Transformer数据需求(第13章) [39][40][41][42][44] 第三部分:自然语言处理 - 涵盖分布假说(第14章)、文本数据增强(第15章)、自注意力机制(第16章)、编码器-解码器Transformers(第17章)、预训练模型微调(第18章)和评估指标(第19章) [46][47][48][49][50][52] 第四部分:生产和部署 - 包括无状态/有状态训练(第20章)、以数据为中心的AI(第21章)、推理加速(第22章)和数据分布偏移(第23章) [54][55][56][57][58][59] 第五部分:预测性能和模型评估 - 涵盖泊松回归与有序回归(第24章)、置信区间构建(第25-26章)、评估指标特性(第27章)、k折交叉验证(第28章)、训练/测试集分布差异(第29章)和有限数据解决方案(第30章) [60][61][63][64][65][66][67][68][69][70]
一文读懂数据标注:定义、最佳实践、工具、优势、挑战、类型等
36氪· 2025-07-01 10:20
数据标注的核心重要性 - 数据标注是AI和ML模型实现高准确性的基础 通过精确标记和分类数据使机器学习模型发挥最佳性能 [1] - 80%的数据科学家将超过60%的时间用于数据准备和注释而非模型构建 凸显其作为AI基础的关键地位 [2] - 标注良好的数据可确保模型识别模式 做出准确预测并适应新场景 直接影响AI系统性能 [5] 数据标注技术类型 - 图像标注涉及添加标题和关键词作为属性 对计算机视觉和面部识别至关重要 [13] - 音频标注需标记语言 方言 情绪等多维参数 包括非言语情况的识别 [16] - 视频标注通过逐帧标记实现运动追踪和行为分析 对自动驾驶等应用关键 [20] - 文本标注需处理语义 意图和情感等抽象元素 是NLP领域最复杂的标注类型 [23] - LiDAR标注处理3D点云数据 在自动驾驶和城市规划中实现精确空间识别 [31] 行业应用与市场趋势 - 全球数据标注工具市场规模预计2028年达34亿美元 2021-2028年CAGR为38.5% [5] - 自动驾驶领域依赖标注的图像和激光雷达数据检测行人及障碍物 [5] - 医疗AI通过标记的X射线和CT扫描训练模型识别病理特征 [5] - 78%企业AI项目采用内外结合的数据标注服务 较2022年增长24个百分点 [5] - 零售AI通过产品标记和情感分析实现个性化推荐 [5][81] 标注方法与效率提升 - AI辅助注释可减少70%的标注时间 同时提高15-20%的模型准确率 [5][48] - 半自动标注结合人工准确性和AI处理能力 显著提升大规模数据处理效率 [7] - 主动学习方法通过模型引导标注过程 减少30-40%的标注成本 [8][5] - 合成数据生成技术降低对人工标注的依赖 提高模型多样性 [6] 工具选择与实施策略 - 专业标注工具应支持多模态数据管理和版本控制 确保数据集完整性 [40] - 标注平台需内置质量检查模块 实现实时协作和反馈跟踪 [42] - 企业级解决方案必须符合GDPR/HIPAA等数据安全标准 [43][61] - 构建与购买决策需权衡项目规模 预算 合规要求和人力资源等因素 [50][68] 质量控制与最佳实践 - 多阶段质量控制系统包括初始培训 持续监控和最终审查 [47][54] - 采用多位注释者交叉验证可显著提高标注一致性 [86][88] - 清晰的标注指南和标准化流程是保证质量的关键因素 [86][88] - 人机协作模式将人工聚焦于复杂案例 提升整体效率 [86][88]