卷积神经网络
搜索文档
速递|重磅!深度学习巨头Yann LeCun将从Meta离职独立创业,疑因与扎克伯格路线决裂
搜狐财经· 2025-11-12 06:32
公司核心人事与架构变动 - Meta首席人工智能科学家Yann LeCun计划离开公司并筹备创立新的AI初创企业,已开始与潜在投资方进行早期谈判[2] - Meta宣布将旗下所有人工智能业务统一整合为新部门Superintelligence Labs,并由前Scale AI创始人Alexandr Wang出任领导人[2] - LeCun的汇报关系发生变化,从原先向首席产品官Chris Cox汇报改为直接向Alexandr Wang汇报[2] 公司战略方向转变 - Meta的AI研究哲学发生根本转变,新成立的Superintelligence Labs更接近于OpenAI式的激进路线,主打商业落地、算力堆叠与速度优先[3] - 公司将AI视为未来十年的核心战役,将所有资源押注在超智能方向,目标直接对标AGI(人工通用智能)[4] - 公司原有的FAIR研究院地位动摇,被逐步吸收进以Superintelligence Labs为中心的新体系,更多服务于产品导向和商业需求[4] 行业理念分歧与影响 - Yann LeCun的AI理念与当前主流的大语言模型路径存在深刻分歧,他认为大语言模型并不真正理解世界,并更关注让机器具备世界模型与常识推理能力[3] - 工业界与学术界之间的界线正在迅速被抹平,AI巨头的重心急速滑向应用、商业与产品,资本迫切希望看到有结果的智能[5] - LeCun的离开被视为一位科学家对加速主义潮流的无声抗议,其新创业方向可能更侧重于研究的纯粹性及构建接近人类认知机制的解释型AI[4][5]
【广发金工】AI识图关注银行、能源
广发金融工程研究· 2025-11-09 15:58
市场表现 - 最近5个交易日,科创50指数涨0.01%,创业板指涨0.65%,大盘价值涨2.33%,大盘成长涨0.28%,上证50涨0.89%,国证2000代表的小盘涨0.52% [1] - 行业板块中,电力设备、煤炭表现靠前,计算机、美容护理表现靠后 [1] 估值水平 - 截至2025年11月7日,中证全指PETTM分位数为82%,上证50与沪深300分位数分别为77%、74% [1] - 创业板指估值分位数接近53%,中证500与中证1000分位数分别为63%、62%,创业板指风格估值相对历史总体处于中位数水平 [1] 资金流向 - 最近5个交易日,ETF资金流入372亿元,融资盘减少约7亿元 [2] - 两市日均成交额为19899亿元 [2] 风险偏好 - 截至2025年11月7日,中证全指静态EP与十年期国债收益率的风险溢价指标为2.78%,其两倍标准差边界为4.74% [1] AI模型配置主题 - 基于卷积神经网络的AI模型将学习特征映射到行业主题板块,最新配置主题包括银行、能源、红利等 [2] - 具体关注的细分指数包括中证银行指数、中证能源指数、中证中央企业红利指数等 [2][3][12]
ACM MM 2025 Oral | 新加坡国立大学提出FractalForensics,基于分形水印的主动深度伪造检测与定位
机器之心· 2025-11-04 11:45
文章核心观点 - 提出一种名为FractalForensics的主动深度伪造检测与定位方法,该方法基于分形水印技术 [5] - 该方法旨在解决现有水印技术在鲁棒性、伪造定位能力以及计算资源消耗方面存在的问题 [4][8] - 通过参数化的水印生成和加密流程,结合卷积神经网络模型,实现了在检测Deepfake的同时完成伪造区域的精确定位 [5][9][11] 工作动机 - 现有针对深度伪造的主动防御研究,如鲁棒水印和半脆弱水印,在检测任务上取得进展但仍存在局限 [4] - 当前技术普遍面临鲁棒性不稳定、无法同时进行鉴伪和定位、以及因存储ground-truth而大量消耗计算资源的问题 [8] 工作介绍 - 提出的水印以矩阵形式出现,区别于以往的水印向量,以实现伪造定位功能 [5] - 设计了一个参数化的水印生成和加密流程,以标准希尔伯特曲线为例,并定义了旋转、镜像、次序改变三个变体参数,共可产生144种分形变体 [6][7] - 构建混沌加密系统对分形矩阵进行加密,加密后的值为0到9的一位十进制数字,并转化为四位二进制值以提升容错率 [7][9] - 水印嵌入与提取基于卷积神经网络,采用entry-to-patch策略将图像划分为32x32的patch,以位置对应方式嵌入水印 [9][10] - 通过控制卷积核大小远小于patch尺寸,确保各patch间水印互不影响,篡改区域会丢失水印从而实现检测与定位 [11] 实验结果 - 经过针对Jpeg压缩的对抗训练后,该方法在面对常见图像处理时保持了最优的鲁棒性,在面对Deepfake伪造时展现了合理的脆弱性 [13] - 在CelebA-HQ数据集上的鲁棒性评估显示,其平均鲁棒性达到99.73%(patch)和99.91%(bit),显著高于对比模型如WaterLo(73.10%)和SepMark(92.39%) [14] - 在Deepfake脆弱性评估中,面对多种伪造方法(如SimSwap、InfoSwap等),该方法平均脆弱性为39.27% [15] - 在Deepfake检测的AUC效果对比中,该方法对多种伪造技术的检测效果均达到99.99%,平均效果为99.99%,优于所有被动检测的SOTA工作 [16][17] - 伪造定位效果显示,该方法能准确聚焦于被篡改区域,face swapping方法定位区域主要在人脸内部,face reenactment方法的定位区域分布更离散 [18][20][21]
【广发金工】AI识图关注银行、能源
广发金融工程研究· 2025-11-02 19:49
市场表现 - 最近5个交易日科创50指数下跌3.19%,创业板指上涨0.50%,国证2000代表的小盘股上涨1.18% [1] - 行业方面电力设备、有色金属表现靠前,通信、美容护理表现靠后 [1] - 两市日均成交额为22967亿元 [2] 估值水平 - 截至2025年10月29日中证全指PETTM分位数为81%,上证50与沪深300分位数分别为75%和73% [1] - 创业板指估值分位数接近53%,中证500与中证1000分位数分别为63%和61% [1] - 风险溢价指标为2.84%,两倍标准差边界为4.75% [1] 资金流向 - 最近5个交易日ETF资金流出69亿元 [2] - 融资盘5个交易日增加约469亿元 [2] AI量化模型主题配置 - 使用卷积神经网络对价量数据建模,最新配置主题为银行、能源、红利等 [2] - 具体关注指数包括中证银行指数、中证能源指数、中证中央企业红利指数等细分指数 [2][3][12]
【广发金工】AI识图关注能源、银行
广发金融工程研究· 2025-10-26 14:52
市场表现 - 最近5个交易日科创50指数上涨7.27% 创业板指上涨8.05% 上证50指数上涨2.63% 国证2000指数上涨3.58% [1] - 行业板块中通信和电子表现靠前 农林牧渔和食品饮料表现靠后 [1] - 市场风格方面 大盘成长风格上涨5.08% 大盘价值风格上涨1.30% [1] 估值水平 - 截至2025年10月24日 中证全指市盈率分位数为81% 处于相对较高水平 [1] - 上证50指数市盈率分位数为76% 沪深300指数市盈率分位数为73% [1] - 创业板指市盈率分位数接近52% 处于历史中位数水平 中证500和中证1000指数市盈率分位数分别为62%和59% [1] 资金流向 - 最近5个交易日ETF资金净流入24亿元 [2] - 同期融资盘减少约62亿元 [2] - 两市日均成交额为17795亿元 [2] 风险溢价 - 截至2025年10月24日 中证全指静态市盈率的倒数EP与十年期国债收益率的差值为2.79% [1] - 该风险溢价指标的两倍标准差边界为4.75% [1] AI模型行业配置 - 基于卷积神经网络的AI模型将价量数据图表化并与未来价格建模 最新配置主题为能源 银行 煤炭等行业 [2][11] - 具体配置指数包括中证能源指数 中证银行指数 中证煤炭指数 中证800银行指数和中证内地低碳经济主题指数 [3][12]
【广发金工】AI识图关注半导体、信息技术
广发金融工程研究· 2025-09-28 21:05
市场表现与风格 - 最近5个交易日科创50指数涨幅为6.47%,创业板指涨1.96%,大盘价值跌0.34%,大盘成长涨2.48%,上证50涨1.07%,国证2000代表的小盘跌1.27% [1] - 电力设备、有色金属行业表现靠前,社会服务、综合行业表现靠后 [1] - 中证全指PETTM分位数为77%,上证50与沪深300分位数分别为70%和69%,创业板指分位数接近51%,处于历史中位数水平 [1] 资金与交易动态 - 最近5个交易日ETF资金流入178亿元,融资盘增加约417亿元,两市日均成交金额为22921亿元 [2] 风险偏好与估值水平 - 截至2025年9月26日,中证全指风险溢价为2.88%,其两倍标准差边界为4.76% [1] - 中证500与中证1000的PETTM分位数分别为62%和58% [1] 人工智能模型应用与主题配置 - 应用卷积神经网络对图表化价量数据与未来价格进行建模,并将学习特征映射到行业主题板块 [2][10] - 最新配置主题聚焦于半导体材料、芯片、信息技术等领域,涉及上证科创板半导体材料设备主题指数、中证半导体产业指数等细分指数 [2][3][11]
准确度提升400%,印度季风预测模型基于36个气象站点,实现城区尺度精细预报
36氪· 2025-09-17 15:27
极端降雨预测技术突破 - 印度理工学院孟买分校与马里兰大学合作开发基于卷积神经网络与迁移学习的超本地预测模型 实现对极端降雨事件提前数天预报[1] - 模型将分辨率从传统全球预报系统的25平方公里下调至城区级别 显著提升空间精度[1][3] - 采用事件同步方法和Louvain算法识别极端降雨空间同步模式 效率优于传统聚类方法[3][7] 模型数据与方法论 - 使用美国国家环境预报中心全球预报系统数据 时间覆盖2015年6月至2023年9月 空间范围北纬18°–20°、东经72°–74° 分辨率0.25°×0.25°[4] - 整合孟买市政公司36个自动气象站数据 记录周期每15分钟一次 时间范围2006至2023年[4] - 通过相关性筛选保留与降雨强相关的可降水量、相对湿度、温度、气压等气象因子作为预测变量[4] 模型性能表现 - 迁移学习模型在提前1至3天预报中均优于传统模型 提前两天表现尤为突出[13] - 极端降雨预测准确度较全球预报系统提升60%-400% 第1-2天预报能更早捕捉暴雨过程[15] - 在95%和99%分位数检验中 虚假警报率显著降低 威胁评分最高提升400%[15][17] 印度人工智能战略布局 - 印度政府启动"IndiaAI Mission" 目标6-10个月内完成本土基础模型研发[20] - 全球采购18,600块GPU建立IndiaAI Compute Facility 为初创公司和研究团队提供补贴算力[20][21] - 指定本土AI公司Sarvam开发印度首个多语言"主权大模型" 重点服务医疗、政务等领域[20]
【广发金工】AI识图关注汽车、通信、化工
广发金融工程研究· 2025-09-14 13:17
市场近期表现 - 最近5个交易日,科创50指数上涨5.48%,创业板指上涨2.10%,上证50上涨0.89%,国证2000指数上涨2.34% [1] - 行业板块中,电子和房地产表现靠前,综合和银行表现靠后 [1] - 市场资金交易活跃,两市日均成交额达到22948亿元,ETF资金流入116亿元,融资盘5个交易日增加约591亿元 [2] 风险溢价与估值水平 - 截至2025年9月12日,中证全指风险溢价为2.87%,其两倍标准差边界为4.76% [1] - 历史数据显示,当风险溢价超过4%(如2022年4月26日的4.17%和2022年10月28日的4.08%)时,市场往往迅速反弹,2024年1月19日该指标为4.11%,是2016年以来第五次超过4% [1] - 估值方面,中证全指PETTM分位数为78%,上证50和沪深300分位数分别为72%和70%,创业板指分位数接近48%,处于相对历史中位数水平 [2] 技术分析与周期观察 - 深100指数技术面呈现约3年一轮的熊牛周期,例如2012、2015、2018、2021年,每次下行幅度在40%至45%之间 [2] - 本轮始于2021年一季度的调整,无论时间或空间均已比较充分,存在底部向上周期的可能性 [2] 基于AI的行业主题配置 - 应用卷积神经网络对价量数据建模,将学习特征映射到行业主题,最新配置主题包括汽车、通信、人工智能和化工 [2][3][11] - 具体关注的细分指数包括中证800汽车与零部件指数、中证全指通信设备指数、中证人工智能主题指数、中证人工智能产业指数和中证细分化工产业主题指数 [3][11]
他们在1993年就提出了Scaling Law
量子位· 2025-09-02 14:17
Scaling Law历史溯源 - Scaling Law概念最早于1993年由贝尔实验室团队提出,而非普遍认为的2020年OpenAI或2017年百度[1] - 核心理论发表于《Learning Curves: Asymptotic Values and Rate of Convergence》论文,揭示训练误差与测试误差随训练规模增加按幂律形式收敛[4] - 该理论与现代Scaling Law高度一致:通过增加模型参数量(N)、训练数据量(D)和计算量(FLOPS)可预测性提升模型性能[6] 理论框架与实验验证 - 研究初衷为节省分类器训练的计算资源,通过中等规模数据集训练结果外推预测大规模数据表现[8][9] - 提出误差收敛公式:测试误差$\mathcal{E}_{\text{test}}=a+\frac{b}{l^{a}}$,训练误差$\mathcal{E}_{\text{train}}=a-\frac{c}{l^{a}}$,渐近误差a值范围0.5-1[10] - 在线性分类器的布尔分类任务中预测准确率达极高精度[15] - 在多层神经网络(如LeNet)中,仅用12000样本训练即可预测60000样本规模下的CNN性能表现[19] - 任务难度与渐近误差呈正相关,困难任务收敛速率更小(学习更慢)[22] 核心研究人员背景 - Vladimir Vapnik为支持向量机(SVM)主要发明者,1964年与Chervonenkis提出原始SVM算法,1992年在贝尔实验室开发核技巧处理非线性分类[27][28] - Corinna Cortes现任Google Research纽约分部副总裁,2022年当选ACM Fellow表彰其对机器学习贡献[30][33] - John S Denker与Yann LeCun合作完成手写识别经典论文,涉及机器学习、系统安全、好莱坞特效等多领域[35][36][37] 贝尔实验室的技术遗产 - 卷积神经网络与支持向量机均诞生于贝尔实验室,曾存在技术路线竞争[38] - 1995年Vapnik与Larry Jackel以豪华晚餐打赌神经网络可解释性,2000年Vapnik胜出但2005年局势逆转[38] - LeCun作为赌局见证人,亲历了神经网络从质疑到主流的技术演进过程[39]
【广发金工】融资余额持续增加
广发金融工程研究· 2025-08-31 16:02
市场表现 - 最近5个交易日科创50指数涨7.49% 创业板指涨7.74% 大盘价值跌1.37% 大盘成长涨5.83% 上证50涨1.63% 国证2000涨0.33% [1] - 通信和有色金属行业表现靠前 纺织服饰和煤炭行业表现靠后 [1] 风险溢价指标 - 中证全指风险溢价指标2022/04/26达4.17% 2022/10/28达4.08% 2024/01/19达4.11% [1] - 截至2025/08/29风险溢价指标为2.92% 两倍标准差边界为4.77% [1] 估值水平 - 中证全指PETTM分位数78% 上证50分位数72% 沪深300分位数70% 创业板指分位数46% [2] - 中证500分位数60% 中证1000分位数59% 创业板指估值处于历史相对较低水平 [2] 技术面分析 - 深100指数技术面呈现3年周期特征 2012/2015/2018/2021年下行幅度40%-45% [2] - 本轮调整始于2021年一季度 时间和空间较充分 关注底部向上周期可能 [2] 资金交易 - 最近5个交易日ETF资金流入286亿元 融资盘增加966亿元 [3] - 两市日均成交额29510亿元 [3] 人工智能主题配置 - 使用卷积神经网络对价量数据建模 特征映射至行业主题板块 [9] - 最新配置主题包括人工智能产业指数 消费电子主题指数 5G通信主题指数等 [10] 指数跟踪 - 重点跟踪指数包括中证人工智能产业指数(931071.CSI) 中证5G通信主题指数(931079.CSI) [10] - 同时关注中证全指通信设备指数(931160.CSI) 中证细分化工产业主题指数(000813.CSI) [10]