深度学习
搜索文档
 中国人民银行原行长周小川:AI给金融系统带来很大的边际变化
 上海证券报· 2025-10-23 18:36
 AI对金融业的基本定位 - AI是信息处理、IT和自动化基础上的又一次重大边际变化 [1]   银行业性质的演变 - 银行业已从传统银行转变为数据处理行业 [3] - 支付、存贷款定价、风险管理及市场营销均高度依赖数据处理和模型计算 [3] - 人机关系从人主导机器辅助演变为人主要作为机器与客户之间的界面 [3]   AI带来的具体边际变化 - 银行系统积累的海量数据可用于机器学习使传统模型转向智能推理模型 [4] - 银行业主要依赖大数据分析和推理模型较少使用多模态或生成式技术 [4] - 客户行为深刻变化越来越多人习惯与机器打交道人工智能在支付、定价、风险管理和市场推广方面发挥重要作用 [4]   AI对监管的影响 - 反洗钱、反恐融资系统可运用大量数据分析通过已破获案件数据进行机器学习升级模型对监管有巨大作用 [4] - AI发展带来模型的黑箱性未来监管需面对黑箱模型产生的结果来调节或监管金融市场 [6] - AI模型大量运用短期高频数据可能导致学习结果与金融稳健和宏观调控所需的面向基础面、长远稳定性要求不一致 [6]   AI对货币政策与金融稳定的潜在影响 - AI对货币政策的影响尚不明显货币政策是慢变量需要慢处理 [5] - 重要方向是通过机器学习从历史金融稳定数据中推理预知金融不稳定的出现如明斯基时刻 [5] - 预知金融不稳定需要从历史经验中长期数据中学习并更广泛运用人工智能处理非结构性数据多模态信息甚至社会情绪 [5]   国际合作 - 可就加强AI基础设施展开国际合作包括金融行业尤其是金融市场方面的AI基础设施的加强和联通 [7]
 周小川:人工智能在银行业的支付、定价等方面发挥着重要作用
 凤凰网· 2025-10-23 16:46
在被问及人工智能是否会对中央银行的主要业务带来新改变,周小川坦言,这个问题可能还需要更长时间的观察和研究。 中国人民银行原行长周小川10月23日在"2025外滩年会"的"金融领域的AI治理与国际合作"圆桌讨论中表示,从金融的角度来看,AI是在历史上信 息处理、IT和自动化基础上的又一次新的边际变化——但这个边际变化是一个很大的变化。 "过去银行系统、金融系统积累了海量数据,这些数据可用于机器学习、深度学习,使传统模型转向智能推理模型。银行与其他行业有所不同:人 工智能前几年兴起时,大家非常关注生成式模型,后来重视多模态处理;而银行相对简单,较少使用多模态或生成式技术,主要依赖大数据分析 和推理模型,因此有其自身特点。基于这一特点,银行未来结构会进一步向这个方向发展。由此带来一个现象,银行的从业人员规模会显著受到 影响和减少。"周小川表示。 在他看来,客户行为也在发生深刻变化。过去客户与银行打交道时,许多人习惯与人沟通,不习惯与机器互动。但近十多年的变化显示,越来越 多人习惯与机器打交道,不太愿意或认为没有必要人工介入。这个变化也非常深刻。因此,人工智能在银行业的支付、定价、风险管理和市场推 广方面发挥着重要作 ...
 王坚对话AI奠基人谢诺夫斯基:如何防止人工智能毁灭人类?也许是“母爱”
 凤凰网财经· 2025-10-21 18:12
 人工智能的现状与影响 - 人工智能已深度融入日常生活,不再是未来概念 [1] - 大语言模型的兴起使人工智能对普通人而言变得触手可及 [6] - 人工智能在芯片设计等复杂工业领域已成为不可或缺的工具 [3] - 人工智能技术已通过图灵测试,达到了真正实用的程度 [9]   核心技术要素及其关系 - 云计算是人工智能发展的基础,二者唇齿相依 [5][6] - 大语言模型是当前人工智能的代表,依赖于神经网络和深度学习技术 [6][7] - 大语言模型可类比为人工智能的引擎,其应用形式可以多样化 [8] - Transformer架构的核心创新在于自注意力机制,能建立词语间的关联 [19]   算力与数据的关键作用 - 算力需求随模型复杂度和数据规模呈百万倍增长 [20] - 数据规模达到一定程度会发生质变,互联网文本数据催生了大语言模型 [20] - 当前人工智能利用的数据仅占地球数据总量很少一部分,未来潜力巨大 [21] - 高质量、有针对性的数据比单纯的数据量更重要,是未来发展方向 [29]   人工智能的前沿应用 - 之江实验室推进“三体计算星座”项目,计划将算力部署到太空 [10][11] - 太空计算系统旨在解决卫星间互通互联及地球数据回传限制问题 [12][14] - 项目计划联合上千颗卫星,目标是将算力资源分享给世界上的每一个人 [14][15] - 人工智能正推动科学发现,大型科学模型旨在处理文本以外的科学数据(如光谱、蛋白质结构) [36][37][41] - 人工智能已应用于解决蛋白质折叠等重大科学难题,并获诺贝尔奖认可 [37][39]   人工智能与跨学科融合 - 人工智能的发展源于心理学、神经科学等多学科的交叉融合 [17][18] - 对人脑工作机制(如情绪、意识)的理解有助于推动人工智能发展 [16][17] - 人工智能被视为释放人类创造力的新工具,如同纸和笔 [30]   人工智能的发展与挑战 - 大语言模型的“幻觉”输出可能被视为创造力的体现,而非缺陷 [27] - 与人工智能交互时,明确的角色指令和礼貌态度有助于提升回复质量 [24][25] - 人工智能的成功(如ChatGPT)背后是长达四十年的持续努力 [50] - 人工智能在教育领域潜力巨大,可实现个性化辅导,惠及全球 [48] - 在人工智能时代,深度思考和批判性思维对人类至关重要 [49]
 可实时预警岩体微小变化!深大团队研发地质灾害防治系统
 南方都市报· 2025-10-21 15:57
突破传统监测困境 据了解,地质灾害传统监测手段主要依赖埋设传感器和人工巡查,存在明显局限性。"传统方法如同'守 株待兔'。"黄惠比喻说:"传感器只能监测预设点位,无法覆盖整个风险区域;人工巡查则受限于天 气、地形,很多危险区域根本无法到达。" 针对这一难题,黄惠教授团队依托国家重点研发计划等多项重大科研项目,创新性地提出了核心图形信 息"云-边-端"协同处理技术,构建了一整套高效优化算子,实现了从"点式监测"到"体式防控"的跨越。 该系统基于计算机图形学、计算机视觉与深度学习相结合的智能监测方法,通过三个关键技术层面实现 突破:在运动检测方面,可有效捕捉监测区域的异常运动;在目标识别方面,对落石事件的识别准确率 超过85%;在精准测量方面,实现了对目标位移的高精度测量。 南都讯 记者伍曼娜 近日,深圳大学计算机与软件学院院长黄惠教授团队成功研发出新一代地质灾害智 能监测系统,该系统通过融合计算机视觉、深度学习与云边端协同技术,实现了对边坡落石、危岩移动 等地质灾害的全天候、全覆盖、智能化监测,彻底改变了传统"点式监测"的落后模式。 智能识别与精准测量 实现全天候值守 应用前景广阔 据了解,这套系统已在多个场景 ...
 从大脑解码 AI,对话神经网络先驱谢诺夫斯基
 晚点LatePost· 2025-10-21 11:09
 AI行业发展历程与驱动力 - 神经网络研究从边缘走向主流,特伦斯·谢诺夫斯基与杰弗里·辛顿等学者在AI研究低谷期坚持探索,其提出的玻尔兹曼机为深度学习奠定基础 [3] - ChatGPT的诞生证明神经网络研究的价值,改变世界对人工智能的预期,杰弗里·辛顿因AI研究在2024年获得诺贝尔物理学奖 [4] - 计算神经科学领域的开创为AI发展打下基础,多层神经网络、语音识别里的独立分量分析、强化学习等算法均源自对大脑运作机制的研究 [5] - AI的崛起并非基于符号逻辑规则,而是借鉴大脑结构——大量简单处理单元但高度互联的模型,实现跨学科融合的“神经AI”领域正在形成 [15][16] - 科学进步需要挑战权威,年轻研究者常被资深人士压制,但新一代人正在开辟无法想象的新方向,这是行业发展的自然法则 [38][39]   大语言模型的技术特性与应用 - ChatGPT的出现令人震惊,被比喻为高度发达的魔法,其能力取决于使用者,在创意写作中其“幻觉”特性反而是不可或缺的优势 [7] - 大语言模型与用户的互动存在“镜像效应”,它会构建用户模型并预判思维方式,提供与用户对话层次相匹配的答案 [11][12] - ChatGPT已通过图灵测试,其句法结构完美无缺,某种程度上是在通过“镜像效应”测试提问者的水平,相当于逆向的图灵测试 [12] - 利用ChatGPT辅助写作可大幅提升效率,谢诺夫斯基撰写《大语言模型》耗时仅一年,ChatGPT在总结、简化、通俗化呈现专业概念方面表现卓越 [9] - 大语言模型目前处于类似莱特兄弟首次飞行的早期阶段,面临类似飞机发展初期的“监管”困境,技术需要漫长的渐进式发展才能达到高效安全 [13][14]   神经科学对AI技术进步的启示 - 大语言模型模拟了大脑皮层的极小部分,存在类似健忘症的长期记忆问题,而人类大脑在长期记忆上表现卓越 [13] - 技术突破使得如今能同时监测数万个神经元,覆盖大脑数十个区域,获得大脑整体活动模式的全局图景,但对大脑运作机制的理解仍远未完善 [14][15] - 大脑采用分布式控制方式,将实际控制权分散到多个区域,AI的崛起正是借鉴了这种大量简单处理单元但高度互联的模型结构 [15] - 神经科学家开发的神经形态芯片能耗远低于传统数字芯片,功耗降低千倍,仅需毫伏级微弱电流,但技术转型需要庞大基础设施支撑 [18][19] - 大脑仅占人类体重约2%,但消耗全身能量的20%,其采用模拟处理方式,能耗仅20瓦,远低于当前数据中心的数百瓦功耗 [19][22]   AI技术未来发展方向与挑战 - 当前大语言模型只会说话没有身体,机器人发展面临巨大挑战,控制机器人需要身体多处部位同步协调,目前连简单动作都难以完成 [20][21] - 语言复杂性低于身体能力,人类语言历史仅数十万年,而哺乳动物耗费数亿年发展出身体能力,语言必须融入现有的神经回路才能发展 [22] - AI发展需要基础数学在高维空间的进步,大脑有1000亿维,高维数学将催生全新的数学体系,这是当前正在探索的领域 [28][29] - 下载大脑目前属于科幻范畴,但人类行为模式可以被复制,99%的行为都是习惯使然,研究这些习性背后的机制是可行的科学课题 [24][25] - 通过分析人类神经影像数据,在计算机中复现行为模式,某种意义上是将大脑功能下载至计算机,使计算机执行类似行为 [26]   行业竞争格局与商业模式演变 - 小模型可以替代大模型,在许多商业应用场景或特定领域,基于企业自身数据的专用小型语言模型比通晓万物的大模型更具优势 [35] - 数据质量至关重要,小型语言模型有能力筛选全部数据,未来将出现偏见更少、误判概率更低的小型模型 [35] - DeepSeek的成功证明即便资源远不及巨头企业,小型团队通过架构优化提升效率也能取得重大突破,困境催生创新 [36][37] - 全球有10万家AI初创企业,人员都非常年轻,正在积极推动变革,小公司完全有可能超越OpenAI、微软等大公司 [37] - 企业需要基于自身保密数据的专用小型语言模型,这场变革正在发生,未来需要大批懂得如何运用AI而不仅是创造新AI的人才 [35][36]   行业认知与监管环境 - 媒体存在夸大和误导倾向,常渲染“AI将让你失业”等论调,但绝大多数使用者工作效率更高、工作表现更优 [30] - 超级智能消灭人类的“生存威胁”论调被过度炒作,虽然需要保持警惕,但当前技术已带来巨大福祉,需权衡利弊 [30] - 自我监管是起点,专家群体应审视现有成果并加以约束,类似1970年代重组DNA技术诞生后的科学家自我监管模式 [33] - 政府干预过于粗暴且缺乏专业知识,科学家群体完全有能力自我监管,当前已有相关努力正在推进 [34] - 需要厘清AI的风险与收益,认清为获取AI效益必须承担的风险和代价,建立避免无法逆转错误决策的机制 [30][34]
 中国成世界最大人工智能专利国 百度深度学习专利申请量全球第一
 中国经济网· 2025-10-20 16:07
近期,中国人工智能科技股持续走高。10月20日,市场人工智能ETF(159819)上涨3.76%,百度港股开 涨超5%,涨幅居前。至此,百度股价创下近半年新高,获全球知名投资人"木头姐"Cathy Wood持续增 持。 据悉,"木头姐"旗下的投资管理公司ARK增持百度股票,将该持仓总价值推高至约4700万美元。ARK 团队表示AI是下一波创新大潮,在这一领域领先的公司可能实现指数级增长。 百度公司专利事务部总经理崔玲玲近日表示,我国人工智能专利数量已占全球60%,成为全球最大的人 工智能专利拥有国。 Questel发布的《2024深度学习专利全景报告》显示,百度在深度学习和大模型领域申请专利数量位居 全球第一。其中,以文心大模型为代表的大模型创新表现出色,专利申请283件,在中国排名第一。百 度深度学习专利申请量6751件,居全球第一。 ...
 美银看高AMD(AMD.US)至300美元:成长前景广阔 分析师日活动为重要催化剂
 智通财经网· 2025-10-20 15:20
 投资评级与目标价 - 美国银行重申对AMD的买入评级并将目标价从250美元上调至300美元 [1] - 新的300美元目标价基于33倍2027年预期市盈率该倍数处于公司14-55倍的历史市盈率区间内 [1]   市场机遇与竞争地位 - AMD所处的个人电脑服务器高端游戏深度学习及相关市场存在价值数千亿美元的潜在市场机遇 [1] - 公司目前在这些领域的价值份额不足30% [1]   产品前景与客户支持 - 美银对AMD MI450系列Helios机柜在2026年下半年发布前景更为明朗 [1] - MI450系列获得了甲骨文Meta和OpenAI等客户的支持 [1]   股价催化剂与市场持仓 - 11月11日在纽约举行的分析师日活动被标记为下一个需重点关注的股价催化剂 [1] - 截至8月主动型基金管理人对AMD的持仓比例极低仅占约20% [1] - 公司在标普500指数成分股中的基金权重仅为0.16倍较去年同期显著下降而大多数大型半导体同行的权重达到或超过市场权重1倍以上 [1]
 研判2025!中国支持向量机行业产业链、市场规模及重点企业分析:小样本高维数据处理显身手,规模化应用需突破效率瓶颈[图]
 产业信息网· 2025-10-20 09:25
 行业概述 - 支持向量机是一种监督学习算法,核心思想是在特征空间中寻找最优超平面以实现数据区分,具有全局最优性和强泛化能力 [2] - 算法基于结构风险最小化原则,决策边界仅由少数关键样本(支持向量)决定 [2] - 主要分为线性支持向量机和非线性支持向量机两类 [2]   产业链结构 - 产业链上游包括高性能计算芯片、工业相机、图像采集卡、传感器等硬件设备,以及算法库、工具和数据服务 [3] - 产业链中游为支持向量机算法开发与服务提供商 [3] - 产业链下游应用领域涵盖金融、医疗、工业、教育和零售等 [3]   政策环境 - 2024年6月,工业和信息化部等四部门印发《国家人工智能产业综合标准化体系建设指南(2024版)》,提出规范机器学习的多项标准 [6] - 该政策规范了支持向量机的技术发展,促进创新和应用拓展,并保障数据和模型安全 [6]   市场规模 - 2024年中国支持向量机行业市场规模约为4.28亿元,同比增长10.03% [1][8] - 2024年中国国内机器学习平台市场规模约为35.5亿元,同比增长1.14% [5]   竞争格局 - 互联网巨头如百度、阿里巴巴、腾讯凭借资金、技术和数据资源在行业中占据主导地位 [8] - 专注于人工智能技术的企业如九章云极通过技术积累和行业应用拓展了稳定市场 [8]   重点企业案例 - 中科曙光 - 公司旗下中科睿光软件技术有限公司聚焦"云计算操作系统+算力调度"双轮驱动 [9] - 其Cloudview SVM Edition通过虚拟化技术实现资源池化与动态调度,支撑SVM模型训练与推理 [9][10] - 2025年上半年,中科曙光营业收入为58.50亿元,同比增长2.41%;归母净利润为7.29亿元,同比增长29.39% [10]   重点企业案例 - 腾讯控股 - 公司依托腾讯云平台构建"向量数据库+算法模块"的生态体系,VectorDB向量数据库支持海量高维数据存储 [12] - 腾讯云PAI平台提供SVM算法模块,支持多种核函数,在金融风控场景中实现欺诈误报率降低 [12] - 2025年上半年,腾讯控股总营收为3645亿元,同比增长13.69%;毛利为2055亿元,同比增长21.05% [12]   发展趋势 - 支持向量机将与深度学习技术深度融合形成混合模型,并拓展在多模态学习中的应用 [12] - 未来将致力于开发更高效的优化算法和分布式计算框架以提升训练速度和可扩展性 [13] - 量子计算的发展将带来量子支持向量机新机遇,在处理高维数据和复杂问题时具有显著优势 [14][15]
 LSTM之父向何恺明开炮:我学生才是残差学习奠基人
 量子位· 2025-10-19 14:10
鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 何恺明 残差学习奠基人的身份,也被"挑战"了。 为什么要说"也"?因为发起讨论的,又双叒是我们熟悉的 Jürgen Schmidhuber ——LSTM之父。 不过这一次,他不是要把功劳揽到自己身上,而是替LSTM的另一位作者 Sepp Hochreiter 发声: 残差学习 这把改变深度学习格局的 "钥匙",其实早在30年前就已经诞生——Sepp Hochreiter在1991年就在使用循环残差连接解决梯度消失 问题。 随即他们展开了长达多年的争论,尤其是在18年的 图灵奖 结果公布后,Jürgen更是洋洋洒洒写了篇援引200多条文献的小作文反击。 之后在 GAN 的原创争议上,双方也是争执不休,要知道GAN的提出者正是Bengio的得意门生。 而如今有关残差学习的创始之争,也是因为Jürgen自认为将残差学习这一成果的发现完全归因于何恺明团队有失偏颇。 不过正如网友所说: 从Hochreiter到ResNet,光芒随时间递归延续。阴影是被模糊的归属,但真理始终不变:1991年的种子闪耀着每一层。 有一说一,Jürgen争title也不是第一次了,作为深 ...
 大疆卓驭感知算法工程师面试
 自动驾驶之心· 2025-10-19 00:03
作者 | Neob0dy@知乎 编辑 | 自动驾驶之心 原文链接: https://zhuanlan.zhihu.com/p/19295746738 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 本文只做学术分享,如有侵权,联系删文 自动驾驶感知算法工程师-动态目标感知预测方向 JD写得很模糊,面试之后才知道是做障碍物和语义目标识别追踪(运动状态估计)、意图预测的。目前和DJI藕断丝连,面试前要做一模一样的性格测评还有找 规律题目。一开始投的是SLAM,面试官说看到有深度学习的经验,被转到这个岗。 一面 自我介绍,讲项目。面试官应该不是做slam是做BEV的,所以听我一席话如听一席话,转而问参加机器人比赛的时候设计的目标检测网络和关键点检测相关的 内容,问是否了解现在自动驾驶用的视觉模型,occupancy network,讲讲大概的原理。能不能说下transformer为什么有效,多头自注意力模型的每个head有什 么作用,tf相比cnn的优势和劣势。平常用什么语言,小问了一下cpp的八股,智能指针三 ...