人工智能模型

搜索文档
自给自足“至关重要”!微软(MSFT.US)豪掷重金加码自研AI模型
智通财经· 2025-09-12 07:20
微软(MSFT.US)计划扩大其物理基础设施以训练自己的人工智能(AI)模型,希望这些模型能与OpenAI、 Anthropic等公司竞争。微软消费者人工智能主管Mustafa Suleyman周四在全体员工大会上表示,公司将 对自己的计算能力集群进行"大规模投资",以训练模型。 据与会者透露,Suleyman告诉员工,对于像微软这样规模的公司来说,具备在人工智能领域自给自足的 能力至关重要。他补充说,微软采取了同时深化与OpenAI的合作、与其他模型制造商合作以及构建自 研模型的策略。 这家全球最大的软件制造商主要依靠OpenAI的大型语言模型来支持其产品。然而,随着两家公司各自 推出竞争产品并寻求更多合作伙伴,双方关系也出现了紧张的迹象。DeepMind联合创始人Suleyman去 年加入微软,领导公司自研模型的开发,并创建了一个专注于人工智能的消费者特许经营项目。 上个月,微软发布了由Suleyman领导开发的首个大型语言模型。该模型在15000块英伟达H100芯片上进 行了训练。Suleyman补充说,Meta Platforms Inc.、Alphabet Inc.旗下谷歌和埃隆.马斯克的xAI等公 ...
临时文件管理解释:监管机构如何应对人工智能可解释性问题
国际清算银行· 2025-09-10 16:06
行业投资评级 - 报告未明确给出具体的行业投资评级 [2][10] 核心观点 - 金融机构越来越多地采用人工智能(AI)正在改变其运营、风险管理和客户互动方式 [7] - 复杂AI模型的有限可解释性对金融机构和监管机构构成了重大挑战和问题 [7] - 可解释性对于透明度、问责制、监管合规性和消费者信任至关重要 [7] - 深度学习和大语言模型(LLM)等复杂AI模型通常难以解释 [7] - 现有的可解释性技术存在显著局限性,包括不准确性、不稳定性以及对误导性解释的易感性 [7] - 有限的模型可解释性使得管理模型风险具有挑战性 [8] - 国际标准制定机构已发布模型风险管理(MRM)要求,但只有少数国家金融监管机构发布了具体的指导 [8] - 现有指南可能并未针对先进的AI模型进行制定,并未明确提及模型可解释性的概念 [8] - 随着金融机构将人工智能模型应用于其关键业务领域,金融监管机构有必要寻求在人工智能背景下相关健全的模型风险管理与模型输出(MRM)实践 [9] - 可能需要在可解释性和模型性能之间做出权衡,只要风险得到适当评估和有效管理 [9] - 允许使用可解释性有限但性能优越的复杂人工智能模型,或许能够使金融机构更好地管理风险并提升客户体验,前提是引入了充分的保护措施 [9] - 对于监管资本应用场景,复杂人工智能模型可能被限制在特定的风险类别和敞口范围内,或受到输出下限的约束 [9] - 监管机构还必须投入资源提升员工评估人工智能模型的能力 [9] 目录总结 第一部分——引言 - 人工智能(AI)模型正越来越多地应用于金融机构的所有业务活动,从内部运营到面向客户的业务 [11] - 金融机构在使用人工智能进行关键业务应用方面似乎比较谨慎,尤其是那些涉及客户互动的应用 [11] - 预计人工智能的使用将变得更加普遍,包括在关键业务领域 [11] - 一个关键的监管/监督关注点是人工智能模型的可解释性,特别是对于关键业务活动 [12] - 可解释性没有普遍公认的定义,但一些组织从各自的视角定义了这个概念 [12] - 某些AI模型结果的缺乏可解释性可能引发审慎关切 [13] - 缺乏可解释性也可能使监管机构难以确定金融机构在模型使用方面是否符合现有的监管要求 [13] - 可解释性在使用AI模型计算监管资本方面也同样重要 [14] - 缺乏人工智能模型可解释性可能会潜在地导致系统性风险加剧 [15] - 可解释的人工智能模型输出从消费者保护的角度也很重要,以避免歧视性决策 [16] - 从金融机构的角度来看,缺乏可解释性构成了采用和部署AI模型的障碍 [17] - 监管者通常期望企业能够解释用于关键活动或辅助决策的人工智能模型 [18] - 现存在关于模型风险管理(MRM)的国际标准和区域监管要求,其中一些已明确涵盖或隐含提及可解释性问题 [19] 第二部分——MRM和可解释性 - 全球标准制定机构(SSBs)已经对金融机构使用模型提出了一些高阶要求 [23] - 巴塞尔核心原则(BCPs)规定使用风险模型的银行必须遵守模型使用的监管标准,包括对模型进行独立验证和测试 [23] - 保险核心原则(ICPs)涉及风险测量的模型使用,包括用于测量技术准备金 [23] - 巴塞尔银行监管委员会(BCBS)也存在其他与模型使用相关的重要文件 [23] - SSBs还就监管资本目的下模型的使用发布了更详细的要求 [23] - 最近,IAIS(2025)阐述了现有ICPs在保险公司使用人工智能的背景下的应用方式 [24] - 在国家层面,只有少数几家金融监管机构制定了模型风险(MRM)指导方针 [26] - MRM指南具有共同要素,涵盖治理和监督、模型开发与文档、模型验证与实施、监控与维护 [30] - 所有MRM指南都要求评估模型风险,以便采用基于风险的方法来应用MRM要求 [30] - 所有MRM指南都涵盖使用第三方模型时风险的管理 [30] - 虽然模型可解释性的概念在许多现有的MRM指南中并未明确提及,但它隐含于这些指南中包含的许多条款之中 [31] - 评估模型风险性的要求,以便能够基于风险应用MRM要求,加剧了实施挑战 [35] - 使用第三方模型也加剧了缺乏可解释性所带来的挑战 [36] - MRM中一个现有指南未明确涵盖的方面与公司对受模型结果影响的客户的责任有关 [37] 第三部分——在AI背景下执行可解释性要求所面临的挑战 - 企业可能会发现,满足现有的关于人工智能模型可解释性的监管要求是一项挑战 [40] - 深度神经网络等高级人工智能模型由于其众多参数和过度参数化而难以解释 [40] - 构建大型语言模型(LLM)使其功能比其他人工智能模型更为复杂 [40] - 在大多数政策讨论中,使用"可解释性"一词,而在大多数学术文献中,则使用"可解释性"一词 [41] - 可解释性是指模型的输出能在多大程度上被解释给人类 [42] - 可解释性是指人工智能模型的内部工作机制可以被人类理解的程度 [42] - 这些概念是相互关联的 [42] - 某些AI模型是固有的可解释的,例如决策树和广义加性模型 [43] - 存在一些黑盒模型,由于其复杂性、非线性和大量参数的使用,本质上是不透明的 [43] - 为了提高这些模型的可解释性,可以使用事后技术来分析黑盒模型在做出预测/已交付输出 [48] - 后验技术可以根据全局和局部可解释性进一步细分 [48] - 事后技术包括SHapley Additive exPlanations (SHAP)方法、本地可解释模型无关解释(LIME)方法和反事实解释 [52] - 这些可解释性技术并非相互排斥,每种方法都有其利弊 [54] - 可解释性技术存在局限性,包括不准确、不稳定性、无法泛化、不存在普遍接受的指标和误导性解释 [55] - 新的可解释性技术正在进行开发,并改进现有方法 [55] - 一个总体的MRM要求是,人工智能模型必须就其如何得出结果而言是可解释的 [56] - 可解释性要求可能需要根据目标受众进行调整,例如高级管理层、消费者或监管机构 [58] - 一些MRM要求规定了公司需要遵循的模型变更流程;然而,在人工智能模型方面,构成变更的内容尚不明确 [59] - 使用第三方提供的AI模型在遵守MRM要求方面带来了多重挑战 [59] - 不同类型的AI模型在遵循MRM要求时可能会呈现不同级别的挑战 [59] - 缺乏既有的或全球公认的可解释性方法,特别是对于新型人工智能模型,是满足MRM指南的障碍 [60] - 大型语言模型(LLM)正越来越多地被金融机构应用于许多活动 [62] - 解释和理解大型语言模型是一项极其复杂的任务 [63] - 随着更多公司开发基于大型语言模型(LLM)的人工智能应用,如果它们无法充分解释应用的工作原理,可能会成为一个监管问题 [65] 第四部分——MRM指南的潜在调整 - 当局可能需要审查现有的MRM指南,并确定是否需要制定新指南或对现有指南进行调整 [67] - 随着金融机构在不同职能和业务领域扩大对人工智能模型的使用,金融当局可能需要就模型在监管资本目的之外的使用提供指导 [67] - 原则上,若AI模型用于关键活动中进行决策,MRM指南可能要求金融机构使用本质上可解释的AI模型或者至少采取足够针对黑盒模型的解释性技术 [68] - 对于复杂模型,仅使用一种现有的解释性方法可能无法完全提供信息 [69] - MRM指南可能需要要求金融机构为相关用例建立可接受的解释性标准 [71] - 可以考虑根据人工智能用例的不同风险程度来定制监管可解释性要求 [72] - 应该明确认识到可解释性和模型性能之间可能的权衡 [74] - 承认这种权衡的一个更具影响力的决定是允许使用那些不完全符合既定可解释性标准但性能明确且显著优于更传统和简单模型的复杂模型 [75] - 可解释性豁免的引入应仅影响可解释性差距有限的人工智能模型,并考虑此类模型使用的风险程度 [75] - 解决用于监管目的的人工智能模型的低可解释性问题更加棘手 [76] - 一种折衷方案可能是,允许在一定限度内使用表现良好且复杂的人工智能模型来计算拨备、最低资本或其他监管义务 [76] 第五部分——结论 - 人工智能的应用预计将在金融机构的业务活动中更加普及 [78] - 某些人工智能模型的缺乏可解释性是金融监管机构的一个关键担忧 [79] - 随着金融机构在关键业务领域推出更复杂的AI模型,这将影响消费者、监管合规和系统性风险 [79] - 金融监管机构寻求促进金融机构中考虑人工智能发展的稳健的MRM实践是至关重要的 [80] - 监管机构可以通过发布MRM指南来实现这一目标 [80] - 在人工智能可解释性的背景下,MRM指南可以包括要求金融机构采用可解释性技术来解释黑盒模型,根据模型的潜在影响和风险性建立可解释性标准,并要求补充性保护措施 [81] - 可能需要认识到可解释性与模型性能之间的权衡,只要风险得到适当评估和有效管理 [81] - 当局也需要提升其员工技能,以便能够理解企业提交的可解释性提交 [82]
美国:苹果公司因非法使用受版权保护书籍进行AI训练遭起诉
搜狐财经· 2025-09-07 17:02
目前,苹果尚未就此事发表正式回应。 转载请注明央视财经 编辑:潘煦 (央视财经《第一时间》)5日,多名作家在美国加州一法院对苹果公司发起集体诉讼。诉讼指出,苹果公司在进行人工智能模型训练的过程中,大量使用 了受版权保护的内容,未经许可、未署名、也未支付报酬便复制了多名作家的相关作品,涉嫌侵犯作者的知识产权。 ...
苹果陷版权风波:被指盗用书籍训练AI
环球网资讯· 2025-09-07 12:45
核心观点 - 苹果公司因涉嫌未经授权使用版权书籍训练人工智能模型而面临集体诉讼 两位作家指控其侵犯版权并谋取商业利益 [1][4] - 生成式人工智能技术公司面临普遍的法律挑战 类似诉讼在行业中不断出现 [4] 诉讼细节 - 原告为作家格雷迪·亨德里克斯和詹妮弗·罗伯森 他们拥有多部作品 指控苹果使用盗版数据集训练AI [4] - 苹果公司的爬虫工具Applebot被指潜入未经授权的"影子图书馆"获取书籍内容 [4] - 诉讼寻求集体诉讼地位 因涉及书籍和作者数量庞大 [4] 指控内容 - 苹果被指控复制版权作品训练AI模型 这些模型输出与原作品竞争 削弱原作品市场 [4] - 苹果的行为被指剥夺作者对作品的控制权 破坏劳动经济价值 通过非法手段谋取商业成功 [4] - 原告称若没有这些作品 苹果智能的商业价值将大打折扣 [4] 行业背景 - 针对生成式人工智能技术公司的诉讼层出不穷 OpenAI也被纽约时报和非营利新闻编辑室起诉 [4]
半年募资1049亿港元,港股IPO缘何重夺全球冠军?
搜狐财经· 2025-08-25 08:57
港交所业绩表现 - 2025年上半年总收入140.76亿港元 同比增长32.53% [2] - 净利润85.19亿港元 同比增长39% 创历史半年度新高 [2] - 证券市场日均成交额2402亿港元 同比上升1.18倍 [8] - ETF市场日均成交额338亿港元 同比上升1.84倍 [8] - 期货期权日均成交合约超170万张 同比上升11% [8] IPO市场表现 - 新股上市数量44家 募资总额1094亿港元 同比增长7.16倍 [2] - 处理中上市申请207宗 为2024年底84宗的两倍多 [2] - 全球IPO融资额前十中独占四席(宁德时代/恒瑞医药/海天味业/三花智控) [6][11] - 四家A股龙头企业共募资超718亿港元 占港股IPO总额近70% [6] - 再融资额1429亿港元 超过同期IPO规模 [8] 市场地位变化 - IPO规模超越纳斯达克/纽交所/上交所及印度国家证券交易所 荣登全球首位 [2] - 香港成为亚洲表现最好股票市场之一 恒生指数上半年涨幅22% [9] - 在港上市内地企业占市场总市值81% [8] - 沪深港通南北向成交额均创半年度新高 [8] - 债券通北向通日均成交459亿元人民币 同比上升3% [8] 政策驱动因素 - 内地推出刺激措施包括资金支持与降息 支撑商业信心 [5] - 港交所推出FINI系统缩短结算周期 降低特专科技公司上市门槛 [5] - 设立"科企专线"绿色通道 审批效率大幅提升 [5] - 宁德时代从递表到通过聆讯用时不足100天 [5] - 监管部门明确支持内地行业龙头赴港上市 [5] 行业结构特征 - 生物科技与健康/零售消费行业IPO宗数并列第一 [5] - 工业(含先进制造业)IPO集资额跃居行业之首 [5] - "新消费+硬科技"成为港股新引擎 [5] - 未盈利生物医药公司与人工智能企业加速赴港上市 [6] 资金流动趋势 - 南向资金与海外避险资金共同推动流动性改善 [8] - 欧美长线基金与中东主权财富基金积极参与IPO基石投资 [9] - 宁德时代H股国际配售获23家国际机构认购92.5%份额 [9] - 国际投资者因规避地缘政治风险调整资产配置 [9] 创新企业影响 - DeepSeek发布低成本AI模型 推动中国科技股上涨 [7] - 人工智能和创新领域发展推动投资者兴趣回升 [4] - 企业通过"A+H"模式拓展国际化战略(如宁德时代90%募资投入匈牙利项目) [6] - 讯飞医疗借助香港资本市场加速AI技术迭代 [6] 市场环境转变 - 从悲观论调到市场狂欢仅用一年时间 [10] - 投资者对中国经济前景和政策持乐观态度 [4] - 香港巧妙转化中美博弈压力为发展机会 [9] - 资本利得税豁免/自由资本流动等制度构成独特优势 [10]
智元灵犀X2即将完成量产,将于8月底开始陆续供应;马斯克的星链赢得更多豪华航司青睐,稳步进军机上Wi-Fi市场丨智能制造日报
创业邦· 2025-08-22 11:16
能源与数据中心基础设施 - 安特吉获准新建三座天然气发电厂 专为Meta最大数据中心供电 该数据中心面积达400万平方英尺(约37万平方米) 满负荷年耗电量预计达5吉瓦 [2] 显示设备投资趋势 - 2020-2027年全球显示器设备累计支出预计达758亿美元 OLED技术为主要驱动力 2025年OLED设备支出预计同比增长31% LCD支出预计同比下降45% 2025-2027年OLED将占总投资的80% LCD份额降至17% [2] 制造业产能调整 - 尼康将于9月30日正式关闭横滨工厂 生产线转移至神奈川县其他设施及东京总部 该工厂主要生产显微镜及平板显示器制造设备 [3] 卫星通信市场扩张 - 星链服务已签约法国航空、卡塔尔航空、美联航等航司 阿拉斯加航空将于明年安装系统 维珍航空7月达成协议 英国航空可能跟进 重点拓展中东市场 正与阿联酋航空、海湾航空、迪拜航空及沙特航空深入谈判 [3] 机器人产业进展 - 智元灵犀X2机器人将于8月底开始量产供应 第四季度起不限量发货 [3]
国内多数AI模型训练使用的中文数据占比已超60%
新华社· 2025-08-21 15:13
中文数据在AI大模型训练中的关键作用 - 国内AI模型训练使用的中文数据占比超过60% 部分模型达到80% [1] - 中文高质量数据开发和供给能力持续增强 推动人工智能模型性能快速提升 [1] - 高质量数据集建设是人工智能发展的核心要素 在推动"人工智能+"过程中发挥关键作用 [1] 人工智能数据消耗与基础设施发展 - 日均Token消耗量从2024年初1000亿增长至2024年6月底30万亿 一年半时间增长300多倍 [1] - 截至2024年6月底 建设高质量数据集超过3.5万个 总体量超过400PB [1] - 400PB数据总量相当于中国国家图书馆数字资源总量的140倍 [1] 数据交易市场与未来发展方向 - 截至2024年6月底 各地高质量数据集累计交易额近40亿元 [2] - 数据交易机构挂牌的高质量数据集总规模达246PB [2] - 体系化布局推进高质量数据集建设 重点发展具身智能、低空经济、生物制造等领域数据高地 [2]
国内多数模型训练使用中文数据占比超60%
人民日报· 2025-08-19 06:31
本报北京8月18日电 (记者王云杉)记者从国家数据局获悉:中文数据在国内大模型的训练性能提升方 面发挥着重要作用。国内多数模型训练使用的中文数据占比已经超过60%,有的模型达到80%。中文高 质量数据的开发和供给能力持续增强,推动我国人工智能模型性能快速提升。 在人工智能时代,Token(通常所说的词元)是处理文本的最小数据单元。国家数据局局长刘烈宏介 绍,2024年初,我国日均Token的消耗量为1000亿,截至今年6月底,日均Token消耗量已经突破30万 亿,1年半时间增长了300多倍,反映了我国人工智能应用规模的快速增长。 《 人民日报 》( 2025年08月19日 06 版) (责编:赵欣悦、袁勃) 关注公众号:人民网财经 ...
俄媒:西方“芯片铁幕”挡不住中国技术进步
环球网资讯· 2025-08-18 06:54
西方对华技术制裁的影响 - 美国7月暂停禁止英伟达对华出口H20芯片的决定,暴露了西方技术制裁的弱点 [1] - 西方制裁导致英伟达损失数十亿美元,阿斯麦等公司被迫寻找新客户 [2] - 西方制裁措施缺乏法律机制支持,盟友被迫做出配合姿态 [2] 中国技术自主化战略 - 中国2000家企业正在重构半导体、工业软件等关键领域的生态系统 [2] - 中国计划在2028年实现全产业链自主化率超过70% [2] - 中国通过补贴和税收优惠系统化推进技术自主,将技术自主转化为政策常态 [2] 全球技术格局变化 - 中国人工智能模型进入全球南方市场,巩固新的技术地理格局 [2] - 亚洲正在构建自己的供应链并制定新规则,英美叙事正在瓦解 [3] - 未来技术中心向东转移,西方失去对全球技术垄断地位 [1][3] 西方制裁的实际效果 - 西方制裁未能阻碍中国技术发展,反而加速了中国自主化进程 [2] - 西方企业公开表态忠诚,私下仍在与中国进行谈判 [2] - 西方制裁措施被形容为"政治秀",实际效果有限 [1]
合理资本开支护航硬科技上市公司发展
证券日报· 2025-08-07 00:26
资本开支对硬科技上市公司的战略意义 - 资本开支是企业为获取长期资产所产生的支出 能够在多个会计期间带来经济利益 对硬科技公司具有多维度积极影响 [1] - 合理增长的资本开支有助于企业扩大生产规模 提升研发水平 优化资产结构 提高未来收入预期并实现估值提升 [1] 扩大生产规模的具体作用 - 通过加大研发投入扩充核心团队(如算法工程师 数据标注师) 加快不同场景下AI智能体的迭代速度 [1] - 推动供应链优化 与芯片厂商 云服务提供商建立长期合作 降低硬件采购和算力成本 [1] - 生产能力提升后通过批量交付降低单位成本 形成"规模效应—价格优势—市场份额扩大"的正向循环 [1] 研发能力提升路径 - 持续投入资金购买先进研发设备 吸引高端科研人才 加速新技术新产品推出 [2] - 人工智能企业通过资本开支用于高性能计算设备和算法研发 开发更智能高效的人工智能模型 [2] 资产结构优化机制 - 针对性购置资产并淘汰落后技术设备 紧跟行业发展趋势(如5G技术兴起时及时投入研发) [2] - 根据市场需求和自身发展战略调整资产结构 在新的市场机遇中占据有利地位 [2] 资本开支决策要求 - 需要建立科学严谨的决策机制 充分了解行业发展趋势 市场需求及竞争对手动态 [2] - 必须评估投资项目可行性和潜在回报 以实现企业健康长远发展 [2]