大语言模型

搜索文档
官宣!2025 全球机器学习技术大会北京站首批嘉宾出炉,重磅来袭!
AI科技大本营· 2025-08-11 15:16
继 4 月 ML-Summit 2025 上海站圆满举办,现场座无虚席,反响热烈之后,2025 全球机器学习技术大会·北京站在大家的期盼下正式官宣。 10 月 16-17 日, 作为最具行业风向标的年度盛会, CSDN 联合高端 IT 咨询与教育平台 Boolan 主办的 2025 全球机器学习技术大会·北京站 将 延续高品质的前沿议题设置与高规格嘉宾阵容,聚焦大模型、多模态、智能体、AI Infra、具身智能等核心方向,携手顶尖学者与技术实践先锋,共同 探讨 AI 的演进路径与产业落地实践。 围绕技术深度与应用价值的双重驱动,本次大会特别设置了 12 大专题,全面覆盖当前 AI 最具前沿性与工程挑战的关键领域: 每一个专题都将聚焦"技术可解释 × 工程可复制 × 场景可落地"的真实价值,以最前沿的内容结构与最实战的案例经验,为技术决策者、一线开发者带 来高密度的信息增量。 12 大核心专题 构建 AI 技术与应用全图谱 大语言模型技术演进 大模型应用开发实践 大模型驱动的软件开发变革 多模态大模型前沿 GenAI 产品创新与探索 AI Infra:大模型基础设施建设 大模型工程与架构 DeepSeek 技术 ...
人工智能安全治理白皮书(2025)
中国联通研究院· 2025-08-05 10:18
行业投资评级 - 报告未明确提及具体行业投资评级 [1][5][7] 核心观点 - 人工智能技术快速发展,正在重塑全球产业格局,但伴随数据、模型、基础设施与应用的多重安全风险 [7] - 建立安全可靠、公平可信、智能向善的人工智能系统是核心目标 [8] - 需从基础设施、数据、模型、应用等多个维度构建安全治理体系 [8][18] - 全球各国和组织正在积极推进AI技术监管政策制定,防范滥用行为 [84][91] AI技术发展现状 AI技术演进 - AI技术从符号规则、机器学习演进至深度学习,大模型成为推动科技进步的关键技术 [11] - 国际大模型代表包括OpenAI的GPT系列、Google的Gemini系列等,国内代表有百度的文心一言、阿里巴巴的通义千问等 [11][12] - DeepSeek模型采用开源策略,推动AI技术普及并对行业格局产生深远影响 [13] AI技术应用趋势 - AI智能体产业链分为上游算力提供商、中游平台化服务、下游垂直应用,呈现多模态交互升级趋势 [14] - 具身智能在工业制造、家庭服务等领域应用广泛,可解决劳动力短缺问题 [15] - 端侧AI技术进展显著,百亿参数大模型有望端侧落地,端云协同架构成为主流 [16] AI安全治理风险 基础设施安全风险 - 智算硬件设备面临物理攻击、硬件接口攻击、软件攻击等风险 [32] - 智算云安全风险包括存储泄露、API滥用、内部威胁等 [33][34] - 智算MaaS平台存在模型知识产权风险、拒绝服务攻击风险等 [35][36] - 智算算力网络面临编排管理安全风险和运营服务安全风险 [37][39] 数据安全风险 - 通用数据安全风险包括数据合规、泄露、篡改及质量问题 [41][42] - 训练数据风险涉及数据来源违规、内容安全、数据投毒等 [43] - 微调数据风险主要是隐私泄露,攻击者可逆向工程推断训练数据 [45] - 推理数据风险包括模型窃取、隐私数据窃取等 [46] - 知识库数据风险包括外部攻击、内部泄露、恶意软件感染等 [48] 模型算法安全风险 - 通用模型风险包括鲁棒性弱、泛化性差、可解释性差等 [55][56][58] - 生成式模型风险包括提示词攻击、内容合规风险、模型幻觉等 [63][65] - 模型生命周期风险涵盖训练、微调、推理、部署各阶段 [50][54] 应用安全风险 - AI模型滥用风险包括虚假信息传播、多模态深度伪造等 [69][70] - 应用开发风险涉及端侧AI安全税、智能体协议缺陷等 [73][75] - 垂直行业风险如医疗领域的数据偏差、金融领域的深度伪造等 [79][81] AI安全治理技术解决方案 基础设施安全方案 - 智算硬件防护包括物理访问控制、固件安全启动等 [104][105] - 智算云防护采用网络分区、CSPM工具、容器镜像扫描等 [106][108] - 智算MaaS平台通过数据加密、安全审计、供应链管理提升安全性 [109][112] - 智算算力网络通过安全编排、调度、管控保障运营安全 [113][116] 数据安全方案 - 通用数据防护采用脱敏、加密、访问控制等手段 [119][122] - 训练数据防护包括数据质量管理、对抗性训练等 [125] - 微调数据防护采用沙箱环境、权限最小化等 [126][128] - 推理数据防护包括输入输出过滤、运行时监控等 [129][130] 模型算法安全方案 - 通用模型防护通过对抗训练、正则化、公平性约束等提升安全性 [134][138] - 生成式模型防护采用提示词过滤、内容合规检测等技术 [63][65] - 模型生命周期防护覆盖训练、微调、推理、部署全流程 [50][54] 应用安全方案 - 模型滥用防范通过虚假信息检测、深度伪造识别等实现 [69][70] - 应用开发安全涉及端侧优化、智能体协议加固等 [73][75] - 垂直行业安全方案如医疗数据加密、金融身份核验等 [79][81]
电力设备行业周报:海外巨头CapEx上调验证AI高景气度,国产算力自主可控势不可挡-20250804
华鑫证券· 2025-08-04 13:53
行业投资评级 - 对电力设备板块维持"推荐"评级 [4][15] 核心观点 - 海外科技巨头集体上调资本开支验证算力产业高景气度:谷歌2025全年资本开支上调13.3%至850亿美元,Meta下限调增至660亿美元,微软Q2同比增长27%至242亿美元,亚马逊Q2同比增长90%至314亿美元(全年指引1100-1200亿美元),重点投向AI数据中心及云设施升级 [3][12] - 英伟达芯片安全漏洞事件凸显国产算力自主可控紧迫性,中国网信办约谈要求提交H20芯片安全风险说明材料 [13] - 国产替代将加速政务云、央企数字化等领域的芯片及服务器产业链发展,带动液冷解决方案等技术协同突破 [14] 重点公司推荐 - 柴发板块首推潍柴重机(2025E PE 43.99x),HVDC环节推荐科华数据(2025E PE 31.60x)、禾望电气(2025E PE 27.21x)、通合科技(2025E PE 54.66x) [4][7] - 服务器电源及液冷环节推荐英维克(2025E PE 63.90x)、申菱环境(2025E PE 42.48x)、欧陆通(2025E PE 41.18x),麦格米特获"买入"评级(2025E PE 39.33x) [7][17] 光伏产业链动态 - 硅料价格企稳:致密料42-47元/kg,颗粒料43-46元/kg,8月产量或突破11万吨 [29][30] - 硅片价格普涨:183N涨至1.20元/片(+8.1%),210RN达1.35元/片,成本传导顺畅但需观察终端接受度 [30][31] - 组件价格分化:TOPCon双玻现货新单0.68-0.72元/W,集中项目维持0.61-0.68元/W [33][35] 政策与行业数据 - 2025上半年中国新增光伏装机21.2GW(集中式10GW+分布式11.3GW),累计装机达110GW(同比+54.1%) [18] - 第三批风光大基地已纳入10.3GW海上光伏项目,山东、江苏出台专项规划 [19] - 6月河南、安徽、四川备案储能项目超4.92GW/11.46GWh,其中国家电投、宁德时代等企业主导84.5GWh项目 [48][49] 技术创新进展 - 阿里开源2350亿参数模型Qwen3-Thinking-2507,GPQA测试得分81.1媲美国际顶级模型 [24] - 智元机器人发布"灵渠OS"开源计划,构建具身智能操作系统框架 [26] - AiMOGA Robotics人形机器人实现端到端强化学习开车门功能,已在奇瑞4S店商用 [27]
宁夏加强东西部科技合作 为人工智能和清洁能源产业发展提供科技支撑
证券日报网· 2025-08-01 22:11
人工智能和清洁能源领域科技成果对接活动 - 活动由宁夏科技厅、宁夏数据中心、宁夏国有资产投资控股集团联合主办,聚焦人工智能和清洁能源领域[1] - 腾讯云计算、中科闻歌、上海交大、天津大学等企业和高校展示了大模型应用、新能源技术、智能算力等前沿成果[1] - 一工机器人银川公司、宁夏交通投资集团等5家企业发布了智能制造、数字交通、智慧水务等领域技术需求[1] - 宁夏国投基金推介了"宁科投"创投基金及产业引导基金(二期),支持科技成果转化[1] - 现场签约11项重大科技合作项目,总金额达6980万元,包括铝基铅炭长时储能电池制备关键技术等[1] 宁夏科技创新成果 - 宁夏科技厅重点推动人工智能、清洁能源产业科技创新,发挥东西部科技合作引领区作用[2] - 在大语言模型、直流外送和新能源消纳技术、风光储氢一体化等关键技术取得突破[2] - 铸造、仪表、电气、物流等领域云平台服务能力显著提升[2]
AI,人类豢养的老虎,还是智慧之子?
虎嗅· 2025-07-27 15:55
人工智能发展理念对比 - 辛顿将AI比作可能反噬人类的"小老虎",强调其潜在威胁性;莫拉维克则视AI为人类文明的继承者,认为会通过"和平演变"实现智能交接 [1][3] - 两者均认同AI将超越人脑成为超级智能,但辛顿侧重神经网络架构设计与算法训练,莫拉维克强调进化时间带来的感知/动作优化 [3][7] - 莫拉维克在1980年代末预测通用机器人将在2030-2040年间实现类人推理能力,并认为这是人类演化的自然结果 [4][5][6] 莫拉维克悖论核心 - 人类感知/运动能力需消耗巨大计算资源(十亿年进化成果),而高阶推理仅需极少资源(十万年进化产物) [8][9] - 视觉、听觉等"低阶技能"由高度优化的生物算法栈支撑,抽象思维因进化时间短更易被AI逆向工程 [11][12] - 明斯基补充:无意识的人类技能最难被AI模仿,这是机器人研发的根本挑战 [10] 具身智能发展现状 - 当前人形机器人(如宇树R1)多通过预设轨迹完成动作,缺乏真实环境感知能力,实际表现与宣传视频存在显著差距 [13][14] - 英伟达科学家Jim Fan指出:训练"盲体操选手"可通过模拟器实现零样本部署,但具备感知/操作能力的机器人需突破物理模拟技术瓶颈 [15][17] - 宇树认为基础动作训练是机器人进化的必经阶段,但行业共识认为现有技术尚未解决莫拉维克悖论指出的感知-运动鸿沟 [16] 行业领军者技术路线 - 英伟达主张物理AI是AGI关键,认为缺乏具身性则无法实现真正通用智能,其机器人研究聚焦原子世界的复杂交互 [17] - 黄仁勋对AI威胁论持谨慎乐观态度,将人类毁灭概率估值从50%降至10%-20%,与辛顿的警惕立场形成对比 [18] - OpenAI等公司定义的AGI侧重数字空间智能,与莫拉维克1987年提出的物理世界通用机器人理念存在路径差异 [16][19]
斯坦福大模型推理课免费了,谷歌推理团队创始人主讲
量子位· 2025-07-25 15:59
大模型推理能力 - 大模型推理指大语言模型在给出最终答案前的中间思考步骤,这种推理过程与人类思维无关,关键在于生成大量中间内容[5][9] - 有推理过程的回答会先分解问题并逐步推导(如拆分单词找字母),而非直接输出结果,这显著提升答案准确性(数学题正确率从随机猜测提升至逐步推导)[8][15][17] - 中间步骤使复杂问题可解:对于布尔电路规模T的问题,生成O(T)中间步骤后固定大小的Transformer即可解决,否则需极深模型或无法处理[11][12] 推理能力提升机制 - 思维链(CoT)赋能:引入CoT后无需扩展模型规模即可让Transformer解决任何问题,理论上可模拟多项式大小电路的计算,缩小与图灵机差距[12][13] - 解码方式优化:通过CoT-decoding从top-k解码路径中选择含推理且置信度高的路径,效果接近指令微调模型[25][26] - 监督微调改进:采用自我改进(模型自生成步骤纠错)和强化学习微调(验证器引导生成正确答案),后者成为当前最强推理引出方法[27][28][29][31] 前沿方法与未来方向 - 聚合与检索方法:通过边缘化自一致性(高频答案筛选)、通用自一致性(模型自主选择)及检索+推理(先回忆相关知识再解题)提升效果[40] - 未来突破方向:解决非唯一可验证答案任务(如开放式问题),构建实际应用而非仅优化基准测试[35][40] 核心研究背景 - 理论奠基:Denny Zhou与马腾宇等证明足够长思维链可使Transformer解决所有问题,其论文《Chain of Thought Empowers Transformers...》奠定领域基础[2][12][31] - 技术应用:Google DeepMind推理团队通过思维链、自洽性、任务分解等方向推动AGI发展,目标实现完美泛化[37]
白宫发布AI行动计划
财联社· 2025-07-24 09:50
美国AI行动计划 - 白宫发布AI行动计划,围绕三大支柱展开:加速创新、在美国本土构建AI基础设施、让美国硬件和软件成为全球AI创新的"标准"平台 [2] - 计划要求联邦政府采购的大语言模型必须"客观、不受自上而下意识形态影响" [2] - 计划涉及消除"繁杂监管举措"来促进AI技术发展,并听取了私营部门、学术界和公民社会团体的建议 [3] 政策与监管 - 计划要求简化对数据中心、半导体制造设施和能源基础设施的项目许可流程 [3] - 提出抑制各州对AI过度监管的策略:建议联邦机构在拨付AI相关资金时考虑各州的AI监管环境 [3] - 特朗普政府曾在国会支持一项提案,试图在10年内禁止各州通过任何AI相关法律,但该提案本月初在参议院被否决 [3] 国际合作与竞争 - 美国政府将与科技公司合作,向美国盟友提供"全套AI出口套餐"(AI模型、硬件和软件),以确保美国技术成为全球标准 [3] - 白宫AI事务负责人表示AI可能改变全球经济并改变世界力量平衡,美国必须赢得这场竞赛以保持领先地位 [3] 产业动态 - OpenAI与甲骨文就开发4.5吉瓦"星际之门"数据中心达成协议,该项目获得特朗普政府大力宣传 [5] - 亚马逊、微软、Meta以及xAI等公司都在推进大型数据中心项目 [5] 实施时间表 - 白宫科技办公室主任表示行动计划中概述的所有政策都可以在未来6个月到1年内执行 [4]
中国科学院院士、清华大学人工智能研究院名誉院长张钹:要走出符合自己特色的人工智能发展路径
上海证券报· 2025-07-23 02:16
通用人工智能发展现状 - AGI定义存在分歧 根源在于标准不统一 部分观点认为三五年内可实现 部分认为无法实现 [3] - AGI三大定义标准:领域通用性(跨领域任务执行能力) 任务通用性(达到人类水平的多任务能力) 通用理论支撑(明确理论体系) 当前大语言模型仅满足部分语言交互功能 [4][5] - 大模型里程碑意义在于突破特定领域局限 实现开放领域语言生成与自然交互 但需与硬件、机器人技术深度融合才能推动AGI落地 [5] 人工智能+医疗领域应用 - 导诊、分诊等辅助性工作技术门槛低 AI可有效提升效率 医疗诊断因涉及生命安全 对模型可靠性、可解释性要求极高 [5] - 当前机器诊断系统输出结果需医生签字确认 模型需提供可理解的决策逻辑 实现可靠诊断应用仍需长期技术积累 [5] 人工智能+机器人发展瓶颈 - 人形机器人多数处于"展品"阶段 服务老人、无人驾驶等场景对可靠性要求极高 高昂成本制约商业化进程 [6] - 需解决可靠性、成本两大核心问题 才能推动机器人从实验室走向大规模商品化应用 [6] 中国人工智能特色发展路径 - 人形机器人需避免照搬美国模式 中国家庭以平层为主 轮式机器人比人形更具经济性和实用性 [7] - AI+工业发展缓慢主因是成本过高 中国可通过工程优化、算法优化优势降低技术应用成本 形成市场良性循环 [7] - 清华大学40余年AI研究积累 形成完整科研产业化队伍 孕育出大批优质企业 企业潜力评估需关注技术业务契合度与创始人能力 [7] 中国AI战略方向 - 需在前沿技术突破与理论基础夯实双轨并行 发挥工程优化优势 推动跨学科融合 探索中国特色发展道路 [8]
试析“严格而简单”的特朗普2.0出口管制策略:杠杆优先、扩散为辅和控制为盾
西部证券· 2025-07-22 19:42
美国出口管制历史与演变 - 冷战初期起,出口管制是美维护安全和外交目标手段,近年规模范围扩大,美国务院、商务部、财政部有权核发出口许可证[11] - 特朗普 1.0 签署《2018 年出口管制改革法案》,扩大管制范围至“新兴和基础技术”,2018 - 2020 年管制名单迅速增加[16][17] - 拜登政府采用“小院高墙”策略,2022 年 10 月 7 日起多次对先进计算集成电路和半导体制造设备实施出口管制,并细化规则[19][39] 人工智能领域格局 - 美国在人工智能领域领先但地位脆弱,2025 年 DeepSeek R1 等模型发布带来挑战,欧洲有人力资本优势,新兴国家有发展潜力[22][23] - 底层算力是美国出口管制重心,各国半导体产业链相互依存,美、日、韩、欧投入大量资金发展半导体产业[28] 特朗普政府 AI 管制政策 - 特朗普撤销拜登 AI 监管框架,减少国内监管,支持基础设施建设,废除《人工智能扩散出口管制框架》,拟重新制定规则[53][54] - 科技发展战略为促进与保护并举,提升创新地位需分配资金、构建监管制度、推广美国产品,保护领先地位有三重战略[55][56][64] - 可能采取杠杆优先、扩散为辅和控制为盾的策略,将 AI 技术作为交易工具,支持企业海外扩张并附加条件[75] 企业立场 - 美国大企业支持减少国内 AI 监管,对出口管制态度复杂,分为支持、担忧、反对三类[76][77] 未来 AI 管制图景 - 特朗普政府可能频繁更新人工智能芯片出口限制,限制 laaS 服务但执行效果可能不佳,增强开源模型和蒸馏技术管控[88][89][90] - AI 行动计划可能包括双边许可协议和优先国家名单、加强出口管制、供应链安全新措施、AI 全球治理碎片化[92][93][95][96]
估值55亿美元,英伟达投资的Cohere加码亚太市场
搜狐财经· 2025-07-17 17:48
公司扩张计划 - 估值55亿美元的人工智能初创公司Cohere计划2024年在韩国首尔设立亚太业务枢纽 [2] - 公司已任命Andrew Chang担任亚太区副总裁 负责首尔办事处运营及区域扩张 [2] - 公司在亚洲现有客户包括日本富士通和韩国LG集团旗下LG CNS [2] 高管团队背景 - 新任亚太区副总裁Andrew Chang曾担任纳斯达克上市公司Confluent韩国区经理 拥有谷歌 微软 IBM等科技巨头任职经历 [2] - 公司由Aidan Gomez等三人于2019年联合创立 其中Gomez是开创性论文《Attention Is All You Need》的合著者 [3] 融资与技术实力 - 公司累计融资9.7亿美元 投资方包括英伟达 AMD 甲骨文 Salesforce等 2024年7月完成5亿美元D轮融资 [2] - 与LG CNS联合开发1110亿参数大语言模型 支持23种语言并可在企业数据中心运行 [5] 商业模式与客户案例 - 专注于为受监管行业(金融 医疗 能源等)提供定制化大语言模型 强调数据安全性 [5] - 典型案例包括为LG CNS开发支持韩语处理的AI模型 并合作获得韩国外交部公共项目 [6] - 在日本与富士通建立类似合作 开发企业级AI解决方案 [5] 区域战略背景 - 韩国新政府承诺投资100万亿韩元(约720亿美元)用于AI基础设施建设 推动公司选址决策 [6] - 公司强调将组建本地团队 与政府合作推出安全AI解决方案以提升经济生产力 [2]