开源大语言模型
搜索文档
“东盟+中日韩(10+3)人工智能产业发展论坛”在山东济南举办
中国新闻网· 2025-10-31 21:36
论坛概况 - 东盟+中日韩(10+3)人工智能产业发展论坛在山东济南举办,主题为“智济东方·数联未来” [1] - 来自东盟及日韩的60余名国际嘉宾以及上百家中国人工智能企业代表参会 [1] - 论坛由国家工业信息安全发展研究中心联合山东省工业和信息化厅、济南市人民政府等单位共同主办 [2] 新加坡人工智能发展 - 新加坡积极推动人工智能技术的本地化适应,并开发多款开源大语言模型 [1] - 这些模型在东南亚语言处理方面表现出色,提升了人工智能对区域多元文化的理解能力 [1] 印度尼西亚人工智能战略 - 印度尼西亚致力于构建兼具包容性与责任感的人工智能生态系统,聚焦健康、技术与教育等领域 [1] - 计划到2045年将人工智能打造为国家经济增长的重要引擎 [1] - 印度尼西亚已做好准备与中国、日本、韩国及东盟各国深化合作,共同推动人工智能的可持续发展 [1] 老挝人工智能现状与合作 - 老挝的人工智能发展尚处于起步阶段,相关课程的整合与推广仍较为有限 [1] - 老挝在地理与人口结构方面具备独特优势,其区位、年轻化的人口及稳定的自然环境为建设区域数据中心提供了良好条件 [1] - 老挝已与中国合作开发国家大型语言模型,该模型将深度融合老挝语言与文化特色 [2] - 未来将重点推动人工智能在旅游、教育、医疗等关键领域的应用 [2] 区域合作与展望 - 人工智能被认定为驱动全球数字经济发展的核心引擎,东盟与中日韩(10+3)合作机制是区域内协同创新的重要纽带 [2] - 各方在人工智能领域的合作已经从“播种期”迈入了“成长期” [2] - 济南市表示愿意与10+3国家深化在AI领域的产业交流与成果对接,并欢迎10+3国家企业来济投资兴业 [2]
俄推动人工智能领域对华深度合作
科技日报· 2025-09-25 07:46
在2024年末举行的"人工智能之旅"国际会议上,俄罗斯总统普京表示,人工智能(AI)技术注定将成为 实现国家发展目标、增强国防实力、确保经济和社会部门高质量发展、公共管理以及创新增长的关键资 源。为了成功应对这些挑战,俄罗斯不仅必须在技术创造方面,而且必须在技术应用规模方面成为全球 领先者,使其渗透到生活的方方面面。 AI技术的全面普及或许还有待时日,但AI确实已渗透到了俄罗斯生活的方方面面,并成为中俄合作的 热门关键词。9月初随普京访华的俄副总理切尔内申科在谈到中俄两国合作时特别强调,"AI领域是最具 合作前景的方向之一"。俄AI行业领军人物——俄罗斯联邦储蓄银行(以下简称"俄储蓄银行")第一副 董事长亚历山大·维德亚欣在近期举行的东方经济论坛上也特别谈到了与中国开展AI领域合作的进展, 以及对AI领域发展的展望。 俄人工智能市场:潜力巨大,前景广阔 俄罗斯的AI市场究竟有多大?对于这个问题,维德亚欣的答案是:俄罗斯AI市场最低估值达50亿—70 亿美元,俄AI市场蕴含着巨大潜力和广阔前景。 从市场规模增长数据来看,2025年俄AI应用市场规模同比2023年增长89%,其中企业级解决方案占比首 次超越消费级 ...
开源模型竟被用于窃取下游微调数据?清华团队揭秘开源微调范式新型隐藏安全风险
机器之心· 2025-05-27 17:54
研究背景 - 基于开源模型微调的范式已成为大型语言模型发展的基础,推动其在科研和工业界的广泛应用[5] - 研究揭示该范式中存在此前未被认识到的安全漏洞:开源模型开发者可通过后门注入方式提取下游私有微调数据[5] - 与传统模型蒸馏不同,该后门机制可恢复微调过程中使用的查询语句,这些查询通常包含专有内容或用户特定提示语[5] 方法概览 - 后门攻击实现的关键原因是在微调过程中对训练查询计算损失,这是某些开源大语言模型后训练框架的默认设置[6] - 团队提出两种后门训练方案:基于SFT的方案通过构造特殊数据对增强模型遵循抽取指令能力[7],基于GRPO的方案通过强化学习进一步提升抽取性能[8] - 在抽取阶段采用打分机制识别真实出现的开头词,依据模型拒绝回复的可能性和重复输出频率进行判断[9][10] 实验结果 - 在Dolly数据集测试中,Qwen2 5-32B模型经过SFT训练后Match Ratio均值达49 2%,Max@10达81 3%[14] - 在Finance数据集上,Qwen2 5-32B模型召回率最高达76 3%,精准度在使用50个开头词时超60%[16][17] - 开头词信息已知情况下,完整query召回率可提升至94 9%[16][19] - 后门训练未对模型通用性能产生负面影响,AlpacaEval2和MMLU测试结果保持稳定[12][14] 技术原理 - 后门训练使模型输出分布与实际训练分布匹配度显著提升,KL散度从0 61降至0 11[17] - 通过分析输出分布发现,模型能准确捕捉训练查询中开头词的实际分布特征[17] 防御探讨 - 基于检测的防御手段通过尝试不同抽取指令来识别后门训练,但对乱码指令完全失效[20] - 实验显示当使用乱码抽取指令时,Match Ratio均值从29 8%降至11 2%[20] 研究意义 - 该工作揭示了开源模型微调范式的新型安全风险,具有较大危害性且难以检测[1][5] - 研究启发了后续在攻击防御、数据筛选机制、可控性增强等方面的探索方向[22]