Workflow
开源大语言模型
icon
搜索文档
OpenAI面临人才保卫战?奥特曼:Meta曾开价1亿美元挖人
中国新闻网· 2025-06-19 10:18
人才争夺战 - Meta试图通过提供高达1亿美元的签约奖金和更高的年薪挖走OpenAI员工 [1] - OpenAI首席执行官表示Meta将OpenAI视为最大竞争对手 但OpenAI最优秀人才尚未接受Meta邀请 [1] - Meta首席执行官亲自组建顶级人工智能团队 并在人工智能领域投入大量资金 [1] 高管变动与收购 - Scale AI创始人将离职加入Meta 这是Meta以143亿美元收购该公司49%股份交易的一部分 [2] - 作为协议的一部分 Scale AI少数员工也将加入Meta [2] - 前Scale AI创始人将领导Meta研究"超级智能"人工智能系统 [2] 行业竞争态势 - Meta近期还挖走了谷歌DeepMind首席研究员等顶尖人才 [2] - 扎克伯格直接参与了Meta的招聘工作 [2] - 人工智能领域创新速度加快 导致企业对顶尖人才的争夺压力与日俱增 [2]
Meta(META.US)天价挖角OpenAI 曝单笔签约奖金高达1亿美元
智通财经· 2025-06-18 15:03
人才争夺战 - Meta Platforms(META US)试图以高达1亿美元的签约奖金和更高金额的年度薪酬方案挖角OpenAI员工[1] - 截至目前OpenAI最核心团队成员尚未有人接受Meta的邀约[1] - Meta首席执行官亲自牵头为"超级智能"AI实验室组建顶尖团队并通过Meta AI研究部门重金投入AI领域[1] - Meta近期挖走谷歌DeepMind实验室首席研究员Jack Rae等顶尖人才且扎克伯格直接参与招聘工作[2] - OpenAI首席执行官认为Meta的高额预付保底薪酬策略会让团队偏离实际工作重心且无法构建获胜的企业文化[2] 战略布局 - Meta以143亿美元收购AI初创公司Scale AI 49%的股份其创始人Alexandr Wang加盟Meta并领导"超级智能"研究实验室[2] - 根据协议一小部分Scale AI员工也将加入Meta[2] - OpenAI上月以64亿美元全股权交易收购苹果前首席设计师Jony Ive的AI设备初创公司io随后Ive加入OpenAI[2] 技术进展 - Meta近期再次推迟最新旗舰AI模型的发布计划因对模型性能的担忧[1] - 部分科技分析师认为Meta为开源AI开发搭建了底层框架当前AI领域的诸多进展都基于其技术生态[3] - Meta对Scale AI等企业的巨额投资将持续推动其在超大规模模型训练领域的进展[3] 行业竞争 - OpenAI首席执行官透露Meta将OpenAI视为最大竞争对手[1] - Meta当前的AI项目进展未达预期但OpenAI尊重其积极尝试新策略的态度[1] - 开源特性已促使众多第三方应用基于Llama架构开发[3]
开源模型竟被用于窃取下游微调数据?清华团队揭秘开源微调范式新型隐藏安全风险
机器之心· 2025-05-27 17:54
研究背景 - 基于开源模型微调的范式已成为大型语言模型发展的基础,推动其在科研和工业界的广泛应用[5] - 研究揭示该范式中存在此前未被认识到的安全漏洞:开源模型开发者可通过后门注入方式提取下游私有微调数据[5] - 与传统模型蒸馏不同,该后门机制可恢复微调过程中使用的查询语句,这些查询通常包含专有内容或用户特定提示语[5] 方法概览 - 后门攻击实现的关键原因是在微调过程中对训练查询计算损失,这是某些开源大语言模型后训练框架的默认设置[6] - 团队提出两种后门训练方案:基于SFT的方案通过构造特殊数据对增强模型遵循抽取指令能力[7],基于GRPO的方案通过强化学习进一步提升抽取性能[8] - 在抽取阶段采用打分机制识别真实出现的开头词,依据模型拒绝回复的可能性和重复输出频率进行判断[9][10] 实验结果 - 在Dolly数据集测试中,Qwen2 5-32B模型经过SFT训练后Match Ratio均值达49 2%,Max@10达81 3%[14] - 在Finance数据集上,Qwen2 5-32B模型召回率最高达76 3%,精准度在使用50个开头词时超60%[16][17] - 开头词信息已知情况下,完整query召回率可提升至94 9%[16][19] - 后门训练未对模型通用性能产生负面影响,AlpacaEval2和MMLU测试结果保持稳定[12][14] 技术原理 - 后门训练使模型输出分布与实际训练分布匹配度显著提升,KL散度从0 61降至0 11[17] - 通过分析输出分布发现,模型能准确捕捉训练查询中开头词的实际分布特征[17] 防御探讨 - 基于检测的防御手段通过尝试不同抽取指令来识别后门训练,但对乱码指令完全失效[20] - 实验显示当使用乱码抽取指令时,Match Ratio均值从29 8%降至11 2%[20] 研究意义 - 该工作揭示了开源模型微调范式的新型安全风险,具有较大危害性且难以检测[1][5] - 研究启发了后续在攻击防御、数据筛选机制、可控性增强等方面的探索方向[22]
明略科技宣布与Dify达成生态合作 推动企业级AI Agent应用落地
环球网· 2025-05-23 11:45
资料显示,Dify作为一款开源的大语言模型(LLM) 应用开发平台,融合了"后端即服务"(Backend as Service)和"LLMOps"理念,为开发者及企业用户提供了构建 LLM 应用所需的关键技术栈,包括对全 球1000+大语言模型的支持、直观的Prompt编排界面、高质量的RAG引擎、稳健的Agent框架、灵活的 流程编排,并同时提供了一套易用的界面和API。 明略科技副总裁杨威表示:"企业级Agent技术正在从试验阶段迈向生产力阶段,逐渐成为智能化转型的 核心驱动力。通过本次合作,明略科技将与Dify平台形成协同互补,为企业客户提供从应用构建到落地 部署的一站式解决方案,帮助企业解决生成式AI应用投入生产的实际痛点。在复杂业务场景中,我们 将共同致力于优化企业级Agent的可用性、适配性与实用性,推动其深度融入企业核心系统,并为企业 进入AGI时代铺设重要入口。" 此外,依托自身在多模态数据集成、企业知识图谱及数据隐私保护方面的技术积淀和服务经验,明略科 技称将在与Dify的合作基础上提供更丰富的技术服务,以适配企业发展需要。如通过自研的MoE(混合 专家模型)架构,明略科技能够为不同领域动态 ...
2025年4月社消零售数据点评:金银珠宝销售加速增长,国补品类持续高增
光大证券· 2025-05-19 23:25
报告行业投资评级 - 批发和零售贸易行业投资评级为买入(维持) [6] 报告的核心观点 - 2025年4月社消零售总额整体表现稳健,必选品中粮油食品品类表现突出,可选品中金银珠宝类同比增速高,国补相关品类延续高增态势 [5] 各部分总结 社消零售总额情况 - 2025年4月社会消费品零售总额为3.72万亿元,同比增长5.1%,增速比3月下降0.8个百分点;1 - 4月,社会消费品零售总额为16.18万亿元,同比增长4.7%,增速比上年同期上升0.6个百分点 [1] - 4月限额以上企业(单位)商品零售额为1.38万亿元,同比增长6.6%,增速比3月下降2.0个百分点 [1] CPI及必选品情况 - 2025年4月份全国CPI当月同比增速为 - 0.1%,与3月持平 [1] - 4月,粮油食品类零售额同比增长14.0%,增速较3月份上升0.2个百分点;饮料类零售额同比增长2.9%,增速较3月份下降1.5个百分点;日用品类零售额同比增长7.6%,增速较3月份下降1.2个百分点 [1] 百货行业相关类别情况 - 4月,纺织服装类零售额同比增长2.2%,增速较3月份下降1.4个百分点;化妆品类零售额同比增长7.2%,增速较3月份上升6.1个百分点 [2] 黄金珠宝行业相关类别情况 - 4月,金银珠宝类零售额同比增长25.3%,增速较3月份上升14.7个百分点 [3] 地产相关类别情况 - 4月,家用电器类零售额同比增长38.8%,增速较3月份上升3.7个百分点;家具类零售额同比增长26.9%,增速较3月份下降2.6个百分点;建筑及装潢材料类零售额同比增长9.7%,增速较3月份上升9.8个百分点 [4] 其他类别情况 - 4月,烟酒类零售额同比增长4.0%,增速较3月份下降4.5个百分点;通讯器材类零售额同比增长19.9%,增速较3月份下降8.7个百分点;文化办公用品类零售额同比增长33.5%,增速较3月份上升12.0个百分点;中西药品类零售额同比增长2.6%,增速较3月份上升1.2个百分点;体育、娱乐用品类零售额同比增长23.3%,增速较3月份下降2.9个百分点 [4] 电商近期重要事件 - 美团将在未来几个月内将旗下外卖服务Keeta引入巴西,并计划5年内在巴西投入10亿美元;5月16日,全国近万家数码家电品牌实体门店联合美团闪购启动“超级国补周” [9] - 阿里巴巴2025财年实现营业收入9963.47亿元,同比增长5.9%,净利润等指标也有增长;4月29日,阿里巴巴发布开源大语言模型家族最新成员Qwen3 [10] - 拼多多旗下“多多买菜快递代收业务”更名为“拼多多驿站”,新增24小时自助取件功能和送货上门服务,已覆盖多个省市地区 [11] - 市场监管总局等部门约谈京东等平台企业;5月17日,京东MALL武汉光谷广场店试营业,面积超3万方 [12]