Workflow
千问Qwen
icon
搜索文档
华为盘古大模型事件的“三重门”
经济观察网· 2025-07-10 06:55
经济观察报 记者 周悦 7月4日,开源社区GitHub用户HonestAGI发布研究报告称,通过一种"模型指纹"技术(分析Transformer层注意力参数的标准差分布),发现华为盘古Pro MoE 72B与阿里通义千问Qwen-2.5 14B模型的相似度高达0.927(在统计学上,完全一致为1),远超业内通常的0.7阈值。 经济观察报检索该报告引用的文献内容,发现部分文献无法在公开数据库中查验。截至发稿前,该报告已经在Github删除,HonestAGI主页无法找到。 此外,原报告发布在GitHub页面,但点赞(stars)、收藏(forks)等数据数较低;相比之下,其他具备社区共识的模型安全/评估工具如OpenLlama Eval等, 往往在发布几小时内即获得数百互动。作为对比,OpenLlama Eval点赞目前超过7500,收藏超过400。 该报告作者认为,盘古模型可能在千问模型的基础上进行了增量训练,而非完全从零训练。 事涉华为和阿里,这一报告引发关注。支持者认为,两个模型在众多注意力参数上呈现近乎一致的分布,自然发生(非人为干预)的可能性较低。质疑者则 指出,这一方法过于简化,来自Github、知 ...
华为盘古否认抄袭阿里后,其大模型员工自曝存在套壳、续训、洗水印
齐鲁晚报· 2025-07-07 11:50
华为盘古大模型开源事件 - 华为宣布开源盘古大模型核心组件Pangu Pro MoE 包括70亿参数稠密模型和720亿参数混合专家模型 宣称是构建昇腾生态的关键举措 [1] - 开源仅四天后 GitHub研究指出盘古Pro MoE与阿里通义千问Qwen-2 5 14B模型的注意力参数分布相似性高达0 927 远超业内0 7以下的正常差异范围 [1] 华为官方回应 - 华为诺亚方舟实验室声明盘古Pro MoE是基于昇腾硬件平台开发训练的基础大模型 并非基于其他厂商模型增量训练 [4] - 公司承认部分基础组件代码参考了业界开源实践 但强调严格遵循开源许可证要求并标注版权声明 [4] 内部员工爆料 - 自称盘古大模型团队员工自曝存在套壳续训洗水印现象 初期因算力有限导致效果不佳 领导层默许造假行为换取短期成果 [5] - 爆料称实际使用Qwen 1 5 110B续训而来 通过加层扩增ffn维度等操作凑够135B参数 并采取多种方法洗掉千问水印 [5] - 员工表示还套壳DeepSeekv3续训 通过冻住参数进行训练 最终因技术伦理问题选择离职曝光 [5] 事件后续 - 截至目前华为未对员工自曝内容发表声明 [6]
事关大模型,盘古团队声明
新华网财经· 2025-07-06 14:43
华为盘古开源模型与通义千问的相似性争议 - 华为宣布开源盘古70亿参数的稠密模型和盘古Pro MoE 720亿参数的混合专家模型,引发业界对盘古Pro MoE与通义千问Qwen-2 5 14B模型参数结构高度相似的热议 [1] - GitHub研究显示盘古Pro MoE与通义千问Qwen-2 5 14B在注意力参数分布上平均相关性高达0 927,远超正常范围 [1] - 诺亚方舟实验室声明盘古Pro MoE是基于昇腾硬件平台开发的基础大模型,并非基于其他厂商模型增量训练而来 [1] 模型架构与技术创新 - 业内分析认为盘古Pro MoE未直接使用通义千问的预训练权重,两者偏置数值分布存在本质差异 [2] - 盘古Pro MoE与通义千问可能在架构设计上高度一致,但大模型架构趋同是行业普遍现象 [2] - 盘古Pro MoE创新提出分组混合专家模型(MoGE)架构,解决大规模分布式训练的负载均衡难题,提升训练效率 [2] 开源实践与社区回应 - 诺亚方舟实验室承认部分基础组件代码参考业界开源实践,但严格遵循开源许可证要求并标注版权声明 [1] - 公司强调坚持开放创新,尊重第三方知识产权,倡导包容、公平、可持续的开源理念 [2] - 盘古团队感谢开发者关注,希望通过开源加速技术突破与产业落地 [3]
AI周报|华为盘古团队否认开源模型抄袭;英伟达市值逼近4万亿美元
第一财经· 2025-07-06 09:52
苹果AI战略转向 - 苹果可能放弃自研大语言模型 转而采用OpenAI的ChatGPT或Anthropic的Claude模型为Siri提供技术支持 [5] - 苹果自研模型在多轮对话、复杂逻辑推理等核心指标上与GPT-4o、Gemini存在代际差距 [5] - 原计划2026年推出的"Apple Foundation Models"驱动版Siri因技术瓶颈多次延期 [5] 华为盘古模型争议 - 华为否认盘古Pro MoE开源模型抄袭 声明称是基于昇腾硬件平台开发的基础大模型 [2] - 盘古团队承认部分基础组件代码参考了业界开源实践 但严格遵守开源许可证要求 [2] - 研究显示盘古大模型与阿里通义千问Qwen-2.5 14B模型在参数结构上存在0.927的高相关性 [2] 英伟达市值创新高 - 英伟达市值一度突破3.92万亿美元 超过苹果创下的3.915万亿美元纪录 [3] - 6月以来英伟达股价累计上涨17.92% 年初至7月3日累计上涨18.67% [3] - AI推理需求激增 tokens生成在过去一年增长50-100倍 [3] Meta人工智能布局 - Meta成立"超级智能实验室" 整合基础AI研究、大语言模型开发和AI产品团队 [4] - 新部门引入Scale AI前CEO等11位行业重量级人物 包括6名OpenAI华人员工 [4] - 扎克伯格已在人工智能领域投资143亿美元 [4] 大模型开源趋势 - 百度开源文心大模型4.5系列10款模型 包括47B、3B MoE模型和0.3B稠密型模型 [7] - 华为开源盘古70B稠密模型和720B MoE模型 [7] - 阿里、腾讯等也已通过开源大模型布局AI生态 [7] xAI融资进展 - xAI完成100亿美元新一轮融资 包括50亿美元债务和50亿美元股权 [8] - 资金将用于开发全球最大数据中心之一和旗舰平台Grok [8] - xAI目前每月烧钱高达10亿美元 今年营收预计仅5亿美元 [8] AI人才争夺战 - Meta挖角OpenAI顶级研究员 开出1亿美元签约奖金 [9] - OpenAI CEO批评Meta招聘方式 称可能导致企业文化问题 [9] - 人才争夺导致研究人员薪资上涨 [9] 存储行业动态 - DDR4内存条价格近一个月上涨近一倍 16G 3200现货价涨幅超200% [13] - 原厂减产DDR4 将产能转向DDR5和HBM [13] - HBM成为SK海力士、美光、三星等存储原厂的竞争重点 [13] 英伟达GB300部署 - CoreWeave成为首家部署GB300 NVL72系统的AI云服务提供商 [14] - GB300 NVL72系统AI性能超过每秒百亿亿次浮点运算 每个机架提供40TB快速内存 [14] - Blackwell架构芯片占英伟达数据中心收入近70% [14]
华为盘古团队声明:严格遵循开源要求
观察者网· 2025-07-05 17:32
华为盘古Pro MoE大模型争议 - 公司近期发布盘古Pro MoE大模型 采用动态激活专家网络设计 实现以小打大的优异性能 [1] - 开源社区研究指出盘古Pro MoE与阿里巴巴通义千问Qwen-2 5 14B模型参数结构存在"惊人一致" [1] - 公司回应强调盘古Pro MoE是基于昇腾硬件平台开发的基础大模型 并非基于其他厂商模型增量训练 [1][2] - 公司声明该模型是全球首个面向昇腾硬件平台设计的同规格混合专家模型 [1][2] 技术创新与架构设计 - 模型创新性提出分组混合专家模型(MoGE)架构 解决大规模分布式训练的负载均衡难题 [1][2] - 该架构显著提升训练效率 具体技术特性可参考昇腾生态竞争力系列技术报告 [2] - 模型部分基础组件代码实现参考业界开源实践 但严格遵循开源许可证要求 [1][2] 开源社区与知识产权 - 公司在开源代码文件中清晰标注第三方开源代码的版权声明 [1][2] - 强调该做法符合开源社区通行惯例和协作精神 [1][2] - 公司表示始终坚持开放创新 尊重第三方知识产权 [1][2] - 提倡包容 公平 开放 团结和可持续的开源理念 [1][2] 开发者互动与产业合作 - 公司感谢全球开发者关注 重视开源社区建设性意见 [2] - 希望通过开源与合作伙伴共同优化模型能力 加速技术突破与产业落地 [2] - 邀请开发者在Ascend Tribe开源社区进行专业技术交流 [3]
网传华为盘古大模型疑似抄袭通义千问,盘古团队否认
快讯· 2025-07-04 20:02
近日,一项发布于GitHub的研究引发业界热议,该研究的作者认为,华为推出的盘古大模型(Pangu Pro MoE)与阿里巴巴发布的通义千问Qwen-2.514B模型在参数结构上存在"惊人一致"。该作者通过实证比 较,发现Pangu Pro MoE模型与Qwen-2.514B模型在注意力参数分布上的平均相关性高达0.927,远超其 他模型对比的正常范围。网友们认为,这可能意味着Pangu Pro MoE存在抄袭。据悉,盘古大模型团队 在GitHub中进行了回应,否认抄袭指控,并且认为该作者的评估方法不科学。针对此事,截止发稿前, 华为官方暂未置评。(新浪科技) ...
你的下一个AI项目灵感,藏在首届魔搭开发者大会的七大论坛里
机器之心· 2025-07-01 13:01
AI时代背景与魔搭社区发展 - 当前处于AI下半场和软件3.0时代,创造者与AI协同进化重新定义可能性[1] - 魔搭社区(ModelScope)作为开放协作平台,汇聚顶尖智慧连接开发者与用户[1] - 社区成立两年多托管开源模型超7万个增长200倍,用户达1600万增长16倍[1] - 提供全链路服务覆盖LLM、多模态等领域,成为中国最大AI开源社区[2] 技术趋势与创新方向 - 开源生态:中国企业如阿里巴巴(通义千问)推动全球开源创新,Qwen系列成为开发者首选工具之一[8][10] - 多模态与世界模型:AI实现文本/图像/音频/视频跨模态交互,世界模型理解物理规律支撑机器人/自动驾驶发展[11][13] - 边缘AI:模型压缩技术推动端侧部署,清华团队开源Megrez-3B等小模型降低云端依赖[15][17][19] - 具身智能:人形机器人结合视觉语言模型执行仓库分拣等复杂任务,强调感知与行动协同[20][21][22] 行业应用与开发者生态 - 生成式AI深度应用于科学发现(新材料/药物设计)、工程设计(3D模型优化)、软件开发(代码重构)等领域[24] - 魔搭开发者大会覆盖65个主题,吸引通义千问、Gemma等国内外顶尖团队参与[5][6][7] - 推出开发者勋章激励计划,提供免费GPU算力及训练资源促进社区创新[25][26]
赛道Hyper | 通义千问推出多模态模型Qwen VLo
华尔街见闻· 2025-07-01 10:58
阿里云市场地位 - 2024年中国AI基础设施(AI IaaS)市场份额占比23%,位列中国市场第一,超过第二名和第三名总和 [1] - 在生成式AI基础设施领域取得模型训练和模型推理市场的双项冠军 [1] Qwen VLo技术创新 - 推出多模态统一理解与生成模型Qwen VLo,具备理解和基于理解进行再创造的能力 [2] - 采用渐进式生成方式,在生成图像时逐步构建画面并不断调整优化,确保结构、色彩、语义和谐统一 [3] - 运用动态分辨率训练技术,支持任意分辨率和长宽比,打破传统模型固定尺寸限制 [3] - 提升细节捕捉能力,在生成中保持较高语义一致性,精准识别并保留关键特征 [4] - 支持自然语言指令编辑,可完成艺术风格迁移、场景元素添加等复杂操作 [4] Qwen VLo多语言与全球化 - 支持中文、英文等多种语言指令,全球用户可通过简洁描述需求生成结果 [5] - 技术手段打破语言壁垒,促进全球用户在图像生成领域的交流 [5] Qwen VLo行业应用 - 广告设计行业:快速生成多版不同构图、配色的海报草图,缩短设计周期 [5] - 包装设计:根据产品特点和目标受众生成设计图,提供创意灵感 [5] - 教育领域:将抽象知识具象化,如生成地貌图片或古诗词场景图辅助教学 [6] - 自媒体与内容创作:根据主题生成优质配图或视频分镜草图,提升创作效率 [6] - 游戏开发:生成游戏场景、角色、道具等美术素材,降低开发成本 [6] - 影视制作:生成影视场景概念图、角色概念图,为前期设计提供方向 [6]
华为、百度同日宣布大动作:开源!
第一财经· 2025-06-30 20:16
开源战略转变 - 百度开源文心大模型4.5系列10款模型,包括47B、3B MoE模型和0.3B稠密型模型,实现预训练权重和推理代码完全开源 [1] - 华为开源盘古70亿参数稠密模型、盘古Pro MoE 720亿参数模型及昇腾模型推理技术 [1] - 百度从闭源转向开源,李彦宏此前认为闭源模型更适合商业化竞争,但受DeepSeek等开源模型冲击后调整策略 [4] - 华为内部曾对开源存在争议,最终选择开源以展示昇腾算力能力并消除外界质疑 [5] 技术性能与优势 - 文心4.5系列采用多模态异构模型结构,提升多模态理解能力,在视觉常识、推理等评测中优于OpenAI o1 [5][6] - 文心4.5-21B-A3B-Base文本模型效果与同量级Qwen3相当 [6] - 盘古Pro MoE 720亿参数模型通过动态激活专家网络设计实现"以小打大",性能接近千亿级模型 [6] - 华为70亿参数稠密模型适合智能客服等场景,720亿参数MoE模型适合复杂任务 [6] 行业竞争格局 - 阿里已开源200多款模型,通义千问Qwen衍生模型超13万,全球下载量超3亿,HuggingFace占比超30% [7] - 腾讯混元开源Hunyuan-A13B MoE模型和3D生成模型 [1] - 开源成为推动AI技术进步的重要力量,DeepSeek和阿里已验证其有效性 [1] 商业价值与生态建设 - 开源可降低开发者门槛,推动AI在千行百业的应用,同时通过云服务、API等实现商业闭环 [10] - 百度华为开源意味着模型成本已大幅降低,李彦宏称大模型推理成本年降90% [10] - 华为开源旨在推动昇腾生态战略,加速AI行业应用 [10] - 阿里云CTO认为开源社区是AI产业创新的重要驱动力 [9] 挑战与未来方向 - 开源可能导致二次开发产品与公司内部业务竞争,需持续技术优化保持优势 [11] - To B项目成功关键仍是产品能力、交付能力和客户需求理解,开源非决定性因素 [12] - 百度聚焦应用落地,华为通过开源追赶英伟达CUDA生态 [11] - 行业对英伟达依赖或转向多元化选择,涉及训练和推理全链条能力重构 [11]
阿里缩减合伙人人数,AI纳入核心业务范畴
雷峰网· 2025-06-30 19:21
核心观点 - 阿里巴巴2025财年年报显示战略聚焦AI和电商,将AI增补进核心业务范畴,从"电商和云计算"变为"电商、AI+云" [2] - 公司合伙人团队精简9人,保留业务一线负责人,体现"留下有话事权的人,做更聚焦的事"的管理思路 [2][3] - AI成为业务核心驱动力,相关产品收入连续七个季度三位数增长,云业务财年营收重回双位数增幅 [6][7] - 电商业务由蒋凡全面主导,整合国内外资源并推动AI技术应用,618大促GMV同比增长10% [10][13][16] - 公司加速构建超级APP生态,整合饿了么、飞猪等业务,淘宝闪购日订单突破6000万 [17][19] 战略调整 - 年报内容减少437字,不再单独阐述"经营原则",AI被提及35次 [2][5] - 合伙人名单显示业务聚焦:云业务5人、电商2人,非核心业务仅保留3名高管 [4][20] - 放弃阿里云分拆、叫停盒马菜鸟上市,减持非核心资产累计亏损427亿元 [16] - "1+6+N"架构被打破,盒马聚焦鲜生和NB业态,大文娱更名虎鲸文娱 [20] AI业务进展 - 通义千问Qwen3模型全球评测领先,开源200多款模型下载量超3亿次 [9] - AI技术反哺电商:重构搜索推荐系统,广告推送覆盖更多场景 [10] - 云业务客户从互联网向制造业延伸,开源模型开发者优先采用阿里云产品 [6] - 未来三年重点投入基础设施、基础模型和原生应用三大领域 [9] 电商变革 - 蒋凡整合淘天集团与海外业务,速卖通实现连续六季度双位数增长 [13] - 推行"确收GMV"考核指标,1688全面入淘实现产业带直供 [16] - 用户运营双路径:88VIP高净值用户与月卡性价比用户并行 [17] - 即时零售协同效应显著,淘宝闪购零售订单同比增长179% [17] 行业竞争 - 京东拓展酒旅外卖业务促使阿里重新定义"聚焦"与"协同" [18] - 电商平台集体向超级APP转型,整合本地生活与即时配送 [19] - 行业从流量扩张转向存量深耕,竞争重点转为生态布局与用户黏性 [19]