Workflow
华为盘古大模型
icon
搜索文档
国泰海通|产业:华为盘古大模型与昇腾AI计算平台,共同构建软硬一体的AI技术体系
华为AI发展战略 - 公司正通过从大模型设计到基础设施的软硬协同,构建全栈AI竞争力,策略从对标业界SOTA模型转向为自研昇腾硬件量身定制模型架构[1] - 双向协同进化路径旨在解决AI模型规模化应用中的系统性问题,构建由软硬件协同架构、算子与软件栈构成的全栈技术体系[1] 盘古大模型技术突破 - 盘古大模型核心为解决大规模分布式系统效率难题,聚焦混合专家(MoE)稀疏架构中的专家负载不均衡问题[1] - 公司创新方向从单纯硬件或算法问题拓展至在自研硬件上高效解决AI系统工程问题[1] 大模型创新路径 - Pangu Pro MoE采用分组专家混合(MoGE)架构,通过结构性设计解决负载不均衡问题[2] - Pangu Ultra MoE通过系统级优化和仿真先行设计方法适配昇腾硬件,实现训练与推理的协同优化[2] AI基础设施CloudMatrix - CloudMatrix以统一总线(UB)网络为核心技术,构建统一寻址的分布式高速内存池,降低跨节点通信性能差异[2] - 硬件发展为上层PDC分离架构等软件创新提供物理前提,支持大规模专家并行(LEP)和AIV-Direct等算子级优化[2]
大模型“套壳”争议:自研与借力的边界何在?
搜狐财经· 2025-07-17 09:39
AI行业套壳与自研的争议 - 华为盘古大模型与阿里云Qwen大模型相似性引发行业对"原研"与"套壳"的辩论 [1] - 早期套壳行为表现为对ChatGPT的简单模仿 如通过API调用配中文界面在微信平台售卖会员服务 [1] - 自主研发公司普遍采用ChatGPT生成数据微调模型 利用OpenAI对齐的高质量数据成为行业公开秘密 [1] 大模型技术发展脉络 - 当前主流大模型架构均源于2017年Google Brain的Transformer 分为Decoder-only(GPT)、Encoder-Decoder(T5)和Encoder-only(BERT)三大类 [2] - ChatGPT基于GPT 3.5推出后迅速吸引数千万用户 推动GPT架构成为主流 同时催生国内山寨ChatGPT泛滥现象 [2] 套壳行为的演变与监管 - 早期低劣套壳如"ChatGPT在线"公众号被罚款6万元 成为首例行政处罚案例 [3] - 2023年部分模型仍出现"GPT味"回复 企业解释为训练数据混入ChatGPT内容或采用"数据蒸馏"技术 [3] - 字节跳动被曝使用微软OpenAI API生成训练数据 引发套壳合规性讨论 [4] 开源时代的技术争议 - Meta开源LLaMA 2后 超10款国产模型通过微调LLaMA 2上线 引发二次开发是否构成套壳的争议 [4] - 零一万物Yi-34B模型被指套壳LLaMA 但Hugging Face工程师认为其未违反开源协议 [5] - 斯坦福LLaMA3V模型被实锤抄袭面壁智能MiniCPM-LLaMA3-V 2.59 反映国产模型开始成为被套壳对象 [8] 行业对套壳的认知分歧 - 头部企业开源可减少资源浪费 百度CEO李彦宏称"重做ChatGPT无意义" [7] - 业内对道德边界存在分歧 部分认为需明确技术文档说明 法律层面仍属灰色地带 [8] - 头部企业通过开源套壳加速技术积淀 但需平衡自研与套壳的取舍 [9]
盘古大模型与通义千问,谁抄袭了谁?
技术争议核心 - 华为盘古3.5与阿里通义千问1.5-7B模型的"指纹"相关性得分高达0.927,远高于其他主流模型间普遍低于0.1的得分 [14][15][16] - 华为回应称盘古与通义在词表和配置文件存在不同,但技术专家认为这不足以证明底层模型结构和参数不相似 [19][20] - 争议涉及AI开源生态中"复用"与"抄袭"的模糊界限,尤其在Apache 2.0开源协议下如何界定参数相似度的合规性 [28][29] 行业背景与竞争格局 - 大模型研发成本极高,华为单次有效训练成本达1200万美元,行业普遍采用基于优秀开源模型的二次开发模式 [25][26] - 阿里通义系列凭借全尺寸全功能特点在to B市场占据优势,已服务超9万家企业,80%中国科技企业使用阿里云 [27][37] - 华为将盘古模型植入HarmonyOS 4,作为其"软硬芯云"全栈生态的关键环节,尤其在国产昇腾算力上的标杆应用 [32][33] 技术生态现状 - 阿里通义模型家族已推出至少228个模型,覆盖0.5B至72B多种参数规模及文本/图像/语音/视频全模态 [44][45] - Hugging Face榜单显示排名前十的开源模型曾全部基于通义千问二次开发,反映其开源生态影响力 [26] - 行业面临技术发展快于规则制定的矛盾,需建立模型溯源标准、透明化机制以促进健康生态 [52][53][54]
【产业互联网周报】华为盘古大模型被质疑抄袭;AI人才争夺加剧,DeepSeek在海外大举招聘人才;微软被曝将“AI使用量”纳入员工考核,直接挂钩绩效;设...
钛媒体APP· 2025-07-08 11:37
华为盘古模型争议 - 华为开源盘古7B稠密和72B混合专家模型 但被质疑抄袭阿里云通义千问Qwen-2 5 14B模型 注意力参数分布相似性高达0 927 [2] - 华为声明盘古Pro MoE基于昇腾硬件平台开发 部分代码参考业界开源实践 严格遵循开源许可证 [2] - 自称华为员工发文揭露内部团队通过套壳续训阿里千问 Deepseek等竞品模型伪造技术突破 [2][3] 腾讯微信AI搜索争议 - 微信AI搜索功能被指强行开盒 点击推文中蓝色人名链接可浏览AI生成的个人简历及关联推文 [5] - 腾讯回应称AI搜索仅整合公众号及互联网公开信息 不使用用户隐私数据 [5] 百度搜索改版 - 百度搜索框支持超千字长文本输入 集成AI写作 AI画图等功能 为十年来最大改版 [6] 全球AI人才动态 - 全球AI领域Top100人才榜单中华人占主力席位 包括何恺明 张祥雨等就职于国内外企业的研究者 [7] - Meta成立超级智能实验室 引入6名OpenAI前华人员工及Scale AI前CEO等11位行业重量级人物 [28] 大模型开源与进展 - 百度开源文心大模型4 5系列 含47B 3B MoE模型等10款 预训练权重和推理代码完全开放 [15] - 智谱AI开源通用视觉推理模型GLM-4 1V-Thinking 9B参数多模态模型在18项任务中持平GPT-4o等 [10] - 马斯克旗下xAI意外曝光Grok 4模型 定位为旗舰级万能模型 同期完成100亿美元融资 [20][32] 企业级AI应用 - 钉钉多维表新增100+电商行业AI模板 支持AI生成图片 解析文件等功能 产品全面免费 [16] - 微软将AI工具使用量纳入员工考核 GitHub Copilot生成代码比例等成KPI指标 [26][30] - 苹果考虑弃用自研AI模型 转向Anthropic或OpenAI技术为Siri提供支持 [27] 机器人及硬件进展 - 字节跳动两年半量产超千台轮式物流机器人 团队从50人扩至150人 长期目标具身智能 [10] - 宇树科技完成C轮7亿元融资 投后估值120亿元 资金用于加速IPO及技术研发 [35][36] 半导体与EDA动态 - 美国取消对华EDA出口限制 西门子 新思科技 楷登电子恢复中国客户软件访问权限 [17][18] - 国产GPU公司曦望Sunrise融资10亿元 产品线含兼容CUDA生态的S2大模型推理芯片 [38] - 摩尔线程 沐曦科创板IPO获受理 拟分别募资80亿元和39 04亿元 [39] 融资与上市 - Figma提交纽交所IPO申请 2024年营收7 49亿美元 同比增长48% 亏损7 3亿美元 [31] - 云知声港交所上市 募资3 2亿港元 资金用于研发及国际市场拓展 [37] - 智谱AI获上海国资10亿元战略投资 三方合作建设AI新型基础设施 [34] 政策与行业趋势 - 前5个月中国软件业务收入55788亿元 同比增长11 2% 出口227 1亿美元增3 3% [41] - 工信部印发网络安全专项行动方案 目标为800家工业企业开展贯标达标试点 [42] - 北京发布AI+医药健康计划 探索类脑智能 DNA存储等技术在医药领域应用 [43] 海外AI动态 - 谷歌全球开放Veo3 AI视频生成模型 集成音频生成能力 质量与可控性显著提升 [21] - CoreWeave首发英伟达GB300 NVL72服务器 单机架AI性能超百亿亿次浮点运算 [22] - 欧洲44家企业联名呼吁欧盟暂停AI法案 称模糊规则阻碍创新与国际竞争 [29]
美团、阿里外卖红包大战;首批小米YU7交付丨新鲜早科技
21世纪经济报道· 2025-07-07 10:19
外卖平台补贴大战 - 美团、淘宝闪购发放"满25减21""满25减20""满16减16"等多张大额外卖红包券 京东外卖发放1000万张"苏超外卖"专享券 [2] - 补贴导致美式咖啡不足4元且免配送费 COCO门店3.9元"奶茶三兄弟"抵用券售出超600份 社交平台出现大量"零元购"订单 [2] - 用户激增致美团服务器宕机 官方回应称因下单量突破历史峰值触发限流保护 [2] 小米汽车交付动态 - 小米YU7首交仪式在小米科技园举行 雷军亲自为车主开车门并合影 [3] - 该车型标准版/Pro版/Max版定价分别为25.35万/27.99万/32.99万 开售3分钟大定突破20万台 1小时达28.9万台 18小时锁单量突破24万台 [3] - 7月6日至7日限时开放改配服务 用户可修改车型版本或配置 改配后需重新安排生产 [3] AI技术进展 - Google推出Gemini 2.5 Flash-Lite模型 较2.0 Flash速度提升1.5倍且成本更低 支持实时处理数百页文档并生成动态摘要 [4] - 模型可跨文档分析并生成数据图表 实现复杂商业信息的可视化探索 [4] - 华为回应盘古大模型抄袭质疑 声明称严格遵循开源许可证要求 部分代码参考业界开源实践但非基于其他厂商模型增量训练 [5] 充电宝行业动态 - 3C认证充电宝销量激增 部分商家库存告急 电商平台已全面下架无认证产品 [5] - 罗马仕召回330807件问题产品 已处理79891件 安克创新完成超20万用户召回申请 寄出10万个防火安全袋 [7] - 两家企业合计召回充电宝超120万台 原因为电池混入金属异物导致过热风险 [6][7] 华为汽车业务调整 - 鸿蒙智行正由合作车企建设品牌专属销售网络 但华为仍主导销售、营销及服务体系 [8] 科技产业宏观趋势 - 专家预测AI未来十年有望为全球GDP带来7%增量 数智技术成为经济增长新引擎 [9] - 民航局成立通用航空和低空经济工作领导小组 协调跨部门发展问题 [9] 显示面板行业 - 京东方预计2024年为苹果MacBook供应51%的LCD面板 超越LG显示成为最大供应商 [10] 机器人领域融资 - 银河通用完成11亿元融资 由宁德时代及旗下资本领投 创具身大模型机器人领域单笔融资纪录 [11] - 该公司两年累计融资超24亿元 含此前7亿元天使轮和5亿元战略轮融资 [11] 机器人技术突破 - 国产"黑豹2.0"机器狗以10.3米/秒速度打破波士顿动力保持十年的8.89米/秒世界纪录 [12]
华为回应盘古大模型抄袭;DeepSeek 在海外招聘;马斯克宣布成立“美国党”,明年参加大选|AI 周报
AI前线· 2025-07-06 12:03
华为盘古模型争议 - 华为开源盘古7B稠密和72B混合专家模型后被质疑抄袭阿里云通义千问Qwen-2.5 14B模型,论文指出两者注意力参数分布相关性高达0.927 [1] - 华为诺亚方舟实验室声明盘古Pro MoE为自研基础大模型,仅参考业界开源代码实现部分组件 [2] - 诺亚方舟实验室为华为AI核心研究机构,2021年发布盘古系列预训练模型,2024年6月推出5.0版本含十亿级Pangu E至万亿级Pangu S系列 [5] AI行业人才动态 - DeepSeek在LinkedIn密集发布10个招聘岗位,含3个AGI相关职位,工作地点为北京和杭州 [6][7] - 字节多维表格AI产品负责人王翛离职创业AI硬件,其95后背景及南大/斯坦福学历受资本青睐,曾创立无代码平台明雀获数百万美元融资 [8] - 前月之暗面产品负责人明超平AI编程项目"新言意码"估值达数亿美金,红杉中国投资,较上轮翻两倍 [9] 科技巨头战略调整 - 微软年内二次裁员约9000人(占员工4%),拟将GitHub Copilot使用量纳入绩效考核以应对推广缓慢问题 [11][12] - 苹果考虑弃用自研AI模型,转向Anthropic或OpenAI技术支持Siri,或标志其生成式AI战略重大转变 [13] - AMD CEO苏姿丰获132万美元年薪+3300万美元股票奖励,任期内公司市值从20亿增至2250亿美元 [17] 硬件与供应链进展 - 美国取消对华EDA出口限制,西门子、新思科技、楷登电子恢复供货 [16] - 字节两年半量产超千台物流机器人,团队扩至150人,远期目标为具身智能 [18][19] - 罗马仕被曝全面停工停产且拖欠工资,公司回应称"未倒闭"并聚焦产业链自检 [14][15] 大模型技术突破 - MiniMax开源混合架构模型M1登全球第二,支持100万token上下文处理能力,研发成本仅53.5万美元 [24][25] - 智谱AI获浦东创投10亿战略投资,开源视觉语言模型GLM-4.1V-Thinking [27] - 百度开源文心大模型4.5系列含47B MoE等10款模型,完全开放预训练权重 [28] 新兴AI产品发布 - Cursor推出网页应用支持浏览器管理AI编码智能体网络,Pro套餐定价200美元/月 [26] - LiblibAI发布中文版"星流Agent",支持多模态生成设计物料并接入十余个大模型 [29][30] - 国脉科技推出居家养老AI智能体,采用自研轻量级协议实现智能体间直接对话 [31] 行业热点事件 - 马斯克宣布成立"美国党"并计划明年参选 [10] - xAI提前泄露Grok 4模型,基准测试HLE得分45%,融资100亿美元 [22][23] - 微信AI搜索被指泄露隐私,腾讯回应称仅整合公开信息 [20]
为什么 DeepSeek 大规模部署很便宜,本地很贵
AI前线· 2025-07-04 14:10
核心观点 - AI推理服务提供商在吞吐量和延迟之间存在基本权衡,高吞吐量通常伴随高延迟,低吞吐量则伴随低延迟[1] - 批处理大小是影响吞吐量和延迟的关键因素,大批次可提高GPU效率但增加延迟,小批次则相反[2] - 专家混合模型(如DeepSeek-V3)需要更大的批次大小才能保持GPU效率,导致更高的延迟[6] - 具有多层的大型模型需要足够大的批次以避免"管道气泡",这会显著影响吞吐量[8] - 注意力机制限制了批处理的灵活性,因为只能批量处理相同序列长度的token[9] 批处理推理机制 - GPU擅长执行大型矩阵乘法(GEMMs),批量处理多个token比逐个处理更高效[1] - 推理服务器通过将多个用户的请求堆叠成矩阵进行批量处理,显著提高GPU利用率[3] - 大批次处理减少了GPU命令开销和权重内存访问时间,这是小批次无法实现的优势[4] - 服务器设置"收集窗口"来决定批次大小,窗口时间从5毫秒到200毫秒不等[5] 专家混合模型特性 - 专家混合模型包含多个独立的前馈权重块,路由层选择子集处理每个token[6] - 这种架构导致需要执行大量小型矩阵乘法,GPU效率较低[6] - 大批次处理可确保每个专家获得足够工作量,否则吞吐量会急剧下降[12] - DeepSeek-V3作为专家混合模型,在个人使用场景效率低下,因为无法形成足够大的批次[12] 管道化与延迟问题 - 大型模型采用管道化处理,不同GPU负责不同层,需要保持连续token流[6] - "预热"和"排水"阶段导致GPU空闲,小批次会放大这种效率损失[7] - "管道气泡"发生在处理token数少于层数时,会严重影响吞吐量[8] - 消除管道气泡需要足够大的批次,这必然增加延迟[8] 注意力机制限制 - 注意力GEMMs只能批量处理相同形状的序列,限制了批处理的灵活性[9] - 解码过程中只能批量处理同一步骤的token,迫使采用短"tick"运行[9] - 不同用户的请求可以批量处理,但同一用户的token必须顺序处理[10] - 现代推理栈将注意力和FFN步骤合并成大GEMMs以提高效率[9] 行业实践观察 - OpenAI和Anthropic模型响应迅速,可能采用更高效架构或特殊优化技巧[12] - 连续批处理技术在实际中应用,但核心吞吐量-延迟权衡不变[12] - transformer模型可批量预填充长提示,这是递归模型无法实现的优势[12]
全国首例!深圳龙岗智慧教育AI平台率先接入华为盘古大模型
南方都市报· 2025-07-02 16:58
华为开源大模型与教育应用 - 华为宣布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿参数的混合专家模型和基于昇腾的模型推理技术 [1] - 龙岗区教育局成为全国首个部署开源盘古大模型的政府部门,并基于其打造龙岗教育专属模型 [1][5] - 龙岗区智慧教育AI平台成为全国首个接入开源盘古大模型的应用平台 [5] 战略合作与技术选择 - 龙岗区选择华为盘古大模型与昇腾硬件,以保障教育数据安全与师生隐私 [3] - 龙岗区教育局与华为紧密合作,深度参与模型建设,融入本地教育资源和方法,打造专属大模型 [3] - 此举旨在实现从"数字化"到"智能化"的跃升,为培养未来创新型人才奠定技术基础 [3] 产教协同与模型落地 - 龙岗区教育局联合本土优质AI技术资源,多家科技企业参与开发"模型训练+应用优化"方案 [4] - 基于教师发展、学生评价等基础数据,科技企业辅助进行盘古大模型的接入与精调 [4] - 构建"1+2+1+N"支撑体系,聚焦"教、学、育、评、研、管"六大核心场景 [4] 教育场景赋能 - 盘古大模型与"龙老师"平台成为驱动教育变革的"双引擎" [6] - 赋能教师:辅助备课授课、智能批改作业、生成个性化习题、分析学情报告 [6] - 陪伴学生:升级为"一对一智能学伴",提供7x24小时答疑、个性化学习路径规划 [6] - 优化管理:通过智能分析教育大数据,为资源配置和政策制定提供决策支撑 [6] 未来展望与城市战略 - 龙岗区"All in AI"城市战略在民生领域的关键落子,推动"技术创新"与"教育应用"双向奔赴 [8] - 未来将持续探索"AI+德育""AI+心理健康"等创新应用场景 [8] - 致力于培养拥有"智能协同力"和"复杂判断力"的未来学习者 [8]
松山湖崛起科学城
经济日报· 2025-06-29 05:56
松山湖科学城发展概况 - 松山湖科学城已成长为粤港澳大湾区综合性国家科学中心先行启动区,拥有经营主体超1.7万户,聚集7家国家级制造业单项冠军、770家国家高新技术企业、64家上市及后备企业 [1] - 松山湖国际机器人产业基地孵化140余家硬科技企业,团队存活率超80%,2024年帮助近70家企业出货超18万台产品 [2] - 政府支持科技领军企业组建创新联合体,华为与东莞共建开发者村,提供核心技术底座并解决中小企业数字化转型痛点 [2] 广东科技创新与产业优势 - 广东制造业基础雄厚,拥有全国40个大类工业行业中的40个,14个国家级创新型企业集群中9个规模超万亿元 [3] - 广东新能源汽车产量占全国25%,工业机器人和智能手机产量占比超40%,低空经济产业链企业占全国30%以上,人工智能核心产业规模超2200亿元 [4] - 2024年广东智能机器人产业集群营收突破900亿元,区域创新能力全国"八连冠","深圳—香港—广州"科技集群全球创新指数五年稳居第二 [4] 创新生态与跨区域合作 - 松山湖与深圳光明科学城形成"环巍峨山"创新走廊,构建"科研攻关—技术转化—产业升级"全链条生态 [3] - 企业依托华为盘古大模型等技术底座,为东莞企业破解发展难题,例如海之晨人工智能已服务多家本地企业 [3] - 广东形成"科技强→企业强→产业强→经济强"的创新路径,高新区以1%土地贡献全省20%GDP [4]
华为云CloudRobo亮相:赋能具身智能,不做本体专注平台服务
搜狐财经· 2025-06-24 06:54
华为CloudRobo具身智能平台发布 - 华为在HDC 2025大会上发布CloudRobo具身智能平台 专注于平台搭建而将机器人实体制造留给合作伙伴 [1] - 平台深度融合华为盘古大模型 提供从数据合成到安全监管的完整流程链 [1] - 核心包含三大模型:具身多模态生成大模型 具身规划大模型 具身执行大模型 [1] 具身多模态生成大模型 - 连接数字与物理世界 为机器人提供海量多样化训练样本 [1] - 通过模拟不同光照和视角提升数据合成真实度与效率 [1] - 使机器人仅需少量实际数据即可通过生成数据高效学习 [1] 具身规划大模型 - 赋予机器人空间感知 环境理解及复杂推理能力 [2] - 能规划超过十步的复杂任务 并与执行模型配合拆解为精确指令 [2] 具身执行大模型 - 实现毫米级控制精度 已应用于工业领域精细作业 [4] - 在光纤操作演示中成功率超90% 展示全机器人化光产品组装系统 [4] 工业应用案例 - 助力埃夫特机械臂快速适应新喷涂任务 [4] - 帮助乐聚机器人在汽车制造线实现高效物流搬运 [4] - 支持优艾智合物流机器人在半导体制造中灵活调整任务规划 [4] 行业标准倡议 - 提出R2C协议 构建开放高效的机器人到云联接标准 [4] - 呼吁业界共同参与推动协议普及 促进更多机器人接入智能平台 [4]