Workflow
华为盘古大模型
icon
搜索文档
数智赋能:建筑地产行业的转型突围与未来筑造
机器之心· 2025-09-24 15:48
行业趋势与转型动力 - 建筑地产行业作为全球经济核心支柱 在供应链重组和人口流动红利推动下展现出强劲韧性 为核心区域注入持续开发需求[1] - 人口结构变迁与远程办公浪潮正在重塑住宅 商业和城市建设需求格局[1] - ESG理念推动绿色发展成为行业共识 数字化转型成为企业激活运营创新和提升竞争力的关键引擎[1] 产品力与价值链重塑 - 全球对高品质生活追求推动"好房子 好小区 好社区 好城区"需求升级 驱动企业将产品力作为核心竞争力[4] - 制造业"研产供销服"全生命周期管理经验为行业"投融建管营"全链条优化提供关键范本[4] - 华为凭借对好产品的深刻理解和自身数字化实践 成为行业转型重要伙伴[4] - 中国建筑科学研究院与华为合作 从顶层规划 大数据平台到"一网一云"建设 深化行业级垂直产品合作[4] - 联发集团借助华为数字化能力打造"新青年好房子"系列 通过"1+2+3*N"数智蓝图实现模式创新[4] 数智化技术应用 - 数智化技术实现"投融建管营"全流程效率革命与质量升级[5][6] - 中指研究院预测AI赋能将从工具辅助升级为全产业链智能决策 未来竞争焦点转向空间与资产运营能力[6] - 设计端大模型技术重构创意与审查逻辑 华为昇腾算力与构力科技推出"知识驱动的审图智能体"提升审查效率[6] - 运营端深圳明源云与华为共建"业务-数据-AI"三层平台 支撑四大AI场景落地[8] - 设计与建造端数字孪生与AI技术释放数据潜能 万翼科技图云接入华为盘古大模型实现图纸全生命周期协同[8] - 斗拱BIM智能建模软件结合华为工业软件能力加快建筑软件研发进程[8] - AI智工管理平台集成鸿蒙物联网管理平台 构建"自主创新+生态系统"研发与应用体系[8] 空间价值重构 - 华为全屋光网与全屋智能将家庭打造成高速互联 场景随心的智能空间[8] - 设施云为楼宇降本节能 智慧园区以"数字大脑"实现运营可视可控[8] - 从房间到城区的全尺度空间都因数智技术焕发新活力[8] 行业未来展望 - 数智化是建筑地产转型必由之路 更是实现绿色低碳与高质量发展的核心支撑[9][10] - 华为将持续以数智技术为笔 生态协同为墨 与客户共绘行业转型蓝图[10]
深圳:探路者 | 《财经》封面
财经网· 2025-08-18 20:08
深圳经济发展成就 - 2024年上半年深圳GDP达到18322.26亿元,同比增长5.1% [1] - 1980年至2024年GDP从2.7亿元增长至近4万亿元,45年间增长超1.3万倍 [6] - 连续两年位居"中国城市95后人才吸引力排名"榜首 [22] 产业创新与集群发展 - 2022年发布"20+8"产业集群政策,布局20个战略性新兴产业集群和8个未来产业 [13] - 人工智能产业规模达3600亿元,企业超2800家,综合实力处于全国第一梯队 [23] - 机器人产业集群2024年增加值53.28亿元,同比增长15.9%;2025年一季度增加值14.21亿元,同比增长38% [24] - 新能源汽车产业链企业数量全国占比超30% [16] 科技创新能力建设 - 全社会研发投入从2020年1510.8亿元增至2023年2236.6亿元,年均增长13.9% [22] - 国家高新技术企业突破2.5万家,企业研发投入占全社会研发投入比重超90% [8] - 累计发布近200个"城市+AI"应用场景,涵盖城市治理、公共服务等领域 [15] 企业生态与产业链优势 - 形成以华为、腾讯等龙头企业引领的"雁阵式"企业梯队 [23] - 在机器人领域实现全产业链覆盖,汇川技术伺服系统国内市场份额第一,越疆协作机器人全球出货量第二 [25] - 私募股权创投基金投资项目超2万个,在投本金超9700亿元 [29] 区域合作与开放发展 - 粤港澳大湾区应用场景创新推进会发布67个需求场景和140项能力清单 [12] - 深圳东莞地铁互联互通标志大湾区一体化进程加速 [4] - 广东省政府将20项省级行政职权调整由深圳市实施 [31] 改革政策支持 - 中央发布《关于深入推进深圳综合改革试点深化改革创新扩大开放的意见》 [3] - 政策要求破解教育科技人才体制机制障碍,强化创新链产业链资金链人才链深度融合 [2] - 支持建设现代化国际化创新型城市,拓展粤港澳合作新途径 [27]
国泰海通|产业:华为盘古大模型与昇腾AI计算平台,共同构建软硬一体的AI技术体系
华为AI发展战略 - 公司正通过从大模型设计到基础设施的软硬协同,构建全栈AI竞争力,策略从对标业界SOTA模型转向为自研昇腾硬件量身定制模型架构[1] - 双向协同进化路径旨在解决AI模型规模化应用中的系统性问题,构建由软硬件协同架构、算子与软件栈构成的全栈技术体系[1] 盘古大模型技术突破 - 盘古大模型核心为解决大规模分布式系统效率难题,聚焦混合专家(MoE)稀疏架构中的专家负载不均衡问题[1] - 公司创新方向从单纯硬件或算法问题拓展至在自研硬件上高效解决AI系统工程问题[1] 大模型创新路径 - Pangu Pro MoE采用分组专家混合(MoGE)架构,通过结构性设计解决负载不均衡问题[2] - Pangu Ultra MoE通过系统级优化和仿真先行设计方法适配昇腾硬件,实现训练与推理的协同优化[2] AI基础设施CloudMatrix - CloudMatrix以统一总线(UB)网络为核心技术,构建统一寻址的分布式高速内存池,降低跨节点通信性能差异[2] - 硬件发展为上层PDC分离架构等软件创新提供物理前提,支持大规模专家并行(LEP)和AIV-Direct等算子级优化[2]
大模型“套壳”争议:自研与借力的边界何在?
搜狐财经· 2025-07-17 09:39
AI行业套壳与自研的争议 - 华为盘古大模型与阿里云Qwen大模型相似性引发行业对"原研"与"套壳"的辩论 [1] - 早期套壳行为表现为对ChatGPT的简单模仿 如通过API调用配中文界面在微信平台售卖会员服务 [1] - 自主研发公司普遍采用ChatGPT生成数据微调模型 利用OpenAI对齐的高质量数据成为行业公开秘密 [1] 大模型技术发展脉络 - 当前主流大模型架构均源于2017年Google Brain的Transformer 分为Decoder-only(GPT)、Encoder-Decoder(T5)和Encoder-only(BERT)三大类 [2] - ChatGPT基于GPT 3.5推出后迅速吸引数千万用户 推动GPT架构成为主流 同时催生国内山寨ChatGPT泛滥现象 [2] 套壳行为的演变与监管 - 早期低劣套壳如"ChatGPT在线"公众号被罚款6万元 成为首例行政处罚案例 [3] - 2023年部分模型仍出现"GPT味"回复 企业解释为训练数据混入ChatGPT内容或采用"数据蒸馏"技术 [3] - 字节跳动被曝使用微软OpenAI API生成训练数据 引发套壳合规性讨论 [4] 开源时代的技术争议 - Meta开源LLaMA 2后 超10款国产模型通过微调LLaMA 2上线 引发二次开发是否构成套壳的争议 [4] - 零一万物Yi-34B模型被指套壳LLaMA 但Hugging Face工程师认为其未违反开源协议 [5] - 斯坦福LLaMA3V模型被实锤抄袭面壁智能MiniCPM-LLaMA3-V 2.59 反映国产模型开始成为被套壳对象 [8] 行业对套壳的认知分歧 - 头部企业开源可减少资源浪费 百度CEO李彦宏称"重做ChatGPT无意义" [7] - 业内对道德边界存在分歧 部分认为需明确技术文档说明 法律层面仍属灰色地带 [8] - 头部企业通过开源套壳加速技术积淀 但需平衡自研与套壳的取舍 [9]
大模型套壳往事
虎嗅· 2025-07-14 17:26
文章核心观点 - 大模型行业存在"套壳"与"自研"的争议 从早期直接包装API的简单套壳 发展到利用开源架构和数据蒸馏等更复杂形式 行业在争议中推动技术迭代和应用落地 [1][12][22] - 套壳行为存在灰色地带 法律界定困难 但技术层面可通过架构标签和文档透明度进行追溯 企业宣传口径是争议焦点 [22][23][24] - 开源技术降低开发门槛 促进百模齐放 92%企业通过微调开源模型提升业务效率24%-37% 但需明确区分技术使用与原创声明 [16][17][23][24] 技术演进与套壳形式 - 早期套壳表现为直接包装ChatGPT API加价售卖 如上海熵云公司因仿冒被罚6万元 [4][5][6] - 数据蒸馏成为主流技术 用GPT-4等教师模型生成高质量数据训练学生模型 字节跳动曾因违规使用OpenAI API引发争议 [8][9][10] - 开源时代套壳争议转向架构使用 如零一万物Yi-34B被指重命名LLaMA变量 但未违反开源协议 [13][14] 行业生态与影响 - 2023-2024年百模大战中约90%模型基于开源架构微调 仅10%为基座模型 Hugging Face平台超150万个模型多为衍生版本 [16] - 轻量化微调技术(LoRA/QLoRA)降低开发成本 斯坦福团队LLaMA3V抄袭面壁智能模型事件显示国产模型亦成被套壳对象 [17][19][20] - 国内仅5家企业具备完整自研预训练框架能力 多数企业通过开源技术加速垂直领域应用落地 [22][23] 合规与道德边界 - 法律层面存在举证难点 套壳获利额度和行为性质界定模糊 处于灰色地带 [22] - 技术层面可通过架构标签追溯原创性 企业需在文档中明确开源技术使用声明 [23][24] - 行业共识强调"用开源技术不丢人 但不应宣称自研" 宣传口径是争议核心 [24]
盘古大模型与通义千问,谁抄袭了谁?
技术争议核心 - 华为盘古3.5与阿里通义千问1.5-7B模型的"指纹"相关性得分高达0.927,远高于其他主流模型间普遍低于0.1的得分 [14][15][16] - 华为回应称盘古与通义在词表和配置文件存在不同,但技术专家认为这不足以证明底层模型结构和参数不相似 [19][20] - 争议涉及AI开源生态中"复用"与"抄袭"的模糊界限,尤其在Apache 2.0开源协议下如何界定参数相似度的合规性 [28][29] 行业背景与竞争格局 - 大模型研发成本极高,华为单次有效训练成本达1200万美元,行业普遍采用基于优秀开源模型的二次开发模式 [25][26] - 阿里通义系列凭借全尺寸全功能特点在to B市场占据优势,已服务超9万家企业,80%中国科技企业使用阿里云 [27][37] - 华为将盘古模型植入HarmonyOS 4,作为其"软硬芯云"全栈生态的关键环节,尤其在国产昇腾算力上的标杆应用 [32][33] 技术生态现状 - 阿里通义模型家族已推出至少228个模型,覆盖0.5B至72B多种参数规模及文本/图像/语音/视频全模态 [44][45] - Hugging Face榜单显示排名前十的开源模型曾全部基于通义千问二次开发,反映其开源生态影响力 [26] - 行业面临技术发展快于规则制定的矛盾,需建立模型溯源标准、透明化机制以促进健康生态 [52][53][54]
【产业互联网周报】华为盘古大模型被质疑抄袭;AI人才争夺加剧,DeepSeek在海外大举招聘人才;微软被曝将“AI使用量”纳入员工考核,直接挂钩绩效;设...
钛媒体APP· 2025-07-08 11:37
华为盘古模型争议 - 华为开源盘古7B稠密和72B混合专家模型 但被质疑抄袭阿里云通义千问Qwen-2 5 14B模型 注意力参数分布相似性高达0 927 [2] - 华为声明盘古Pro MoE基于昇腾硬件平台开发 部分代码参考业界开源实践 严格遵循开源许可证 [2] - 自称华为员工发文揭露内部团队通过套壳续训阿里千问 Deepseek等竞品模型伪造技术突破 [2][3] 腾讯微信AI搜索争议 - 微信AI搜索功能被指强行开盒 点击推文中蓝色人名链接可浏览AI生成的个人简历及关联推文 [5] - 腾讯回应称AI搜索仅整合公众号及互联网公开信息 不使用用户隐私数据 [5] 百度搜索改版 - 百度搜索框支持超千字长文本输入 集成AI写作 AI画图等功能 为十年来最大改版 [6] 全球AI人才动态 - 全球AI领域Top100人才榜单中华人占主力席位 包括何恺明 张祥雨等就职于国内外企业的研究者 [7] - Meta成立超级智能实验室 引入6名OpenAI前华人员工及Scale AI前CEO等11位行业重量级人物 [28] 大模型开源与进展 - 百度开源文心大模型4 5系列 含47B 3B MoE模型等10款 预训练权重和推理代码完全开放 [15] - 智谱AI开源通用视觉推理模型GLM-4 1V-Thinking 9B参数多模态模型在18项任务中持平GPT-4o等 [10] - 马斯克旗下xAI意外曝光Grok 4模型 定位为旗舰级万能模型 同期完成100亿美元融资 [20][32] 企业级AI应用 - 钉钉多维表新增100+电商行业AI模板 支持AI生成图片 解析文件等功能 产品全面免费 [16] - 微软将AI工具使用量纳入员工考核 GitHub Copilot生成代码比例等成KPI指标 [26][30] - 苹果考虑弃用自研AI模型 转向Anthropic或OpenAI技术为Siri提供支持 [27] 机器人及硬件进展 - 字节跳动两年半量产超千台轮式物流机器人 团队从50人扩至150人 长期目标具身智能 [10] - 宇树科技完成C轮7亿元融资 投后估值120亿元 资金用于加速IPO及技术研发 [35][36] 半导体与EDA动态 - 美国取消对华EDA出口限制 西门子 新思科技 楷登电子恢复中国客户软件访问权限 [17][18] - 国产GPU公司曦望Sunrise融资10亿元 产品线含兼容CUDA生态的S2大模型推理芯片 [38] - 摩尔线程 沐曦科创板IPO获受理 拟分别募资80亿元和39 04亿元 [39] 融资与上市 - Figma提交纽交所IPO申请 2024年营收7 49亿美元 同比增长48% 亏损7 3亿美元 [31] - 云知声港交所上市 募资3 2亿港元 资金用于研发及国际市场拓展 [37] - 智谱AI获上海国资10亿元战略投资 三方合作建设AI新型基础设施 [34] 政策与行业趋势 - 前5个月中国软件业务收入55788亿元 同比增长11 2% 出口227 1亿美元增3 3% [41] - 工信部印发网络安全专项行动方案 目标为800家工业企业开展贯标达标试点 [42] - 北京发布AI+医药健康计划 探索类脑智能 DNA存储等技术在医药领域应用 [43] 海外AI动态 - 谷歌全球开放Veo3 AI视频生成模型 集成音频生成能力 质量与可控性显著提升 [21] - CoreWeave首发英伟达GB300 NVL72服务器 单机架AI性能超百亿亿次浮点运算 [22] - 欧洲44家企业联名呼吁欧盟暂停AI法案 称模糊规则阻碍创新与国际竞争 [29]
美团、阿里外卖红包大战;首批小米YU7交付丨新鲜早科技
21世纪经济报道· 2025-07-07 10:19
外卖平台补贴大战 - 美团、淘宝闪购发放"满25减21""满25减20""满16减16"等多张大额外卖红包券 京东外卖发放1000万张"苏超外卖"专享券 [2] - 补贴导致美式咖啡不足4元且免配送费 COCO门店3.9元"奶茶三兄弟"抵用券售出超600份 社交平台出现大量"零元购"订单 [2] - 用户激增致美团服务器宕机 官方回应称因下单量突破历史峰值触发限流保护 [2] 小米汽车交付动态 - 小米YU7首交仪式在小米科技园举行 雷军亲自为车主开车门并合影 [3] - 该车型标准版/Pro版/Max版定价分别为25.35万/27.99万/32.99万 开售3分钟大定突破20万台 1小时达28.9万台 18小时锁单量突破24万台 [3] - 7月6日至7日限时开放改配服务 用户可修改车型版本或配置 改配后需重新安排生产 [3] AI技术进展 - Google推出Gemini 2.5 Flash-Lite模型 较2.0 Flash速度提升1.5倍且成本更低 支持实时处理数百页文档并生成动态摘要 [4] - 模型可跨文档分析并生成数据图表 实现复杂商业信息的可视化探索 [4] - 华为回应盘古大模型抄袭质疑 声明称严格遵循开源许可证要求 部分代码参考业界开源实践但非基于其他厂商模型增量训练 [5] 充电宝行业动态 - 3C认证充电宝销量激增 部分商家库存告急 电商平台已全面下架无认证产品 [5] - 罗马仕召回330807件问题产品 已处理79891件 安克创新完成超20万用户召回申请 寄出10万个防火安全袋 [7] - 两家企业合计召回充电宝超120万台 原因为电池混入金属异物导致过热风险 [6][7] 华为汽车业务调整 - 鸿蒙智行正由合作车企建设品牌专属销售网络 但华为仍主导销售、营销及服务体系 [8] 科技产业宏观趋势 - 专家预测AI未来十年有望为全球GDP带来7%增量 数智技术成为经济增长新引擎 [9] - 民航局成立通用航空和低空经济工作领导小组 协调跨部门发展问题 [9] 显示面板行业 - 京东方预计2024年为苹果MacBook供应51%的LCD面板 超越LG显示成为最大供应商 [10] 机器人领域融资 - 银河通用完成11亿元融资 由宁德时代及旗下资本领投 创具身大模型机器人领域单笔融资纪录 [11] - 该公司两年累计融资超24亿元 含此前7亿元天使轮和5亿元战略轮融资 [11] 机器人技术突破 - 国产"黑豹2.0"机器狗以10.3米/秒速度打破波士顿动力保持十年的8.89米/秒世界纪录 [12]
华为回应盘古大模型抄袭;DeepSeek 在海外招聘;马斯克宣布成立“美国党”,明年参加大选|AI 周报
AI前线· 2025-07-06 12:03
华为盘古模型争议 - 华为开源盘古7B稠密和72B混合专家模型后被质疑抄袭阿里云通义千问Qwen-2.5 14B模型,论文指出两者注意力参数分布相关性高达0.927 [1] - 华为诺亚方舟实验室声明盘古Pro MoE为自研基础大模型,仅参考业界开源代码实现部分组件 [2] - 诺亚方舟实验室为华为AI核心研究机构,2021年发布盘古系列预训练模型,2024年6月推出5.0版本含十亿级Pangu E至万亿级Pangu S系列 [5] AI行业人才动态 - DeepSeek在LinkedIn密集发布10个招聘岗位,含3个AGI相关职位,工作地点为北京和杭州 [6][7] - 字节多维表格AI产品负责人王翛离职创业AI硬件,其95后背景及南大/斯坦福学历受资本青睐,曾创立无代码平台明雀获数百万美元融资 [8] - 前月之暗面产品负责人明超平AI编程项目"新言意码"估值达数亿美金,红杉中国投资,较上轮翻两倍 [9] 科技巨头战略调整 - 微软年内二次裁员约9000人(占员工4%),拟将GitHub Copilot使用量纳入绩效考核以应对推广缓慢问题 [11][12] - 苹果考虑弃用自研AI模型,转向Anthropic或OpenAI技术支持Siri,或标志其生成式AI战略重大转变 [13] - AMD CEO苏姿丰获132万美元年薪+3300万美元股票奖励,任期内公司市值从20亿增至2250亿美元 [17] 硬件与供应链进展 - 美国取消对华EDA出口限制,西门子、新思科技、楷登电子恢复供货 [16] - 字节两年半量产超千台物流机器人,团队扩至150人,远期目标为具身智能 [18][19] - 罗马仕被曝全面停工停产且拖欠工资,公司回应称"未倒闭"并聚焦产业链自检 [14][15] 大模型技术突破 - MiniMax开源混合架构模型M1登全球第二,支持100万token上下文处理能力,研发成本仅53.5万美元 [24][25] - 智谱AI获浦东创投10亿战略投资,开源视觉语言模型GLM-4.1V-Thinking [27] - 百度开源文心大模型4.5系列含47B MoE等10款模型,完全开放预训练权重 [28] 新兴AI产品发布 - Cursor推出网页应用支持浏览器管理AI编码智能体网络,Pro套餐定价200美元/月 [26] - LiblibAI发布中文版"星流Agent",支持多模态生成设计物料并接入十余个大模型 [29][30] - 国脉科技推出居家养老AI智能体,采用自研轻量级协议实现智能体间直接对话 [31] 行业热点事件 - 马斯克宣布成立"美国党"并计划明年参选 [10] - xAI提前泄露Grok 4模型,基准测试HLE得分45%,融资100亿美元 [22][23] - 微信AI搜索被指泄露隐私,腾讯回应称仅整合公开信息 [20]
为什么 DeepSeek 大规模部署很便宜,本地很贵
AI前线· 2025-07-04 14:10
核心观点 - AI推理服务提供商在吞吐量和延迟之间存在基本权衡,高吞吐量通常伴随高延迟,低吞吐量则伴随低延迟[1] - 批处理大小是影响吞吐量和延迟的关键因素,大批次可提高GPU效率但增加延迟,小批次则相反[2] - 专家混合模型(如DeepSeek-V3)需要更大的批次大小才能保持GPU效率,导致更高的延迟[6] - 具有多层的大型模型需要足够大的批次以避免"管道气泡",这会显著影响吞吐量[8] - 注意力机制限制了批处理的灵活性,因为只能批量处理相同序列长度的token[9] 批处理推理机制 - GPU擅长执行大型矩阵乘法(GEMMs),批量处理多个token比逐个处理更高效[1] - 推理服务器通过将多个用户的请求堆叠成矩阵进行批量处理,显著提高GPU利用率[3] - 大批次处理减少了GPU命令开销和权重内存访问时间,这是小批次无法实现的优势[4] - 服务器设置"收集窗口"来决定批次大小,窗口时间从5毫秒到200毫秒不等[5] 专家混合模型特性 - 专家混合模型包含多个独立的前馈权重块,路由层选择子集处理每个token[6] - 这种架构导致需要执行大量小型矩阵乘法,GPU效率较低[6] - 大批次处理可确保每个专家获得足够工作量,否则吞吐量会急剧下降[12] - DeepSeek-V3作为专家混合模型,在个人使用场景效率低下,因为无法形成足够大的批次[12] 管道化与延迟问题 - 大型模型采用管道化处理,不同GPU负责不同层,需要保持连续token流[6] - "预热"和"排水"阶段导致GPU空闲,小批次会放大这种效率损失[7] - "管道气泡"发生在处理token数少于层数时,会严重影响吞吐量[8] - 消除管道气泡需要足够大的批次,这必然增加延迟[8] 注意力机制限制 - 注意力GEMMs只能批量处理相同形状的序列,限制了批处理的灵活性[9] - 解码过程中只能批量处理同一步骤的token,迫使采用短"tick"运行[9] - 不同用户的请求可以批量处理,但同一用户的token必须顺序处理[10] - 现代推理栈将注意力和FFN步骤合并成大GEMMs以提高效率[9] 行业实践观察 - OpenAI和Anthropic模型响应迅速,可能采用更高效架构或特殊优化技巧[12] - 连续批处理技术在实际中应用,但核心吞吐量-延迟权衡不变[12] - transformer模型可批量预填充长提示,这是递归模型无法实现的优势[12]