雷峰网
搜索文档
华为发布OmniPlacement技术,实现超大规模MoE专家最优动态部署,提升昇腾推理系统吞吐10%
雷峰网· 2025-05-20 21:01
混合专家模型(MoE)技术发展 - 混合专家模型通过将输入token分配给不同专家网络实现高效扩展,显著提升大语言模型处理复杂任务的能力[2] - 当前MoE模型面临核心挑战是负载不均衡问题,表现为热专家调用频率比冷专家高出一个数量级以上[2] - 负载不均导致三大问题:计算节点成为瓶颈延长推理时间、系统吞吐量受限、资源利用率不足[2][3] 华为OmniPlacement技术创新 - 提出三层技术方案:计算均衡联合优化、层间冗余部署、近实时动态调度[4] - 核心算法通过分析专家激活数据优化部署顺序,降低负载不均现象[4] - 采用层间差异化冗余策略,高负载层分配更多冗余实例,节省显存同时提升吞吐量[4][5] - 动态调度机制实现毫秒级专家分配调整,监控与推理流程分离保障系统稳定性[6][8] 开源框架技术特性 - 开发vLLM推理优化框架Omni Placement,具备模块化架构设计[7] - 框架四大优势:兼容多种MoE架构、时延开销低于1%、模块化支持快速迭代、可扩展新算法[9] - 应用昇腾算力并整合开源最佳实践,近期将全面开源回馈社区[1][10] 实验验证效果 - 在DeepSeek-V3模型测试中,相比基线方法实现10%延迟降低和10%吞吐量提升[14] - 高并发场景下通过冗余部署和动态调度有效缓解负载瓶颈[12][14] - 系统在动态输入环境下保持稳定,未出现性能波动或中断[14] 未来技术方向 - 重点开发智能调度算法提升系统自适应能力[16] - 探索基于输入特征的自适应专家选择机制[16] - 扩展框架功能支持更多类型MoE模型[16] - 在智能客服等工业场景展现应用潜力,提升用户体验和系统吞吐[15]
曝宁德时代不希望太多散户参与IPO,更青睐机构投资者;华为首款鸿蒙折叠电脑售价超两万;美的方洪波首度回应与小米竞争,称从不加班
雷峰网· 2025-05-20 08:31
宁德时代IPO - 宁德时代赴港IPO定价每股263港元,机构投资者认购总额超500亿美元(折合3903亿港元),剔除基石部分后超额认购30倍 [4] - 散户认购超额117倍但占比固定为7.5%,公司明确倾向长线机构投资者以稳定股价,预计募资410亿港元成今年全球最大IPO之一 [4][5][6] 小米玄戒芯片研发 - 小米玄戒O1芯片采用第二代3nm工艺,累计研发投入超135亿元,团队规模达2500人,预计2024年研发投入超60亿元 [8] - 该芯片定位高端旗舰,需出货千万片摊平流片成本,将与小米15SPro手机、SUV车型YU7于5月22日同步发布 [8][9] 美的与小米竞争 - 美的董事长方洪波称战术上重视小米但战略上不惧其竞争,已研究超十万字小米报告,认为小米进军家电将打破行业固化格局 [10][11] - 方洪波否认进入汽车领域,称内部多次讨论后认为美的缺乏相关能力 [11] 华为鸿蒙电脑 - 华为发布首款鸿蒙折叠电脑MateBook Fold(起售价23999元)和MateBook Pro(7999元起),搭载HarmonyOS 5系统 [11][12] - 鸿蒙电脑研发历时5年投入上万人员,布局2700多项专利,已实现1100+外设互联和1000+生态应用适配,目标年底突破2000应用 [12][14] 蚂蚁集团国际业务 - 蚂蚁国际2024年收入近30亿美元并连续两年盈利,已设立独立董事会为分拆上市铺路,计划在香港单独IPO [14] - 该部门核心产品包括Alipay+、Antom和WorldFirst,覆盖跨境支付服务 [14] 特斯拉自动驾驶出租车 - 特斯拉奥斯汀无人出租车项目采取邀请制,初期车队规模仅10-20辆,配备大量远程操作员保障安全 [27] - 公司曾多次推迟该计划,2019年承诺的百万辆目标未兑现,近期招聘远程操作团队工程师强化控制能力 [27] 谷歌AI与Android动态 - Google I/O大会将发布Gemini新AI模型、Astra多模态AI计划及Android 16系统,后者采用Material 3设计语言并优化通知交互 [25][26] - 谷歌CEO皮查伊称AI将增强而非取代搜索,公司主导的变形金刚论文推动了当前AI革命 [28] 苹果AI本土化困境 - 美国试图阻止苹果与中国企业(字节、腾讯、百度、阿里)的AI合作,可能影响iPhone在中国市场的AI功能落地 [28] 理想汽车无障碍改造 - 理想汽车开发轮椅套件产品助残障人士用车,CEO李想称不盈利且寻求合作伙伴量产以降低成本 [23] 禾赛科技合作进展 - 禾赛科技获长城欧拉汽车下一代车型激光雷达独家定点,相关车型预计年内量产交付 [23] 零一万物业务调整 - 零一万物转向B端数字人和模型定制业务,C端产品因商业化困难被边缘化,联创谷雪梅离职创业 [16][17] 中信建投机器人行业观点 - 华为、腾讯等巨头合作机器人厂商将加速人形机器人商业化,中证科创创业机器人指数覆盖34家公司或吸引资金流入 [20][21]
华为全面揭秘超大规模MoE模型昇腾推理部署技术,国产芯片推理性能再创新高
雷峰网· 2025-05-19 20:14
行业趋势:大模型发展的重点转向推理部署 - 人工智能行业的发展重点正从模型训练开发转向推理支撑的应用落地[2] - 推理场景被视为大模型认知能力的试金石和商业化落地的核心能力[2] - 在推理为王的时代,提升推理部署计算效率是获得大模型商业成功的关键[2] 技术挑战:超大MoE模型部署面临多重难题 - DeepSeek V3作为拥有6710亿参数的混合专家架构模型,代表了软硬件协同优化的新趋势[6] - 部署完整版超大MoE模型需要硬件集群支持,不再是单机多卡或单机单卡可以运行[6] - 庞大的专家数量对硬件内存使用效率提出挑战,需要合理的分布式并行和通信策略设计[7] - 模型架构创新如多头隐式注意力机制带来了中间变量膨胀和向量计算占比增加的挑战[7] 技术优化:数学补物理提升计算效率 - 华为技术团队创造性应用数学补物理思想,通过等价数学变换提升计算效率[3][4] - 优化技术包括从点到面的推理框架侧优化、FlashComm通算优化技术、通算极致掩盖技术等[4] - 采用以加法代乘法的昇腾MLA最优实现和硬件感知亲和的大量创新算子[4] 部署方案:针对不同硬件配置的优化策略 - 针对CloudMatrix 384超节点采用大规模EP并行部署,Prefill使用16卡,Decode使用144卡[12] - 在保证50ms时延下,单卡decode吞吐达到1920 token/s[12] - 针对Atlas 800I A2服务器采用多机互联方式,使用2机16卡作为prefill示例,4机32卡作为decode示例[13] - 在100ms时延下实现单卡吞吐速度808 tokens/s[13] 核心技术创新 - 推理框架侧优化技术包括API Server扩展技术和高效的负载均衡策略[14][15] - FlashComm通信优化技术通过低比特和低维度数据通信降低通信数据量和时延[16] - 层内并行转换技术优化Prefill阶段网络MLA层的并行策略,显著降低通信时延[17] - 利用昇腾芯片的多流机制实现计算通信并发,最大化推理模型性能[17][18] 算子优化技术 - MLA算子优化针对昇腾处理器架构特性进行算法重构和硬件亲和性能优化[21] - MoE算子优化提出MoeDistributeDispatch和MoeDistributeCombine通算融合算子技术[23] - SMTurbo-CPP技术解决大通信域场景下小数据传输效率低的问题[24] - 通过细粒度分级流水算法提升集群中集合通信算子的执行效率[26] 性能表现与生态建设 - 基于CloudMatrix 384超节点的DeepSeek-R1服务在保证单用户20 TPS前提下,单卡Decode吞吐突破1920 Tokens/s[27] - 昇腾算力部署的DeepSeek-R1模型精度与官方保持一致[27] - 华为将通过技术报告和代码开源全面披露技术细节,构建开放共赢的开发者生态[5][28] - 相关核心技术代码将在不到一个月后陆续开源,体现公司坚定建设开放生态的决心[5]
增速18%背后:阿里云如何讲AI盈利故事?
雷峰网· 2025-05-19 20:14
阿里云AI业务表现与市场反应 - 阿里云2025财年Q4营收301.27亿元,同比增长18%,为三年来最快增速,主要由公共云业务(含AI产品)驱动[2] - AI相关产品收入连续七个季度保持三位数增长,全财年阿里云收入达1180亿元[2] - 公司宣布未来三年将投入超3800亿元建设云和AI硬件基础设施,但Q4 Capex环比减少22%,引发市场对投入决心的质疑[2][4] 阿里云AI战略布局 - 算力储备覆盖全球29个地域、87个可用区,新客户需求多来自推理场景,但Q1受供应链扰动和春节因素影响需求延迟[4] - 开源模型生态显著:通义系列已开源200余款模型,Qwen衍生模型超10万个,采用"先占市场再求规模效应"策略[5] - 客户结构从互联网、金融扩展至传统行业(如养殖业、制造业),且API调用客户上云比例高于行业平均水平[5][6] 市场竞争与盈利挑战 - 模型调用量增长近100倍但利润微薄,通义千问系列价格降幅达97%(如Qwen-Long输入价格从0.02元/千tokens降至0.0005元)[9][10] - DeepSeek等开源模型冲击闭源市场,导致模型训练公司需求减少,影响算力租赁业务[10] - 阿里云利润率环比下滑1.9%,当前商业模式依赖"AI带动云增长"叙事,但市场预期已超过实际变现能力[9][10] 市场预期与估值分歧 - 财报发布后股价下跌8%,反映市场对20%增长预期的落差,且资本支出(246亿)低于腾讯(270亿)[9] - 摩根士丹利认为阿里云战略完好但市场预期过高,IDC数据显示其市场份额连续三个季度回升且为国内唯一盈利云厂商[10] - AI基础设施投入周期长、回报不确定,当前股价调整被视为对盈利预期的矫正[11]
割草机玩家上演「始乱终弃」;扫地机公司机场「截胡」友商经销商;老牌3D打印公司去年营收28亿丨鲸犀情报局Vol.10
雷峰网· 2025-05-19 14:52
割草机器人行业 - 「RTK+双目」方案成为割草机行业新趋势 公司A优化该方案并投入200人团队 同时与外部协作团队B合作但最终因效率与成本问题终止合作 [1] - 公司A未采用B代工方案的另一原因是B使用大厂算法 存在潜在法律风险 [1] - 2023年全球割草机器人出货量达120万台 第一梯队富世华出货60万台 宝时得Wrox出货20万台 第二梯队九号 松灵 追觅等公司出货量在10万台级别 [5] - 科沃斯割草机在德国通过传统清洁电器渠道打开市场 Q1销售超预期并追单 [5] 扫地机行业渠道动态 - 公司C采取「一省一代理」策略 一级代理商获30-32个点返利 二级代理商仅获22个点 在无国补情况下产品难以销售 [1] - 公司D通过机场「偶遇」成功截胡友商最大出海经销商 该经销商2020年底同时经营D与友商产品 成为D出海关键转折点 [2] - 公司E曾组建50人德国工程师团队 但因文化差异与执行力问题导致效率低下 最终被友商D单人团队超越 [3] 扫地机市场竞争格局 - 公司F在美国市场表现优异 关键原因包括维持亚马逊4.3星以上评分 低于此评分转化率下降50% [3] - 公司F在2022年调整团队结构 线上团队专注美国市场 线下团队负责欧洲市场 [3] 3D打印行业 - 公司G去年营收28亿元 其中生态部门贡献10亿元 该部门产品包括耗材 配件 激光扫描仪与雕刻机 [4] - 公司G计划在香港上市 若成功将成为国内首家消费级3D打印机IPO企业 [4] - 创想三维在研发与产品定义方面落后 不愿培养人才 从DJI与拓竹挖人未果 [4] 家电与新兴科技 - 创维电视国内业务亏损 依靠国补维持 海外业务表现良好 近期收购飞利浦美国电视业务 [6] - 创维白电业务表现突出 去年白电负责人分红2000万元 集团总裁分红7000万元 [6] - 首批白牌AI拍照眼镜进入量产阶段 采用500万像素摄像头 无蓝牙功能 [6]
游戏大厂们的「产品长青」,与不得不提的「手游小年」
雷峰网· 2025-05-19 14:52
行业现状 - 中国33家手游发行商2025年4月全球收入达20亿美元,占全球发行商收入近40%份额 [5] - 当前市场主导产品为大厂长青内容型产品+大DAU产品及中小厂商平台型小游戏,新上线重磅手游表现乏力呈现"缺位"现象 [5] - 行业面临"手游小年"困境,2021-2022年立项的重度手游因版号寒冬导致开发留力,普遍呈现高开低走态势 [5] 厂商战略分化 大厂策略 - 腾讯通过《王者荣耀》(4月全球收入增长71%)和《三角洲行动》(2025Q1本土市场第六)实施"旗舰长青+潜力长青"双线战略 [6] - 网易聚焦自研出海,《漫威争锋》通过赛季更新(S2新增地图/英雄)登顶Steam畅销榜,赛季周期缩短至2个月以维持热度 [7] - 米哈游凭借《崩铁》2周年活动(新角色+营销)带动4月海外收入增长200%,整体收入提升超50%,连续登顶中日韩iOS畅销榜 [7] 中小厂商突围 - 点点互动以平台型产品《无尽冬日》和《Kingshot》实现爆发,进入总榜第二,采用"休闲副玩法+重度主玩法"融合模式吸引泛用户 [7] - 出海小游戏通过本地化素材(如卡通末日题材)吸引非传统玩家群体,依赖IAA模式实现流水,虽用户流失率高但基数庞大支撑收益 [8][9] - 海外验证产品回归国内市场预期营收可提升1-2个档次,但中小型项目因成本回收周期长(1年以上)难获大厂青睐 [9] 产品趋势 - 重度SLG面临核心"大R"用户流失,玩法创新瓶颈导致厂商转向休闲/超休闲市场获取泛用户 [8] - 模拟经营类项目出现开发困境,部分厂商陷入短期收入与品牌声誉的决策矛盾 [6] - 行业生态向长线运营倾斜,大厂强化IP产品商业化挖掘(如《原神》《崩铁》),中小厂商探索融合玩法创新 [6][7][8]
分析师道破阿里股价下跌之谜:云业务增长不及买方预期
雷峰网· 2025-05-19 08:23
阿里巴巴2025财年第四季度业绩表现 - 公司实现营收2364.54亿元人民币,同比增长7%,非公认会计准则净利润298.47亿元人民币,同比增长22% [2] - 核心电商业务和云业务是主要增长驱动力,所有分部EBITA同比改善,多项亏损业务逐步转为盈利 [2] - 尽管业绩增长,公司股价在业绩发布后暴跌,美股跌幅超7%,港股跌幅一度超6% [2] 国内电商业务表现 - 淘天集团中国零售商业板块营收同比增长8%至955.81亿元人民币,客户管理收入同比增长12% [4] - 公司调整电商业务组织架构,剔除线下零售资产,由蒋凡统管所有电商业务 [4] - 商业模式调整包括推出"全站推广"产品和收取千分之六的软件服务费 [4] - 阿里巴巴GMV占全国网上零售额比例从64%下降至49% [5] - 88VIP用户规模突破5000万,同比增长43% [6] 云业务发展 - 阿里云过去两个季度营收同比增速分别为13%和18% [9] - AI相关产品收入连续七个季度保持三位数增长,带动云业务增长 [10] - 微软Azure和其他云服务收入增长33%,其中16个百分点来自AI服务贡献 [11] - 亚马逊AWS季度营收增速放缓至17% [11] 公司战略与市场表现 - 公司提出"用户为先、AI驱动"战略,加大对价格竞争力产品供应、客户服务等领域的投资 [5] - 年初至今阿里巴巴美股上涨约46%,港股上涨约52%,远超微软31%的涨幅 [11] - 公司当前股价低于3月中旬高点,市值仅为腾讯控股的一半 [11] - 公司将继续聚焦电商和"AI+云"核心业务增长 [11]
员工买车可离职两个月?深蓝CEO回应质疑:并非借机裁员;雷军首次回应SU7事故,称要造行业同档最安全的车;曝字节跳动福利调整
雷峰网· 2025-05-19 08:23
深蓝汽车员工购车政策 - 深蓝CEO提出员工购车后可离职2个月再召回,旨在解决员工年假不足无法长途旅行的问题[4] - 该政策被质疑为变相裁员,但公司回应称是突破常规的福利尝试[4] - 公司正在研究具体实施方案,确保符合人事制度的同时满足员工需求[5] 小米汽车安全战略 - 雷军内部讲话强调小米汽车要成为同档最安全车型,远超行业平均水平[7] - 三月底的交通事故让公司意识到公众对安全性的超高期待[7] - 小米已召开多次会议系统性提升安全性能,回应公众关切[8] 京东管理层培训 - 刘强东2024年已开展1800人次管理层培训,每周至少4天[8] - 培训内容包括战略设计、业务规划等,导致声带撕裂[8] - 京东外卖业务强调食品安全,要求高管定期为孩子点外卖测试[9][10] 字节跳动福利调整 - 多地工区禁止员工打包餐食回家,防止多拿多占现象[12] - 午休政策调整:深圳工区不再允许关灯午休[12] - 折叠床使用受限,不得占用公共区域和消防通道[12] AI领域动态 - 青藤云发布全球首个L4级安全智能体「无相AI」,告警覆盖率100%,研判准确率99.99%[14] - 罗永浩被曝与百度合作AI项目,首款硬件JARVIS ONE已曝光[17][19] - 美国拟立法要求NVIDIA AI GPU内置位置追踪,可远程关闭[29][30] 特斯拉董事会变动 - 任命快餐连锁品牌奇波雷前高管杰克・哈通加入董事会[30] - 哈通将加入审计委员会,应对电动车销量下滑挑战[30] - 董事会扩容至9人,上次新增成员是2022年的爱彼迎创始人[30] 比亚迪组织调整 - 撤销王朝、海洋等五大品牌研究院,整合研发资源[21] - 腾势、方程豹公关部回归集团,成为二级部门[21] - 两位智驾技术高管离职,包括前地平线研发总监廖杰[22] 叮咚买菜战略转型 - 商品开发中心拆分为10个独立事业部,由高管直管[22] - APP改版强调品质和健康,增加AI功能[22] - 实施"4G"战略(好用户、好商品、好服务、好心智)[22] 国际科技动态 - 谷歌CEO透露曾接近收购Netflix,最终放弃[31] - 微软或将砍掉Surface Laptop Studio产品线[32] - OpenAI计划协助阿联酋建设全球最大数据中心之一[34]
吉利高层大调整:安聪慧「拿回」迟到5年的CEO
雷峰网· 2025-05-19 08:23
吉利高层人事调整 - 安聪慧升任吉利控股集团CEO,全面负责集团运营管理工作,同时仍兼任极氪科技集团CEO [5] - 李东辉卸任吉利控股集团CEO,转任副董事长,负责董事局日常工作管理和投融资管理 [5] - 淦家阅出任合并后的吉利汽车集团CEO,下设吉利银河和极氪科技事业群 [7] - 戴庆被任命为吉利控股集团轮值总裁,向安聪慧汇报 [8] 安聪慧的职业背景与能力 - 安聪慧是吉利内部培养的高管,1996年从李书福秘书起步,逐步成长为吉利二号人物 [8] - 安聪慧在内部声望极高,擅长演讲和销售,业务能力突出,以勤奋务实著称 [8] - 安聪慧曾主导成立极氪品牌,初期一肩挑研发、销售、融资等工作 [2] - 安聪慧在2020年未被选为吉利控股集团CEO后,负气创立极氪并取得显著成绩 [2][4] 吉利业务整合与战略目标 - 吉利以"一个吉利"名义整合极氪、领克、吉利品牌,目标实现降本增效 [9] - 整合后生产降本目标大于3%,研发和管理优化目标均达到10~20% [9] - 安聪慧被视为带领吉利回归"一个吉利"时代的最合适掌舵者 [10] 极氪品牌发展 - 极氪成立于2021年3月,前身为领克电动汽车事业群,首款车型极氪001脱胎于领克ZERO [2] - 安聪慧以重新创业态度经营极氪,体现吉利奋斗者文化 [2] 吉利内部管理风格 - 安聪慧推动高管"去总化",自称"聪聪",其他高管如李传海称"大海"、淦家阅称"阿甘" [3] - 吉利内部曾山头林立,需要安聪慧这样的强有力人物进行整合 [8]
安克转战UV打印机,15天众筹超2000万美金背后
雷峰网· 2025-05-16 15:31
安克的爆款法则 - 将工业级技术下放到消费级市场,用十分之一的价格做到近似性能是核心策略 [1][3] - E1 UV打印机整合平台式、卷筒式、圆柱体式打印功能,体积仅为传统设备的1/5,支持3D纹理输出 [3] - 早鸟价1699美元(约1.2万人民币),仅为传统UV打印机价格的1/10 [3] 众筹表现与营销策略 - eufyMake E1上线12小时众筹金额破千万美金,目前突破2250万美金,打破全球科技类众筹记录 [2][6] - 安克网站月访问量300万~400万人次,利用私域流量降低新品牌冷启动难度 [4] - 众筹营销总投入或达百万美元,宣传物料和视频内容制作质量顶尖 [5][4] 用户补偿与品牌切换 - 上一代3D打印机用户因多色打印功能未实现获补偿:全额退款+10%返还或600美元商店积分 [6] - 品牌从AnkerMake更名为eufyMake,团队调整后成功推出新品 [6] 赛道选择与技术转型 - 避开竞争激烈的3D打印市场(如拓竹、Xtool),选择消费级UV打印机空白领域 [8][9][10] - 原计划采用光固化技术路线,后转向FDM技术,2022年3D打印机营收达6000多万元 [10] - 技术验证发现2.5D/平面打印效果显著,促使转向UV打印机 [11] 团队与品牌整合 - 原负责人王志宇离职创业,由谢永昌和许一波接手,后者有23年酷派经验 [11] - eufyMake并入安克智能家居品牌eufy体系 [11] 市场定位与商业逻辑 - UV打印机更符合ToC逻辑,照片打印渗透率(5%-10%)高于3D打印,契合大众消费品属性 [12] - 传统UV打印机被日美企业垄断(单价1万美元起),安克切入消费端避开B端竞争 [8][9] 量产与成本挑战 - 需验证能否在1/10售价下控制成本,传统设备功能单一而E1整合多场景且分辨率达1440 DPI [14][15] - 上一代3D打印机交付问题引发对E1量产稳定性的担忧 [14]