软硬件协同

搜索文档
Deepseek V3.1的UE8M0 FP8和英伟达的FP8格式有什么区别
傅里叶的猫· 2025-08-24 20:31
以下文章来源于More Than Semi ,作者猫叔 More Than Semi . More Than SEMI 半导体行业研究 这是前天的消息了,相信大家都已经看到了,Deepseek V3.1发布,引入了UE8M0 FP8,说了针对即将 发布的下一代国产芯片。 这个消息发布的时候,我们就在星球里面发了一个前一天的国产GPU纪要,根据纪要内容,也基本能 确定是哪款国产芯片了。 UE8M0 是由 Open Compute Project(OCP)提出的。OCP 是 2011 年由 Facebook(现 Meta)联合英特 尔、Rackspace 等发起的开源硬件协作计划,其成员包括微软、谷歌、亚马逊、AMD、英伟达等国外企 业,以及阿里、腾讯、百度等国内企业。2023 年,OCP 发布了《Microscaling(MX)Formats Specification v1.0》,其中定义了 MXFP8 格式,UE8M0 就是 MXFP8 路径里的 "缩放因子"。 看到这里,有些非技术出身的读者可能还是有点晕,简单总结一下就是,FP8就是8位的浮点数, UE8M0、E5M2和E4M3都是FP8的一种,目前国外 ...
抖音全新推荐大模型RankMixer,参数翻70倍,推理成本不涨
量子位· 2025-08-01 17:05
核心观点 - 字节跳动算法团队提出全新推荐排序模型架构RankMixer,通过软硬件协同设计实现模型效果与计算效率的最佳平衡 [2][40] - RankMixer-1B模型将抖音推荐精排模型的Dense参数量从16M扩大至1B量级,同时保持推理成本不变 [4][26] - 该模型在抖音主feed推荐场景全量生效,带来超过0.3%的LT30收益和超过1%的用户时长收益 [4][35] 模型架构创新 - 采用TokenMixing模块实现无参的跨特征信息交互,计算效率优于Self-Attention [17][19][20] - 引入Per-Token SparseMoE结构,通过门控机制动态激活专家网络,提升参数容量 [21][24] - 采用ReLU路由和DTSI训练策略解决MoE专家训练不均衡问题 [25] 性能优化 - 模型MFU从4.47%提升至44.57%,SM Activity从30%提升到80% [4][31] - 通过大矩阵乘法设计、算子融合、混合精度推理等手段实现FLOPs增加20倍下推理成本不变 [29][31] - 图外H2D优化降低3ms延迟,提升MFU [31] 业务效果 - 离线测试显示RankMixer-1B对比纯DNN累积AUC提升超过0.9%,UAUC超过1% [32] - 线上A/B测试显示用户日活跃天数提升0.3%,人均单日使用时长提升超过1% [35] - 低活用户群体效果提升更显著,日活跃天数最高提升1.74%,使用时长提升3.64% [37] 技术理念 - 验证推荐系统存在Scaling Law,通过扩大模型规模持续提升效果 [5][40] - 实现算法与基础设施的协同设计,充分释放GPU算力 [43] - 模型迭代从"雕花"式优化转向可扩展的架构升级 [42]
库克“发飙了”,iPhone16 Pro系列售价很给力,人人买得起了
搜狐财经· 2025-07-17 13:41
国产手机市场竞争格局 - 国产手机品牌华为、小米、OPPO、vivo集体发力,市场份额提升[1] - 苹果销量下滑,用户转向国产阵营,主要因创新不足和价格过高[1] - 苹果采取激进降价策略应对竞争,iPhone16 Pro Max降价2300元,iPhone16 Pro降价2100元[1][3][11] iPhone16 Pro系列产品策略 - iPhone16 Pro Max配备6.9英寸大屏,电池容量4676mAh,续航达一天半[4] - iPhone16 Pro屏幕升级至6.3英寸,电池容量3650mAh,适合轻度用户[7] - 两款机型差异主要在尺寸和续航,分别针对巨屏爱好者和单手操作用户[3] iPhone16 Pro系列技术升级 - A18 Pro处理器优化AI运算、能效控制和图像处理能力[6] - 超广角镜头从1200万像素升级至4800万像素,提升解析力和夜拍表现[6] - 新增独立相机控制按键,模拟传统相机快门反馈[9] - 侧边中框升级为磨砂钛金属材质,提升耐磨性和手感[9] 苹果价格策略调整 - iPhone16 Pro Max 256GB版本降价2300元,iPhone16 Pro 256GB版本降价2100元[11] - 降价幅度显著,使高端机型进入更具性价比区间[3][11] - 价格调整反映苹果应对市场竞争的战略转变[11]
首设工业软件喻家山论坛,第三届软件创新发展大会即将开幕
第一财经· 2025-06-05 13:37
武汉软件产业发展目标 - 到2030年武汉软件产业整体规模将突破8000亿元 [1][2] - 整体发展水平目标跃居全国城市第一梯队 [2] 第三届软件创新发展大会核心内容 - 大会聚焦"十五五"软件新趋势 围绕关键软件创新 AI赋能 开源生态培育 软硬件协同等热点领域 [1] - 中部六省省会城市将签署工业软件中试验证合作协议 重点覆盖航天 船舶 汽车等高端场景 [1] - 创新打造"软件市集" 采用市集化 场景化 沉浸式体验方式展示企业最新技术和产品 [1] 工业软件专项布局 - 首次设立工业软件喻家山论坛 以华中科技大学为底座构建产学研转化枢纽 [2] - 推动机器人 汽车 物联网操作系统 高性能数据库 三维CAD EDA等标志性技术突破 [2] - 强化"车谷"与"光谷"融合 加速建设智能汽车软件创新高地 [2] 行业应用拓展 - 面向医疗 教育 水务 汽车等领域推出行业专用版开源操作系统 [2] - 推动人工智能 区块链 元宇宙与实体经济深度融合 [2] 大会背景与规模 - 历年参会规模达800人左右 本届正值"十四五"收官向"十五五"过渡关键期 [2] - 重点研讨"十五五"期间软件产业机遇挑战 把握形势变化对行业的影响 [2]