昇思AI框架

搜索文档
任正非:干就完了!
国芯网· 2025-06-10 18:42
芯片发展 - 中国在中低端芯片领域具备发展机会,化合物半导体领域潜力更大 [3] - 单芯片性能仍落后美国一代,但通过数学补物理、群计算补单芯片等方法可达到实用水平 [3] - 软件领域不受限制,未来将出现数百种操作系统支持各行业进步 [3] - 昇腾芯片被夸大实际水平,需持续努力才能达到外界评价 [3] 基础研究投入 - 基础理论研究周期需10-20年,是技术突破的核心根基 [4] - 公司年研发投入1800亿元,其中600亿元用于不考核的基础理论研究 [4] - 缺乏基础研究将导致技术无根,需通过自主投入替代国外高价产品 [4] - 已推进"根技术"和操作系统创新,构建鲲鹏、昇腾等计算产业生态 [4][5] 人工智能前景 - 人工智能是可能持续数百年的人类社会最后一次技术革命 [6] - 中国优势包括数亿青少年人才、发达电力与通信网络、东数西算战略 [6] - 充足电力和信息网络是技术发展关键,国内基础设施全球领先 [6] 技术自主化进展 - 2023年Mate60系列搭载自研芯片,2024年发布全栈自研鸿蒙操作系统 [5] - 推出鲲鹏/昇腾处理器、欧拉系统、高斯数据库等软硬件产品 [5] - 原生鸿蒙系统实现操作系统核心技术自主可控 [5]
任正非最新发声:干就完了
天天基金网· 2025-06-10 13:02
芯片技术 - 中国在中低端芯片领域存在发展机会,化合物半导体领域机会更大 [3] - 单芯片技术仍落后美国一代,但通过数学补物理、群计算补单芯片等方法可达到实用水平 [3] - 软件领域不受限制,未来将出现数百至数千种操作系统支持各行业发展 [3] - 昇腾芯片被警告的影响被美国夸大,公司实际技术实力尚未达到外界评价高度 [3] 基础研究 - 基础理论研究需10-20年甚至更长时间投入,是技术突破的核心根基 [5] - 公司年研发投入1800亿元,其中600亿元用于非考核性质的基础理论研究 [5] - 通过鲲鹏处理器、昇腾处理器、欧拉操作系统等构建全栈自研技术生态 [6] - 鸿蒙操作系统HarmonyOS NEXT实现全栈自研,核心技术自主可控 [5] 人工智能 - 人工智能可能是人类社会最后一次技术革命,发展周期将达数十年至数百年 [8] - 中国在电力供应(发电量占全球30%)、通信网络(5G基站超300万座)等领域具备发展AI的基建优势 [8] - 东数西算工程为AI算力需求提供战略支撑 [8] 行业生态 - 通过开源操作系统、数据库及AI框架(如高斯数据库、昇思框架)推动产业协同创新 [6] - 化合物半导体技术路线被明确为差异化突破方向 [3] - 操作系统领域未来将呈现高度多元化格局,支持工业/农业/医疗等垂直场景 [3]
腾讯、华为、微软、阿里专家齐聚一堂,共谈推理优化实践 | AICon
AI前线· 2025-04-23 15:28
大模型推理性能优化技术方向 - 大模型推理性能优化围绕模型优化、推理加速与工程优化三大方向展开 [3] - 模型优化手段包括量化、剪枝与蒸馏,例如DeepSeek-R1-Distill-Qwen-32B通过蒸馏策略显著压缩资源开销 [4] - 推理加速依赖SGLang、vLLM等高效引擎提升生成速度与系统吞吐能力 [4] - 工程优化需结合业务场景规划并发策略与GPU配置,构建高可用推理服务体系 [4] 腾讯混元AngelHCF框架实践 - 腾讯推理架构师向乾彪将分享混元大语言模型的推理加速框架AngelHCF [5] - AngelHCF在算子设计、通信优化、架构调整方面取得显著成本与性能优势 [6] - 关键技术包括混元Turbos Hybrid推理优化、Mamba Hybrid模型结构创新 [6] - 通过Kernel/显存/KVCache优化降低资源消耗,并采用超大规模MoE模型并行策略缓解通信瓶颈 [6][7] - 智能调度与计算通信重叠策略确保大规模推理环境高效运行 [7] 华为昇腾推理技术优化 - 华为昇思AI框架开发者张君将探讨大模型推理加速的算子融合、量化及Attention容量压缩技术 [9] - 通过昇腾硬件加速库ATB、图编译技术TorchAir实现模型层/框架层/算子层协同优化 [10] - 动态批处理技术与前沿融合算子设计最大化硬件资源效率 [10] 微软KV缓存长文本优化 - 微软姜慧强聚焦KV缓存优化,解决长文本推理的计算与内存压力 [13][14] - 围绕KV缓存生成、压缩、检索环节优化,并引入SCBench基准测试工具对比性能 [14] - 对比主流LLM供应商的KV缓存技术差异,展望长文本推理未来方向 [15] 阿里云跨层优化实践 - 阿里云李元龙分享从Transformer前向传播到硬件加速的全链路优化 [17] - 整合PyTorch动态图编译、算子优化与CUDA并行计算策略 [17] - 采用动态计算图与稀疏激活模式突破算力瓶颈 [18] AICon大会其他亮点 - 活动涵盖多模态、Agent、端侧智能等前沿技术 [23] - 包括AI原生产品落地、多领域Agent应用、硬件终端创新及多模态大模型实践 [24][25][26] - 50+行业专家解析大模型最新进展 [27]