Workflow
AMD Instinct MI300X
icon
搜索文档
AMD's AI Chips Gain Ground in Data Centers: A Sign for More Upside?
ZACKS· 2025-07-17 02:01
Key Takeaways AMD's data center revenues jumped 57.2% Y/Y in Q1 2025, driven by rising AI workload demand. Meta is deploying AMD MI300X for Llama models and collaborating on future AI chip platforms. Despite gains, AMD faces strong competition from INTC and NVDA in the data center AI chip market.Advanced Micro Devices (AMD) is strengthening its footprint in the artificial intelligence (AI) market through an expanding portfolio tailored for data center applications. The latest MI300 series accelerator fami ...
Seekr Selects Oracle Cloud Infrastructure to Deliver Trusted AI to Enterprise and Government Customers Globally
Prnewswire· 2025-06-12 20:00
公司与行业合作 - Seekr与Oracle Cloud Infrastructure (OCI)达成多年协议 加速企业AI部署并执行联合市场进入策略 [1] - Seekr利用OCI扩展多节点训练能力 用于下一代大语言模型(LLMs)和AI代理开发 优化边缘部署和视觉语言基础模型训练 [1] - OCI的AI基础设施采用AMD Instinct MI300X GPU 支持Seekr快速安全地部署透明AI代理 并通过SeekrFlow平台实现数据准备、训练和验证 [2] 技术能力与优势 - OCI专用AI基础设施帮助Seekr实现多节点训练 优化GPU使用率 加速LLMs扩展并提升全球可用性 [2] - OCI裸金属GPU实例支持自然语言处理、计算机视觉和推荐系统等高性能AI应用 提供更低价格和更灵活的技术经济性 [4] - AMD Instinct MI300X GPU为SeekrFlow平台提供端到端AI开发性能标杆 展示OCI企业级AI基础设施潜力 [3] 市场战略与客户拓展 - Seekr与OCI执行联合市场进入策略 加速产品可用性和客户增长 包括联邦政府领域 [3] - OCI工程支持团队全程协助客户 从规划到上线确保成功 [4] - Seekr专注于为卫星提供商和国家机构开发视觉语言基础模型 需大规模GPU算力处理数十年影像和传感器数据 [3] 公司背景 - Seekr是私营AI公司 提供安全可信的企业级AI软件解决方案 涵盖数据准备、领域专用LLMs和代理AI工具集 [6] - OCI提供集成应用套件和自主云基础设施 属于Oracle公司(NYSE: ORCL) [5]
超越DeepSeek?巨头们不敢说的技术暗战
36氪· 2025-04-29 08:15
DeepSeek-R1模型技术突破 - 模型性能指标与OpenAI等领军企业产品相当甚至超越 计算资源需求较同类减少30% [1] - 独创分布式训练框架和动态量化技术使单位算力推理效能提升40% [1] - 多头潜注意力机制(MLA)实现内存占用降低50% 但开发复杂度显著增加 [2] MLA技术创新与挑战 - 键值矩阵存储密度提升18-23倍 4096 tokens上下文窗口内存占用量从96GB降至7.2GB(降幅92.5%) [4][5] - 非英伟达GPU部署需手动实现37%算子级优化 工程周期平均延长2.8周 [5] - RISC-V架构处理器运行MLA时推理延迟激增300% [6] 全球AI算力发展格局 - 全球AI算力支出占比从2016年9%升至2022年18% 预计2025年达25% [9] - 2022年全球智能算力规模451EFlops首次超越基础算力(440EFlops) 同比增速94.4% [10] - GPT-4单次训练消耗超2.5万块A100 GPU 相当于1200个美国家庭年用电量 [10] 算力市场竞争态势 - 美国科技巨头2023年AI算力投入占资本开支超60% 中国2022年AI算力支出增速38% [11] - 中美欧形成三足鼎立格局(美34% 中33% 欧17%) 竞争转向生态控制 [12] - 中国国产AI芯片良率仅达国际水平60% 先进制程代工依赖构成隐忧 [13] 新一代计算基础设施需求 - 需实现即插即用式替换 开发者仅需最小化修改即可部署各类系统 [15] - 要求自适应实时性能优化 硬件能动态调整资源配置维持峰值利用率 [16] - 必须突破传统架构桎梏 构建多层次算力矩阵应对指数级增长需求 [18] 中国算力产业发展 - 2024年全国算力总规模突破280EFLOPS 智能算力占比超30% [18] - 2025年中国智能算力预计突破千亿EFLOPS 2026年实现两年翻番 [19] - 推理算力年复合增速将达训练算力四倍 推动形成三位一体算力生态 [20]