Baltra芯片
搜索文档
苹果首款AI服务器芯片曝光,联手博通
36氪· 2025-12-17 10:51
苹果AI服务器芯片开发计划 - 苹果正在开发首款代号为"Baltra"的AI服务器芯片,旨在避免从英伟达购买芯片,以控制成本[1] - 该芯片是与博通合作开发,并采用台积电3nm工艺,预计2026年量产,2027年实际部署[1] - 苹果此举被描述为“宁愿重新发明芯片,也不愿为英伟达的高额利润买单”[1] 芯片定位与架构推测 - Baltra芯片预计主要用于满足AI推理需求,而非模型训练[1][2] - 推理芯片架构更注重时延与吞吐量优化,并可能采用基于低精度运算的设计,如INT8精度[2] - 有推测认为,苹果可能不会打造大规模算力集群,而是推出类似英伟达GB300架构的产品,采用64颗芯片互连并搭配大容量高带宽LPDDR内存,以降低成本并匹配需求[2] 公司AI战略与合作 - 苹果预计不会自己训练大模型,已放弃打造内部大模型,选择每年支付约10亿美元使用谷歌定制的1.2万亿参数Gemini模型[2] - 公司是垂直集成的爱好者,倾向于将关键技术节点保留在内部,庞大的定制芯片设计项目是这一范式的例证[1] - 自主研发AI服务器芯片旨在优化其AI算法,以提升产品AI性能和能效,增强在AI领域的竞争力[7] 潜在技术方向与专利 - 苹果去年3月提交了“基于光学的分布式统一内存系统”专利,该专利涉及硅光子学计算系统[4] - 专利描述的计算系统包含多个计算芯片封装单元和内存芯片封装单元,通过光接口和内存控制器实现分布式内存的统一访问[4] - 该技术方案可能暗示了苹果未来在芯片内存架构方面的发展方向[4]
苹果自研AI芯片…带动手机、NB功能再进化 鸿海大赢家
经济日报· 2025-12-17 07:30
苹果自研AI芯片“Baltra”计划 - 苹果正与博通合作开发其首款自研AI服务器芯片“Baltra”,预计将于2027年开始部署搭载该芯片的AI服务器 [1] - “Baltra”芯片将采用台积电3纳米N3E制程,设计工作预计在约一年内完成 [1] - 该芯片主要用于满足庞大的AI推论需求,而非用于训练大型AI模型 [1] 苹果的AI模型与服务器战略 - 苹果已与Google达成协议,将部署一款经客制化、参数规模达3兆的Gemini AI模型,作为云端Apple Intelligence服务的核心 [1] - 苹果位于美国德州休士顿的工厂已于2024年10月下旬提前投产,开始生产人工智能服务器,以支持Apple Intelligence服务 [1] - 随着Apple Intelligence的AI功能通过iOS更新在iPhone等设备上日趋多元化,未来将需要更多AI服务器支持 [2] 对供应链的影响与机遇 - 鸿海集团作为苹果的主力供应商,有望从苹果自研AI芯片及服务器部署中受益 [1] - 鸿海不仅是iPhone最大组装厂,也已成为苹果云端服务器的主力供应商,掌握云端与终端两大优势,与苹果合作关系将更稳固 [2] - 鸿海集团AI服务器订单横跨英伟达GPU及ASIC服务器两大阵营,在各AI平台的市占率都超过四成 [2] 行业趋势与鸿海布局 - 鸿海董事长刘扬伟表示,集团将根据客户需求,为GPU和ASIC服务器提供对应的解决方案 [2] - 市场预估GPU与ASIC服务器的占比约为8:2,鸿海的业务也将趋近这个比率 [2] - 鸿海预计其ASIC服务器业务在2026年将维持高速或翻倍成长 [2]
腾讯研究院AI速递 20251217
腾讯研究院· 2025-12-17 00:32
苹果AI芯片战略 - 苹果正开发首款代号"Baltra"的AI服务器芯片,与博通合作开发网络技术,采用台积电3nm工艺,预计2027年部署 [1] - 苹果已放弃自建大模型,转而每年支付约10亿美元使用谷歌定制的1.2万亿参数Gemini模型,Baltra芯片主要用于满足庞大的AI推理需求 [1] - 芯片架构将注重时延与吞吐量优化,采用INT8等低精度运算,可能采用64颗芯片互连配合大容量LPDDR内存的方案 [1] 大模型技术进展 - 英伟达推出Nemotron 3系列开源模型,包含Nano、Super和Ultra三种规模,采用突破性异构混合专家架构 [2] - Nemotron 3 Nano的吞吐量比上一代高4倍,在大规模多智能体系统中实现领先的每秒生成token数,推理效率显著提升 [2] - 模型通过先进强化学习技术和大规模并行多环境后训练实现卓越准确率,并提供完整的训练数据集和强化学习库 [2] - 逆向工程发现ChatGPT记忆系统采用四层架构:会话元数据、用户记忆、近期对话摘要和滑动窗口,未使用向量数据库或RAG检索 [3] - ChatGPT通过预生成的轻量级摘要和显式保存的结构化信息实现记忆,GPT-4最大上下文窗口为128k token,超出后最前面的内容会被遗忘 [3] AI应用与内容生成 - 腾讯元宝上线写作模式,支持自动补全剧情人设大纲并一键生成成稿,单次可直出数万字文本 [4] - 元宝可在约14分钟生成约3万字,半小时写出5万字,并支持将长稿一键导出至本地文档或腾讯文档 [4] - 通义万相2.6成为国内首个支持角色扮演的视频模型,支持音画同步、多镜头生成及声音驱动 [5] - 视频生成支持15秒长视频、多镜头叙事和自然音画同步,能参考输入视频角色外观和音色实现单人、多人合拍 [5] - 图像生成升级包括艺术风格高度美学可控、真实人像质感提升、文字生成图表插画、图文混排输出和多图融合生成等功能 [6] - 字节跳动发布Seedance 1.5 pro音视频联合生成模型,支持精准音画同步、多语言方言、电影级运镜和15秒长视频生成 [7] - 模型采用MMDiT架构实现视听流精准协同,原生支持中英日韩等多语种及四川话粤语等方言,音频指令遵循处于业内头部水平 [7] 自动驾驶进展 - 工信部附条件许可长安深蓝SL03和极狐阿尔法S两款L3级自动驾驶车型,成为我国首批获准入的L3车型 [8] - 深蓝SL03可在拥堵环境下最高时速50km/h实现单车道自动驾驶,仅限重庆内环等指定路段;极狐阿尔法S最高时速80km/h,仅限北京京台高速等路段 [8] - 两家企业已完成并通过产品测试与安全评估,将在指定区域开展上路通行试点 [8] AI行业趋势与挑战 - 谷歌前CEO Eric Schmidt提出"旧金山共识",认为语言智能体与推理能力结合将趋近人类核心能力,技术融合到一定阶段会出现AI递归自我改进 [9] - 他预测AI数学家将在未来一年内出现推动新数学理论诞生,行业普遍认为这一变革在2-4年内发生 [9] - 美中AI竞争路径分化:美国聚焦超级智能研发但电力不足,中国全力推动AI商业应用落地且电力充足,两国均依赖私营部门推动发展 [9] - 多款AI模型面对六指手图像无法正确数出手指数量,暴露出当前AI在视觉推理、因果关系理解上的缺陷 [10] - 问题根源在于训练数据中"人手=五指"的强关联和Transformer架构缺乏显式结构约束,单次前向传递无法追踪状态信息 [10]
苹果2026年MacBook Pro升级计划曝光:OLED显示屏与M6芯片齐亮相
环球网· 2025-06-18 14:54
产品升级计划 - 苹果计划在2026年对MacBook Pro进行全面升级以迎接五周年纪念[1] - 2026款MacBook Pro将首次搭载OLED显示屏技术[3] - 采用与iPad Pro相同的串联OLED显示屏技术[3] - 可能取消刘海屏设计改用更小的挖孔摄像头[3] - 计划引入更薄的机身设计[3] 硬件配置 - 将推出全新的M6芯片系列[3] - M6芯片基于台积电2nm工艺制造[3] - 与iPhone的A20芯片同期亮相[3] - 预计带来性能和能效的显著提升[3] - 系列可能包括M6、M6 Pro和M6 Max三个版本[4] - 提供14英寸和16英寸两种尺寸选择[4] 芯片研发进展 - 正在为智能眼镜开发定制芯片[4] - 智能眼镜芯片预计2026年底或2027年量产[4] - 与博通合作开发AI服务器芯片Baltra[4] - AI服务器芯片采用台积电N3P工艺[4] - AI服务器芯片预计2027年完工[4]