Workflow
Open Source
icon
搜索文档
Intel (NasdaqGS:INTC) 2026 Conference Transcript
2026-02-04 02:47
涉及的行业或公司 * 英特尔公司 (Intel) [1] * 半导体制造 (Foundry) 行业 [6] * 人工智能 (AI) 行业 [23] * 半导体设备与材料行业 (如 PDF Solutions, KLA, ASML) [9][40] * 半导体设计工具 (EDA) 行业 (如 Cadence, Synopsys) [40] * 内存 (Memory) 行业 [23] * 数据中心冷却技术行业 [28] * 互连技术行业 (如 Credo Semiconductor, Astera Labs) [29] * 量子计算 (Quantum Computing) 行业 [32] * 中国科技公司 (如华为 Huawei, DeepSeek) [36][38] 核心观点和论据 **公司战略与转型** * 英特尔是一家复杂的公司,拥有战略上非常重要的晶圆代工 (Foundry) 业务和产品业务,需要平衡两者 [6][8] * 公司的目标是使代工业务成为通用代工,不仅服务于自身产品 [9] * 公司文化需要从产品创新驱动转变为同时注重服务与“苦干”(grinding),以赢得客户信任 [21] * 公司不局限于 x86 架构,也拥抱 RISC-V 和 Arm 架构,关键驱动力来自软件层,即“软件 2.0” [61] * 公司未来将同时制造 CPU 和 GPU [61][62] **技术进展与规划** * Intel 18A 制程的良率 (yield) 已实现每月提升 7%-8%,达到最佳实践水平 [9][11][12] * 公司正聚焦于更先进的 14A 制程,计划在 2028 年进行风险生产,2029 年进行量产 [12][13] * 为服务客户,公司正在完善知识产权 (IP) 库,例如为移动客户准备低功耗 IP [13] * 本月将发布 0.5 PDK,客户可使用测试芯片进行合作 [14] * 公司正在投资玻璃基板 (glass substrate) 等新材料以及必要的资本支出 (CapEx) 设备,以支持客户承诺 [19] * 公司正在投资先进封装技术,以解决瓶颈并推动系统级晶圆封装 [60] * 公司正在探索氮化镓 (gallium nitride) 等新材料,因为 CMOS 技术发展动力有所减弱 [65] **市场与客户动态** * 已有几位客户对 Intel 18A 表现出兴趣并接洽,公司期待在今年下半年获得客户关于产品与数量的量产承诺 [12][14][15][17] * 公司不会公开宣布客户信息,但将通过投资玻璃基板等举措间接表明已获得真实客户承诺 [19] * 公司要求客户将最重要产品的一部分 (5%, 10%, 20%, 50%) 交给英特尔生产,以建立信任 [21] * 几乎所有 CEO 级别的客户都在要求更多产品,公司面临的最大挑战是聚焦生产和供应链以满足需求 [27] * 信任对于 AI 和代工业务都至关重要 [22] **行业挑战与瓶颈** * AI 发展的最大挑战是内存 (Memory) 短缺,预计在 2028 年前都不会缓解 [23][24] * 计算需求激增,摩尔定律的翻倍周期从过去的 3-4 年缩短到现在的 3-4 个月 [26] * 高性能处理器 (GPU/CPU) 面临热管理和功耗限制,需要新的冷却技术,如液冷、微流体冷却、浸没式冷却 [27][28] * 互连技术正从铜转向光互连 (optical),因为速度和延迟变得非常关键 [29][30][31] * 软件,特别是集群管理软件,是另一个约束,需要从全栈 (full stack) 视角解决问题 [31][32] * 美国在基础研究方面投入不足,顶尖教授被亚洲和欧洲挖走 [35] * 美国在监管审批上耗时较长,而中国决策和执行速度更快,可能导致美国落后 [50][51] **竞争格局与地缘政治** * 中国在 AI 和半导体领域正快速追赶,DeepSeek 是一个警钟 [36] * 尽管无法获得最先进的 GPU、处理器、EDA 工具和 ASML 设备,但中国公司通过“穷人的方法”和大量工程师投入进行替代和优化 [38][40][41][43][45][47] * 华为拥有 100 名顶尖的 CPU 架构师,令英特尔 CEO 感到震惊 [38] * 如果美国不够谨慎,中国可能会实现技术跨越 (leapfrog) [40] **开源与创新生态** * 英特尔 CEO 是开源 (open source) 的坚定支持者,认为这是避免重复努力、加速成功改进的最佳方式 [31][35][54] * 美国在开源方面可能已落后于中国 [36] * 一些公司成功后从开源转向闭源,阻碍了发展 [52] * 由于训练成本高昂,纯粹的开源模式在经济上难以持续,需要新的商业模式或资助方式 [55][57] * 风险投资 (VC) 正加大对半导体和 AI 领域的投资,这对行业是积极信号 [59] **未来趋势展望** * AI 之后的下一个大浪潮是具身 AI (Physical AI),再下一个将是量子计算 (Quantum Computing) [32][34] * 企业采用 AI 时,应首先明确要解决的问题和期望的结果,并审视和更新其遗留的 IT 基础设施基础,而不是在旧系统上简单叠加 [68][69] * 尽管 AI 火热,但全球经济的生产力增长幅度仍然很小,需要更广泛地采用 AI 技术以提升生产力 [69] 其他重要内容 * 英特尔 CEO Lip-Bu Tan 加入董事会两年后,于大约 10-11 个月前决定担任 CEO 角色,认为英特尔是一家标志性公司,对美国很重要 [5] * 作为风险投资家和英特尔 CEO 的双重身份,使其能洞察新兴技术趋势 [32] * 公司刚刚聘请了首席 GPU 架构师 [61] * 公司招募了最好的首席信息官 (CIO) 来推动内部 IT 基础设施的变革 [68]
Sentient 引入 Franklin Templeton 作为战略投资方
新浪财经· 2026-01-27 04:02
公司战略合作 - Sentient公司宣布,富兰克林邓普顿已作为战略投资方参与其项目 [1] - 双方基于“AGI应采用开源、社区共建模式”的共识达成合作 [1] - 双方计划在未来数月内合作推进金融领域的高风险AI应用 [1] - 合作目标是将开源推理能力引入机构级、可投入生产的业务流程中 [1]
Hugging Face回看“DeepSeek时刻”:过去一年,中国AI如何改变全球开源格局?
硬AI· 2026-01-21 17:19
文章核心观点 - 全球最大AI开源社区Hugging Face发布文章,指出DeepSeek R-1的发布是重要分水岭,打破技术、应用与心理三重壁垒,引领中国AI全面开源,并重塑全球开源生态格局 [2][3] - 中国AI模型在Hugging Face上的下载量已超越美国,全球众多初创企业和研究人员正逐渐依赖中国开发的开源模型作为基础,中国AI已深度嵌入全球供应链 [2][3] DeepSeek时刻:打破三重壁垒 - 在DeepSeek R-1发布前,中国AI产业主要集中在闭源模型上,开源并非默认选择 [6] - R-1的真正意义在于降低了三个关键壁垒:技术壁垒、采用壁垒和心理壁垒 [7] - 技术壁垒:R-1将高级推理能力转化为可下载、可微调的工程资产,使推理表现得像一个可重用的模块 [8] - 采用壁垒:MIT许可证使得模型能迅速进入生产环境,社区讨论焦点从模型评分转向如何部署 [9] - 心理壁垒:问题从“能否做到”转变为“如何做好”,改变了公司的决策,证明在资源有限情况下通过开源和快速迭代仍可快速进步 [10] - R-1的发布使开源从战术选择转变为科技公司的长期战略,中国AI开发模式从闭源为主迅速转向开源主导 [12] 巨头入局与战略重构 - 中国AI格局形成新模式:大型科技公司带头,初创公司紧随其后,垂直行业公司也越来越多进入 [13] - 百度、字节跳动、腾讯等巨头及Moonshot等初创企业纷纷入局,导致Hugging Face排名前列的模型不再由美国开发者垄断 [13] - 百度在Hugging Face上的发布量从2024年的零增加到2025年的100多个 [15] - 字节跳动和腾讯的发布量增加了八到九倍 [15] - Moonshot发布的Kimi K2被视为“另一个DeepSeek时刻” [15] - 竞争焦点已从单一的模型性能转向生态系统建设,例如智谱AI的GLM和阿里巴巴的Qwen不仅发布模型权重,还构建工程系统和生态接口 [15] - 竞争越来越多地集中在生态系统、应用场景和基础设施上 [15] “受限下的协同”与市场主导 - 中国AI玩家的集体崛起源于在共享的技术、经济和监管压力下的对齐,而非协议协同 [17] - 在算力受限和成本控制的共同压力下,各公司在相似的技术基础和工程路径上竞争,这种同构性促进了生态系统发展 [17] - 在新建模型(<1年)中,中国模型的下载量已经超过了包括美国在内的任何其他国家 [18] - Hugging Face热图数据显示,从2025年2月到7月,中国公司的开源发布活动明显更加活跃 [18] - 中国AI产业已从模型参数竞赛,进化为更具商业落地潜力的系统级工程能力比拼 [20] 全球反应:依赖与追赶并存 - 尽管美国、法国等地机构加速推出开源模型以保持竞争力,但中国模型的影响力已渗透至底层 [21] - 全球使用开放权重模型的初创公司和研究人员,往往默认甚至依赖于中国开发的模型 [22] - 举例:2025年11月发布的美国领先开放权重模型Deep Cogito v2.1,实际上是DeepSeek-V3的微调版本 [22] - DeepSeek在东南亚和非洲等全球市场被大量采用,其多语言支持和成本优势成为企业使用的关键因素 [22] - 美国推出ATOM项目,明确引用DeepSeek和中国模型的势头作为动力,呼吁在开放权重模型开发方面进行协调努力 [22] - 世界仍在做出反应,掀起新的开源热潮,预计2026年将有更多来自中国和美国的重大发布,架构趋势和硬件选择将成为下一阶段关注焦点 [22]
裁员惹的祸?MySQL开源仓库被曝三个月无提交
36氪· 2026-01-14 20:17
MySQL开源项目开发停滞现状 - MySQL Server在GitHub的官方仓库已超过三个月无任何代码提交,最新提交记录停留在2025年9月[1] - 2025年MySQL的总提交量降至项目启动(2000-2001年)以来的最低值,远低于2019年之前的水平[5] - 自2025年9月28日起至2026年1月11日,连续17周代码提交数量为0[8] Oracle公司战略调整与团队变动 - 2025年9月,Oracle对MySQL核心开发团队实施大规模裁员,约70名资深工程师和核心开发者被裁[9] - 公司战略重心明显转移,更加专注于MySQL的专有产品线,包括企业版、分布式集群版本及云托管HeatWave服务[11] - MySQL团队已被并入Oracle HeatWave业务单元,未来开发重点转向云端分析与AI相关能力[11] 社区与行业对MySQL开源性质的质疑 - 开源仓库断更引发社区对MySQL是否仍为真正开源项目的热议[4] - 前MariaDB基金会CEO Otto Kekäläinen指出,MySQL所有开发工作几乎都在封闭环境中进行,对外部贡献者态度糟糕[14] - 尽管仍以GPL v2许可证发布,但在项目运作层面,MySQL被认为已不再是一个真正的开源项目,与MariaDB的开放开发模式形成鲜明对比[15][16] MySQL产品技术发展问题 - 自2018年发布MySQL 8.0后,长达六年没有推出真正意义上的新主版本,直到2024年发布MySQL 8.4 LTS,但被指几乎没有引入实质性新功能[17] - 在更新到较新版本后出现性能下降问题,例如在写密集型负载下,MySQL 9.5的吞吐量比8.0低约15%[17] - 小版本更新中不断引入新功能和行为变更,而非仅进行缺陷修复和安全更新,违背了用户对维护版本的长期预期[16] 市场地位与未来隐忧 - MySQL目前在DB-Engines排名中位列第二,在Stack Overflow调查中仍是使用最广泛的开源数据库之一[22] - 项目长期停滞可能迫使企业用户重新评估数据库选型,LAMP生态中大量“隐性MariaDB替代MySQL”的现象正在稀释其真实用户基础[22] - 行业观点认为,MySQL不会立即消失,但如果项目继续停滞不前,其使用量可能会下降[24]
“AI火了,我们却快完了!”顶级开源框架Tailwind之父含泪裁掉75%兄弟:半年后,这个项目可能就没了
AI前线· 2026-01-08 18:20
公司核心困境 - 公司因AI冲击导致业务模式不可持续,在一天之内裁掉了工程团队约75%的员工[2] - 创始人表示,若趋势不变,大约6个月后将无法继续支付工资,迫使公司立刻缩编[2] - 公司收入已连续多年下滑,近期预测显示收入以几乎固定的绝对值持续下滑,导致现金流预计在6个月内耗尽[14][17] 开源成功与商业失败的反差 - 公司产品Tailwind CSS是前端生态最具影响力的开源项目之一,使用量持续走高,甚至成为AI生成UI的“默认选项”[2][12] - 然而,这种“被默认使用”的成功并未转化为可持续的商业回报,反而与商业成功呈反向关系[2][3] - 尽管产品“比以往任何时候都更受欢迎”且“增长速度比历史上任何时候都更快”,但公司收入却下滑了接近80%[6] AI的双刃剑效应 - AI编程工具大规模采用Tailwind,使其使用量持续走高,但这也导致公司官方文档流量相比2023年初下滑了大约40%[6] - 文档是公司的唯一分发渠道,流量下降意味着更少的人会了解到其付费产品,使业务不可持续[5][6] - AI将Tailwind视为一套“高层语言”或“组件库”,因其清晰、可重复的模式而更擅长使用它,但这加剧了公司“开源越成功,生意越艰难”的困境[12][13][23] 裁员具体细节与团队现状 - 工程团队原本只有4名工程师,裁员75%后对应3人离职,如今只剩1名全职工程师[18] - 裁员后,整个公司只剩下“3位合伙人 + 2名员工”共5人,资源配置被压缩到极限[19][20][21] - 创始人将重新回到更偏个人贡献者的角色,亲自下场构建以维持公司生存[21] 社区争议与创始人回应 - 公司关闭了一项旨在优化文档以供大模型使用的GitHub Pull Request,该请求希望提供面向LLM优化的纯文本文档版本[4][5] - 创始人回应称,团队必须优先考虑能直接带来收入的事情以维持生存,没有时间做“不能帮我们付账单”的事情[5] - 此举在社区引发争议,被批评为只想着赚钱而非服务用户,创始人随后披露了公司的真实困境作为解释[5][6] 历史对比与行业观点 - 2020年7月,公司首个商业化产品Tailwind UI上线约5个月后,收入即将跨过200万美元,累计安装量突破1000万[10] - 行业观点认为,整个Web生态正在向Tailwind标准化,因此每个AI工具都在使用它[14] - AI并非在底层CSS上变强,而是Tailwind提供了一种AI更擅长使用的、类似自然语言的“高层语言”抽象[13]
Z Product | Product Hunt最佳产品(12.29-1.4),6 款华人AI产品上榜!“反拖延自律闹钟”榜首
Z Potentials· 2026-01-08 10:05
文章核心观点 文章总结了2025年12月29日至2026年1月4日期间Product Hunt平台上最受欢迎的十款新产品 这些产品主要聚焦于人工智能应用、生产力工具和创意软件 其中多款产品由华人团队打造 反映了当前创业生态中AI与具体场景深度结合、提升效率与创造力的趋势 [1] TOP1: Mom Clock * 产品定位为“反拖延自律闹钟”,通过强制闹钟和应用封锁来对抗拖延症,目标用户是试遍各种工具仍会拖延的知识工作者、学生和创作者 [4] * 核心功能包括不可协商的系统级硬闹钟、可设定时间段的应用自动封锁以及支持多场景的日程模板 其差异化在于像“数字版严厉家长”,通过提高拖延成本来强制用户执行预定计划 [5] * 该产品获得了538个Upvote和52条评论 [6] TOP2: BizCard * 产品定位为“无干扰电子墨水名片”,用E-ink屏实时显示个人职业信息,替代LinkedIn二维码 目标用户是频繁进行线下社交的创始人、销售、BD等人士 [9] * 核心优势在于通过常亮E-ink屏展示实时同步的在线资料,实现“一眼可视”,避免社交场合因扫码而打断对话 设计极简,专注于让交换名片动作更顺畅 [10] * 该产品由华人团队打造,首席商务官Jack Kam曾任职于百度和字节跳动 产品获得了511个Upvote和86条评论 [10][11] TOP3: Giselle * 产品定位为开源的可视化AI工作流编排平台,主打零基础设施配置,在浏览器中通过拖拽节点构建并执行复杂、多步骤的AI任务 [11] * 核心功能包括可视化节点画布、支持在同一工作流中混用OpenAI、Claude、Gemini等多方模型,以及提供长任务实时追踪和排错视图 [12][13][14] * 该产品获得了494个Upvote和137条评论 [15] TOP4: Brief My Meeting * 产品定位为开源AI助手,作为“会前自动情报官”,在会议前4小时自动生成汇总邮件、附件、历史记录和参会者背景的简报 [18] * 核心功能包括与日历和邮箱打通自动生成简报、自动补充参会者公开情报(如LinkedIn资料)以及完全开源支持自部署,注重数据隐私与合规 [19] * 该产品获得了488个Upvote和67条评论 [1][19] TOP5: Creaibo * 产品定位为“AI原生创作工作室”,专注于帮助专业内容创作者和营销团队在保持个人或品牌风格的前提下提升内容产出效率 [21] * 核心功能包括通过示例内容训练“风格指纹”以模仿用户表达、提供从选题到成稿的分步式结构化创作流程以及支持同一想法跨格式(长文、视频脚本等)生成的工作台 [22] * 该产品由华人团队打造,创始人Yiran Wang曾任职于RSS3和美团 产品获得了455个Upvote和76条评论 [22][24] TOP6: Flux * 产品定位为“消息原生AI代理平台”,允许开发者在iMessage、WhatsApp等聊天应用中部署AI代理,使其像真人联系人一样融入日常沟通 [26] * 核心优势在于让AI代理以聊天联系人形式存在,支持自定义语气和知识库以建立情感连接,并实现零代码部署到主流消息平台,降低集成门槛 [27][28] * 该产品由华人团队打造,获得了385个Upvote和54条评论 [29][32] TOP7: Foundire * 产品定位为端到端AI招聘平台,覆盖从全球人才搜索、简历评分到自适应AI面试和背景调查的全流程,目标用户是中小企业和初创公司的招聘团队 [35][36] * 核心功能包括搜索超8亿专业档案并AI评分、支持多语言和时区的自适应AI初筛面试以及为现场面试提供实时提示的“面试副驾” [37][38][39] * 该产品由华人团队打造,创始人Tan Lin有丰富的创业和投资经历 产品获得了360个Upvote和35条评论 [39][40][41] TOP8: Joodle * 产品定位为“涂鸦式日记”App,用户通过每日绘制简单涂鸦来记录生活,最终形成全年的可视化时间线网格,目标用户是想记录生活但难以坚持文字日记的人群 [43] * 核心功能包括生成每日涂鸦和全年网格“生活热力图”、支持将涂鸦以小组件形式展示在设备主屏/锁屏以及通过iCloud在多设备间同步 [44] * 该产品由华人创始人Li Yuxuan打造,获得了378个Upvote和42条评论 [45][47] TOP9: Community Figma MCP Server * 产品定位为开源桥接器,使AI代理能够通过MCP协议读写Figma设计文档,弥补了官方服务器仅支持读取的局限 [50] * 核心优势在于通过WebSocket和Figma插件架构支持调用Figma全API进行创建、编辑等写操作,并兼容ChatGPT、Claude Desktop、Cursor等多个客户端 [51][52] * 该产品完全免费开源,获得了352个Upvote和28条评论 [53][54] TOP10: Qwen-Image-2512 * 产品定位为最新的开源SOTA文本转图像模型,由阿里巴巴集团阿里云团队发布,主打大幅提升图像真实感、细节渲染和文本生成能力 [56][60] * 核心优势包括生成照片级真实感图像、渲染精细自然细节以及优异的文本渲染准确性(支持中英文),适用于电商、广告等专业场景 [57][58][59] * 该模型采用Apache 2.0许可完全开源,获得了327个Upvote和9条评论 [61]
36氪首发 | 开源异构算力调度平台「密瓜智能」获复星创富数千万元投资,为企业提供高效灵活算力解决方案
36氪· 2026-01-06 12:33
行业背景与核心问题 - 大模型时代下,GPU算力成为稀缺资源,但全球GPU的平均利用率仅徘徊在10%-20%之间,大量显存与算力因“静态分配”模式而闲置[1] - 随着国产及多样化AI芯片发展,企业内部算力环境呈现多元复杂特征,不同架构、厂商的GPU与AI加速芯片并存,导致异构算力资源难以统一调度、共享效率不足、利用率不高[2] - 在AI智算时代,AI任务负载对算力的需求与底层硬件分配方式之间存在巨大错配,虚拟化被视为通向AI普惠的核心钥匙[13] 公司概况与融资情况 - 异构算力虚拟化与高效调度管理平台「密瓜智能」完成天使轮融资,由复星创富领投,拙朴资本和种子轮投资人跟投[1] - 天使轮融资金额为数千万元人民币,资金将主要用于HAMi开源生态建设及异构算力调度平台的产业化落地[1] - 公司成立仅一个季度内,便获得了200万元的产品订单合同[5] 核心技术:HAMi开源项目 - 密瓜智能发起并主导全球唯一专注异构算力虚拟化的CNCF开源项目——HAMi,其目标是成为算力调度领域的“统一语言”[2] - HAMi已完成对NVIDIA、华为昇腾、沐曦、摩尔线程、寒武纪、海光、燧原等9种以上芯片的适配[8] - 技术能力包括:1) 细粒度切分与显存超卖,支持将单枚GPU显存与算力进行精度达1/10甚至更小的切分;2) 支持动态MIG灵活配置;3) 支持显存自动弹性扩缩容及OOM抑制,配合任务优先级抢占机制;4) 通过高性能Turbo模式优化调度效率,实现与Kubernetes生态的原生融合,用户无需修改代码即可实现算力自动感知与分配[4][8] 应用案例与效果 - 在顺丰科技案例中,在仅有的6张GPU上成功部署了19个测试服务,节省了13张卡,资源效率提升了2倍以上[5][6] - 在越南AI学习平台PREP EDU案例中,面对RTX 4070与4090混装的复杂异构环境,实现了GPU集群痛点减少50%,GPU基础架构优化了90%[5][6] - 公司已获得AWS推理芯片的主动适配支持[5] 商业模式与团队背景 - 公司在开源项目HAMi基础上,打造面向企业客户的商业化产品与技术服务,提供工程能力、稳定性支持与持续运维保障,已与多家企业客户开展付费合作[10] - 核心创始团队长期深耕云计算、云原生及AI基础设施领域,CEO张潇曾任DaoCloud容器团队负责人,CTO李孟轩曾任第四范式异构算力技术负责人,两人均是Kubernetes核心贡献者及多个CNCF项目维护者[11] - 创始人表示,公司不追求激进的短期商业化,而是坚持通过开源社区HAMi建立行业的“事实标准”,愿景是让异构算力像水电一样简单好用[12] 投资人观点与行业意义 - 投资人认为,异构将成为算力市场的长期格局,密瓜智能在AI大生态中不可或缺地链接算力端与应用端,能极大提升算力效率并节省成本[12] - HAMi的开源路径与AI行业开源化、协同化发展趋势高度契合,其虚拟化技术能显著提升算力利用率,为客户带来极具竞争力的投资回报率[12] - 在国产算力多元异构的背景下,开源成为生存发展的必需,HAMi有望打破硬件藩篱,成为异构算力调度虚拟化的全球通用标准[13]
Red Hat Expands Collaboration with NVIDIA to Pair Enterprise Open Source with Rack-Scale AI for Faster, Production-Ready Innovation
Businesswire· 2026-01-06 07:00
合作核心内容 - 红帽与英伟达宣布扩大合作 旨在将企业开源技术与快速发展的企业AI及机架级AI进步相结合[1] - 合作旨在为行业从单服务器向统一高密度系统转型提供起点 具体产品为专为英伟达Rubin平台优化的红帽企业Linux特别版[1] - 双方目标是在红帽混合云和AI产品组合中 为最新的英伟达架构提供“第0天”支持 以推动下一代企业AI[2] - 英伟达CEO表示 双方正将开源工业化 以将AI带给企业 起点是Vera Rubin平台[2] 合作背景与目标 - 到2026年 许多组织准备将AI从实验转向生产 这需要从底层架构到上层软件都具备稳定、高性能且更安全的基础设施堆栈[2] - 英伟达Rubin平台旨在为智能体AI和高级推理带来巨大的智能飞跃 红帽通过优化其混合云产品组合来支持此平台 旨在帮助企业更自信地扩展AI计划[2] - 合作旨在为企业提供启动即用的企业级Linux平台 全面支持机架级AI的最新突破[7] 英伟达Rubin平台技术细节 - 英伟达Vera Rubin平台引入了变革性创新 包括能效最高的Vera CPU、BlueField-4数据处理器以及NVIDIA Vera Rubin NVL72机架级解决方案[3] - 红帽宣布计划在其整个红帽AI产品组合中为英伟达Rubin平台提供“第0天”支持[3] 红帽产品集成与优化 - 红帽企业Linux将作为连接先进硬件与现代AI所需复杂软件生态系统的桥梁 并引入对英伟达机密计算的支持 为GPU、内存和模型数据提供增强的安全能力[4] - 红帽OpenShift将为英伟达基础设施软件和CUDA X库添加支持 以优化加速工作负载的性能 同时支持英伟达Bluefield以增强网络和集群管理[4] - 红帽AI平台将增加与英伟达的新集成 扩展对分布式推理的支持 包括支持英伟达Nemotron系列及其他面向视觉、机器人等领域的开源模型[4] - 红帽推出“红帽企业Linux for NVIDIA”新版本 该版本在发布时即包含最新的英伟达平台进步 并将从Rubin平台开始 在其上市第0天支持最新英伟达架构的平台功能[5] - 该特别版与操作系统主构建版完全保持一致 其改进将融入主版红帽企业Linux 客户可根据生产需求轻松过渡回传统版本[6] 产品上市与客户价值 - 红帽企业Linux对英伟达Vera Rubin平台的支持将于2026年下半年该平台全面上市时同步提供 客户可通过红帽客户门户获取最新驱动和集成工具[7] - 红帽企业Linux是英伟达最新加速器的经验证操作系统 有助于确保硬件和软件能力无缝协作 减少部署摩擦[10] - 企业可通过红帽企业Linux仓库直接获取经验证的英伟达GPU驱动和CUDA工具包 简化AI基础设施的生命周期管理[10] - 红帽企业Linux提供统一平台 适用于本地、边缘或公有云中的英伟达加速计算基础设施 减少基础设施孤岛并降低总拥有成本[10]
上海加快开源体系建设 拟培育100家开源商业化企业
新华财经· 2025-12-25 21:57
政策目标 - 上海市发布《上海市加强开源体系建设实施方案》,旨在加快推进自主开源体系建设,释放开源发展潜能,将上海建设成为服务全国、具有国际竞争力的开源创新策源地和发展高地 [1] - 到2027年,初步建成技术支撑齐全、服务体系完善、人才结构合理、开源产业繁荣的开源体系 [1] - 到2030年,开源在引领产业创新发展、提升产业链供应链韧性方面作用凸显,主动建设开源、使用开源、贡献开源的氛围基本形成 [1] 具体量化指标 - 到2027年,计划打造1—2个具有国际影响力的开源社区 [1] - 到2027年,计划培育100家开源商业化企业 [1] - 到2027年,计划孵化200个以上优质开源项目 [1] - 到2027年,计划集聚开源开发者超300万人 [1]
小米语音首席科学家:AI发展的本质就像生物进化,不开源要慢1000倍 | MEET2026
量子位· 2025-12-15 16:05
AI演进与生物进化的类比 - AI技术演进与生物进化遵循相似的底层逻辑,即通过尝试不同变体并筛选出更优方案的过程[1][7] - AI发展呈现“长期停滞+突然跃迁”的非线性模式,类似于生物学中的“间断平衡”理论[3][7] - AI进化与外部环境(如硬件、数据)相互影响,类似生物进化与环境(如大气成分)的相互作用[15][16] AI研发中的试错与迭代机制 - AI“配方”的设计本质上是不断试错的过程,最终能落地的通常只是“配方”本身,而非99%缺乏可操作价值的理论论文[10][11] - 设计流程为尝试不同变体,筛选有效方案发布,他人再进行复现和跟进[12] - “世代间隔”类比于复制一个新想法所需的时间,该周期已从过去的约两年缩短至现在的六个月[18][20] - 实验速度对迭代至关重要,更快的实验能加速进化过程[33] 开源对AI发展的核心加速作用 - 开源是AI进化的核心加速器,若没有开源,行业进化速度可能慢上一千倍[3][13][35] - PyTorch等工具使研究者能近乎完美地复现他人发布的“配方”,极大缩短了代际周期[21] - 当前许多公司(如小米)积极拥抱开源,这与过去大公司对开源不感冒的情况形成对比[37][38][56] 跨领域探索与架构多样性策略 - 不同AI任务间存在相互作用,例如视觉领域的方法可能应用于语音或语言任务[27] - Transformers最初为语言模型设计,后来在各种任务中广泛应用,体现了跨领域迁移的价值[29] - 公司应在不同任务上探索新思路,因为为特定限制研发的解决方案可能具有极高的通用价值[30][42] - 需要维持模型架构的多样性,保留多种技术路线,以增加孕育重大突破的机会[13][45] 大公司的双轨发展策略 - 大公司应采取“两条腿走路”的策略:一方面利用当前领先技术(如Transformer)赋能现有产品,另一方面投入资源进行探索性研究,寻找下一个颠覆性机会[5][13][45] - 在Transformer和大型语言模型主导的当下,公司不可能完全押注其他路线,但需为技术范式转变做好准备[46][47][48] - 例如,小米在大型语言模型上的研究主线是利用最先进的AI技术赋能“人车家全生态”,同时有团队负责探索性研究,尝试大量不同方向[49] 探索性研究的具体实践与案例 - 探索性研究成功率极低,但旨在寻找能产生巨大影响的成果[49] - 研究人员有责任判断并推广有价值的想法,未能妥善推广是自身的失误[52] - 团队正在研发名为Zapformer的新型通用声音基座架构,专注于语音领域[53] - Zapformer相较于前代Zipformer实现了三大跨越:从人声建模到通用声音理解、通过梯度流理论指导设计将语音识别精度提升10%-15%、为海量数据训练移除Dropout并升级优化器以提升通用性与稳定性[57]