生成式AI
搜索文档
两大硅片厂,延期
半导体芯闻· 2026-03-30 18:36
SUMCO战略调整 - 日本硅晶圆大厂SUMCO推迟两座新硅晶圆厂的兴建计划,将专注于对现有工厂进行设备升级,以强化应对最先进半导体需求的能力 [1] - SUMCO原计划斥资2250亿日元兴建两座新厂,并曾获得日本经济产业省最高750亿日元的补助 [1] - 因变更建厂计划,来自经济产业省的补助额将从原先的最高750亿日元缩减至193亿日元 [2] 行业结构性转变 - 全球半导体市场正发生结构性转变,生成式AI需求激增,而PC、智能手机用硅晶圆需求趋于平稳 [1] - 在2纳米世代以后的最先进领域,预估品质要求将更加严苛、技术竞争将更趋严峻 [1] - 公司研判,现阶段将营运资源集中于现有设备升级,比扩增产量(建新厂)更符合经济合理性和提升竞争力考量,以抢攻成长显著的最先进半导体用硅晶圆需求 [2] 未来投资规划 - 关于包含新厂兴建案在内的增产投资,公司将谨慎评估市况走势,在适当时机再敲定新厂动工时间以建构量产体制 [2] - 今后公司将以伊万里市等现有工厂为中心,致力于升级可支援最先进产品生产的制造设备 [2]
一年一度最值得关注的AI榜单来啦!申报即日启动
量子位· 2026-03-30 18:36
中国生成式AI产业发展阶段与趋势 - 中国生成式AI正在从“新技术”、“新工具”阶段,进入深刻影响企业研发、营销、协作与决策流程的“产业深水区” [1] - AI的发展已跨越从论文参数到日常应用的分水岭,行业正从“观望期”迈入“全民参与期” [16][17] 2026中国AIGC产业峰会 - 峰会将于2026年5月在北京举办,主题为“@所有人,马上AI起来”,聚焦“如何用好AI” [17] - 峰会旨在汇聚AI创业者、开发者与资深玩家,共同推动AI技术的普及与应用落地 [17] “2026年度值得关注的AIGC企业”评选 - 评选旨在发现拥有最创新、最前瞻或最有规模落地潜力的AI企业 [4] - 参选企业需满足:公司主体或主营业务在中国;主营业务为生成式AI或已广泛应用AI;近一年在技术、产品或商业化方面有出色表现 [7] - 评选从四个维度进行:技术维度(技术实力、研发投入、人才储备);产品维度(产品创新性、用户规模、体验);市场维度(商业模式、市场规模、营收、合作生态);潜力维度(核心团队、投融资、品牌影响力) [12] “2026年度值得关注的AIGC产品”评选 - 评选旨在发现拥有最创新、最实用、最热门或最有应用潜力的AI产品 [10] - 参选产品需满足:主要功能基于生成式AI;技术成熟已投放市场并有一定用户规模;近一年有重要技术创新或迭代,对行业有影响力 [13] - 评选从四个维度进行:产品技术力(技术先进性、成熟度、效果);产品创新力(功能、场景、痛点的创新性);产品表现力(用户规模、留存、反馈、影响力);产品潜力(生态、市场潜力、战略规划) [13] 评选活动参与信息 - 评选报名截止日期为4月27日,最终结果将于2026年5月的中国AIGC产业峰会上公布 [14] - 企业可通过指定网页链接或扫描二维码进行报名 [16]
ICLR 2026 Oral | 大道至简!斯坦福、英伟达、新国立联合推出InfoTok,用信息论重新定义高效视频分词
机器之心· 2026-03-30 14:52
InfoTok自适应视频分词器的核心创新 - 提出一种基于信息论的自适应视频分词器InfoTok,能够根据视频内容复杂度自动分配Token数量,解决了传统固定压缩率分词器在简单和复杂内容上“一刀切”导致的效率低下问题[2] - 该方法实现了2.3倍的压缩率,推理速度比同类自适应方案快11倍,同时取得了更优的重建质量,为高效视频理解与生成开辟了新路径[2] - 该论文已被ICLR 2026接收为口头报告,由斯坦福大学、英伟达Cosmos团队和新加坡国立大学的研究团队合作完成[2] 当前视频分词器存在的问题与理论突破 - 当前主流视觉分词器采用固定压缩率,将视频帧切分为均匀网格,无论内容简单或复杂都消耗相同数量的Token,这造成了巨大的计算冗余并产生了信息量不同的Token,不利于下游任务处理[2][9] - 研究团队从香农的信源编码定理获得灵感,指出高效压缩的基本原则是:越容易预测(信息量少)的信号应使用越少的Token,反之,越稀有、出乎意料的内容应分配越多的Token[11][15] - 团队推导出定理:在理想情况下,每个视频的最优Token数量应由其似然概率p(x)决定,遵循“越常见的内容使用越少Token”的原则,这为自适应分词提供了理论保障[13][15] InfoTok的方法论与核心组件 - InfoTok通过两个核心组件解决自适应分词的落地挑战:ELBO路由器(决定分配多少Token)和自适应压缩器(执行变长编码),二者作为即插即用插件架设在现有固定压缩率分词器之上[19] - ELBO路由器使用证据下界作为视频“可预测性”的代理指标,以此动态决定Token数量,其计算公式可直接从预训练分词器中廉价获得,无需额外模型[20][22] - 自适应压缩器基于Transformer架构,能够将固定长度的嵌入智能地“打包”进由路由器决定的变长Token序列中,通过端到端训练实现信息浓缩[23][25] 实验效果与性能优势 - 可视化效果显示,InfoTok能自动在动态、信息丰富的区域(如移动车辆、机械臂)投入更多Token,而在静态或高度可预测的区域(如纯色天空、黑色边框)大幅节省Token[6][35][36] - 定量评估在TokenBench和DAVIS基准上进行,结果显示,在0.81和0.56两种压缩级别下,InfoTok在PSNR、SSIM、LPIPS、FVD等关键指标上全面优于固定压缩率基线及基于启发式的动态编码器ElasticTok[40] - 关键性能结论:InfoTok可以在节省20% Token的情况下实现无损重建,在2.3倍压缩率下仍然全面超越ElasticTok,且基于ELBO的路由器在所有压缩级别上都一致优于启发式方法[41][42] - 效率优势显著:InfoTok的推理速度比同类自适应方案ElasticTok快11倍,同时实现了更优的重建质量[2][44] 技术应用前景与未来展望 - InfoTok证明了从经典信息论中汲取灵感可以大幅优化AI效率,其框架仅需在现有分词器上增加极小额外开销,即可用更少的Token实现更好的重建质量[45] - 该技术的普及有望推动更长、更细腻、更高效的AI视频生成时代到来[46] - 未来发展方向包括:将框架扩展至连续Token空间以弥合离散分词器与连续VAE编码器之间的鸿沟;将自适应分词深度整合进视频生成管线;以及将信息论原则应用于图像、3D场景、多模态数据等其他非均匀信息密度分布领域[48]
亚洲半导体:2026 年云端 AI 前景强劲,覆盖 GPU 与ASIC领域-Asia Semiconductors_ Robust Cloud AI outlook in 2026 across GPUs and ASICs
2026-03-30 13:15
亚洲半导体行业研究纪要关键要点 一、 涉及的行业与公司 * **行业**:亚洲半导体行业,重点关注逻辑半导体、先进制程、先进封装、AI加速器(GPU/TPU/ASIC)及硅片市场[1][3][5][8] * **覆盖公司**:研究覆盖了晶圆代工、IC设计、封测、硅片等半导体产业链多个环节的数十家上市公司,主要位于台湾、香港等地[4][8] * **重点公司**:台积电、联发科、日月光、信骅、鸿准、京元电、环球晶、硅力杰、联电、广积、家登、ASM Pacific、瑞昱、世界先进、力积电、中芯国际、华虹半导体等[10][12][18] 二、 核心观点与论据 1. 2026年核心主题:云端AI驱动增长 * **整体观点**:2026年亚洲逻辑半导体行业将由云端AI需求主导,涵盖GPU和ASIC,前景强劲[1] * **台积电**:作为云端AI技术赋能者,预计2026年美元营收将增长30%,资本支出将增至560亿美元[14];N3和N2产能扩张将加速,2026年全年产能利用率紧张[14];预计N2代工需求到2028年将达到约220k wpm,超过N3量产第三年的需求[12] * **联发科**:在谷歌TPU市场的结构性份额增长,预计H226开始量产,2027年销量存在显著上行风险[14];预计2027/2028年TPU销售额分别达80亿/134亿美元[20];在基础/乐观情景下,2027年TPU业务可为联发科带来61%/144%的EPS增长[32] * **竞争格局**:谷歌TPU设计服务从博通独家转向与联发科双轨并行[20];预计2026/2027年博通TPU出货份额为93%/75%,联发科份额从7%增至25%[20];联发科每颗TPU芯片的设计服务费比博通低50%以上[20] 2. 先进封装与测试需求激增 * **产能扩张**:预计2026年行业CoWoS产能同比增长85%,台积电和OSAT厂商均有扩张[15];英特尔EMIB预计从H226开始获得发展势头[15] * **技术驱动**:CoWoS、SoIC、WMCM、面板级封装、CPO等多种技术推动先进封装资本支出增长[15] * **测试需求**:云端AI加速器因芯片/封装结构更复杂,测试插入次数增加,测试时间更长以确保质量控制[15] * **日月光**:随着先进封装对下一代云端和边缘AI愈发关键,日月光将成为主要受益者,有望显著提升附加值和利润率[12] 3. 量化AI服务器投资对半导体产业链的影响 * **对台积电的影响**:每1GW服务器投资,预计需要约2-5k wpm先进制程(N3/N2)产能和约3-6k wpm的CoWoS产能[36];逻辑设备支出约10-20亿美元,包括前端产能和CoWoS[36];为台积电带来约10-20亿美元收入机会,相当于销售额提升约1.0-1.5%[36] * **客户差异**:博通为谷歌设计的TPU v7p每1GW需要约5k wpm的N3产能,高于英伟达的2-4k wpm[38];ASIC为台积电带来的收入占机架价值的10-11%,高于GPU的4-6%[38];AMD的AI GPU(如MI455)因chiplet设计,每1GW对台积电产能需求最低,约1k wpm N2产能[38] * **具体项目测算**:针对OpenAI已公布的260亿美元投资(涉及英伟达、AMD、谷歌),预计将为台积电带来344亿美元收入[47] 4. 共封装光学技术前景与挑战 * **技术趋势**:为支持更高带宽和更低功耗,CPO技术正在发展,但未来2-3年传统可插拔光模块仍是主流[56] * **市场预测**:基础情景下,光模块市场规模预计从2025年的120亿美元以22%的CAGR增长至2030年的323亿美元,其中CPO占比20%,达65亿美元[58][59];乐观情景下,市场CAGR为30%[59] * **对台积电机会**:硅光子学行业销售额预计在2025-2030年以35%的CAGR增长,台积电有望占据主要市场份额,预计其硅光子学收入在2030年贡献总销售额的2.0%[60][61] * **供应链影响**:CPO将强化台积电在云端AI的护城河,日月光有望在光纤阵列单元耦合和交换机板封装中占据重要份额,对ABF载板制造商有利[56] 5. 制程与封装供需深度分析 * **N3供需**:预计2026年底台积电N3产能(含美国)达170k wpm(2025年底为120k wpm)[91];2026年云端AI将占N3需求的35-40%,智能手机/PC等占60-65%[91];2026年产能利用率紧张,Q4尤甚,英伟达可能在Q4占据约40k wpm产能用于Rubin产品[91] * **CoWoS产能**:预计2026年底行业CoWoS产能提升至150k wpm(2025年底为90k wpm)[105];台积电CoWoS产能从2025年底的70k wpm增至2026年底的120k wpm;OSAT(日月光、安靠)产能从20k wpm增至30k wpm[105] * **客户结构**:2026年英伟达仍是最大CoWoS客户,占需求的56%(2025年为65%)[110];预计2026年英伟达AI GPU产量为870万颗[110];博通TPU产量上调至370万颗,联发科v8X预计在H26达到30万颗[110] 6. 成熟制程与IC设计 * **成熟制程**:看好未来2-3年供需前景改善,原因包括中国竞争更趋理性、台积电优化成熟产能用于先进封装、需求复苏[12];联电是成熟制程领域的首选[12] * **IC设计**:信骅的BMC可寻址市场随着AMD Venice和Intel Oak Stream等新服务器CPU平台而增长,内容显著提升[16];智能手机和PC的一个潜在风险是内存BOM成本上升可能影响2026年终端需求[16] * **非AI半导体**:预计2026年成熟制程和OSAT的增长将超过IC设计,因竞争改善和更有利的定价环境[16] * **硅片**:供需将逐步改善,价格前景更趋稳定,尽管仍存在一些持续性供应过剩[17] 三、 其他重要内容 * **市场表现**:年初至今,SOX指数上涨11%,研究覆盖公司平均上涨19%(台积电+19%,联发科+19%,联电+17%),同期道指下跌4%,台湾加权指数上涨16%[12] * **投资建议**:首选股为台积电、联发科、日月光[12][18];买入评级包括信骅、广积、鸿准、致茂、联电、环球晶、智原、ASM Pacific、家登、硅力杰等[18];中性评级包括世界先进、瑞昱、力积电、中芯国际、华虹半导体等[18] * **AI数据中心建设**:文档列举了多个超大规模AI数据中心项目,如Project Matador (11 GW)、Colossus 2 (3 GW)、Jupiter (2.3 GW)等,显示强劲的基础设施投资[49] * **OpenAI合作承诺**:汇总了OpenAI与各厂商的巨额合作承诺,总价值超过1.4万亿美元,包括英伟达(约3750亿美元)、甲骨文(约3000亿美元)、微软(2500亿美元)、博通(约1500亿美元)、AMD(约1050亿美元)等[51] * **供应链图谱**:详细列出了谷歌TPU和英伟达GPU供应链上的主要供应商,涵盖半导体、硬件、基板、PCB、散热、电源等多个环节[34]
软银集团加大对OpenAI的投资,凸显其在AI领域的激进押注
环球网· 2026-03-30 10:25
软银集团对OpenAI的追加投资 - 软银集团获得400亿美元过桥贷款 用于加大对OpenAI的投资及一般企业用途 该笔贷款为无担保贷款 期限至2027年3月 [1] - 贷款由摩根大通、高盛、瑞穗银行、三井住友银行和三菱UFJ银行等机构共同安排 [1] - 追加投资落地后 软银对OpenAI的总投资额将达646亿美元 持股比例为13% [1] OpenAI的行业地位与竞争格局 - OpenAI作为人工智能模型ChatGPT的开发商 在微软支持下已成为生成式AI领域标杆 推动行业投资升温 [1] - OpenAI在美国有十几个正在开发的地点 包括在威斯康辛州与Oracle共建的一个项目 [3] - 微软将接手OpenAI放弃的位于得克萨斯州阿比林的人工智能数据中心扩建项目 两家公司将继续在相邻的大型AI运营设施中展开竞争 [3] 软银集团的战略意图 - 此次加码凸显软银在人工智能领域的激进押注 试图在激烈的行业竞争中抢占优势 [1]
腾讯研究院AI速递 20260330
腾讯研究院· 2026-03-30 00:11
生成式AI模型能力与产品进展 - **Anthropic开启Claude Mythos 5.0内测**,该模型被定位为比Opus更大更智能的顶配模型,Polymarket预测其6月上线概率达73% [1] - **Claude模型在安全研究领域展现强大能力**,安全研究员现场演示其自主发现了Ghost CMS的盲SQL注入漏洞和Linux内核NFSv4守护程序中存在20年的堆栈缓冲区溢出漏洞 [1] - **Anthropic内部工作模式发生变革**,工程师团队已转向多智能体并行工作模式,不再手写代码,角色转变为AI智能体的管理者 [1] - **谷歌发布Gemini 3.1 Flash Live预览版**,大幅提升语音交互的延迟和自然度,增强对音高、语速、重音和意图的识别能力,在嘈杂环境中任务完成率显著提升 [3] - **Gemini 3.1 Flash Live具备实时音视频流处理能力**,基于有状态WebSocket连接,支持连续音视频流输入,并具备工具调用、多语言支持、用户打断和Google Search接入等能力 [3] - **智谱发布GLM-5.1模型**,其编程能力较上一代GLM-5提升近10分,与全球最强编程模型Claude Opus 4.6仅差2.6分,支持约200K上下文窗口和reasoning模式 [4] - **GLM-5.1市场需求火爆**,该模型面向GLM Coding Plan全部用户开放,上线后一度售罄,网友实测用其生成了可交互的国际象棋游戏和在线版“我的世界” [4] AI辅助开发与安全 - **Claude Code推出自动模式**,用基于Sonnet 4.6的转录分类器替代人工审批,在1万条真实流量中误拦率仅0.4%,解决了用户93%审批通过率带来的审批疲劳问题 [2] - **自动模式分类器采用双层安全架构**,输入层检测提示注入,输出层评估操作安全性,并刻意剥离模型自身回复以防止自我辩护干扰判断 [2] - **系统设置了安全控制权交还机制**,针对过度主动行为的漏报率为17%,系统设置连续3次或累计20次拦截后交还控制权,多Agent场景下在委派和返回节点均执行安全检查 [2] AI视频生成与多模态应用 - **Runway上线Multi-Shot App**,用户输入一段文字描述即可自动生成最多5个镜头的完整视频,包含对话、音效、镜头切换和节奏控制,无需手动剪辑 [5][6] - **该App基于Gen-4.5模型**,支持自动镜头语言编排、角色对话口型同步、环境音效匹配和电影化构图,输出分辨率720p,单镜头最长10秒 [6] - **Runway近期完成3.15亿美元融资,估值达53亿美元**,公司正从单镜头生成向完整成片制作方向发力 [6] AI记忆与长期交互 - **Claude Code推出实验性AutoDream功能**,通过后台子Agent周期性回顾历史会话,对记忆文件执行合并、压缩、修剪和刷新操作,类似人类睡眠巩固记忆的机制 [7] - **该功能每次运行约10分钟**,能复盘数十至数百个会话,核心价值在于减少重复交代背景、控制上下文膨胀、提升关键信息召回率,将记忆文件从信息堆积转变为结构化索引 [7] 行业动态与争议 - **谷歌TurboQuant论文遭RaBitQ作者公开指控学术不端**,指控包括回避方法相似性、无证据将RaBitQ理论保证定性为“次优”、用单核CPU测试RaBitQ却用A100 GPU测试自身算法 [8] - **NeurIPS会议新增制裁合规条款引发争议**,其2026手册新增条款禁止OFAC制裁名单机构投稿,涉及华为、商汤、中芯国际等873家机构,引发中国学术圈强烈反对 [9] - **NeurIPS在4天内撤回条款并致歉**,称系基金会与法律团队沟通失误,已更新政策文本,欢迎所有合规机构和个人投稿 [9] 行业领袖观点与趋势 - **智谱CEO张鹏表示智能体让token用量增长10倍**,但实际需求可能达100倍,GLM-5 Turbo专为长程任务优化,近期涨价是回归正常商业价值 [10] - **小米罗福莉认为“自进化”是未来一年AGI最关键方向**,指出国产开源模型加OpenClaw的任务完成度已接近Claude,团队借助AI工具研究效率提升近10倍 [11] - **无问芯穹夏立雪提出需打造“Agentic Infra”**,认为当前基础设施是为人设计而非为Agent设计,未来基础设施本身也应是能自我进化的智能体 [11]
AI 进了游戏公司,但还没开始改变游戏丨GDC 现场大讨论
晚点LatePost· 2026-03-29 22:25
文章核心观点 AI技术正在深刻影响游戏行业,但并非以颠覆性的方式,而是逐步渗透到开发流程的各个环节,以提升效率、降低成本。行业面临传统大制作商业模式难以为继的挑战,而AI被视为一种“外骨骼”式的增强工具,其价值在于辅助人类创作者,而非替代。游戏的核心——创意、玩法与情感连接——依然由人类主导,AI的最终目标是帮助制作出更好的游戏,而非单纯增加游戏数量。 行业现状与挑战 - 传统大制作游戏的商业模式面临危机:游戏开发成本显著上升,但标准售价(60-100美元)涨幅有限,导致利润承压。自2021年高峰以来,流向游戏工作室的投资额已缩水85%[6]。行业经营利润正以约7%的复合年率下滑[6]。 - 玩家消费习惯改变,对传统3A游戏兴趣减弱:UGC平台(如Roblox、Minecraft)增长迅速(游玩时长分别同比增长52%和19%),而传统热门品类如大逃杀游戏总游玩时长同比下滑27%[8]。仅有41%的Roblox玩家对《怪物猎人:荒野》这类3A游戏感兴趣[8]。 - 行业面临结构性调整:疫情后涌现的大量游戏工作室因融资环境变化(美联储加息、科技公司重心转向AI)而集中陷入危机,这被视作一场B2B端的流动性问题,但B2C端收入在2025年已有恢复迹象[10]。 - 从业者对AI的焦虑情绪加剧:根据GDC 2026年报告,52%的从业者认为生成式AI对行业有负面影响,该比例高于2025年的30%和2024年的18%[25]。 AI在游戏开发中的应用与进展 - AI主要应用于优化重复性高、标准清晰的“劳动密集型”生产环节,如资产制作、动画生成等,而非颠覆整个开发流程[11][12]。 - **成本控制**:AI被首先用于降低最昂贵的资产生产成本,以改写游戏开发的经济模型[13]。例如,腾讯利用AI将全局光照制作时间从两三天缩减到5分钟,效率提升百倍[15]。 - **流程提效**:在特定美术环节(如角色蒙皮、动作中间帧补齐),AI能在几分钟内完成80%-90%的工作,人工仅需检查和调整[16][17]。动捕流程也因AI而简化[18]。 - **质量提升**:AI能改善传统技术难以解决的美术问题(如角色动作“滑步”、武器穿模),玩家一旦体验过更好的效果就难以接受旧有标准[18][19]。 - **开发流程压缩**:传统游戏开发的七个阶段正被压缩成开发、上线和增长三大阶段,原型验证和立项环节被合并[14]。 AI技术的局限性与挑战 - **控制精度不足**:当前AI在复杂动作衔接、角色一致性、局部细节保持上控制精度不够,离稳定投入生产尚有距离[20]。例如,难以精准还原打斗动作的后续节奏衔接[20]。 - **游戏系统复杂,难以标准化**:游戏引擎底层缺少统一标准,不同项目技术选型差异大,导致AI大模型难以像在网页前端那样给出通用解法[21][22]。 - **世界模型尚未成熟**:如Google DeepMind的Genie 3,其重点在于实时生成可交互环境,但远未达到开箱即用阶段,在记忆、一致性、长期稳定性等方面存在局限[23][24]。 - **无法替代核心创意**:写作、核心玩法设计等创意工作高度依赖人类的情感和经验,从业者普遍认为AI无法替代[25][26][27][29]。创意是人类的核心价值,未来组织形态将是“AI劳动密集型,人类创意密集型”[29]。 公司的AI转型策略与实践 - **自下而上与涌现式创新**:腾讯等公司转变过去自上而下的执行方式,更强调由业务团队根据自身情况探索,鼓励有研究能力的年轻人主导AI项目[34]。 - **务实落地,从“近地轨道”开始**:EA等公司倡导先利用AI工具解决实际工作流中的具体问题,提升全员AI素养,而非一开始就追求激进的“登月计划”[32][33]。 - **明确人机协作边界**:网易在管线中确立底线,绝不让AI决定美术方向,AI负责批量执行标准化任务,人类负责制定标准并最终审核[30][32]。 - **AI应用于玩家体验**:腾讯在《和平精英》(日活9000万)中上线AI队友功能,降低了组队门槛并提升社交活跃度(单局消息互动量达70轮,麦克风开启率近75%),但需克服实时响应、游戏知识库、长期记忆与行为强化学习等挑战[39][40][42]。 AI与游戏玩法的未来 - **AI原生游戏尚未出现实质性成果**:自2021年AI新时代兴起,五年过去,几乎未出现由AI催生的新型游戏和全新玩法[35]。游戏的乐趣源于设计好的规则内的无限可能,而非无限自由,这与生成式AI的强项不完全匹配[35]。 - **玩法机制生成是终极挑战**:若AI要在玩法上创造增量价值,需同时做到“自由、直观、低门槛”,并能基于“游戏机制数据集”生成无穷机制[37][38]。但目前自动设计出如“吃鸡”这类宏观创新玩法仍不可能[37]。 - **行业共识是创造“更好的游戏”**:市场不缺游戏数量(移动平台年超20万款新游戏,Steam平台年1.8万款),关键在于制作出最好的游戏并延长其生命周期[36]。AI的价值在于辅助实现这一目标[43]。
一文看懂博通的光布局
半导体行业观察· 2026-03-29 09:46
博通在OFC展会发布的新产品与技术组合 - 公司发布针对吉瓦级AI集群的开放、可扩展且高效能AI基础设施组合,包括3.5D XPU、具备共同封装光学技术的102.4T以太网交换器、400G/lane光学DSP、200G/lane以太网重定时器与主动式电缆、以及PCIe Gen6交换器与重定时器 [1] - 公司推出业界首款400G/lane光学DSP解决方案Taurus,可搭配400G电吸收调变激光器与光电二极管,用于开发1.6T收发器,并为未来3.2T光学收发器奠定基础 [2] - 公司展示多项已进入生产阶段或新推出的先进技术,包括3.5D XDSiP、以太网交换器Tomahawk 6、800G NIC、200G重定时器与主动式电缆、PCIe Gen6交换器与重定时器,以及结合2.5D与3D-IC Face-to-Face技术的模组化多维度XPU平台 [2] 博通推动开放标准与产业联盟 - 公司与多家半导体大厂及云端服务商共同成立光学计算互连多源协议,旨在将基于光通讯的Scale-up技术标准化,打造开放、无须妥协的端对端织网架构 [1][3] - 参与OCI MSA的重要厂商包括博通、超微、NVIDIA,以及云端与AI服务供应商Meta、微软、OpenAI [3] - OCI MSA的目标是建立一套能让不同供应商的处理器与互连协议在同一套光纤基础设施上运作的开放规范,例如让UALink、NVLink等不同的Scale-up协议兼容 [3] 光学计算互连的技术规格与未来蓝图 - OCI将针对AI机柜与scale-up集群内的短距离光互连,定义一套以NRZ调变与波分复用为基础的共通实体层,初期规格采用4波长×50Gb/s配置,单向传输速率为200Gb/s,并可扩展至每条光纤800Gb/s [4] - 未来技术蓝图计划增加波长数量与信号速率,目标将每条光纤的传输能力提升至3.2Tb/s以上 [4] - OCI技术将支援多种光学整合形式,包括可插拔光模块、板上光学模块以及与运算芯片直接整合的共同封装光学 [4] 公司高层对AI基础设施发展的观点 - 公司半导体解决方案事业群总裁表示,生成式AI的爆发式成长需要开放的端对端织网架构,公司正按照蓝图成功迈向200T目标,并为合作伙伴打造全球最大规模AI集群所需的基础架构 [1] - 公司强调通过开放标准解决复杂的电力和带宽挑战,实现垂直、水平和跨域扩展的连接,其102T以太网交换器是业界首款且唯一出货的产品 [1]
一年一度最值得关注的AI榜单来啦!申报即日启动
量子位· 2026-03-29 08:51
行业趋势与峰会背景 - 中国生成式AI正在从“新技术”、“新工具”阶段,进入深刻改变企业研发效率、营销方式、团队协作及决策流程的“产业深水区”[1] - AI的发展已跨越从论文参数到日常应用的分水岭,行业正从“观望期”迈入“全民参与期”[16][17] - 2026中国AIGC产业峰会将于5月在北京举办,主题为“@所有人,马上AI起来”,聚焦如何用好AI[17] 2026年度值得关注的AIGC企业评选 - 评选旨在发掘拥有最创新、最前瞻或最有规模落地潜力的AI企业[4] - **参选条件**:公司主体或主营业务在中国;主营业务为生成式AI或已广泛应用AI;近一年在技术/产品、商业化有出色表现[7] - **评选维度**:涵盖技术实力与创新性、产品市场适配与用户体验、市场表现与增长机会、团队实力与品牌潜力四个维度[12] 2026年度值得关注的AIGC产品评选 - 评选旨在发掘拥有最创新、最实用、最热门或最有应用潜力的AI产品[10] - **参选条件**:产品主要功能基于生成式AI;技术成熟已投放市场并有一定用户规模;近一年有重要技术创新或迭代,对行业有影响力[13] - **评选维度**:涵盖产品技术先进性、功能与应用场景创新性、用户反馈与市场表现、未来发展潜力四个维度[13] 评选活动安排 - 评选报名即日开始,截止日期为4月27日,最终结果将于2026年5月的中国AIGC产业峰会上公布[14] - 评选结合对公司的深入调研及数十位行业知名专家的意见[1] - 届时将邀请数百万行业从业者共同见证[2]
走出网页和 App 后,消费级 AI 应用的实力该如何衡量?
机器之心· 2026-03-28 10:30
为什么以流量为主的统计口径已难以界定 AI 时代的真实增长? - 行业过去主要通过追踪独立网站和App的网页访问量、移动端MAU及基于点击的归因来观察消费级AI增长[1] - 随着生成式AI越来越多地以内嵌能力形式进入既有产品和任务流程,旧有的统计框架难以覆盖这部分内嵌式能力的实际调用[5][6] - AI驱动的搜索和平台内直接给出的答案,扩大了“信息发现过程”与“可被统计的访问结果”之间的缺口,使传统的最后一次点击归因法难以准确刻画用户决策路径[6] - 数据分析机构Similarweb指出,2025年1月至2026年1月,美国AI平台访问量增长28.6%,但同期来自这些平台的外部referral基本持平,表明AI平台使用的增长不再必然以对外跳转的形式体现[8] - 行业评估重点正从“平台获得了多少流量”转向“AI在信息发现、品牌比较和消费决策中实际产生了多大影响”[7] 众多消费级 AI 应用中谁是赢家? - 生成式AI进入用户日常操作的主要场景已从独立网页和App,扩展至浏览器、桌面端、命令行以及文档、表格等办公与生产工具[9] - 浏览器本身正在成为AI产品,OpenAI、Perplexity和Browser Company在近九个月都推出了相应产品[6] - 数据分析公司Similarweb数据显示,2025年6月,ChatGPT、Gemini、Perplexity、Grok、Copilot等AI平台合计产生超过11亿次referral visits,同比增长357%[8] - 到2025年12月,生成式AI平均月访问量同比增长76%,App下载量同比增长319%,面向交易类网站的生成式AI referral转化率约为7%[8] - a16z在其消费级AI应用观察框架中,已将“生成式AI已成为核心体验”的消费产品纳入统计,而不再仅围绕独立的AI-first网站和App[5]