Workflow
谷歌(GOOG)
icon
搜索文档
与美国关系出现裂痕,欧洲要学中国打造自主版DeepSeek
凤凰网· 2026-01-20 16:21
欧洲AI产业现状与挑战 - 美国公司在AI产业链各环节(处理器设计与制造、数据中心容量、模型与应用开发)均领先于欧洲同行,并吸引了该领域巨额资金[4] - 以英伟达、谷歌、Meta、OpenAI、Anthropic为代表的美国领军企业已形成难以撼动的优势,使欧洲难以摆脱对美国AI技术的依赖[4] - 欧洲已“在互联网领域失去了自主权”,可能需要接受在一定程度上依赖美国基础设施的现实[4] 欧洲的应对策略与努力 - 英国和欧盟各国政府已承诺投入数亿美元资金,以降低对外国AI供应商的依赖[5] - 欧洲正试图通过资金扶持计划、定向放松监管以及与高校机构建立合作关系,将AI开发“本土化”[8] - 部分努力聚焦于为欧洲本土语言打造具有竞争力的大语言模型,例如Apertus和GPT-NL[8] 寻求创新路径与开放模式 - 受中国AI创业公司DeepSeek成功的鼓舞,欧洲研究人员正探索通过创新模型设计来开发具有竞争力的产品[5] - DeepSeek凭借突破性进展打破了“谁控制最多AI处理器谁就能胜出”的行业教条[5] - 欧洲AI实验室可能拥有的一项优势在于愿意以开放方式推进研发,通过发布可自由使用或修改的模型,使突破在合作打磨中叠加放大[5] 地缘政治与自主化紧迫性 - 面对白宫的冷淡态度及部分特朗普盟友的敌意,欧洲推动创新、实现自给自足的努力显得愈发紧迫[6] - 欧洲对美国AI的依赖被视为一项负担和谈判中的软肋,在最极端情形下美国可能切断欧洲对AI服务和关键数字基础设施的访问[7] - 近几个月,欧洲领导人在一系列问题上与特朗普政府争执不休,双方在监管美国科技公司(特别是马斯克拥有的X平台)问题上公开爆发了激烈冲突[6] 内部政策分歧与讨论 - 目前尚不清楚英国或欧盟打算将“数字主权”推进到何种程度,这一概念被部分人士认为“相当模糊”,更像是一种政治叙事[10] - 欧洲内部尚未就应采取哪些政策手段以实现自给自足达成广泛共识[10] - 部分欧洲供应商主张推行一项战略,要求或激励欧洲企业优先采购本土AI公司的产品,以培育需求市场[10] - 倡导开放市场的人士则警告,试图排斥美国AI公司可能导致欧洲本土公司在全球竞争中处于劣势[10] 欧洲版DeepSeek的愿景 - 欧洲AI行业普遍认为,即便是预算和资源有限的实验室,也完全有可能缩小与美国领先者之间的性能差距,正如DeepSeek所展示的那样[11] - 参与开源模型开发项目SOOFI的奈德尔表示,该领域进展将不再主要依赖于规模最大的GPU集群,并计划在未来一年内推出一个约拥有1000亿参数的通用语言模型竞品[11] - 奈德尔称:“我们将成为欧洲的DeepSeek。”[11]
中国的斯坦福,快来了
36氪· 2026-01-20 16:14
福耀科技大学的定位与愿景 - 福建福耀科技大学于2025年正式官宣,由“宝藏校长”王树国担任首任校长,其办学理念反复强调“对标斯坦福” [1] - 创办人曹德旺与王树国校长均强调理想与情怀,王校长表示自己是“义务工作者”,一分钱工资都没有,将此解释为“一个理念,一个理想” [3] 斯坦福大学的创立与基因 - 斯坦福大学由铁路大亨利兰·斯坦福夫妇为纪念早逝的儿子而创立,其创办动机纯粹出于情怀,旨在使“所有加州的孩子都是我们的孩子” [3] - 大学于1891年正式开学,校训为“让自由之风吹拂”,效仿康奈尔大学成为西部第一所男女同校、非宗教性质的文理大学 [5][6] - 斯坦福夫妇为创立大学捐助了4000万美元(购买力约相当于2024年的14亿美元)以及8180英亩(约33.1平方公里)校属土地 [7] - 学校基金会协议条款强调教育应引导学生“听从内心对于生命意义的呼唤”,奠定了其理想主义的文化基因 [8] 斯坦福与硅谷的诞生:弗雷德里克·特曼的角色 - 斯坦福电机系教授弗雷德里克·特曼是连接斯坦福与科技产业的“硅谷教父”,他鼓励学生创业、教授参与企业咨询,并推动科研成果商业化 [9][10][13] - 特曼深度参与了惠普公司的创立与早期发展:1939年为创始人争取了1000美元启动资金,并推荐了首批客户,包括迪士尼以71.5美元单价订购8台HP-200B音频振荡器 [16][18] - 特曼推动斯坦福于1951年划出约580英亩校园地皮,建立了世界上第一个高校工业园区——斯坦福工业园区,吸引了通用电气等公司入驻,其当时最好的40位科学家中有16人来自斯坦福 [22] 半导体产业的兴起与“仙童系”的扩散 - 晶体三极管发明人之一威廉·肖克利在特曼邀请下于圣克拉拉创立肖克利半导体实验室,虽管理失败,但其“叛逆八人帮”员工于1957年创立了仙童半导体公司 [23][26][27][29] - 仙童半导体成为半导体产业先驱,到1965年已与得州仪器、摩托罗拉并称产业三巨头,并率先提出商业化生产集成电路的方法 [30][31] - 仙童半导体成为硅谷的“人才摇篮”:截至1984年,直接或间接从其分拆的公司达70多家,包括英特尔、AMD等;1969年一次半导体行业会议中,400名与会者仅24人非仙童前雇员 [32][33] 斯坦福的持续创新与商业化成就 - 第10任校长约翰·亨尼斯是斯坦福“学产结合”的典范,他本人是计算机专家,在担任教授期间联合创办了RISC公司(1992年以3.33亿美元出售)和创锐讯通信公司(2011年被高通以37亿美元收购) [37][38] - 亨尼斯在任期内大力支持学生创业,包括雅虎和谷歌的创始人,斯坦福因持有谷歌搜索技术专利于2005年获得价值3.36亿美元的谷歌授权股票 [40] - 在亨尼斯担任校长的12年间,斯坦福获得了170亿美元的捐款,为同期美国大学之最 [40] - 过去50年中,由斯坦福教授、学生和毕业生创办的公司超过1200家,目前超过50%的硅谷产品来自斯坦福校友的公司;1988-1996年间,由斯坦福人创办的企业(含惠普)收入占硅谷总收入的60% [41][42] - 斯坦福专利办公室已将超过8000项学校专利授权给企业,获得13亿美元的专利费,孵化了包括惠普、谷歌、特斯拉等众多知名公司 [43] 中国对标斯坦福的探索与潜力 - 文章以浙江大学石虎山机器人创新基地为例,指出其占地6000平方米,分布着31家机器人、人工智能初创企业,堪称中国机器人“幼儿园”,展示了中国学术与产业结合的初步形态 [44] - 福耀科技大学被寄予厚望,因其由企业家资助,制度性约束更少,想象空间更大;王树国校长提出要从本科生开始实施个性化培养方案,摒弃“批量生产模式”,并采用全球顶尖师资和教材 [46] - 文章指出,中国目前最需要的是类似斯坦福的、能打通学术理论与产业创新的机构,当所有有利条件聚集时,“炼出中国科技新未来,只是个时间问题” [48][49]
“商业的HTTP”来了:谷歌CEO劈柴官宣 UCP,Agent 直接“剁手”下单,将倒逼淘宝京东“拆家式重构”?
AI前线· 2026-01-20 14:35
谷歌发布通用商务协议(UCP) - 谷歌CEO在NRF大会上正式宣布了Universal Commerce Protocol(UCP),这是一项旨在让AI智能体(Agent)能够直接在线上完成购物的开放标准 [2] - 该协议通过定义一组“代理商务的构建模块”,将端到端的购物流程拆解为可复用的能力组件,覆盖从商品发现到下单后服务的全流程 [2] - 目标是使生态系统在同一套标准下实现互操作,让任何Agent都能与任意商家对话并自主完成完整购物流程 [2] UCP的技术架构与核心能力 - UCP的架构设计连接了消费者触点(如Google AI Mode、核心搜索、Gemini)与零售商后台系统(如订单管理、库存管理) [9] - 协议定义了六项核心能力:产品发现、购物车、身份绑定、结账、订单以及其他垂直能力 [10] - 其中,身份绑定、结账、订单三项能力已宣布可用,而产品发现、购物车及其他垂直能力尚未上线 [10] - UCP并非孤立协议,可与谷歌其他Agent协议协同使用,如Agent Payments Protocol(AP2)、Agent2Agent(A2A)以及Model Context Protocol(MCP) [11] UCP的战略意义与行业影响 - 风险投资人Linas Beliūnas评论称,谷歌对“商业”做了类似HTTP对Web所做的事情,UCP试图将传统电商链路“搜索—广告—商品页—结账”压缩为“意图—Agent推理—购买” [5] - UCP旨在成为商业领域的“HTTP”,即所有由AI介导交易背后不可或缺的基础设施,可能标志着“非人类商业”的开端 [6] - 行业观察者Scott Wingo认为,谷歌在NRF的动作是一次“震撼与威慑式”的进攻,将大会焦点从传统零售议题转向了Agent Commerce [6] UCP解决的核心问题:商品可发现性 - UCP旨在用一套协议建立“通用兼容性”,商家只需按标准描述商品与销售方式,即可在不同平台和Agent间通用,其真正要解决的核心难题是“可发现性” [16] - 这意味着页面不再是交易唯一入口,商品数据本身成为入口,对传统零售网站是一次变革 [17] - 谷歌正在升级其商品数据规范,为Merchant Center新增数十个字段,包括描述性文本、产品规格、Q&A、评论等,以提供AI所需的内容与上下文,这被视为Google Shopping Feed 2.0 [18][19] - 专家建议品牌和零售商应尽可能扩展商品级内容与上下文,这直接决定其在AI时代能否被Agent选中 [19] 主要合作伙伴与生态建设 - UCP发布之初已集结科技与金融领域重量级玩家,首日即吸引20多家合作伙伴加入 [21] - 合作伙伴主要分为两类:零售商与电商平台(如Shopify、Walmart、Target、Etsy、Wayfair等),以及支付与清算体系(如PayPal、Stripe、Visa、Mastercard等) [23] - 蚂蚁金服(ANT Financial)也已出现在UCP合作名单中 [23] 行业竞争与未来趋势 - OpenAI此前也已推出过主打“即时结账”的Agent商业协议,但谷歌的优势在于绝大多数零售商本就熟悉其广告与企业服务生态 [14] - 阿里巴巴近期在其千问App上线AI Agent“任务助理”,打通淘宝、支付宝等应用,可自动完成选店、下单等流程,显示其也在布局自有AI商务平台 [24] - 趋势显示,到2026年,Agent正从技术展示加速进入真实交易和服务场景,成为真正的赚钱工具,并可能对“社交+电商+服务”的组合进行洗牌,重写入口、链路和分发规则 [24][25]
分析师称OpenAI广告业务2030年将达250亿美元,对谷歌搜索构成实质性挑战
环球网资讯· 2026-01-20 14:01
公司业务与战略 - OpenAI正式启动ChatGPT广告测试,将在未来几周内向部分免费及Go订阅用户展示广告,初期广告将出现在回答内容底部并与对话上下文相关,所有广告将明确标注且不会与广告商共享用户的私人对话内容[3] - 公司正探索“对话式广告”模式,允许用户在ChatGPT中研究、比较并讨论潜在购买选项,这种深度互动被视为高意向场景[4] - 广告业务被视为提升盈利能力的关键路径之一,公司需要在用户体验、商业化与隐私保护之间取得平衡[4] 财务与收入预测 - 据Evercore ISI高级分析师预测,若OpenAI顺利推进其广告战略,到2030年其年度广告收入可能达到250亿美元以上[3] - 该分析师指出,到2026年实现数十亿美元的广告收入,到2030年突破250亿美元的路径是合理的[3] - OpenAI首席财务官披露,公司2025年年化营收已突破200亿美元,较2023年的20亿美元增长十倍[4] 市场与竞争格局 - 分析师指出,OpenAI有望在四年内打造一个年收入高达250亿美元的广告业务,直接冲击谷歌的核心搜索广告市场[1] - 谷歌的搜索与YouTube广告业务预计将在2025年创造近3000亿美元收入,Meta则将贡献约1800亿美元,两者均享有超过40%的营业利润率[4] - 分析师认为,OpenAI若能构建一个“有益而非侵入式”的广告体验,将有效分流原本流向谷歌的商业搜索流量[4] - 尽管前景可观,但OpenAI要撼动谷歌的主导地位仍面临巨大挑战,谷歌拥有成熟的广告技术栈并通过浏览器、操作系统和用户习惯构筑了强大生态壁垒[4] - ChatGPT不会一夜之间取代谷歌,但其存在已经改变了竞争格局[4] 用户基础与数据价值 - ChatGPT每周活跃用户已接近10亿[3] - 大量用户在与ChatGPT互动时主动表达需求、兴趣和购买意图,这类高价值信号正是谷歌和Meta数字广告帝国的基石[3]
SK海力士将向员工发放创纪录巨额年终奖;台积电或在美国追加投资5家工厂;王腾新公司完成数千万种子轮融资
搜狐财经· 2026-01-20 13:35
文章核心观点 全球科技、媒体和电信行业在2026年初呈现活跃态势,主要围绕半导体制造与投资、人工智能芯片与模型进展、初创企业融资与估值飙升、以及消费电子新品发布等关键领域展开,显示出行业持续的技术创新与资本投入热潮 [1] 半导体制造与投资 - SK海力士将向全体员工发放创纪录的年终绩效奖金,人均约1.36亿韩元(约64万元人民币),奖金池总额预计达4.5万亿韩元(约212.72亿元人民币),源于公司2025年营业利润预计逼近45万亿韩元(约2127.15亿元人民币)并将其中10%用于奖金,员工可选择将最高50%的奖金兑换为公司股票并持有满一年以获得额外15%现金奖励 [2][4] - 台积电计划将2026年设备投资定为创历史新高的最多560亿美元,投资重点在亚利桑那州和台湾,并可能在美国亚利桑那州基地至少追加投资5家工厂,以应对预计达到产能3倍的AI半导体增产需求 [5] - 中微半导即将推出首款非易失性存储器芯片,为4M bit容量的低功耗SPI NOR Flash,具有低成本、低功耗、高速读写和掉电不丢失等特点 [15] 人工智能芯片与硬件 - 特斯拉CEO马斯克公布AI芯片研发路线图,称AI5芯片设计接近完成,AI6进入早期开发,未来目标是实现9个月的设计周期,并指出AI4将使自动驾驶远超人类水平,AI5将提升汽车与擎天柱机器人性能,AI6用于机器人与数据中心,AI7/Dojo3将基于太空计算 [6] - OpenAI计划在2026年下半年发布其首款硬件设备,该产品由OpenAI与苹果前设计师乔尼·艾维合作打造 [7] - OpenAI在2025年年化营收突破200亿美元,较2024年的60亿美元大幅增长,其算力规模从2024年的0.6吉瓦提升至2025年的1.9吉瓦,周活跃与日活跃用户数持续创历史新高 [8] 人工智能模型与融资 - 谷歌旗下Gemini人工智能模型的授权业务在过去一年实现爆发式增长,其热销有望进一步提振谷歌云核心服务器销售及基于Gemini的软件销售业务 [9] - 红杉资本计划加入由新加坡政府投资公司和美国Coatue领投的融资轮,对Anthropic进行巨额投资,此轮融资预计筹集数百亿美元,其中GIC和Coatue各出资15亿美元,微软和英伟达已承诺投资150亿美元,风险投资等将再投入100亿美元或更多,交易将使Anthropic估值达3500亿美元,较四个月前翻倍多 [10] - 由阿里巴巴投资的人工智能初创企业月之暗面在最新一轮融资中估值达48亿美元,较数周前的43亿美元有所提升,此轮融资有望很快完成交割 [11] 消费电子与公司动态 - 荣耀发布Magic8 Pro Air手机,售价4999元起,机身厚度6.1mm,重量155g,搭载5500mAh电池及5000万像素主摄,同时发布与泡泡玛特合作的限定版手机,售价4499元 [13] - TCL科技公告,董事长李东生不再兼任公司CEO,提名首席运营官王成担任首席执行官,全面负责日常经营管理工作 [14] - 原小米中国区市场部总经理王腾成立的新公司“今日宜休”完成数千万元种子轮融资,投资方包括高瓴创投、智元机器人等,公司计划在下半年发布系列软硬件产品并出海 [12] 市场观察 - 美股大盘股走势出现分化,昔日备受追捧的“美股七雄”等科技巨头股票中,多只已跑输大盘,反映出投资者对人工智能支出热潮日趋谨慎 [17]
2 Top Quantum Computing Stocks to Buy in January
The Motley Fool· 2026-01-20 13:00
量子计算行业前景与投资策略 - 量子计算是继人工智能之后最热门的科技趋势之一 但技术仍处于早期阶段 一些纯量子计算公司几乎没有收入 投资者应谨慎对待 [1] - 早期投资量子计算股票应关注拥有长期记录的公司 而非投机性初创企业 [2] Alphabet (GOOG/GOOGL) 量子计算进展 - Alphabet在量子计算领域研究多年 并于2024年底取得重大进展 推出了能显著减少量子计算机固有错误的处理器Willow [3] - Willow芯片解决了传统超级计算机需要10 septillion年才能完成的复杂数学问题 仅用时5分钟 随后发布的量子算法比传统算法快15000倍 [4] - 公司正致力于其六个里程碑中的第三个目标 即实现少于一个错误的100万次计算步骤 [5] - Alphabet拥有充足现金支持量子计算投资 第三季度(截至9月30日)自由现金流约为246亿美元 [6] - 公司当前股价为330.34美元 市值4.0万亿美元 毛利率59.18% 股息收益率0.25% [7] Microsoft (MSFT) 量子计算进展 - Microsoft在量子计算领域拥有突破性技术 其Majorana 1处理器能创造一种全新的物质状态(拓扑超导体) [8] - Majorana 1的优势在于能创造稳定快速的量子比特 最终目标是在单个处理器上实现100万个量子比特 [9] - 公司通过与Atom Computing合作向客户提供商用量子计算机 并通过Azure Quantum云服务销售量子计算服务 作为第二大云服务商 量子云服务可能在未来几年成为其增长点 [10] - Microsoft拥有充足现金支持投资 第三季度(截至9月30日)自由现金流为256亿美元 [11] - 公司当前股价为460.16美元 市值3.4万亿美元 毛利率68.76% 股息收益率0.74% [12][13] 投资价值分析 - Microsoft和Alphabet均已确立在量子计算领域的主要参与者地位 并拥有持续多年投入的资本实力 [13] - 两家公司股票目前估值具有吸引力 其市盈率均为过去12个月盈利的33倍 而科技股平均市盈率接近45倍 [14] - 凭借相对较低的估值、用于新技术投资的大量现金以及当前的技术发展 Alphabet和Microsoft在未来几年处于从量子计算中获益的有利地位 [14]
速递|Gemini API月度请求五个月翻倍至850亿次,谷歌AI的“两条腿”战略
Z Potentials· 2026-01-20 10:57
Gemini AI业务增长与财务影响 - 谷歌Gemini AI模型访问权限销售业务在过去一年呈现爆发式增长,反映出模型质量持续提升 [1] - 发送至Gemini API的请求从3月的约350亿次增长至8月的约850亿次,增长了一倍多 [3] - AI业务增长势头有望进一步推高谷歌云服务器销售核心业务的营收,因为客户在AI领域的投入往往会带动他们对谷歌其他产品的额外采购 [1] Gemini API业务发展 - 谷歌通过谷歌云的应用程序编程接口销售其模型的访问权限 [3] - Gemini 2.5版本发布后获得开发者好评,API销量开始迅猛增长,众多客户想使用导致谷歌不得不调整模型交付方式以提升效率 [5][7] - Gemini 3发布后同样获得强烈好评,并引发了新一轮的使用激增 [8] - API调用的支出也带动了其他谷歌云产品的消费增加 [9] 盈利能力与成本结构 - 谷歌预计2024年资本支出在910亿至930亿美元之间,这几乎是其2024年525亿美元资本支出的两倍,其中包括对AI业务的支持 [2] - 最初的Gemini 1.0和1.5模型利润率为负,运营成本高于收费价格 [8] - Gemini 2仅在某些情况下实现了正向利润,Gemini 2.5则取得了正向利润,但利润仅能覆盖提供代币服务的直接成本,并未涵盖模型研发投入 [8] - 截至去年年中,谷歌旗下所有型号Gemini产品的混合利润率仅勉强为正,远低于云业务整体利润率水平 [9] Gemini Enterprise软件业务 - 基于AI模型销售软件的新兴业务近几个月快速增长,但获得的客户反馈呈现两极分化 [2] - Gemini企业版已覆盖1500家公司的800万订阅用户,同时线上注册用户也超过100万 [3] - 专门为客户提供谷歌云服务咨询的顾问公司Sada的高管表示,与其交流的客户中,略微超过半数对Gemini Enterprise有良好的体验,但喜欢和不喜欢它的客户比例接近五五开 [4] - 毕马威咨询公司的内部调查显示,83%的毕马威员工对Gemini企业版感到满意 [10] - 客户反馈显示,该产品在企业数据基础上的浅层通用问题解答及基于代码仓库生成代码方面表现良好,但在应对高度具体的问题或执行特定任务指令时力不从心 [11] 市场策略与客户行为 - 谷歌面临的一大挑战是说服企业为其基于AI模型开发的复杂软件付费,这类软件能显著提升其AI业务的利润率 [3] - 谷歌历来更像是一个“构建者”的云平台,而非一个“购买产品”的云平台,客户可能选择构建定制化智能体而非购买Gemini Enterprise [5] - 尽管反馈不一,但客户对Gemini Enterprise产品颇为满意,尚未放弃使用,这与对待Copilot等竞争对手的态度不同 [12]
喝点VC|a16z 2026预测:创业公司的机会在“有主见”的交互界面
Z Potentials· 2026-01-20 10:57
文章核心观点 - 2025年是消费者AI产品发布的爆发年,各大模型实验室推出了众多新功能和新应用,但市场格局呈现高度集中态势,ChatGPT在用户规模、参与度和留存率方面保持绝对领先,而Google的Gemini则展现出强劲的增长势头 [5][6][7] - 通用AI助手(如ChatGPT)面临产品体验的局限性,其通过现有对话框界面推送的多种新体验(如购物、任务、学习模式)均未实现真正突围 [6][9] - 成功获得大量用户的消费者AI产品(如Replit、Suno、Character AI)通常拥有观点鲜明且专注的专用界面,能为用户提供超越通用模型的“超能力”,这为创业公司留下了巨大的市场机会 [6][21][22] - 模型公司(如OpenAI、Google)的战略重心在于模型本身和通过现有核心产品交付新功能,而非在核心能力之外进行广泛的消费者应用创新 [21] 主要AI实验室/公司的表现与战略 OpenAI (ChatGPT) - ChatGPT保持了巨大的消费者采用率,估计跨平台周活跃用户已达8亿至9亿,继2023年成为史上最快达到1亿周活的产品后持续增长 [7] - 2025年通过现有ChatGPT界面推送了多项新模型和体验(如GPT-4o图像生成、群聊、录音转写、购物研究、任务和学习模式),但均未在使用率或留存率上实现真正突围 [6][9] - 推出了“连接器”功能,允许ChatGPT访问G Suite、Microsoft、Notion等工作应用以提取上下文并执行操作,旨在成为个人工作管理中心 [9] - 产品扩展存在两个例外:1) 独立应用Sora作为创意工具全球下载量超过1200万,但作为社交应用30天留存率低于8%(顶级应用通常超30%)[10];2) 浏览器Atlas功能强大但仅限于Mac,估计访问过其下载页面的ChatGPT用户不足5% [10] - 未来的关键看点是Apps(第三方开发者在ChatGPT中构建体验的新基础设施),若成功,ChatGPT有机会成为十多年来第一个真正的新消费者平台 [10] Google (Gemini) - Gemini在用户规模上约为ChatGPT的34%(网页端)至40%(移动端),但增长迅猛:桌面用户同比增长率高达155%(ChatGPT为23%),且过去五个月增速仍在加快 [7] - 付费订阅增长亮眼:Gemini Pro订阅量同比增长近300%,而ChatGPT为155% [8] - 与OpenAI将所有功能集成进ChatGPT的策略不同,Google为新产品创造了更多独立“接触面”,例如独立的图像模型Nano Banana(发布第一周生成2亿张图像,为Gemini带来1000万新用户)和视频模型Veo 3 [12] - NotebookLM是成功新界面的典型案例:网页端用户同比翻番以上,5月推出的移动应用月活跃用户已达800万 [12] - 在将AI嵌入核心产品方面取得进展,如Chrome中的Gemini、Gmail的“帮我写”、Google Meet的实时语音翻译等,但AI模式在Google Search中的交互率仅约2% [13][14] - 未来的关注点包括将AI带入更多核心体验,以及创新核心UI的尝试(如能将搜索标签页重组为交互式Web应用的Disco)[14] 其他核心玩家 Anthropic (Claude) - 专注于“专业消费者”尤其是技术型用户,几乎所有发布都围绕Claude或其扩展(如Claude for Chrome)[15] - 推出了强大的工作新原语,如Skills和Artifacts,其AI生成幻灯片、文档和模型的速度与可靠性在测试中远超ChatGPT的Agent [15] - Claude Code产品在六个月内达到10美元的年化营收,预计未来将继续投资并可能发布一流的数据分析界面等产品 [15] Perplexity - 专注于技术门槛较低的“效率发烧友”类专业消费者用户 [17] - 最大发布是AI浏览器Comet(拥有超过100万用户)和邮件助手 [17] - 公司年化营收达1亿美元,付费使用量同比增长6倍,月活跃用户超过2000万 [17] - 通过收购(如Read.cv、Visual Electric)可能暗示了明年的资源投入方向 [17] xAI (Grok) - 从年初零用户增长至12月中旬的950万日活跃用户和3800万月活跃用户 [18] - 推出了独立应用,并通过伴侣功能(如Ani和Rudi,拥有全动画角色)掀起波澜 [18] - 在Grok Imagine中推出了自己的图像和视频模型,能力提升速度极快 [18] - 更深度整合到X应用中,例如用户可“长按”时间线上的图片进行编辑或制作视频 [18] - 未来目标包括制作“可观看的”电影和AI生成游戏,并可能在X应用中让模型控制算法以匹配用户兴趣 [19] Meta (Meta AI) - 推出了独立应用Meta AI,经历负面舆情后于9月重新发布,并推出AI生成短视频信息流“Vibes” [20] - 应用显示出持续增长,主要在美国以外地区,截至12月中旬日活达420万,月活达2660万 [20] - 在现有应用(Facebook, Instagram, WhatsApp)中拥有巨大分发优势,并开始整合AI功能(如Instagram Reels的AI翻译)[20] 市场格局与创业公司机会 - AI使用率总体上升,但消费者支出高度集中:仅9%的消费者同时订阅了ChatGPT、Gemini、Claude和Cursor中的一项以上 [6] - ChatGPT在用户参与度和留存率上占主导:日活/月活比率为36%(Gemini为21%),第12个月桌面端用户留存率为50%(Gemini为25%)[7] - 大语言模型助手竞争呈现“赢家拿走大头”的局面,而非完全的“赢家通吃” [6][7] - 模型公司的注意力集中在模型本身和通过现有产品交付新功能上,这为致力于构建专用消费者体验的创始人留下了巨大的空白机会 [21] - 已出现许多成功的消费者AI产品案例(如Replit、Gamma、Character AI、Suno),它们拥有专注的界面,赋予用户“超能力”,且收入增长迅速 [22] - 创业公司甚至可能从ChatGPT即将推出的第三方应用发现和分发机制中受益 [22]
AIDC电源革命开启-2026从预期到现实
2026-01-20 09:50
涉及的行业与公司 * **行业**:人工智能数据中心电源与储能行业 * **公司**:英伟达、谷歌、微软、Meta、三星、村田、博迁新材、天通电子、台达、铂科新材、英飞凌、Flex、MPS、西安西电、Vicker、阳光电源、曼美欧陆通、金盘科技 核心观点与论据 数据中心功耗与功率密度激增 * 数据中心芯片功耗显著增长,英伟达单颗芯片功耗从十年前的250瓦左右上升到Ruby芯片的1,800~3,600瓦,增长超过10倍[5] * 谷歌、微软和Meta的数据中心芯片功耗也呈现类似增长趋势[5] * 数据中心机柜功率密度大幅提升,从2020年单机柜10千瓦左右上升到英伟达Rubin Ultra芯片开伯尔机柜的兆瓦级别,不到10年提升两个数量级[6] * 谷歌数据中心单Pod功率到2025年可达10兆瓦级别[6] 未来新增功率需求巨大 * 预计到2028年,仅北美AI数据中心新增功率可达70吉瓦左右,加上中国需求,全球总新增功率预计达百吉瓦级别[1][7] 供电技术演进路线明确 * 英伟达与谷歌均提出数据中心供电四步走战略,最终目标一致:采用中压整流器或固态变压器将中压交流一步降至800伏直流,提高转化效率[1][8][9] * 传统UPS将被快速放量的HVDC迭代,预计2026至2028年,800伏特的新一代HVDC将迅速扩展市场份额[32] * SST作为终极技术路线,预计2028年会有不错的商业化节奏并快速增长[32] 电源技术发展趋势 * **一次电源**:发展方向是高压直流和固态变压器,SST难点在于高频变压器技术,目前仅少数企业交付产品或样机[1][12] * **二次电源**:单颗PSU功率不断提升,需采用碳化硅和氮化镓等第三代半导体及新型拓扑结构,功率从5.5千瓦逐步提升至SST中的40千瓦[14] * **三次电源**:趋势是垂直供电技术,将供电脉冲通过PCB孔垂直送至GPU或CPU,提高效率并减少损耗[15] 核心零部件市场机遇 * **AI芯片电容**:市场由三星和村田主导,三星份额40%,村田45%,三星原材料来自博迁新材[1][16] * **AI线路电感**:仅天通电子、台达全资子公司及铂科新材三家公司能实现材料器件一体化,价值量大幅提升[2][18] * **固态断路器**:在兆瓦级机柜中应用前景广阔,英伟达白皮书指出每个一兆瓦机柜内使用1,500安固态断路器进行保护[4][26] * **第三代半导体**:碳化硅和氮化镓是关键技术,碳化硅半导体成为固态断路器、高压直流设备和SST架构的关键材料[3][28] 储能系统成为数据中心刚需 * 美国电网新规鼓励数据中心自建发电设施并配备储能系统以加快并网[4][23] * 德州SB6规定要求大型负荷具备需求响应能力,使得储能系统成为刚需[4][23] * 预计到2028年美国数据中心储能市场空间将超过100GWh,单年市场规模可能达到1,000亿以上[4][25] * 储能系统主要功能:解决电能质量问题、与风光联合供电、灵活并网或加速并网[22] 其他重要内容 行业标准与竞争格局 * OCP组织数据中心供电标准不断迭代,服务器PSU单个功率从700瓦提升至12千瓦,单机柜功率等级从12.6千瓦升级至800千瓦[10] * 市场上存在800伏和正负400伏两种电压标准,英伟达主推800伏,谷歌及一些ASIC公司主推正负400伏[11] * AI芯片对材料配方要求极高,中游电源模块企业首先考核供应商是否能快速提供符合性能参数要求的材料配方[19] * 博迁新材在纳米粉体领域具有显著优势,全球只有其可以供应120纳米以下甚至8纳米级别粉体[20] 市场空间与投资策略 * PSU电源市场预计在未来三年内达到百亿规模[30] * 评估市场空间可从四个方向入手:电源主机环节、新增核心零部件环节、电站级储能、第三代宽禁带半导体[29] * 投资应首先关注海外链,优选切入北美链或欧美链应用场景,重点关注价值量大的场景[35] * 国内厂商在电力电子技术方面领先,技术路线跟进速度快,在SST锚定最终技术路线后迅速产出样机产品[34]
谷歌刚掀了模型记忆的桌子,英伟达又革了注意力的命
36氪· 2026-01-20 09:12
文章核心观点 - 英伟达与斯坦福的研究人员提出了一种名为“端到端测试时训练”的新方法,旨在通过让大语言模型在推理过程中持续更新自身参数来学习并内化长上下文信息,从而替代或补充传统的基于注意力机制的KV缓存记忆方式 [1][4] - 该方法将记忆重新定义为一种持续的学习过程,其价值在于改变模型未来的预测,而非完整存储过去,为解决传统注意力机制因二次方成本而面临的可扩展性瓶颈提供了一种潜在的工程解决方案 [34] 技术演进与核心理念 - 测试时训练并非全新概念,其早期形式可追溯至2013年的动态评估,核心思想是在推理时通过下一词预测损失对模型参数进行小步梯度更新,使其适应当前文本的局部特征 [5] - 英伟达的TTT-E2E方法回归了最原初的动态评估理念,其测试时更新的唯一目标函数就是网络末端的下一词预测交叉熵损失,这使得模型的学习与最终任务完全对齐 [10] - 与谷歌Nested Learning等TTT-KVB路线不同,TTT-KVB侧重于教导模型如何构建内部记忆结构,而TTT-E2E则直接优化最终预测目标,实验表明后者能带来更低的语言建模损失 [10][16] 方法创新与工程实现 - 研究团队通过移除Transformer中的所有自注意力层,构建了一个仅含多层感知机的“玩具模型”,证明了仅靠测试时参数更新就能编码长上下文信息,其性能曲线几乎紧贴全注意力模型 [12][15] - 为了解决早期动态评估存在的训练-测试不匹配导致的参数漂移和灾难性遗忘问题,TTT-E2E引入了元学习框架,在训练阶段就模拟推理时的更新过程,让模型学会如何稳定、高效地更新自身参数 [20][21] - 在工程层面,该方法采用了多重安全阀以确保稳定性,包括结合滑动窗口注意力作为短期记忆、冻结大部分网络层、仅更新最后1/4的块,以及在可更新块中引入静态MLP来保护预训练知识 [24][25] 性能表现与优势 - 在语言建模损失方面,将760M参数模型的TTT-KVB方法改为使用下一词预测损失后,在8K上下文长度下的损失从2.818降至2.806,提升了0.012,这表明端到端优化能直接提升预测能力 [16][17] - 在长上下文扩展性上,当上下文长度增加到64K乃至128K时,TTT-E2E的损失曲线保持稳定,未出现优势稀释,而Mamba 2、Gated DeltaNet等其他线性时间模型以及TTT-KVB的损失则开始上升 [27] - 在推理延迟方面,TTT-E2E继承了参数学习方法的优势,其延迟不随上下文长度增长而显著增加,在H100上处理128K上下文的预填充阶段比全注意力模型快约2.7倍 [29] 局限性与适用场景 - TTT-E2E及其所在的线性模型路线在需要精确检索的“海底寻针”类测试中表现不佳,被全注意力模型碾压,这表明其记忆方式更偏向于压缩和概括,而非逐字存档 [31] - 该方法的训练成本较高,其训练延迟比标准Transformer高出50-100%,这在扩展到工业级的数万亿token训练时可能成为一个制约因素 [33] - 该方法更适合写作连贯性、长文理解、风格约束等任务,通过以学习压缩换取长上下文的可扩展性,使模型在超长上下文上既能高效运行,又能提升预测能力 [31][34]