Workflow
token
icon
搜索文档
“百虾大战”开打,云厂商重估token价值
第一财经· 2026-03-27 21:57
行业趋势:Agent(智能体)市场爆发与“百虾大战” - 科技行业出现“百虾大战”,腾讯、阿里、百度、京东、网易有道、小米、360等厂商纷纷入局,使市面上的龙虾(Agent)相关产品扩容至数十个[3] - OpenClaw推动AI从对话层走向执行层,降低了AI使用门槛,提振了B端用户使用大模型的意愿,AI to B已成为所有云厂商最大的增量市场,正站在产业级AI爆发的临界点[5] - Agent不是过渡产品,而是一个有诉求、有场景的概念,具备不侵入、自动化、安全可控完成任务的能力[8][9] 市场影响:Token消耗激增与云业务增长 - Agent市场的繁荣最明显地体现在云厂商的token(词元)消耗量增长上,token消耗提升带动了算力使用大幅提升[4][5] - 京东云龙虾产品一周内token调用量环比增长455%[5] - IDC预计,全球最大的2000家上市公司的Agent使用量到2027年将增长10倍,token和API调用量将增长1000倍[5] - 字节跳动旗下火山引擎日均云端大模型调用量在不到两个月时间内上涨超60%,并提高了MaaS年业务收入超百亿元的目标[7] 公司动态:主要云厂商的战略布局 - **腾讯**:其Workbuddy产品原型1月已迭代出来,1月17日上线,春节后补齐了远程控制能力并推出与企业微信、QQ等的联动能力,腾讯CodeBuddy整套基建是该产品迅速推出的基础[3];腾讯云将MaaS平台升级为TokenHub,并发布了涵盖Infra、模型与生态、场景及应用、安全维度的Agent产品全景图[3][7] - **阿里**:成立了Alibaba Token Hub事业群,以“创造token、输送token、应用token”为核心目标,由CEO吴泳铭亲自挂帅,其判断未来商业化MaaS收入将成为阿里云收入最多的产品[7] - **行业观点**:腾讯云预期今年整体营收增长会高于去年,AI将是一大增长引擎[5];但公司也强调只消耗token不是健康的生意,更重视SaaS业务和AI带来的训练、数据库等需求,token是重要的管理指标之一,但不放在最高优先级[7][8] 应用场景:Agent能力的多元化拓展 - Agent能力可用于多场景,例如代码编写、日常业务协同、办公事务处理、合同审核、标书撰写和审核、视频材料读取、内部审计等核心领域替代人工[6] - Agent可以在客服领域审核人工客服的回答质量,对于无人机巡检拍摄的照片,也能替代人力快速阅读、提出见解[6] - 由于人群画像有多样性,Agent多样性也会存在,哪个做得更好取决于工程信息提取和上下文理解能力[9] 行业挑战:对Token商业模式的冷思考 - 业界认为,如果仅靠token消耗,是无限压低价格的游戏,此前云厂商围绕大模型调用打价格战[6] - 有观点认为token不是有黏性的业务,利用低价获取客户容易导致客户流失,与其关注token,不如关注能否做出跟OpenClaw同样好用且更安全的Agent[8] - 云厂商需要评估Agent的深度影响,并在这波机遇中继续调整身姿[5][8]
黄仁勋的三颗炸弹,炸出了什么?
吴晓波频道· 2026-03-25 08:30
文章核心观点 - AI行业正经历深刻变革,其发展由三大关键趋势驱动:以“token”为衡量单位的新经济模式、以OpenClaw为代表的智能体操作系统普及,以及物理AI(具身智能)的加速落地 [2][3][4][6] AI时代的新经济模式:Token与Token工厂经济学 - “Token”将成为AI时代的新货币,是衡量AI工作量的单位,AI处理的文本越多、任务越复杂,消耗的token就越多,成本也越高 [3] - 全球AI算力需求在过去两年暴涨了100万倍,预计到2027年将达到1万亿美元 [4] - 增长源于AI已突破“推理拐点”,从基于检索的计算转向需要自主推理和内容创造的生成式AI,算力成为行业最大瓶颈 [4] - 数据中心将成为“token生产工厂”,未来AI企业的核心竞争力在于单位能耗下的token生产效率,即“每瓦token吞吐量”,这直接决定了生成token的成本与企业的营收和生死 [4] 智能体操作系统的战略必要性:OpenClaw - 最近爆火的“龙虾”OpenClaw,本质上是Agent计算机的“操作系统”,其开源特性让每个人和企业都能搭建自己的AI智能体 [4] - 未来,每一家SaaS公司都会向“智能体即服务”转型 [4] - 每一家公司都必须制定OpenClaw战略,未来企业为员工配备“年度Token预算”将像配备办公经费一样平常 [5] AI的物理化:具身智能与机器人 - 物理AI正在引爆,AI正加速走出数字世界,拥有与物理世界交互的“身体” [6] - 在自动驾驶领域,比亚迪、现代、日产等车企加入英伟达Robotaxi平台,推动自动驾驶规模化落地 [6] - 在通用机器人领域,英伟达的Project GR00T通用基础模型,能让机器人通过观察人类行为直接学习自然语言和模仿动作,无需人工编码指令 [6] - 未来,类似迪士尼乐园的卡通人物互动角色,可能由聪明灵活的机器人扮演,这标志着具身智能成为AI的新“肉身” [6]
黄仁勋暴论核弹:AGI已经实现,Ilya错了,程序员有10亿
量子位· 2026-03-24 16:47
文章核心观点 - 英伟达首席执行官黄仁勋在访谈中提出,通用人工智能(AGI)已经实现,并基于此第一性原理对未来技术、产业和社会变革进行了系统性展望 [1][3][8][189] - 访谈核心围绕AI Scaling Laws的持续演进展开,驳斥了行业对数据瓶颈和推理计算轻量化的悲观判断,并阐述了从预训练、后训练、推理时到智能体(Agentic)的完整扩展路径 [4][5][14][15][21][23] - 智能(Intelligence)未来将作为一种可按需分层定价的商品(Token)大规模流通,开启“Token的iPhone时刻”,而人性、品格等特质将比智能更为宝贵 [8][116][120][246][248][249] AI Scaling Laws 的演进与未来 - **预训练(Pre-training)远未触顶**:行业曾因高质量数据耗尽而恐慌,但合成数据将推动数据规模继续扩张,训练瓶颈已从数据转移至算力 [16][17][18] - **推理(Inference/Test time)绝非轻量计算**:推理是思考,远比阅读(预训练)困难,涉及规划、搜索和解决问题,因此需要强大的计算系统 [5][6][19][20] - **智能体扩展(Agentic Scaling)是下一个阶段**:智能体能够进行研究、调用工具并派生子智能体,本质是“AI的乘法”,其产生的高质量数据与经验将反哺预训练,形成增强循环 [21][22][23] - **模型与硬件架构的协同设计周期**:AI模型架构约每六个月变化一次,而系统与硬件架构周期约为三年,公司通过自身研究、深度合作及CUDA的灵活性来预判方向并保持平衡 [24][25][26][27][28] 未来计算范式与基础设施 - **计算角色转变**:从检索式计算(文件仓库)进入生成式计算(Token工厂),新世界需要的算力远高于旧世界 [109][110][111][112][113][114] - **数据中心与能源挑战**:电网在99%的时间有大量闲置电力(仅使用约60%峰值),需重新设计可优雅降级的数据中心,在电网高峰时利用备用发电机或迁移负载,而非盲目扩容电网 [45][47][48][49][50][51][53][57] - **英伟达的硬件演进**:从专为MoE大模型推理设计的Grace Blackwell,转向为需要调用工具的智能体设计的Vera Rubin机架,系统复杂度增加但追求必要简单 [29][30][72][74] - **太空计算的潜力与挑战**:为处理卫星产生的海量实时遥测数据,需在太空边缘进行AI处理,但面临辐射散热等工程挑战 [103][104][105] AI驱动的产业与社会变革 - **智能商品化与Token经济**:智能将像iPhone一样分层定价,高价值Token(如一百万个Token值1000美元)将用于专业场景,计算在全球GDP中的占比可能比过去高出100倍 [116][120] - **OpenClaw的标志性意义**:OpenClaw对于智能体系统的意义,如同ChatGPT之于生成式AI,是历史上增长最快的应用形态,被视为“Token时代的iPhone” [8][32][33][121] - **程序员职业的进化而非取代**:编程本质是规格说明(Specification),具备此能力的人群可能从3000万激增至10亿,木匠、会计等职业将因AI工具而整体能力抬升 [8][206][208][210][211][212] - **AI对就业的实质影响**:以放射科医生为例,AI接管看片任务后,医生人数反而增加,因为职业核心是解决问题而非单一任务,岗位位移将冲击单一任务型工作 [195][199][201][203][236][237] 公司战略与管理哲学 - **市场创造而非份额争夺**:英伟达的许多市场此前并不存在,公司是在创造新市场,因此其规模难以用传统市场份额思维衡量 [118] - **领导力与决策过程**:通过持续分享信息、洞察和推理过程来塑造团队认知,重大决策宣布时让员工觉得顺理成章,目标是让所有人进入同一方向 [131][132][133][136] - **处理压力与焦虑的方法**:拆解问题,对能行动的部分立即执行,并系统性遗忘无法控制的部分,强调对尴尬的耐受力 [140][141][143][144][145][166] - **“光速”与第一性原理设计理念**:强制从物理极限出发进行设计,反对在历史包袱上进行持续优化,追求从零开始的根本性重构 [67][68][69][70] - **知识传承与接班人规划**:通过在日常会议中公开推理,将所学所知即时传递给团队,以此作为最重要的接班规划,而非传统形式 [261][262][263][265] 对中国科技产业与合作伙伴的观察 - **中国科技崛起的原因**:全球约一半AI研究人员是中国人且大部分在本土,其优势在于移动互联网时代的软件人才基础、内部省份竞争催生强者,以及基于家庭朋友关系的“类开源”知识快速传播文化 [76][77][79][80][83][85][87] - **台积电的成功要素**:核心能力是协调全球数百家客户动态需求,并同时做到技术驱动与极致客户服务,与英伟达合作30年涉及上百亿美元业务但无合同,基于深厚信任 [90][91][92][93][94][96]
传媒互联网产业行业研究:蚂蚁要约收购耀才获批,阿里成立Token Hub事业群
国金证券· 2026-03-22 20:24
报告行业投资评级 * 报告未明确给出统一的行业投资评级,但针对不同细分领域给出了具体观点和建议 [4] 报告的核心观点 * 报告认为,尽管部分互联网巨头因传统业务与AI业务新旧动能转换引发市场焦虑并导致股价回调,但其拥有落地AI所需的资源、数据、场景及现金流,伴随回调估值逐步具备吸引力,建议积极关注其AI业务落地进展 [4] * 报告建议持续关注汽车后市场板块的龙头公司 [4] * 报告建议关注贝壳-W [4] * 报告建议持续关注网约车板块 [4] 根据相关目录分别进行总结 1.1.1、消费&连锁咖啡茶饮 * **行业表现**:本期(2026年3月16日-3月20日),恒生非必需性消费业指数累计下跌2.95%,跑输恒生指数2.21个百分点 [9] * **个股表现**:关注个股中,古茗(+6.79%)、茶百道(+5.11%)涨幅居前;瑞幸咖啡(-5.33%)、Tims天好(-7.85%)跌幅较大 [9] * **行业观点**:咖啡行业高景气维持,各品牌积极开店,阿拉比卡咖啡期货价格下跌后续有望带来成本改善;茶饮行业略有承压,4月起受基数影响需关注数据波动风险 [4] * **行业动态**: * 瑞幸咖啡截至3月16日当周新开门店91家,其中一二线城市占比54.9%,三线及以下城市占比44.0%,香港市场占比1.1% [15] * 瑞幸推出三款瓶装即饮咖啡新品,入局即饮市场 [15] * 古茗全国上新HPP瓶装果汁系列 [15] * 挪瓦咖啡在浙江开建年产能两万吨的自动化烘焙工厂,预计可提升产品品质30%以上,降低原料成本约5%,人工成本50%以上 [15] 1.1.2、电商&互联网 * **行业表现**:本期恒生互联网科技业指数累计下跌2.98%,分别跑输恒生科技指数和恒生指数0.85和2.24个百分点 [14] * **个股表现**:关注个股中,仅美团-W(+4.21%)上涨;京东集团-SW(-0.91%)、阿里巴巴(-9.47%)、腾讯控股(-7.21%)等普遍下跌 [14] * **行业观点**:电商持续承压,1-2月网上商品零售额20812亿元,同比增长10.3%,但受消费环境影响,持续性仍需观察 [4] * **行业动态**: * 阿里速卖通作为官方合作伙伴加入YouTube“购物联盟计划”,韩国创作者可在视频中挂出商品链接 [22] * 速卖通在波兰市场推行“品牌+科技”战略,从低价导向转向品牌和质量为核心的发展方向 [22] 1.2.1、流媒体平台 * **行业表现**:本期恒生传媒指数下跌4.72%,跑输恒生指数3.99个百分点,跑输恒生科技指数2.60个百分点 [19] * **个股表现**:关注个股普跌,腾讯音乐(-28.89%)、腾讯音乐-SW(-25.14%)跌幅显著;奈飞(-3.66%)相对抗跌 [19] * **行业观点**:行业竞争加剧,预计今年在线音乐订阅收入增速将放缓,需关注非订阅音乐收入开启第二增长曲线 [4] * **公司业绩**:腾讯音乐2025年总收入329亿元,同比增长15.8%;经调整归母净利润95.9亿元,同比增长25%;其中在线音乐服务收入267.3亿元,同比增长22.9% [4][23] * **行业动态**: * 爱奇艺发布AIGC创投大会招募计划,面向全国征集影视创作团队 [21] * 网易云音乐全面接入OpenClaw,成为首个向AI Agent开放核心音乐服务能力的平台 [28] * Spotify正布局XR智能眼镜设备,开发音乐信息与歌词显示功能 [28] 1.2.2、虚拟资产&资产交易平台 * **市场表现**:截至3月20日,全球加密货币市值24816亿美元,较上期微涨0.06%;比特币和以太币价格分别为70553美元和2146.97美元,较上期末分别变化-0.6%和+2.6% [24] * **个股表现**:耀才证券金融(+27.4%)因收购事件大幅上涨;老虎证券(-10%)跌幅较大 [27] * **行业观点**:宏观波动下加密市场情绪较低,币价承压 [4] * **监管与事件**: * 美国SEC与CFTC发布新监管指引,将加密资产分为五大类,并明确BTC、ETH等16种资产为“数字商品”,不属于证券范畴 [4][33] * 美国SEC批准纳斯达克代币化股票交易试点项目 [4][33] * 蚂蚁集团对耀才证券金融的要约收购已通过中国有关部门审批,预计3月30日完成交割 [4][33] * 香港证监会报告显示,截至2025年第四季度,香港加密ETF总市值上升142%至超过54亿港元 [33] * **公司业绩与动态**: * 老虎证券2025年全年收入6.12亿美元,同比增长56%;经调整净利润1.87亿美元,同比增长165% [4] * Coinbase面向美国以外交易者推出美股永续合约,并推出比特币收益基金 [33] 1.2.3、车后连锁 * **行业表现**:本期恒生综合指数累计下跌1.69%,跑输恒生指数0.95个百分点,但跑赢标普500指数0.20个百分点 [34] * **个股表现**:途虎-W(+0.52%)微涨;中升控股(-19.42%)、永达汽车(-10.6%)等经销商股跌幅居前 [34] * **行业观点**:建议持续关注汽车后市场板块龙头公司 [4] * **公司业绩**:途虎养车2025年汽车服务门店数量达8008家,位居全球第一;总收入165亿元,同比增长11.5%;调整后净利润7.0亿元 [4][39] * **行业动态**: * 2025年仅23.5%的汽车经销商实现盈利,亏损比例达55.7%;新车销售毛利贡献为-25.5% [38] * 2025年近5000家4S店退网,网络规模收缩1.4%至32432家,其中自主品牌网络增长1.1%,合资与豪华品牌网络分别减少5.7%和5.8% [38] * 美孚、嘉实多、壳牌等外资润滑油品牌发布涨价函,涨幅约8% [38] * 途虎养车与蔚来品牌达成战略合作 [38] 1.2.4、O2O * **行业表现**:本期恒生互联网科技业指数累计下跌2.98%,分别跑输恒生科技指数和纳指金龙中国指数0.85和2.70个百分点 [40] * **个股表现**:滴滴全球(+6.6%)上涨;贝壳(-5.08%)、贝壳-W(-4.83%)等下跌 [40] * **行业观点**:建议关注贝壳-W;建议持续关注网约车板块 [4] * **公司业绩**: * 贝壳2025年净收入946亿元,同比增长1.2%;经调整净利润50.17亿元,同比下降30.4% [4][46] * 滴滴2025年第四季度中国出行订单量同比增长10.1%至35.78亿单,日均订单量3890万单,连续12个季度保持双位数增长;国际业务订单量同比增长24.5%至12.65亿单 [4][42] * **行业动态**: * 曹操出行Robotaxi在杭州启用超过3600个虚拟上下车点 [45] * 腾讯出行服务接入小马智行、文远知行两家公司的Robotaxi服务 [45] 1.2.5、AI&云 * **行业表现**:本期纳斯达克互联网指数累计下跌1.69%,跑赢纳斯达克指数0.38个百分点 [47] * **个股表现**:关注个股普跌,谷歌A(-0.42%)相对抗跌;百度(-7.91%)、腾讯控股(-9.37%)、阿里巴巴(-9.47%)跌幅较大 [47] * **行业观点**:AI需求从Chatbot向Agent转变带动token及算力需求翻倍增长;互联网巨头是真正有资源、数据、场景及现金流去落地AI的主要公司 [4] * **行业动态**: * 阿里巴巴成立Alibaba Token Hub(ATH)事业群,并发布全球首个企业级AI原生工作平台“悟空” [50] * 因AI需求爆发及供应链涨价,阿里云AI算力、存储等产品最高涨价34%;百度智能云AI算力产品涨价约5%-30%,存储涨价约30% [50] * 腾讯撤销AI Lab,部分人员调整至大语言模型部 [50] * 月之暗面寻求新一轮融资,估值或达180亿美元 [50] * OpenAI将收购开源开发工具公司Astral,并确认ChatGPT广告业务目前仅限美国市场 [52] * **公司业绩**: * 腾讯控股2025年全年营收7517.7亿元,同比增长14%;ToB业务全年营收2294.3亿元创新高,云业务录得全年规模盈利 [52] * 阿里巴巴FY26Q3(截至2025年12月季度)总收入2848.43亿元,同比增长2%(不考虑资产处置同比增长9%);经调整归母净利润171.12亿元,同比下降67% [52]
英伟达改卖Token?黄仁勋GTC后发声:token就是AI新通货,值钱的不是算力,是“每度电的智商”
AI前线· 2026-03-18 19:37
公司战略定位与愿景 - 公司强调其本质是一家加速计算公司,而非单纯的GPU公司 [2] - 公司的目标是从算力平台演进为“全栈世界引擎”,通过垂直整合和协同设计,将整个软件世界加速后交给AI使用 [12][16][20][24] - 公司的核心方法是先垂直整合地做出一整套解决方案,再进行水平开放,让生态伙伴按需使用其部分或全部技术栈 [114][116] AI竞赛与行业瓶颈演变 - AI竞赛的焦点已从比拼算力转向比拼产出,核心衡量标准是能否快速、低成本地生成高质量结果 [4] - AI发展的瓶颈已从单一的计算环节,扩展到数据搬运、内存、网络和推理等全链路,任何一环的延迟都会制约最终产出 [4][5][24] - 衡量AI产出的核心单位是token,其价值取决于生成它的模型的“聪明”程度,即用更少token给出更准确、有用结果的能力 [7][8] 技术架构与产品布局演进 - 下一代AI推理将走向GPU与LPU(如收购的Groq)的混合架构,旨在解决极低延迟下的token生成问题,而非替代GPU [9][10][70] - Transformer架构在长记忆、处理物理规律和连续任务上存在不足,下一代模型需要混合架构(如Transformer + SSM)和具备几何感知等能力的新模型 [24][32][33][35] - 公司通过“解耦推理”策略,将推理任务(包括decode中的高计算量部分)在异构基础设施中进行更细粒度的拆分和优化,以扩展性能边界 [77][78][81] - CPU的角色至关重要,其单线程性能和I/O带宽是关键,以避免拖慢GPU。公司自研Grace CPU和Vera CPU旨在提供极高的单线程性能与带宽 [53][54][63][64] - 网络内计算(如Mellanox技术)是公司技术栈的关键部分,使得大规模NVLink成为可能 [86] 市场机会与商业模式 - AI已跨越经济价值门槛,基于推理、反思和工具使用的AI应用(如编程Agent)开始真正创造收入,改变了此前搜索等服务难以收费的局面 [39][40][41][74] - 在AI创造经济价值的场景下(如编程效率提升10倍),客户愿意为更高token速率和更低延迟的服务支付溢价 [75][90] - 建设千兆瓦级的AI工厂总投资约500亿至600亿美元,其中基础设施(土地、电力、厂房)约占150亿至170亿美元,其余为计算、网络、存储等 [25] - 公司的商业模式是提供技术栈和平台,而非最终产品或服务,通过将前沿技术开放给整个生态来扩大客户基础 [111][112][115] 行业竞争与生态格局 - 真正的竞争不在于单一的模型或芯片,而在于对整个技术栈(从电力、芯片、基础设施、模型到应用的五层蛋糕)的主导权 [10][24][98] - 中国在AI领域是不可忽视的力量,拥有大量有创造力的研究人员和出色的开源模型(如DeepSeek、Kimi、Qwen),全球技术栈需要能够吸收这些创新 [97] - 公司认为,将技术栈从上到下强制捆绑的策略会限制整体上限,应该让每一层自由竞争 [99] - 供应链面临全面压力,电力、芯片产能、土地等多环节均接近瓶颈,但公司通过长期规划和供应链布局,有信心支撑未来需求 [92][95][96] AI应用与Agent发展 - AI正从处理离散的语言token,转向需要同时理解记忆、结构和连续动作的现实世界任务 [24][36] - AI使用工具(Tool Use)是重要趋势,这些工具原本为人类设计(如Excel、SQL、Photoshop),需要被整体加速以匹配AI Agent的速度 [14][15][55] - 非结构化的工具使用(如通过多模态操作没有API的网页)是下一步方向,这依赖于强大的PC和数据处理系统 [57][58] - 编程是AI创造经济价值的典型领域,AI编程助手让工程师从写代码转向思考架构和解决问题,大幅提升效率 [45][46]
黄仁勋反驳“AI 吞噬软件”:传统软件模式要退场了,实时生成接管,算力需求翻几百倍
AI前线· 2026-02-27 10:55
英伟达第四财季及2026财年业绩表现 - 第四财季总营收为681.3亿美元,同比增长73%,高于市场预期的662.1亿美元[3][5] - 第四财季调整后每股收益为1.62美元,高于市场预期的1.53美元[5] - 净利润达到430亿美元,几乎是去年同期221亿美元的两倍[4] - 公司对下一财季的营收指引为780亿美元(上下浮动2%),显著高于分析师预期的726亿美元[3] 数据中心业务核心驱动 - 数据中心业务本季度营收为623亿美元,同比增长75%,超过606.9亿美元的市场预期[4] - 数据中心部门贡献了公司超过91%的销售额[3] - 用于连接GPU的网络设备销售额达到109.8亿美元,同比暴增263%[13] - 超大规模云服务商是公司最大的客户类别,占数据中心收入略高于50%[19] 下一代产品与技术路线图 - 下一代Vera Rubin机架级系统预计今年晚些时候推出,目标实现每瓦性能提升10倍[6] - 公司已向客户发出首批Vera Rubin样品,并计划在下半年启动量产交付[6] - 公司明确表示不会轻易转向chiplet(小芯片)设计,只要单片集成芯片还能做到极致,就会将其推到极限[10] - 通过NVLink 72等技术,实现了每瓦性能代际提升50倍,每美元性能提升35倍的巨大跃迁[11] 供应链与业务布局 - 公司正在将供应链从高度集中的亚洲地区拓展至美国和拉美,例如在台积电亚利桑那州新晶圆厂生产Blackwell GPU,并在墨西哥富士康工厂组装部分机架级系统[8] - 游戏部门本季度营收为37亿美元,同比增长47%,但环比下降13%[15] - 汽车业务(包括汽车和机器人芯片)本季度营收为6.04亿美元,同比增长6%[15] - 专业可视化业务本季度营收为13.2亿美元,同比增长159%[15] 市场观点与战略判断 - 公司认为AI行业已出现拐点,agentic AI在全球企业场景中具备了明确可用性,导致算力需求惊人[20] - 提出了“算力=营收”的核心等式:没有算力就无法生成tokens,没有tokens就无法实现收入增长[20] - 判断市场高估了AI对软件公司的威胁,认为大量软件公司会利用agentic AI来开发自身软件并提升效率,agents是“工具使用者”而非替代者[23] - 未来软件将由token驱动,AI所需算力是过去传统计算的数百甚至上千倍[24] 投资与合作 - 本年度公司向私营企业和基础设施基金投资了175亿美元,主要用于支持早期初创企业[17] - 公司仍在与OpenAI推进合作协议,并认为双方已接近达成[17] - 此前有报道称,英伟达可能对OpenAI进行300亿美元股权投资[17] 新兴领域探索 - 公司认为太空数据中心具有应用潜力,许多计算问题非常适合在太空完成,例如成像数据的处理[9] - Hopper架构GPU已成功部署在太空[9] - 公司正在推动Vera CPU作为独立方案进入市场,称其是唯一支持LPDDR5的数据中心CPU,设计目标是极强的数据处理能力[6][7] - 下一波拐点将是physical AI,把AI与agentic系统带入制造、机器人等物理世界应用[25] 网络业务与基础设施 - 公司已成为全球规模最大的网络公司之一,其Spectrum-X以太网平台取得了巨大成功[14] - 通过NVLink实现机柜内部的纵向扩展,再通过Spectrum-X和InfiniBand实现机柜之间的横向扩展,构建了完整的互联体系[13] - AI工厂的投资规模动辄达到100亿至200亿美元,网络效率的微小提升也能转化为巨额经济价值,这是网络业务高速增长的根本原因[14]
41年、7次转型后,迈克尔·戴尔再造戴尔:变慢的是人,变快的是AI
36氪· 2025-10-15 08:27
公司战略转型 - 戴尔科技宣布未来四年营收增速和每股收益目标均计划翻倍,并将股息承诺延长至2030年 [1] - 公司正主导从个人电脑公司向数据中心公司,再向AI工厂的转型 [1] - 创始人迈克尔·戴尔指出,AI进化是指数级的,而人类组织的响应是线性的,公司必须变得更快、更聪明 [1][3] AI工厂战略与Token经济 - AI工厂的核心是将数据转化为Token,即“智能的最小单位”,AI的价值在于从数据中持续产出Token的能力 [4][5] - 当AI从单模型过渡到多代理系统时,Token需求会呈现指数级增长,例如在自动驾驶、实时翻译等多模态应用中 [6][7][8] - 戴尔的定位是构建从“数据到Token再到智能”的路径,其AI战略聚焦于让Token能够落地、调度和重复产出 [9][10][14] - 公司已与超过3000家企业合作部署“AI工厂”,帮助企业客户在本地化环境中激活数据价值 [12][47] 市场趋势与业务表现 - 戴尔服务器网络业务去年增长58%,今年第三季度增长69%,显示强劲的市场需求 [12] - 超过85%的企业客户计划将AI工作负载从云端迁移回本地数据中心 [12][44] - 企业AI的核心问题已从“要不要做”转变为“如何运转起来”,市场需求转向实际部署能力 [13] 电力成为AI关键瓶颈 - 电力供应已成为支撑AI工厂Token指数级增长的首要瓶颈,模型和服务器在缺电情况下无法运行 [16][17][22] - 全球电网建设周期长且受能源政策限制,难以快速满足AI数据中心的电力需求,例如OpenAI计划建设10吉瓦级数据中心但面临电力来源不确定性 [18] - 戴尔通过硬件优化提升能效,具体措施包括冷板系统、冷却分配器和热交换后门等技术,旨在让同样的电力支撑更多AI任务 [19][20][21][23] 组织流程重构 - AI技术能够在几小时内完成任务,但传统组织流程仍以“天”或“周”为单位推进,形成了“人慢AI快”的效率差距 [24][25][26] - 戴尔通过将AI工具嵌入日常流程来优化组织效率,例如推出“Next Best Action”工具,能自动阅读客户通话记录并推荐解决方案,提升客服效率和满意度 [28][29][37] - 公司内部已广泛应用AI,销售用AI草拟邮件,工程师自动调试代码,产品经理总结反馈,目标是减少重复工作,提升判断能力 [35][36] 数据价值激活 - 企业并不缺乏数据,但缺少将沉睡数据转化为智能的能力,AI的价值在于激活专属数据而非单纯拥有海量数据 [39][40][42] - 约七成大型企业开始将AI部署从公有云迁回本地,原因在于最有价值的数据不会离开企业内网,本地化部署能更高效地激活数据 [44] - 戴尔科技帮助客户在本地机房搭建AI工厂,例如制造企业利用机器日志降低设备停机时间10%,银行通过交易记录提升欺诈检测效率 [45][47] 创始人思维与公司文化 - 公司41年来完成7次自我重塑,其核心源于创始人的逆向工程思维,即深入拆解复杂事物以理解其本质并重新构建 [48][50][57] - 迈克尔·戴尔的管理哲学是不迷信战略规划,而是通过不断提问来推进变革,例如追问“我们的组织结构是否比技术本身慢”或“客户真正需要的是硬件还是结果” [51][54] - 公司将“如果没有限制呢”和“AI会怎么做”固化为企业文化,推动持续创新和组织重构 [56]
深度|CEO详解亚马逊的AI路径图: 创收数十亿只是起点
Z Potentials· 2025-07-01 15:22
AWS的成就与AI业务发展 - AWS在过去一年见证了客户创新和新技术的快速采用,尤其是AI和生成式技术的爆发式增长[3] - AWS的AI业务已达到数十亿美元规模,包含基础设施业务、Amazon Bedrock平台以及应用层产品如Amazon Q[4] - AI已渗透到亚马逊业务的每个环节,包括物流中心优化、零售网站用户评论总结、Alexa Plus服务等[5] AI工作负载与推理经济 - 当前AI工作负载中推理的使用量已超过训练,预计未来80%至90%的AI工作负载将属于推理范畴[7][8] - 推理将深度嵌入应用程序,成为基础设施组件,如同计算、存储和数据库一样不可或缺[6][7] - token生成量是衡量AI工作负载的参考标准之一,但无法完全反映实际工作量,尤其在图像和视频生成领域[9] 技术创新与项目进展 - Project Rainier是与Anthropic合作的大规模定制服务器项目,用于训练下一代云端模型,规模是前代集群的五倍多[10] - Tranium two服务器已投入运营,在性能、性价比及扩展性方面表现突出[10] - AI成本仍然过高,需通过芯片级创新、软件优化及算法改进来降低计算资源消耗[11][12] 开放生态与合作策略 - AWS与Nvidia保持合作关系,提供最新的Nvidia技术如P6实例系列,同时发展自有技术如Trainium[14][16] - 市场空间巨大,AWS与Nvidia并非对立关系,客户需要技术选择的自由[14][15] - Anthropic模型在其他云平台的可用性不影响AWS的核心竞争力,多数相关应用仍运行在AWS上[17] 全球扩展与市场机遇 - AWS在拉美地区持续扩展产能,包括墨西哥、智利和巴西区域[19] - 欧洲市场将推出"欧洲主权云",专为欧盟关键主权工作负载设计,预计创造巨大市场机遇[6][19]