Workflow
推理成本
icon
搜索文档
华尔街这是“约好了一起唱空”?巴克莱:现有AI算力似乎足以满足需求
硬AI· 2025-03-27 10:52
算力供需分析 - 2025年全球AI算力可支持15-220亿个AI Agent,足以满足欧美1亿多白领和10亿企业软件许可证需求 [3][4] - 2025年全球将有1570万个AI加速器在线,其中40%(630万个)用于推理,50%推理算力(310万个)专用于Agent/聊天机器人 [4] - 现有H100等效安装基数为1570万颗,其中60%(940万颗)用于训练,40%(630万颗)用于推理,50%推理芯片(310万颗)分配给Agent服务 [5] - 使用高效模型(如DeepSeek R1)可使行业容量提升15倍,企业正转向开源模型(如Mistral)降低成本 [6][11] - 表面算力充足但存在结构性缺口,需更多专用推理芯片和训练GPU转推理用途 [13] 市场机会与竞争格局 - AI Agent市场增长潜力巨大,低推理成本和开源模型是盈利关键 [8][9] - 高效推理成本结构和专注小型高效模型的公司更具竞争优势 [13] - 超级Agent产品(如GPT-5)单月消耗3560万Token,日查询44次,远超普通Agent的2.6次 [18] 模型经济效益对比 - OpenAI o1模型Agent年成本2400美元,DeepSeek R1仅88美元,后者用户容量是前者15倍 [15] - Agent单次查询生成1万Token(传统聊天机器人400个),推理成本增加25倍 [15] - 不同模型参数差异显著:GPT-5参数1.5万亿(活跃33%),DeepSeek R1参数671亿(活跃6%) [5] 技术发展趋势 - 行业需从基准测试转向实用Agent部署,关注单位经济学 [2][13] - 更便宜/小型高效模型(如DeepSeek风格)是未来需求方向 [13]
​晚点财经丨任天堂起诉《幻兽帕鲁》制作商侵权;苹果面临欧盟要求其进一步开放 iOS 的威胁
晚点LatePost· 2024-09-19 21:28
AI算力与云计算 - 大模型推理成本一年内下降97%,远超摩尔定律速度[1] - AI驱动新增算力市场超50%需求,计算体系加速从CPU转向GPU[1] - 阿里云持续投资AI算力但仍无法满足客户需求[1] 智能手机行业 - 小米8月全球出货量超苹果升至第二,为近三年首次[2] - 低价机型帮助小米在印度、拉美、东南亚等市场抢占份额[2] - 苹果季节性下滑(8月传统淡季)助推小米排名上升[2] 汽车制造业 - 上汽大众计划关闭南京工厂,年产能36万辆[3] - 帕萨特生产将迁至仪征工厂,斯柯达品牌产能面临调整[3] - 蔚来拟竞购奥迪比利时工厂,应对欧盟加征关税[4] - 目标工厂主要生产奥迪Q8 e-tron,员工约3000人[4] 茶饮行业 - 喜茶宣布退出低价竞争,专注差异化产品策略[5][6] - 认为同质化竞争消耗用户热情,门店规模非行业关键[6] 游戏产业 - 任天堂起诉《幻兽帕鲁》侵犯游戏机制专利[7] - 游戏含100多个与宝可梦相似角色,Steam在线峰值达历史第二[7] 零售与消费品 - 特百惠申请破产保护,直销模式导致销售额大幅下滑[8] - 坚持不进入零售渠道,中国市场业务暂未受影响[8] 自动驾驶 - Waymo与现代洽谈使用Ioniq 5电动车搭载第六代自动驾驶技术[9] - 现代旗下Motional推迟Robotaxi计划并裁员数百人[9] 科技与反垄断 - Google提议出售AdX平台被欧盟拒绝[10][11] - 欧盟第四次指控Google偏袒自家广告服务[11] - 欧盟考虑强制苹果进一步开放iOS系统组件[12] - 苹果称现有iOS已平衡开发便利与用户安全[12]