推理成本 - 财报，业绩电话会，研报，新闻

推理成本

搜索文档

硬AI· 2025-03-27 10:52

算力供需分析 - 2025年全球AI算力可支持15-220亿个AI Agent，足以满足欧美1亿多白领和10亿企业软件许可证需求 [3][4] - 2025年全球将有1570万个AI加速器在线，其中40%（630万个）用于推理，50%推理算力（310万个）专用于Agent/聊天机器人 [4] - 现有H100等效安装基数为1570万颗，其中60%（940万颗）用于训练，40%（630万颗）用于推理，50%推理芯片（310万颗）分配给Agent服务 [5] - 使用高效模型（如DeepSeek R1）可使行业容量提升15倍，企业正转向开源模型（如Mistral）降低成本 [6][11] - 表面算力充足但存在结构性缺口，需更多专用推理芯片和训练GPU转推理用途 [13] 市场机会与竞争格局 - AI Agent市场增长潜力巨大，低推理成本和开源模型是盈利关键 [8][9] - 高效推理成本结构和专注小型高效模型的公司更具竞争优势 [13] - 超级Agent产品（如GPT-5）单月消耗3560万Token，日查询44次，远超普通Agent的2.6次 [18] 模型经济效益对比 - OpenAI o1模型Agent年成本2400美元，DeepSeek R1仅88美元，后者用户容量是前者15倍 [15] - Agent单次查询生成1万Token（传统聊天机器人400个），推理成本增加25倍 [15] - 不同模型参数差异显著：GPT-5参数1.5万亿（活跃33%），DeepSeek R1参数671亿（活跃6%） [5] 技术发展趋势 - 行业需从基准测试转向实用Agent部署，关注单位经济学 [2][13] - 更便宜/小型高效模型（如DeepSeek风格）是未来需求方向 [13]

晚点财经丨任天堂起诉《幻兽帕鲁》制作商侵权；苹果面临欧盟要求其进一步开放 iOS 的威胁

晚点LatePost· 2024-09-19 21:28

AI算力与云计算 - 大模型推理成本一年内下降97%，远超摩尔定律速度[1] - AI驱动新增算力市场超50%需求，计算体系加速从CPU转向GPU[1] - 阿里云持续投资AI算力但仍无法满足客户需求[1] 智能手机行业 - 小米8月全球出货量超苹果升至第二，为近三年首次[2] - 低价机型帮助小米在印度、拉美、东南亚等市场抢占份额[2] - 苹果季节性下滑（8月传统淡季）助推小米排名上升[2] 汽车制造业 - 上汽大众计划关闭南京工厂，年产能36万辆[3] - 帕萨特生产将迁至仪征工厂，斯柯达品牌产能面临调整[3] - 蔚来拟竞购奥迪比利时工厂，应对欧盟加征关税[4] - 目标工厂主要生产奥迪Q8 e-tron，员工约3000人[4] 茶饮行业 - 喜茶宣布退出低价竞争，专注差异化产品策略[5][6] - 认为同质化竞争消耗用户热情，门店规模非行业关键[6] 游戏产业 - 任天堂起诉《幻兽帕鲁》侵犯游戏机制专利[7] - 游戏含100多个与宝可梦相似角色，Steam在线峰值达历史第二[7] 零售与消费品 - 特百惠申请破产保护，直销模式导致销售额大幅下滑[8] - 坚持不进入零售渠道，中国市场业务暂未受影响[8] 自动驾驶 - Waymo与现代洽谈使用Ioniq 5电动车搭载第六代自动驾驶技术[9] - 现代旗下Motional推迟Robotaxi计划并裁员数百人[9] 科技与反垄断 - Google提议出售AdX平台被欧盟拒绝[10][11] - 欧盟第四次指控Google偏袒自家广告服务[11] - 欧盟考虑强制苹果进一步开放iOS系统组件[12] - 苹果称现有iOS已平衡开发便利与用户安全[12]