高阶Agent应用

搜索文档
中美AI叙事和背后的算力逻辑
雪球· 2025-04-04 11:16
中美AI叙事差异 - 中国AI叙事聚焦于DS开源带来的LLM平权及小模型端侧、边缘侧应用落地 呈现全面开花态势 算力需求以H20和国产Asic为主 大厂持续加大数据中心投入 [1] - 北美AI叙事坚持通往AGI的技术路线 持续推出多模态高阶模型和万亿参数大模型 高端NV显卡供不应求 [2][3] 算力需求分化 - 中国场景下 H20和910c芯片可满足LLM chatbot及端侧AI推理需求 异构芯片如fpga+risc-v也能支持简单AI端侧推理 [4] - 北美高端NV芯片在以下场景不可替代: - GPT-4o类文生图及多模态应用 需高显存+大带宽 单次交互可能消耗500 TFlops [5][6][8] - 千亿/万亿参数大模型训练 NV高阶芯片的互联优势显著 [7] - AI医疗生物科技等科学计算 如AlphaFold3预测分子相互作用 手术机器人需超低延时 [7] - 高阶Agent应用 需支持高并发(如AI游戏数百万NPC交互)、超长上下文记忆(数万token)、多模态处理 [8] 商业化落地差异 - 中国AI应用商业化更快 如会议纪要AI月赚数千万 腾讯接入DS模型获得2000万DAU 成本效益显著 [3][8] - 北美CSP仍在探索多模态等高阶应用 成果周期较长 但若GPT-4o等突破性应用出现 将引发高端NV卡抢购潮 [9][10] 技术变量 - DS的AI infra能力是核心变数 若V4版本实现多模态且低耗能 可能颠覆NV高端芯片逻辑 [7][10] - 视频类企业(如字节跳动)对高端NV卡需求更强 因AI视频生成需500+TFlops和48G显存 [6]