Workflow
AI周观察:英特尔18A正式量产
国金证券·2025-10-12 16:43

摘要 风险提示 - 本周 AI 聊天应用市场活跃度分化,海外 Gemini 下降而 Perplexity 与 Claude 上升,国内应用则因国庆假期普遍 下滑。模型应用方面,OpenAI 正式上线迄今最强大的 GPT-5Pro API,凭借 40 万 Token 超大上下文窗口和多模态 能力,瞄准科研、法律等高端市场,定价为每百万 Token15 美元。谷歌预览了能像人一样操作网页的 AI 代理模 型 Gemini2.5 Computer Use,并升级视频模型 Veo 至 3.1 版本。此外,谷歌宣布其 AI 月处理代币数超 1300 万 亿,主要反映了新模型导致后端计算复杂度与成本激增,而非用户活跃度的直接体现。 - Semianalysis 发布 InferenceMAX 推理基准框架,以"TCO 每百万 token"和"每 MW 产出"衡量 AI 推理系统经 济性与能效,为 AMD 与 NVIDIA 竞争提供统一评估语境。结果显示,NVIDIA 在低至中交互性区间凭借 GB200/B200 与封闭软件栈保持优势,而 AMD 在中高交互性与 vLLM+MX4 组合下能效逼近、ROI 具竞争力。Infe ...