Deepseek V3/R1
搜索文档
神秘资金持续加码AI应用!软件龙头ETF(159899)盘中连续第7日净流入!石基信息、四方精创、莱斯信息跌幅居前
搜狐财经· 2026-01-20 15:00
市场表现与资金流向 - 1月20日,高成长板块表现疲软,软件龙头ETF(159899)截至14时31分下跌3.70% [1] - 软件板块中,石基信息、四方精创、莱斯信息、中科星图、航天信息、神州信息等公司跌幅居前 [1] - 尽管板块调整,但资金热度不减,软件龙头ETF盘中连续第7日实现资金净流入 [1] 政策驱动与产业目标 - 工信部印发《推动工业互联网平台高质量发展行动方案(2026—2028年)》,提出到2028年,具有影响力的工业互联网平台数量超过450家,工业设备连接数突破1.2亿台(套),平台普及率达到55%以上 [3] - 该行动方案与《工业互联网与人工智能融合赋能行动方案》及《“人工智能+制造”专项行动实施意见》形成政策合力,共同推动工业互联网与AI融合,促进平台向“质优效高”转变 [3] 人工智能技术进展与预期 - 近期市场预期部分大型科技公司(如字节、Deepseek)将于春节前发布旗舰版大模型,有望进一步缩小与海外大模型的性能差距 [3] - 回顾去年,Deepseek V3/R1的发布曾引发显著的市场行情,部分投资者对今年春节前的新品发布抱有较高期待 [3] - AI大模型被视为底层生产力的变革,其应用场景广泛,包含传媒、游戏、办公、智能制造、智能驾驶等众多领域,有望重塑生产力内核 [3] 新兴概念与商业化前景 - GEO(生成式引擎优化)概念近期持续受到市场关注,它是一种针对生成式AI平台的优化策略,旨在让企业的品牌、产品或服务在AI生成式回答中被优先提及和精准推荐 [3] - GEO仅是AI大模型对AI搜索的一个升级,代表了AI应用的冰山一角 [3] - AI软件商业化进程正在加速,预计到2026年,AI Agent有望快速落地 [4] 行业趋势与投资展望 - 展望后市,短期内,人工智能板块仍具备一定的市场贝塔(β)机会 [4] - 中期来看,“AI+制造”的落地应用,可能将市场行情从“算力竞赛”阶段推向“应用兑现”阶段,当前板块仍被认为具备一定的配置价值 [4]
AI软件商业化进程加速,关注软件ETF(515230)、计算机ETF(512720)
每日经济新闻· 2026-01-15 09:49
板块市场表现 - 1月14日,软件与计算机板块涨幅居前,软件ETF(515230)收涨4.38%,计算机ETF(512720)收涨4.36% [1] 核心政策驱动 - 工信部印发《推动工业互联网平台高质量发展行动方案(2026—2028年)》,提出到2028年具有影响力的平台超450家、工业设备连接数突破1.2亿台(套)、平台普及率达到55%以上 [2] - 该行动方案与《工业互联网与人工智能融合赋能行动方案》及《“人工智能+制造”专项行动实施意见》形成政策合力,推动平台向“质优效高”转变 [2] 产业与市场预期 - 市场预期部分大厂(如字节、Deepseek)将于春节前发布旗舰版大模型,进一步缩小与海外的性能差距 [2] - 去年因Deepseek V3/R1发布曾引发市场行情,今年春节前部分投资者怀有较高期待 [2] - AI软件商业化进程加速,2026年AI Agent有望快速落地 [3] AI应用前景分析 - GEO(生成式引擎优化)概念持续火爆,但其仅是AI应用的冰山一角 [2] - GEO是一种针对生成式AI平台的优化策略,核心目标是让企业的品牌、产品或服务在AI生成式回答中被优先提及和精准推荐 [2] - AI大模型是底层生产力的变革,其应用场景广泛,包含传媒、游戏、办公、智能制造、智能驾驶等众多场景,有望重塑更多场景的生产力内核 [2]
SGLang 推理引擎的技术要点与部署实践|AICon 北京站前瞻
AI前线· 2025-06-13 14:42
SGLang 开源推理引擎发展现状 - 截至2025年6月 GitHub Stars达15K 月均下载量突破10万次 [1] - 已被xAI Microsoft Azure NVIDIA AMD LinkedIn 美团等行业巨头采用 [1] - 成为DeepSeek R1官方推荐推理引擎 并实现首个完全开源的大规模专家并行部署方案 [1] 核心技术优势 - 采用PD分离架构控制尾延迟 推测解码提升Token生成速度 KV缓存落盘优化显存 [2] - 实现RadixAttention Overlap Scheduling等高效架构设计 复现PD分离 大规模EP等前沿技术 [3] - 支持离线批处理最大化GPU利用率 线上推理优先保障Token生成速度的差异化部署策略 [4] 并行部署技术挑战 - 专家并行实现中面临通讯与Prefill/Decode传输KV缓存的时间重叠问题 [4] - 网卡资源争抢 CPU负载过大 Python GIL锁释放不及时等工程挑战突出 [4] 社区生态建设 - 开源模式吸引广泛参与 技术分享增强社区认同感 [5] - 超过100k显卡规模的工业部署经验反哺技术演进 [5] 关键技术解析 - PD分离使Decode延迟均匀稳定 允许采用不同并行策略提升资源利用率 [6] - 推测解码通过隐藏层信息一次预测多个Token 显著提升Decode速度 [6] - KV缓存落盘将历史上下文存储至大容量设备 避免重复Prefill计算 [6] 部署实践洞察 - 参数配置调试是影响上线效率的关键环节 需精细化优化而非依赖"开箱即用" [7] - 模型规模持续扩大背景下 多GPU与高效并行策略是实现高性价比部署的必经之路 [7] 行业活动预告 - AICon全球人工智能开发与应用大会将深入解析大模型推理关键技术 [2][7] - 聚焦AI Agent构建 多模态应用 大模型推理优化等前沿议题 [7]