Seek .(SKLTY)

搜索文档
硅基流动上线DeepSeek-V3.1,上下文升至160K
第一财经· 2025-08-25 21:09
公司动态 - 硅基流动大模型服务平台上线深度求索团队最新开源的DeepSeek-V3.1 [1] - 该平台支持160K超长上下文处理能力 [1] 技术进展 - DeepSeek-V3.1作为开源大模型实现160K上下文长度突破 [1] - 硅基流动平台集成该模型强化长文本处理功能 [1]
硅基流动:上线DeepSeek-V3.1,上下文升至160K
新浪财经· 2025-08-25 20:32
据硅基流动消息,8月25日,硅基流动大模型服务平台上线深度求索团队最新开源的DeepSeek-V3.1。 DeepSeek-V3.1总参数共671B,激活参数37B,采用混合推理架构(同时支持思考模式与非思考模 式)。此外,DeepSeek-V3.1率先支持160K超长上下文,让开发者高效处理长文档、多轮对话、编码及 智能体等复杂场景。 ...
大厂怎么看DeepSeek-V3
2025-08-25 17:13
涉及的行业或公司 * 行业涉及人工智能芯片、大模型训练与推理、多模态AI应用[1][2][3][8][22][29][30] * 公司包括DeepSeek(深度求索)、华为(昇腾)、寒武纪、阿里巴巴(千问)、英伟达[1][2][8][25][26][29] 核心观点和论据 技术创新与标准制定 * DeepSeek定义U18M零IP8格式 旨在为国产芯片制定新标准 降低训练侧显存占用20%-30% 提升训练效率30%-40%[1][2] * 新格式通过将128x128量化块拆分成128x4小块减少显存占用和计算开销 优化反向量化过程[4] * 采用混合精度策略 敏感参数(如attention)保留FP16高精度计算 非敏感参数采用U18M零IP8处理[5] * 新协议将通过OCP扩展为国产芯片的RP8协议标准 头部厂商将引领变革 通过AI芯片联盟推动标准化[1][10] 国产芯片发展现状与挑战 * 推理侧国产芯片将率先采用FP8格式 预计半年到一年内落地 显著降低成本[8] * 训练侧尚无国产厂商能完全独立完成训练 算子覆盖率仅约50% 存在梯度量化误差和张量扩展不成熟问题[8][9] * 大规模应用预计需等到2025年第二季度或第三季度[8] * 现有硬件可通过软件兼容FP8但性能受限 真正量产需等待下一代硬件支持 周期约一年[10][11][12] 模型性能与市场竞争 * DBC V3.1版本引入混合推理 增强agent能力 增加8,400亿TOKEN数据集 提升长文本、代码理解和数学能力(从70分提高到87分)[3][25] * 开始基于国产芯片进行FP8兼容 价格下降 接近全球顶尖水平 处于全球前六位置 与千问3相当[3][25][26] * 国产文本模型单一模态能力接近海外顶尖模型 但尚未实现全模态 与国际顶尖水平相差5-6分[26][27][28] 多模态发展与算力需求 * 2026年第一季度头部国产AI模型将逐步进入多模态时代 对算力需求依然较高[3][30] * 国外顶尖模型(如GPT-5、Claude 4)参数规模达万亿级别 训练集群庞大(如谷歌使用50万张GPU 其中25万张H100)[29] * 国内算力资源有限(通常8-9万到十几万张训练卡) 通过提升训练效率、优化算法和数据集提高性能[29] * 多模态发展将带来参数量和数据量增加 对高性能计算卡需求持续增长[30] 产业影响与生态建设 * SP8数据格式将提升国产大模型训练效率 缩小与国际领先水平差距 通过统一标准加速技术普及与应用[6][7] * 验证周期约两个季度 预计2026年第一季度大厂发布支持新格式模型 中小厂稍滞后[14] * 短期内对英伟达卡影响不大(技术验证需半年 产业化需一年) 2026年第三季度后对英伟达推理卡(如H20、L40)产生较大影响[17][18] * 现有存量H800、A800、H100等设备将通过算法和技术手段挖掘潜力(提升20%-30%)[19] 其他重要内容 * FV8数据格式是官方IP8子集 可在NV显卡上运行 提升显存利用率和通信效率20%-30%[21] * FP8格式无法全量覆盖所有参数 在科学运算、金融、医学等对精度要求极高领域表现不佳 可能导致训练不稳定[23][24] * 国产FPGA需补齐CUDA生态通用算子 支持ONNX格式 优化量化版本算法 解决集群规模扩大后的系统性问题[20] * 多模态应用中 视频生成需大量显存(一分钟视频占用几十GB) 需针对视频和图像生成进行专门调整[22]
DeepSeek、阿里云AI编程能力进化,全球科技巨头密集投入 为何AI编程是AI领域最具确定性高增长赛道之一?
每日经济新闻· 2025-08-25 15:16
行业动态 - AI编程成为全球大模型落地最狂热的赛道之一 海外市场涌现一批估值超10亿美元的AI编程独角兽 总融资规模达240亿元人民币 竞争从产品功能比拼升级为生态控制权争夺 [2] - 海外AI编程独角兽阵营已形成梯队 截至2025年6月估值超10亿美元的企业至少有7家 [3] - AI编程是当前人工智能领域最有用 用户最愿意付费且增长最快的应用方向之一 并非简单的提效工具 而是重塑软件生产关系的新基建 [1] - 底层模型的持续进步直接提升产品体验 领先应用利用交互数据反哺模型优化 形成模型-产品-用户-数据的正向循环 开发者社区口碑效应结合产品驱动增长模式实现高效病毒式传播 [5] - 当AI将软件开发成本和门槛降至极低时 大量因成本过高而被压抑的个性化软件需求将被释放 催生远超存量市场的庞大衍生经济 增量市场潜在规模高达150亿美元(2030年) [6] 技术进展 - DeepSeek于8月21日正式上线DeepSeek-V3.1 支持多种Code Agent框架 开发者可自行搭建智能体 在Aider编码测试中取得76.3%高分 远超Claude 4 Opus和Gemini 2.5 Pro(0325) [1] - DeepSeek-V3.1在代码修复测评SWE与命令行终端环境下的复杂任务(Terminal-Bench)测试中相比先前版本有明显提高 [2] - 阿里巴巴于8月22日面向全球用户发布Agentic编程平台Qoder 集成全球顶尖编程模型 提供上下文工程能力 可一次检索10万个代码文件 基于强大编程智能体实现AI自主研发 大幅提升真实软件开发效率 [1] - 国内企业采取开源策略 Qwen3-Coder采用Apache 2.0协议允许免费商用 DeepSeek-V3.1在Hugging Face开源Base与推理双版本降低使用门槛 吸引全球开发者参与生态建设 [4][5] 竞争格局 - 阿里巴巴推出Qoder后 意味着百度 腾讯 阿里巴巴三大巨头在AI编程赛道齐聚 百度有Comate 腾讯有CodeBuddy 字节跳动有Trae [2] - 国内科技企业形成性能追赶 生态协同 全栈布局的独特优势 Qwen3-Coder比肩Claude 4 DeepSeek-V3.1登顶开源编程第一 打破海外模型在编程领域的主导地位 [4] - 以通义千问为代表的国产大模型市占率持续提升 在OpenRouter上AI编程领域市占率从5%(7月下旬)提升至22%(8月中旬) [6] - 海外AI编程独角兽Anysphere凭借AI原生IDE产品Cursor 仅用三年从默默无闻到估值近百亿美元 通过自然语言对话预测开发者需求自动完成代码生成 积累约3万名企业客户包括OpenAI等科技巨头 年化经常性收入突破5亿美元 [2][3] 战略意义 - 科技巨头押注AI编程不仅是为了写代码更快 而是为了在下一轮全球算力和AI竞争中占据高地 Coding AI将成为新一轮AI叙事的起点 [5] - 如果未来机器能完成人类80%以上能力 那么Coding AI是AGI的基础 [5] - AI编程目前已经成为AI最先落地的核心应用之一 国内外多个科技巨头推出相关产品 AI或将率先颠覆它的创造者——AI编程 [6] - 国产开源大模型的持续进步 有望成为国产IDE加速发展的重要基础 [6]
英博数科观察:DeepSeek V3.1 发布,AI 工程化的关键一跃
中金在线· 2025-08-25 14:54
核心观点 - DeepSeek V3.1版本以工程实用主义为核心进行升级 在不牺牲主流任务质量的前提下 实现工具调用 思维组织与系统集成更稳更快更省[1][3] - 此次迭代标志着大模型发展从拼参数走向拼工程 从追求能力走向追求可用性 推动AI在真实场景中发挥更大价值[14] 技术升级 - 思维模式支持更完整 tokenizer增加4个与推理/检索相关的特殊token 配合后训练策略约束 使思考-检索-工具-回答链条更可控[4] - 工具与代理能力更稳 在函数调用 检索增强 智能代理等场景中调用意图更明确 参数更规整 失败重试更克制[4] - Think变体效率提升 DeepSeek-V3.1-Think回答质量对齐DeepSeek-R1-0528 但响应更快 吞吐与时延表现更友好[4] - 长上下文训练数据扩充 32K扩充阶段数据增长10倍到630B tokens 128K扩充阶段数据增长3.3倍到209B tokens[5] - 采用UE8M0 FP8缩放数据格式训练 兼顾可移植性与微尺度数据流兼容 推理时仍采用FP32格式[4] - 新增Anthropic API协议层兼容与适配 便于在现有中台与工具链中快速替换或并行评估[4] 格式兼容性 - 训练阶段兼容Microscaling格式 可能为兼容国产硬件提供更好量化性能[6] - 缩放块大小为128*128 能被Microscaling格式块大小整除 兼容MXFP8格式[7] - 模型后缀weight_scale_inv层的尺度数据值均为2的整数幂或乘系数后为2的整数幂 可表达为E8M0格式 而DeepSeek-V3-0324无法精确表达[7] 性能评估 - 在24点问题测试中 DeepSeek-V3.1非思考模式减少运行长度 思考模式运行较多token且出现中英混杂 而DeepSeek-R1能以较快速度得到正确结果[8] - 使用AIME2025题目评估思考效率 在DeepSeek-R1需思考少于8k tokens的六个题目上 DeepSeek-V3.1(think)平均节省约15% token[9] - 在DeepSeek-R1需思考9k~13k的三个题目上 DeepSeek-V3.1(think)额外思考50%+长度完成题目[9] - 在DeepSeek-R1未能在16k tokens限制做出的五个题目中 有一个题目DeepSeek-V3.1(think)在15k tokens完成[9] - 猜测在较短(<8k)思维长度上 DeepSeek-V3.1具有更普遍的思维效率提升 但在较长(8k~16k)思维长度上可能存在思维效率下降[10] 部署优化 - 将R1思维能力合并到V3.1中 通过模版开关同时提供no-think和think模式 使模型部署工程更简化[11] - 在V3/R1时代需分别部署两套设施 分别维护和扩缩容 每个集群保留buffer资源[12] - 部署一套V3.1模型后 小吞吐一体机方案可缩减50%成本 大吞吐场景只需运维一套集群和保留一份buffer资源 运行成本和运维成本均降低[13]
DeepSeek新版本引爆国产算力
虎嗅· 2025-08-25 14:06
行业动态 - DeepSeek发布V3.1版本并宣布模型支持下一代国产芯片 [1] - 英伟达通知供应商暂停中国特供版芯片H20的生产 [1] 行业趋势 - 中国人工智能行业迎来重要时刻 [1] - 国产算力行业出现新的转机 [1]
AI本土化?特斯拉将接入DeepSeek和豆包
观察者网· 2025-08-25 13:54
合作与技术整合 - 特斯拉与字节跳动旗下火山引擎达成合作 由火山引擎为特斯拉智能座舱交互体验提供大模型服务 [2] - 特斯拉车机语音系统同时接入字节跳动旗下豆包大模型和深度求索旗下DeepSeek Chat [2] - 豆包大模型提供语音命令功能 包括导航、媒体播放、温度控制及查询车主手册 [3] - DeepSeek提供AI互动功能 车主可与语音助手聊天并获取天气、新闻等资讯 [4] 功能与车型支持 - 车主可通过物理按键、"嘿 Tesla"或自定义唤醒词激活车机语音助手 [4] - 特斯拉中国未明确哪些车型支持AI互动能力 [6] - 在美国 AI互动功能仅支持搭载AMD Ryzen芯片的特斯拉车型 且需订阅每月9.9美元高级车载娱乐服务包 [6] - 豆包大模型在中国支持直接控车指令 而美国Grok大模型仅支持聊天和信息获取 无法直接控制车辆 [6] 市场表现与本土化战略 - 2025年上半年特斯拉中国市场累计销量约26.34万辆 较2024年同期下降约5.4% [9] - 2025年7月特斯拉上海工厂销量(含出口)为6.79万辆 同比下降8.4% 环比下降5.2% [9] - 特斯拉在中国推出售价33.9万元的6座版Model YL 通过加长车身和6座布局吸引家庭用户 [7] - 特斯拉预计2026年推出低成本Model Y 尺寸更小且成本低20% 将主要面向中国消费者 [9]
半导体早参丨国产芯片版块迎来“DeepSeek”时刻,A股美股半导体联袂大涨!
每日经济新闻· 2025-08-25 09:32
市场表现 - 2025年8月22日A股主要指数大幅上涨 沪指涨1.45%报3825.76点 深成指涨2.07%报12166.06点 创业板指涨3.36%报2682.55点 [1] - 半导体主题ETF表现突出 科创半导体ETF涨7.02% 半导体材料ETF涨5.79% [1] - 隔夜美股半导体板块普涨 费城半导体指数涨2.70% 恩智浦半导体涨4.87% 微芯科技涨5.32% 应用材料涨1.66% [1] 个股表现 - 寒武纪股价20CM涨停 突破1200元关口 收盘价达1243.20元 总市值站上5200亿元 [2] - 炬芯科技2025年上半年营业收入4.49亿元 同比增长60.12% 归母净利润0.91亿元 同比增长123.19% [2] - 炬芯科技扣非净利润0.86亿元 同比增长269.08% 主要受益于端侧AI音频芯片量产和无线音频产品需求爆发 [2] - 盛科通信2025年上半年营业收入5.08亿元 同比下降4.56% 归母净利润-0.24亿元 较上年同期减亏58.36% [3] 行业动态 - DeepSeek言论引爆半导体和算力行情 海光信息、中科曙光等龙头个股接连涨停 [2] - 2025中国算力大会8月23日开幕 我国在用算力中心标准机架数达1085万架 智能算力规模达788EFLOPS [3] - 工信部表示将优化全国算力布局 引导智能算力基础设施适度超前建设 [3] 产品与业务 - 炬芯科技端侧AI音频芯片进入多家头部品牌立项阶段 无线音频终端产品实现量产 [2] - 盛科通信核心产品以太网交换芯片收入3.63亿元 占比71.46% 支持100Mbps到800Gbps端口速率 [3] - 以太网交换芯片模组收入0.61亿元 占比11.94% 应用于企业网络、数据中心网络等领域 [3] 行业观点 - 国内半导体设备及零部件国产化率仍然较低 具备先进制程突破能力的公司将受益 [4] - 先进封装是提升AI算力芯片性能的关键技术 将助力AI算力升级浪潮 [4] - 国产AI算力芯片厂商迎来黄金发展期 持续追赶海外龙头厂商 [4] ETF配置 - 科创半导体ETF跟踪上证科创板半导体材料设备主题指数 半导体设备占比59% 半导体材料占比25% [4] - 半导体材料ETF中半导体设备占比59% 半导体材料占比24% 聚焦半导体上游领域 [4] - 半导体设备和材料行业具备国产化率低、替代天花板高的属性 受益于AI需求扩张和技术进展 [4]
国产芯片版块迎来“DeepSeek”时刻,A股美股半导体联袂大涨!
每日经济新闻· 2025-08-25 09:31
市场表现 - 沪指涨1.45%报收3825.76点 深成指涨2.07%报收12166.06点 创业板指涨3.36%报收2682.55点 [1] - 科创半导体ETF涨7.02% 半导体材料ETF涨5.79% [1] - 道琼斯工业平均指数涨1.89% 标普500涨1.52% 纳斯达克综合指数涨1.88% [1] - 费城半导体指数涨2.70% 美光科技涨1.63% ARM涨3.48% 恩智浦半导体涨4.87% 微芯科技涨5.32% 应用材料涨1.66% [1] 行业动态 - DeepSeek言论引爆A股半导体和算力行情 寒武纪 海光信息 中科曙光等龙头个股接连涨停 [2] - 寒武纪股价突破1200元关口 20CM涨停封板 收盘价达1243.20元 总市值站上5200亿元 [2] - 2025中国算力大会于8月23日在山西大同开幕 [3] - 截至2025年6月底 我国在用算力中心标准机架数达1085万架 智能算力规模达788EFLOPS [3] 公司业绩 - 炬芯科技上半年实现营业收入4.49亿元 同比增长60.12% 归母净利润0.91亿元 同比增长123.19% 扣非净利润0.86亿元 同比增长269.08% [2] - 炬芯科技端侧AI音频芯片进入多家头部品牌立项阶段 无线音频客户终端产品实现量产 [2] - 端侧AI处理器芯片落地头部音频品牌高端音箱 Party音箱等产品 销售收入实现数倍增长 [2] - 盛科通信上半年实现营业收入5.08亿元 同比下降4.56% 归母净利润-0.24亿元 同比增长58.36% [3] - 以太网交换芯片收入为3.63亿元 占比71.46% 以太网交换芯片模组收入为0.61亿元 占比11.94% [3] 行业前景 - 国内半导体设备及零部件国产化率仍然相对较低 国产化率较低环节及具备突破先进制程能力公司有望充分受益 [4] - 先进封装是提升芯片性能关键技术 适用于先进AI算力芯片 助力AI算力升级浪潮 [4] - 国产AI算力芯片厂商不断追赶海外龙头厂商 迎来黄金发展期 [4] - 科创半导体ETF跟踪上证科创板半导体材料设备主题指数 囊括半导体设备59%和半导体材料25%细分领域公司 [4] - 半导体材料ETF指数中半导体设备59% 半导体材料24%占比靠前 充分聚焦半导体上游 [4]
DeepSeek 更新,一句话让国产芯片集体暴涨
36氪· 2025-08-25 07:36
公司技术更新 - DeepSeek V3 1版本采用混合推理架构Hybrid Reasoning Architecture 支持思考模式和非思考模式自由切换[6] - 新架构集成通用对话 复杂推理 专业编程等核心功能于单一模型 打破此前V3与R1模型分离的壁垒[9] - 推理效率大幅提升 思考模式下任务表现与前代顶级R1-0528持平 但输出token数量减少20%至50% 非思考模式输出长度更短且性能不打折[9] - 实现思维链压缩 训练阶段生成更简洁高效的推理路径 在保证答案准确性的同时降低计算成本[10] - 采用UE8M0 FP8参数精度 结合MXFP8块缩放技术 减少信息损失并节省资源[13][15] - UE8M0 FP8格式动态范围大 可同时表示极大和极小数 避免数据溢出或归零[15] - 新参数精度与国产新一代芯片原生兼容 包括摩尔线程MUSA 3 1 GPU和芯原VIP9000 NPU[16] 行业影响 - 国产AI进入软硬协同阶段 减少对英伟达 AMD等国外算力依赖[2] - 打破性能越高成本越贵的行业魔咒 为金融 医疗等高算力场景应用提供经济方案[2][10] - 社区测试显示DeepSeek V3 1在Aider多语言编程测试中分数超过Claude 4 Opus且成本更低[10] - 国产芯片概念股应声大涨 每日互动尾盘拉升收盘大涨13 62%[2] - 推动国产AI芯片技术升级 此前大部分国产AI加速器仅支持FP16 INT8方案[16] 用户反馈与应用 - 开发者社区反响热烈 Hugging Face平台热度显著上升[12] - 用户生成内容多样化 包括符合物理定律的小球动态模拟 振动编码VJ制作 个性化自画像等[17][18][19] - 部分用户反馈翻译和写作功能需现场编写SYSTEM PROMPT指令 存在中英夹杂和错词问题[21] 产品定位与市场表现 - DeepSeek以低调方式发布V3 1版本 未进行大规模宣传[4] - 品牌成为国产AI精神图腾 市场对下一代R2版本期待度高[23]