Workflow
Seek .(SKLTY)
icon
搜索文档
等不来DeepSeek-R2的246天:梁文锋的“三重困境”与“三重挑战”
36氪· 2025-09-23 18:13
核心观点 - DeepSeek-V3.1-Terminus版本发布 主要针对用户反馈问题改进 提升模型稳定性与一致性 [1] - 市场对DeepSeek-R2模型发布预期持续落空 自R1发布后246天内出现至少10次发布传言 反映公司面临技术、战略与市场竞争的多重压力 [2][5][6] - 公司通过开源策略推动技术普惠 开源包括通用模型V3.0324、多模态文生图模型Janus-Pro及底层工具链 但核心产品R2延迟暴露生态短板 [8][9][15] 技术更新与产品迭代 - DeepSeek-V3.1-Terminus版本更新 非例行迭代 重点改进用户反馈问题 提升稳定性与一致性 [1] - 开源通用模型DeepSeek-V3.0324 API成本为GPT-4的1/14 大幅降低使用成本 [8] - 开源多模态文生图模型Janus-Pro 但未在行业掀起波浪 [13][14] - 开源工具链包括FlashMLA解码内核、DeepGEMM矩阵运算库 推理速度提升约30% 并支持华为昇腾平台 [9] 市场预期与竞争环境 - 市场对DeepSeek-R2预期高涨 自2025年2月起多次传言发布 包括5月初、3月17日等 但均未实现 [5][6] - 竞争对手阿里巴巴通义千问、百度文心大模型已完成多轮功能迭代和模型升级 [6] - 公司估值因R1成功水涨船高 但R2延迟发布消耗用户耐心 导致市场预期管理失焦 [5][6][11] 技术挑战与算力限制 - R2延迟因技术突破难度大 需实现碾压级优势 但内部测试未达颠覆性提升 [6][11] - 算力供应问题突出 尝试迁移至华为昇腾芯片遇性能瓶颈和不稳定 被迫切回NVIDIA平台 [11] - 模型面临"幻觉"问题 在创意和事实性内容上表现不佳 影响用户信任 [15] 战略布局与生态构建 - 公司构建全栈开源技术体系 覆盖底层模型到上层工具链 推动国产AI算力落地 [8][9] - 缺乏内容生态优势 依赖外部数据集 无法像百度、字节跳动那样通过自有平台产生实时数据 [15] - 多模态能力缺位 技术路线单一 主要集中在文本和代码领域 限制商业化想象空间 [13][14] 行业影响与公司定位 - DeepSeek-R1开源策略降低AI技术应用成本 打破海外厂商垄断 推动行业创新 [17] - 公司面临创新者窘境 需在技术极致与市场时机间权衡 R2发布决策复杂化 [16] - 当前困境反映国内AI公司普遍挑战 包括技术瓶颈、战略短板和激烈竞争 [17]
DeepSeek成了硅谷最大的“不能说的秘密”
虎嗅· 2025-09-23 17:13
DeepSeek的行业影响 - DeepSeek模型完全免费且训练成本仅为西方模型的一小部分,性能更优价格更低,震撼了西方AI行业根基[14] - DeepSeek刚发布时几乎整个旧金山企业都在使用,包括非AI公司都在运行其本地化版本,成为硅谷“不能说的秘密”[1][14] - 企业悄悄在本地部署DeepSeek用于客服和后台等业务,因其成本极低且实用性强[14][15] 中国AI产业竞争力 - 中国在AI科技竞赛中具备超越美国的潜力,核心依据是顶级AI/ML期刊中中国学者高被引论文数量陡升而欧美近乎横盘[16] - 硅谷AI初创公司中中国籍员工比例很高,即使美国新冒头的AI初创公司骨子里也“很中国”[11][16] - 中国初创企业在面临芯片出口管制等限制条件下仍取得令人瞩目的技术突破,如DeepSeek绕过硬件限制实现创新[17] AI行业发展特征 - AI领域融资规模和增长速度史无前例,初创公司估值、融资额和年度经常性收入均创下纪录[11][21] - 欧洲增长最快的AI独角兽Lovable在8个月内达到1亿美元年经常性收入,速度超过美国同行[12] - 企业端对大模型应用热情有所降温,OpenAI数据显示企业日活下滑,个人使用量仍在攀升[21] 技术发展前景判断 - AI将像电力一样以近乎零边际成本普及,长期价值将集中在算力、带宽、存储、能源等基础设施领域[17] - 当前LLM和Transformer技术面临天花板,堆算力堆数据的边际收益递减现象开始显现[19] - 虽然中国AI公司更可能最终称雄,但距离真正的通用人工智能仍有很大差距[19] 中国企业出海机遇 - 中国AI公司出海面临的环境比想象中宽松,DeepSeek、华为、比亚迪已在西方年轻人心中建立品牌认知[22] - 中国文化软实力出口拐点已到,Labubu等IP产品在海外年轻人中形成潮流,为中国企业创造良好出海氛围[26][27] - 年轻海外用户通过TikTok等平台接触中国城市形象,对中国产生全新认知,有利于中国企业国际化[22] 创业生态观察 - AI浪潮中媒体偏好报道年轻创业者故事,但统计数据显示42岁首次创业成功率最高[23] - 更稳妥的创业路径是先进入优秀公司积累行业经验和领导能力,再独立创业[23] - 欧洲AI公司为与中国竞争采取“997”工作文化,认为必须比中国人更拼才能跑赢[12][19]
仅一个月 DeepSeek再升级!单项测试最大提升超36%
21世纪经济报道· 2025-09-23 16:44
公司技术升级 - DeepSeek-V3.1-Terminus版本于9月22日发布 输出效果相比前一版本更加稳定[1] - 新版本在Humanitys Last Exam测试中得分从15.9分提升至21.7分 提升幅度超过36%[1] - BrowseComp测试得分较上一代提升28.3% 官方API价格保持百万tokens输入0.5元 输出12元[1] 技术优化方向 - 重点针对用户反馈优化语言一致性 缓解中英文混杂和偶发异常字符现象[2] - 增强Agent能力 进一步优化Code Agent与Search Agent表现[2] - 距V3.1发布仅一个月 快速修复Bug成为留住开发者的关键[2] 技术架构创新 - 使用UE8M0 FP8 Scale参数精度 针对下一代国产芯片设计[1] - 提出多项算法创新 打破海外算力堆砌的传统大模型提升路径[2] - 具备高性能、低成本、蒸馏有效、开源等核心优势[2] 行业影响 - DeepSeek展示中国在AI领域具备与全球顶尖水平竞争的实力[2] - 促使全球投资者对中国科技企业技术创新能力塑造新认知[2] - 推动对中国科技资产重新进行价值评估[2] 产业链受益环节 - 大模型训推带动AI算力需求增长[2] - GB300、Vera Rubin等新一代算力架构将推出[2] - AI芯片、服务器整机、铜连接、HBM、液冷、光模块、IDC等环节持续受益[2] 市场反应 - 8月21日DeepSeek-V3.1发布当日 DeepSeek概念板块火热[1] - 国产芯片产业链企业股价大涨[1] - 开源模型竞争趋于白热化[2]
DeepSeek-V3.1版本更新,双模式开放体验
凤凰网· 2025-09-23 15:29
产品升级 - 公司推出全新版本DeepSeek-V3.1-Terminus 同步上线思考模式与非思考模式双版本 均支持128K长上下文[1] - 模型统一升级为DeepSeek-V3.1-Terminus 其中deepseek-chat对应非思考模式 deepseek-reasoner对应思考模式[1] - 非思考模式默认支持4K输出 最高可达8K 思考模式默认32K输出 最大可扩展至64K[1] 技术优化 - 重点优化语言一致性 显著缓解中英文混杂及异常字符问题 输出更规范[1] - 强化Agent能力 进一步提升Code Agent与Search Agent的执行表现[1] 定价策略 - 新模型百万tokens输入费用为缓存命中0.5元 未命中4元[1] - 百万tokens输出定价12元 为开发者提供高性价比服务[1]
仅一个月,DeepSeek再升级!单项测试最大提升超36%
21世纪经济报道· 2025-09-23 15:01
产品更新与性能提升 - DeepSeek-V3.1-Terminus版本于9月22日发布 API价格保持百万tokens输入0.5元 输出12元 [1] - 新版本输出效果更稳定 Humanitys Last Exam测试得分从15.9提升至21.7分 增幅超36% BrowseComp测试提升28.3% [1] - 重点优化语言一致性 缓解中英文混杂和异常字符 增强Agent能力包括Code Agent与Search Agent表现 [3] 技术基准测试表现 - MMLU-Pro测试得分从84.8提升至85.0 GPQA-Diamond从80.1升至80.7 [2] - Agent测评中BrowseComp从30.0升至38.5 SimpleQA从93.4升至96.8 SWE Verified从66.0升至68.4 [2] - Terminal-bench从31.3提升至36.7 Codeforces从2091降至2046 Aider-Polyglot从76.3降至76.1 [2] 技术发展与产业影响 - 采用UE8M0 FP8参数精度 针对下一代国产芯片设计 8月发布后带动国产芯片产业链企业股价大涨 [2] - 快速迭代修复Bug 距上次发布仅一个月 在开源模型竞争中成为留住开发者关键 [3] - 具备高性能低成本优势 提出算法创新 打破海外算力堆砌路径 展示中国AI全球竞争力 [4] 行业投资机会 - 大模型训推带动AI算力需求增长 新一代算力架构GB300和Vera Rubin将推出 [4] - 算力产业链中AI芯片 服务器整机 铜连接 HBM 液冷 光模块 IDC等环节持续受益 [4]
福建舰三型机弹射成功,军工行业再迎DeepSeek时刻!军工含量最高的航空航天ETF天弘(159241)反弹两连阳,昨日“吸金”近4800万元
搜狐财经· 2025-09-23 09:50
航空航天ETF市场表现 - 截至2025年9月22日收盘 航空航天ETF天弘(159241)收涨0.35% 实现两连阳 换手率27.34% 成交额1.20亿元 市场交投活跃 [2] - 跟踪指数成分股表现突出 海兰信(300065)上涨7.51% 航天电子(600879)上涨2.78% 中国海防(600764)上涨2.41% 华力创通(300045)上涨2.11% 中航沈飞(600760)上涨2.07% [2] - 基金规模达4.91亿元 份额4.29亿份 创近1月新高 近5个交易日资金净流入5105.93万元 最新单日净流入4774.66万元 [2] 产品结构特征 - 跟踪国证航天指数 军工属性极强 申万一级军工行业占比97.86% 为全市场军工含量最高指数 [3] - 航空航天装备权重占比高达66.8% 显著超越中证军工和中证国防指数 [3] 行业技术突破 - 海军三型舰载机在福建舰完成首次电磁弹射起飞和着舰训练 标志福建舰具备电磁弹射和回收能力 [4] - 海军舰载航空实现从单机到体系 从岸基到舰基 从滑跃到弹射 从能飞到能战的跨越 [4] 行业基本面展望 - 军工板块处于向上空间广阔向下有底的状态 结构性深度调整可能性较低 [5] - 半年报业绩释放修复信号 预计下半年整体表现优于上半年 行业比较优势凸显 [5] - 低空经济 商业航天 深海科技 大飞机 军事智能化等新域新质主题有望持续活跃 [5]
DeepSeek发布V3.1终极版
每日经济新闻· 2025-09-23 09:22
每经AI快讯,22日晚间,DeepSeek宣布DeepSeek-V3.1已更新至DeepSeek-V3.1-Terminus(终极)版本。新 版本在保持V3.1模型原有能力的基础上,针对用户反馈的问题对两方面进行了改进:一是语言一致性, 缓解了中英文混杂、偶发异常字符等情况;二是智能体能力:进一步优化了Code Agent(代码智能体)与 Search Agent(搜索智能体)的表现。 ...
刚刚,DeepSeek发了“终极版”
36氪· 2025-09-23 08:54
模型升级发布 - DeepSeek于9月22日晚间在官方API平台发布最新升级的DeepSeek-V3.1-Terminus模型并宣布开源[1] - 新模型在保持原有能力基础上改进了语言一致性和偶发异常字符等Bug,并优化了编程和搜索智能体表现[1] 性能基准测试 - 在非Agent类基准测试中,DeepSeek-V3.1-Terminus比DeepSeek-V3.1实现0.2%-36.5%不等的表现提升[3] - Humanity's Last Exam测试性能提升最明显,从15.9提升至21.7,主要考察专家级高难度知识和多模态深度推理能力[3][5] - Agent测评中网页浏览(BrowseComp)从30.0提升至38.5,简单问答(SimpleQA)从93.4提升至96.8,编程测试(SWE Verified)从66.0提升至68.4[5] Bug修复情况 - 修复了API调用时随机输出"极"、"極"、"extreme"等字样的严重Bug[7] - 解决了多语言混用问题,此前小语种翻译时语言混用比例有时达5%[9] - 经测试确认高危提示词不再触发Bug,多语言翻译问题已得到修复[8][10] 功能应用提升 - 编程能力显著提升,能够创建具有逼真重力摩擦力效果的小球弹跳动画[13] - 搜索智能体能力增强,能够进行交叉验证信息可靠性并整合提炼,提供周全准确的建议[17] 版本部署与命名 - DeepSeek官方App、网页端、小程序与API模型均已同步更新为DeepSeek-V3.1-Terminus[6] - Terminus在拉丁语中意为终点或界限,可能象征该版本是V3.1系列架构的终极版本[20]
DeepSeek线上模型升级至V3.1-Terminus!算力与应用板块或迎价值重估(附概念股)
智通财经· 2025-09-23 07:37
模型升级与性能表现 - DeepSeek-V3.1-Terminus版本于9月23日发布 重点优化语言一致性与Agent能力 缓解中英文混杂及异常字符问题 提升Code Agent与Search Agent表现 [1] - 非Agent测评中 MMLU-Pro得分从84.8提升至85.0 GPQA-Diamond从80.1提升至80.7 Humanity's Last Exam从15.9大幅提升至21.7 LiveCodeBench从74.8微升至74.9 Codeforces从2091降至2046 Aider-Polyglot从76.3微降至76.1 [1] - Agent测评显示 BrowseComp从30.0显著提升至38.5 BrowseComp-zh从49.2降至45.0 SimpleQA从93.4提升至96.8 SWE Verified从66.0提升至68.4 SWE-bench Multilingual从54.5提升至57.8 Terminal-bench从31.3提升至36.7 [1] - 官方App 网页端 小程序与API模型均已同步更新至DeepSeek-V3.1-Terminus版本 [1] 学术突破与行业影响 - DeepSeek-R1推理模型研究论文登上《自然》期刊封面 打破主流大模型未经独立同行评审的空白 [2] - DeepSeek-V3.1于8月21日发布 采用混合推理架构 同时支持思考模式与非思考模式 具有更高思考效率和更强Agent能力 [2] - DeepSeek的成功推动中国公司转向开源路线 7月底出现开源井喷潮 阿里连续发布4款开源模型 腾讯开源混元3D世界模型1.0 智谱发布GLM-4.5 阶跃星辰开源Step-3模型 [3] 国产算力生态建设 - DeepSeek-V3.1采用UE8M0 FP8格式专为下一代国产芯片设计 解决与英伟达FP8标准兼容性问题 打破对英伟达依赖 [2] - 英伟达H20芯片停产促使国内算力替代需求迫切 国产算力板块受推荐 [2] - DeepSeek模型训练与推理有望更多应用国产AI芯片 助力国产算力生态加速建设 [3] - 大模型训推带动AI算力需求增长 GB300 Vera Rubin等新一代算力架构将推出 AI芯片 服务器整机 铜连接 HBM 液冷 光模块 IDC等环节持续受益 [4] 相关企业动态 - 百度文心大模型X1.1于9月9日发布 事实性提升34.8% 指令遵循提升12.5% 智能体提升9.6% 在多个基准评测中超越DeepSeek R1-0528 与GPT-5和Gemini 2.5 Pro效果持平 [6] - 阿里巴巴通义千问推出Qwen3-Max-Preview模型 被描述为系列最强大语言模型 国产大模型企业进入全球第一梯队 [6] - 商汤日日新大模型接入小米AI眼镜 实现全双工实时音视频交互能力 为智能硬件交互提供新范式 [7] - 中兴通讯推出多款AI一体机产品 AiCube训推一体机助力企业部署DeepSeek大模型 5G UniEngine算网一体机支撑行业应用 智海AI教育一体机实现国产算力与DeepSeek适配 Common Edge一体机用于5G边缘计算 [7] 半导体产业链布局 - 亚太精选ETF(159687)包含亚太优质红利资产和半导体龙头企业 丰田汽车 腾讯控股 阿里巴巴 三菱集团等提供稳健收益 台积电(权重超8%) 三星 东京电子 联发科等代表半导体核心企业 [5] - 2022年亚太地区半导体产业收入占全球57.6% 凸显区域产业链核心地位 [5]
上证早知道|央行,再次出手;DeepSeek,最新升级;事关工业园区发展,两部门印发
上海证券报· 2025-09-23 07:36
央行公开市场操作 - 央行9月22日开展2405亿元7天期逆回购操作和3000亿元14天期逆回购操作 后者为时隔8个月再度重启 [2][4] 工业园区发展政策 - 工业和信息化部与国家发展改革委印发《工业园区高质量发展指引》 要求加强屋顶光伏、分散式风电、多元储能、充电桩等新能源基础设施开发利用 [2][4] 人工智能技术升级 - DeepSeek线上模型升级至DeepSeek-V3.1-Terminus版本 优化语言一致性和Agent能力(Code Agent与Search Agent) [2][4] 体育产业发展政策 - 国家体育总局发布《关于推动运动促进健康事业高质量发展的指导意见》 旨在完善全民健身公共服务体系并推动运动与健康深度融合 [4] 机构投资动向 - 多家大型险资维持看多AI端侧(消费电子、智能驾驶)、AI应用(港股互联网)、海外算力(通信设备及PCB)等板块 [5] - 上周124家公募机构调研141家A股上市公司 机械设备最受青睐 电力设备和固态电池被列为科技成长扩散方向 [5] - 9月以来权益类ETF净申购额达541亿元 券商、电池、化工等行业主题ETF吸金显著 [5] 资本市场发展态势 - 证监会主席吴清表示A股科技板块市值占比超1/4 市值前50公司中科技企业从18家增至24家 [7] - 下一步将增强多层次市场体系适配性 更好发挥中长期资金作用 提升上市公司质量和投资价值 提高监管精准性 [8] 国产芯片产业发展 - 国产芯片板块大涨 海光信息、芯原股份涨超10% 中科曙光涨停 [10] - 摩尔线程科创板IPO将于9月26日上会 沐曦股份进入IPO第二轮问询 [10] - 2024年中国智能算力规模达725.3EFLOPS(同比增长74.1%) 预计2025年达1037.3EFLOPS(增长43%) [10] 半导体设备景气度 - 长川科技前三季度净利润预增131.39%-145.38%至8.27亿-8.77亿元 因半导体行业需求增长及订单充裕 [11] - AI芯片发展推动封测设备需求 SoC芯片和先进存储芯片复杂性提升带动高性能测试机需求 HBM和COWOS技术推动先进封装设备需求 [11] 公司投资与股权动态 - 张江高科通过子公司持有上海微电子10.779%股权(投资额2.2345亿元) 未直接持有宇树科技及摩尔线程股权 [13] - 华电国际向华电金沙江上游水电公司增资6亿元(持股12%) 增资后注册资本达150亿元 [14][15] - 东方明珠拟出资2.44亿元投资先进计算二期基金(占比34.164%) 通过受让超聚变公司股权实现收益 [18] - 贵研铂业拟定向增发募资不超过12.91亿元 用于贵金属实验室建设、资源再生及抗癌药物产业化等项目 [19] 新药与中标项目 - 华海药业卡络磺钠注射液获国家药监局注册证书 用于泌尿系统等出血疾病 [16] - 三星医疗及子公司中标国家电网多个项目 合计金额约1.93亿元 [17] 机构资金动向 - 聚辰股份获3家机构净买入4.54亿元(占成交额23.62%) 因DDR5渗透及服务器出货量回升驱动SPD芯片需求 [21] - 芯原股份获1家机构净买入2.73亿元(占成交额3.38%) 拟收购芯来科技97.0070%股权以完善RISC-V CPU IP布局 [22] 行业技术进展 - 芯源微前道化学清洗机签单同比增幅大 打破国外垄断并获多家大客户订单 新一代涂胶显影机预计Q4验证 [23] - 比亚迪8月乘用车海外销量80464辆(同比增长146.4%) 2024年研发投入542亿元 与芬兰Veho集团合作拓展欧洲市场 [23]