Workflow
Seek .(SKLTY)
icon
搜索文档
DeepSeek上线两天后再回看:一次“小更新”,一场架构“豪赌”
36氪· 2025-08-22 07:48
模型架构更新 - 采用混合推理架构,使用一个模型同时支持思考模式与非思考模式,模型标识从“R1”变为统一的“V3”[2] - 混合模型架构可简化部署和运维,提高算力利用效率,但用户仍需手动控制是否开启思考模式,而非自动路由[2] - 此次架构变革是模型融合策略的一部分,与GPT-5的智能路由调度不同,引发了社区关于该技术路线利弊的争论[1][2][23] 核心能力提升 - 编程能力大幅提升,在Aider编程基准测试中取得71.6%的高分,超越前代DeepSeek R1的71.4%甚至击败闭源模型Claude 4 Opus[3][5] - 在SVGBench测试中得分为53.1%,实力仅次于GPT-4.1-mini,远超前代DeepSeek R1的40.4%[6][7] - 在多任务语言理解(MMLU)测试中表现优异,得分达到88.5%,毫不逊色于GPT-5[7] - 智能体能力实现跃迁,在SWE-bench Verified基准上取得66.0分,远超前代V3-0324的45.4分和R1-0528的44.6分[18][19] - 在更具挑战性的Terminal-Bench测试中得分达到31.3,是前代推理模型R1-0528(5.7)的五倍以上[18][19] - 网页浏览和工具调用能力全面增强,Browsecomp测试得分从R1-0528的8.9分飙升至30.0分,提升超过三倍[19] 成本与效率优化 - 成本优势显著,完成同样一次完整编程任务的成本仅需约1.01美元,远低于Claude 4 Opus(便宜68倍)[10] - 官方最新定价为输入0.5元/百万tokens(缓存命中)和4元/百万tokens(缓存未命中),输出价格为12元/百万tokens[13] - 成本下降主要源于思维链压缩训练,使输出token数减少20%-50%的情况下,各项任务平均表现与R1-0528持平[15] - 生成速度显著提升,社区用户反馈V3.1比R1速度快了很多[17] 社区反馈与潜在问题 - 模型更新评价呈现两极分化,部分用户反馈旧版模型的“顽疾”复现,如幻觉严重和中英夹杂问题[1][24] - 模型在处理复杂问题时表现出“能省则省”的倾向,在多次尝试无果后会主动“放弃”,而非继续深度推理[25] - 公司激进的更新策略引发商业API用户不满,新模型直接覆盖旧模型且不提供旧版本API,影响商业应用稳定性[26] - 在研究生级别问答(GPQA)和软件工程(SWE-Bench verified)等领域,V3.1与GPT-5相比仍存在一定差距[8]
DeepSeek正式发布新模型,还透露国产AI芯片关键信息
选股宝· 2025-08-22 07:22
DeepSeek-V3.1技术升级与国产AI芯片发展 - DeepSeek-V3.1版本采用UE8M0 FP8 Scale参数精度 专为下一代国产芯片设计 [1] - FP8为AI计算前沿低精度格式 在支持原生FP8的GPU上可大幅提高算力并显著降低显存占用 由英伟达、Arm和英特尔于2022年联合提出 [1] 国产GPU发展现状与厂商进展 - 国产GPU进入快速发展阶段 从可用进入好用阶段 寒武纪、海光信息及华为等厂商领先 [1] - 摩尔线程新一代GPU采用平湖架构 增加FP8精度支持 大幅提升AI算力 可支撑万卡集群智算中心解决方案 [1] - 沐曦提供训推一体C系列GPU 具大规模并行计算能力 已在多个智算中心规模化应用 另提供面向生成式AI推理的N系列GPU 拥有多精度混合算力 [2] GPU市场规模预测与国产算力趋势 - 全球GPU市场规模预计2029年达36119.74亿元 中国市场规模达13635.78亿元 占比从2024年30.8%提升至2029年37.8% [2] - DeepSeek带动AI应用向终端扩散 需要高性价比专用芯片 国内芯片厂商与应用端企业加速对接 预计2025年国产算力大规模起量 [2] 相关上市公司梳理 - A股算力芯片龙头包括寒武纪与海光信息 [3] - 华为昇腾产业链涉及拓维信息、神州数码及华丰科技 [4] - DeepSeek-V3.1升级支持混合推理架构 提升工具使用与智能体任务表现 相关公司包括鼎捷数智、泛微网络及酷特智能 [4][5]
2025《财富》中国科技50强:杭州“科技小龙”崭露头角,DeepSeek等引领创新
搜狐财经· 2025-08-22 05:27
榜单排名 - 华为、DeepSeek和宁德时代位列2025年《财富》中国科技50强前三甲 [1] - 榜单旨在表彰“生于中国 影响世界”的科技企业 [1] - 华为作为科技领域常青树再次上榜 DeepSeek异军突起成为亮点 [1] DeepSeek技术表现 - DeepSeek以人工智能大模型产品为核心竞争力 自主研发DeepSeek-R1大模型 [1] - 在MMLU基准测试中取得88.5分 超越meta Llama 3和Anthropic Claude 2等同类产品 [1] - 截至今年6月月活跃用户数量突破1.63亿 成为全球人工智能生成内容应用领跑者 [1] 新锐企业表现 - 宇树科技凭借全球领先四足机器人技术 去年全球销量达1.8万台 [3] - 宇树科技市场份额达23% 仅次于波士顿动力公司 [3] - 从全球780多名申请者中脱颖而出 获世界知识产权组织2025年全球奖 [3] - 云深处科技专注于人形及四足机器人研发生产 自主研发“山猫”全地形机器人 [3] - 云深处科技产品在能源、应急、工业、教育等多领域得到广泛应用 [3] 榜单格局变化 - 相比去年榜单 华为、比亚迪、宁德时代等十家公司曾稳居前十 [5] - 今年DeepSeek、宇树科技等新兴企业崛起使榜单格局发生显著变化 [5] - 反映中国科技行业蓬勃发展 预示未来科技竞争激烈程度将提升 [5] 上榜企业构成 - 榜单包含华为、DeepSeek、宁德时代、中国种子集团、阿里巴巴、腾讯等企业 [2] - 涵盖新能源、人工智能、电子商务、机器人等多个科技细分领域 [2][3]
DeepSeek 重磅发布!
证券时报· 2025-08-21 23:05
产品升级 - 公司正式发布DeepSeek-V3 1版本 包含混合推理架构 支持思考模式与非思考模式自由切换[1][2][4] - 模型在多项搜索评测指标上取得较大提升 在复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上性能大幅领先R1-0528[3] - 新模型采用UE8M0 FP8 Scale参数精度 并对分词器及chat template进行较大调整 与V3版本存在明显差异[3] 技术特性 - API同步升级 deepseek-chat对应非思考模式 deepseek-reasoner对应思考模式 上下文均扩展至128K[3] - API Beta接口支持strict模式Function Calling 确保输出Function满足schema定义[3] - 通过Post-Training优化 新模型在工具使用与智能体任务中表现有较大提升 思考效率相比R1-0528更高[4] 市场反应 - DeepSeek概念股每日互动尾盘直线拉升[3]
DeepSeek官宣!新模型、新突破、新价格
中国证券报· 2025-08-21 22:51
产品发布与核心特性 - 公司于8月21日正式发布DeepSeek-V3 1大模型 该模型采用混合推理架构 同时支持思考模式与非思考模式 [1] - 新模型思考效率更高 相比DeepSeek-R1-0528能在更短时间给出答案 在工具使用与智能体任务中的表现有较大提升 [1] - 在思考模式下 V3 1-Think在输出token数减少20%-50%的情况下 各项任务的平均表现与R1-0528持平 [2] - 新模型在非思考模式下的输出长度得到有效控制 有助于使用者控制成本 [2] 技术能力与行业定位 - 新模型在智能体能力上实现突破 在代码修复测评和命令行终端环境下的复杂任务测试中有明显提高 并在多项搜索评测指标上取得较大进展 [1] - 公司称此次发布是迈向Agent(智能体)时代的第一步 [1] - 中国信通院测试结果显示 通过软硬件协同优化 参测产品部署DeepSeek模型在语言理解 逻辑推理等典型任务中的精度已基本与国外系统持平 [3] - 新模型使用了UE8M0 FP8 Scale的参数精度 该技术是针对即将发布的下一代国产芯片设计 [2] 市场与商业化 - 中商产业研究院分析师预测 2025年中国AI智能体市场规模将达69亿元 到2030年将接近300亿元 [1] - 公司将于北京时间9月6日凌晨起对API接口调用价格进行调整 取消此前的夜间时段优惠 [2] - 调整后API价格为输入每百万tokens 0 5元(缓存命中)或4元(缓存未命中) 输出每百万tokens 12元 [2] - 此前DeepSeek-V3的API服务价格为输入每百万tokens 0 5元(缓存命中)或2元(缓存未命中) 输出每百万tokens 8元 [2] 产品部署与可用性 - 目前DeepSeek官方App与网页端模型已同步升级为DeepSeek-V3 1 用户可通过深度思考按钮切换思考模式与非思考模式 [1] - DeepSeek API也已同步升级 [1]
华为、DeepSeek、宇树科技,最强中国科技榜单来了!
上海证券报· 2025-08-21 22:47
核心观点 - 2025年《财富》中国科技50强榜单显示人工智能、机器人、生物医药和绿色能源是热门领域 [3] - 入围公司包括华为、DeepSeek、宁德时代、中种集团、阿里巴巴、腾讯、比亚迪等知名企业 [3] - 这些公司在技术创新和商业化应用方面取得显著进展 [12] 机器人行业 - 2025年是机器人从实验室走向量产的关键一年 [5] - 宇树科技在机器人运动控制、高性能关节电机及实时系统等核心领域进行创新,并完成全球化知识产权布局 [5] - 云深处科技自主研发的多款机器人产品性能全球领先,率先实现四足机器人全自主巡检变电站 [5] - 珞石机器人是国内唯一同时具备工业和协作双品类机器人成熟产品线并规模量产的公司 [5] 人工智能行业 - DeepSeek在全球开源大模型下载量排名中稳居前10位,月活跃用户达1.63亿人次 [7] - 字节跳动2024年人工智能领域资本开支达800亿元,接近百度、阿里巴巴和腾讯三家总和 [7] - 稀宇科技自研多模态模型及人工智能原生应用已服务超过1.57亿个人用户和5万企业客户 [7] - 滴普科技在中国企业级大模型人工智能应用解决方案市场排名第一 [8] 生物医药行业 - 石药集团在研创新药和创新制剂项目超过200个,预计2028年底有50余款新药或新适应症申报上市 [11] - 康方生物已开发50个以上拥有完全自主知识产权的创新候选药物,24个进入临床阶段 [11] 绿色能源行业 - 天合光能在英国启动49.9MW光储融合项目,可满足1.65万户家庭用电需求,每年减少1.5万吨碳排放 [11] 公司名单 - 完整榜单包含宇树科技、大疆创新、石药集团、联想集团、京东方、稀宇科技、云深处科技、康方生物、天合光能等企业 [14][15]
A股晚间热点 | 人工智能迎重磅利好!DeepSeek新版本发布
智通财经网· 2025-08-21 22:37
人工智能产业政策与技术进展 - 安徽省发布9条政策举措推动通用人工智能产业发展[1] - DeepSeek-V3.1采用UE8M0 FP8参数精度适配下一代国产芯片[1] 生物医药产业开放政策 - 国务院批复江苏自贸试验区生物医药全产业链开放创新发展方案[2] - 方案以制度创新推动生物医药全产业链集成发展[2] 猪肉市场调控措施 - 国家发改委将开展中央冻猪肉储备收储以稳定生猪市场[3] - 因夏季消费偏弱及二次育肥生猪出栏导致供应增加[3] 电力消费数据 - 7月全社会用电量达1.02万亿千瓦时同比增长8.6%[4] - 用电量较十年前翻倍相当于东盟国家全年用量[4] 外资对中国市场配置 - 野村报告显示AH股配置比例分别提升0.8和0.7个百分点[7] - 韩国散户持有港股达24亿美元创四年新高[7] - 高盛称中国成为全球资金净买入最多市场[7] 钛白粉行业动态 - 龙佰集团上调钛白粉价格国内客户500元/吨国际客户70美元/吨[15] - 超20家企业跟涨且部分企业暂停接单[15] - 原料成本高企及"金九银十"旺季预期支撑价格[15] 上市公司业绩表现 - 中国石化上半年净利润214.83亿元同比减少39.8%[21] - 三一重工上半年净利润52.16亿元同比增长46%[21] - 歌尔股份上半年净利润14.2亿元同比增长15.65%[21] - 万泰生物九价HPV疫苗首次获得批签发证明[21] 上市公司资本运作 - 格力电器每10股派20元权益分派股权登记日8月28日[21] - 盛视科技设立子公司整合AI与人形机器人技术[21] - 中银证券股东江西铜业拟减持不超过3%股份[21] - 恒邦股份拟减持万国黄金不超过3.69%股权[21] 风险与亏损事件 - 广生堂上半年净利润亏损6668.81万元[22] - 安源煤业上半年净亏损2.9亿元[23] - 莱茵生物干燥车间事故致1人死亡3人重伤[23] 国际市场动态 - 美股三大指数下跌道指跌0.44%纳指跌0.46%标普500跌0.39%[9] - 小鹏汽车涨超8%因何小鹏增持310万股港股[9] - 欧盟与美国达成贸易框架汽车关税或降至15%[10] - 印度企业盈利预期下调1.2%受美国50%关税影响[12][13]
DeepSeek-V3.1发布:更高思考效率、更强智能体能力
21世纪经济报道· 2025-08-21 22:30
(原标题:DeepSeek-V3.1发布:更高思考效率、更强智能体能力) 21世纪经济报道记者 陈归辞 在DeepSeek-V3推出5个月后,DeepSeek-V3低调发布升级版模型DeepSeek-V3.1。 8月21日下午,DeepSeek 正式发布 DeepSeek-V3.1(简称"V3.1"),称其为"迈向 Agent 时代的第一 步"。8月19日晚间,DeepSeek 小助手于官方群内宣布线上模型版本已升级至V3.1,引发广泛关注,目 前 V3.1 在HuggingFace趋势榜排名已冲上第二。 据DeepSeek方面介绍,V3.1的升级主要包含三大变化:混合思考模式、更高的思考效率和更强的Agent (智能体)能力。 编程任务方面,DeepSeek测试结果显示,在代码修复测评 SWE 与命令行终端环境下的复杂任务 (Terminal-Bench)测试中,DeepSeek-V3.1 相比之前的 DeepSeek 系列模型有明显提高。 从业内实测反馈来看,V3.1在AiderPolyglot多语言编程测试中,拿下了71.6%的高分,超越了Claude 4 Opus和DeepSeek R1等模型。并且, ...
迈向智能体时代“第一步” DeepSeek-V3.1 发布
新京报· 2025-08-21 22:09
模型升级与技术架构 - 公司正式发布DeepSeek-V3.1版本 采用同时支持思考模式与非思考模式的混合推理架构 [1] - 相比DeepSeek-R1-0528模型 DeepSeek-V3.1-Think版本能在更短时间内给出答案 [1] - 通过Post-Training优化技术 新模型在工具使用与智能体任务中的表现获得较大提升 [1] 产品部署与功能特性 - 官方App与网页端模型已同步升级为DeepSeek-V3.1版本 [1] - 用户可通过"深度思考"按钮实现思考模式与非思考模式的自由切换 [1] - 公司宣称此次发布是迈向Agent时代的第一步 [1]
AI进化速递丨DeepSeek-V3.1正式发布
第一财经· 2025-08-21 21:11
行业技术进展 - DeepSeek-V3.1正式发布 [1] - 百度上线蒸汽机2.0视频生成大模型 实现多人有声视频一体化 [1] - 马斯克宣布Grok 5将于下个月开始训练 [1] 公司商业动态 - OpenAI 7月份首次单月营收突破10亿美元 [1] - 智元灵犀X2将于8月底开始陆续供应 [1] - 智元A计划正式发布 未来三年投入40亿元孵化50个早期项目 [1] 产业生态布局 - 科大讯飞机器人超脑平台应用分中心落地绵阳 [1]