DeepSeek

搜索文档
DeepSeek R1官宣更新:思维深度与推理能力显著提升,优化“幻觉”问题
新浪科技· 2025-05-29 20:40
新浪科技讯 5月29日晚间消息,DeepSeek今日宣布,DeepSeek R1模型已完成小版本升级,当前版本为 DeepSeek-R1-0528。用户通过官方网站、App或小程序进入对话界面后,开启"深度思考"功能即可体验 最新版本。API 也已同步更新,调用方式不变。 工具调用,DeepSeek-R1-0528 支持工具调用(不支持在 thinking 中进行工具调用); 据介绍,DeepSeek-R1-0528 仍然使用 2024 年 12 月所发布的 DeepSeek V3 Base 模型作为基座,但在后 训练过程中投入了更多算力,显著提升了模型的思维深度与推理能力。官方称更新后的 R1 模型在数 学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表 现上已接近其他国际顶尖模型,如o3与Gemini-2.5-Pro。 其他能力更新方面,包括幻觉改善,新版 DeepSeek R1 针对"幻觉"问题进行了优化。与旧版相比,更新 后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了45~50%左右,能够有效地提供更 为准确、可靠的结果; 创意写作,在旧版 R1 ...
DeepSeek R1悄悄更新,用“小版本”干翻大模型
虎嗅· 2025-05-29 17:52
模型升级与性能提升 - DeepSeek-R1-0528版本在编程能力上大幅提升,性能接近OpenAI o3-high水平,尤其在代码生成领域进入第一梯队 [7][8] - Extended NYT Connections基准测试得分从38.6提升至49.8,显示智能水平显著进步 [5] - 模型参数规模达671B,其中37B参数在推理过程中激活,保持164K上下文长度 [4] 技术特性与成本优势 - 新版本输入输出价格维持不变(输入$0.50/M tokens,输出$2.18/M tokens),成本效益突出 [4] - 采用MIT开源许可,支持商业用途,模型文件包含163个safetensors分卷(单个体积4.3-5.23GB) [42] - 支持fp8量化、工具调用(Supports Tools)和164K tokens长上下文处理 [4] 实际应用表现 - 在LiveCodeBench测试中总分73.4,接近o3-high(75.4),尤其在简单题(98.3)和中难度题(83.4)表现优异 [8] - 生成复杂动态动画能力突破:粒子效果模拟与Claude-4-sonnet相当,单次生成代码量达728行(对比Claude的542行) [9][11][12] - 全栈开发能力提升,可快速构建three.js 3D应用(如3D画廊、太阳系模拟器),响应时间仅14秒生成462行代码 [16][20][24][26] 行业趋势与竞争格局 - 小版本迭代策略成效显著,打破大版本号崇拜,通过持续优化实现性能对标头部竞品 [43][44] - 开源策略延续,模型性能与Claude 4形成直接竞争,尤其在编程领域威胁传统AI编码工具(如Cursor、Warp)市场地位 [7][21] - 思维链模式改变导致推理时间延长(如估算π/7耗时148秒),但输出精度和纠错能力提升 [37][39][40] 用户体验与设计改进 - 前端审美显著优化,能生成苹果官网风格网页,融合深空灰/银色调、悬浮动画等设计元素 [28][29] - 科技感UI设计超越Claude4,深色主题界面更具视觉冲击力 [32] - 交互功能增强,如3D太阳系模拟器支持行星点击获取信息,展示实时轨道物理模拟 [24]
DeepSeek R1 迎来小更新大升级,性能直逼 OpenAI o3!
AI科技大本营· 2025-05-29 16:05
DeepSeek R1-0528大模型更新 - 公司低调发布DeepSeek-R1-0528版本并开启公测,未提供详细技术说明[1] - 新版模型在Hugging Face平台开放访问[2] 性能改进 - 推理能力增强:思维链(Chain-of-Thought)表现更结构化,逻辑性提升[4] - 文本输出质量接近Google等领先模型水平,语言风格更成熟[5] - 代码生成优化:编程任务中输出更连贯,质量更高[6] 用户反馈 - Reddit用户实测显示模型可单次对话生成完整可玩游戏,但抽象推理能力有所下降[6] - 响应时间略有增加,用户认为是为准确性作出的合理权衡[7] - 在LiveCodeBench基准测试中表现接近o3(high)水平[8] - 成为首个能稳定正确回答"9.9-9.11"数学问题的模型[9] 技术参数与开源生态 - 模型训练规模达1亿tokens且持续增长,提供免费版本[11] - 采用MIT开源协议,允许商业用途,推动AI技术普及[11] 行业活动 - 2025全球产品经理大会将聚焦AI产品落地等议题[14]
全面实测新版DeepSeek R1,我们挖出了这些隐藏亮点
虎嗅· 2025-05-29 14:22
DeepSeek猝不及防地更新了,不是R2,而是R1v2。 官方的通告也很"DeepSeek",甚至可以说有点佛系,在微信交流群发了一句: "DeepSeekR1模型已完成小版本试升级,欢迎前往官方网页、APP、小程序测试(打开深度思考),API接口和使用方式保持不变。" 看起来平平无奇,但真一顿实测下来,这个"小版本"恐怕还是过于谦虚了。 全球最大AI开源社区HuggingFace已经开源了这个新版本,名字也很实在:DeepSeek-R1-0528。不过截至目前,模型卡还没同步更新。 | deepseek-ai/DeepSeek-R1-0528 ♡ like 4 | | Follow or DeepSeek 69.9k | | | | | | | --- | --- | --- | --- | --- | --- | --- | --- | | & Safetensors deepseek_v3 custom_code | fp8 | | | | | | | | @ Model card Files and versions Community | | | | | | | | | main v DeepSe ...
DeepSeek宣布开源新版R1模型,AI人工智能ETF(512930)、线上消费ETF基金(159793)涨超2%,消费电子ETF(561600)近1月日均成交额居同类第一
搜狐财经· 2025-05-29 13:55
人工智能主题指数表现 - 中证人工智能主题指数(930713)上涨1 90%,成分股德赛西威上涨10 00%,千方科技上涨5 76%,广电运通上涨4 92%,四维图新、易华录等跟涨 [1] - AI人工智能ETF(512930)上涨2 05%,最新价1 3元,近1年累计上涨24 55% [1] - AI人工智能ETF盘中换手2 77%,成交5354 94万元,近1年日均成交8769 66万元 [1] - AI人工智能ETF最新规模达19 04亿元,近1周份额增长900 00万份,新增份额位居可比基金1/3 [1] - 近10个交易日内有6日资金净流入,合计4201 15万元,日均净流入420 12万元 [1] - 杠杆资金持续布局,AI人工智能ETF最新融资买入额209 72万元,融资余额8464 96万元 [2] 消费电子主题指数表现 - 中证消费电子主题指数(931494)上涨1 89%,成分股工业富联上涨5 92%,景旺电子上涨5 72%,生益科技上涨4 31%,信维通信、圣邦股份等跟涨 [5] - 消费电子ETF(561600)盘中涨超2%,现涨1 98%,最新价0 77元,近1年累计上涨22 13% [5] - 消费电子ETF盘中换手4 07%,成交745 46万元,近1月日均成交1371 29万元,居可比基金第一 [5] - 消费电子ETF近1月规模增长1012 54万元,新增规模位居可比基金2/5,份额增长1800 00万份,新增份额位居可比基金2/5 [5] - 近17个交易日内合计资金净流入1502 74万元 [5] 线上消费主题指数表现 - 中证沪港深线上消费主题指数(931481)上涨1 81%,成分股美团-W上涨6 09%,完美世界上涨3 62%,浙数文化上涨3 61%,快手-W、巨人网络等跟涨 [8] - 线上消费ETF基金(159793)上涨2 29%,最新价0 89元,近半年累计上涨6 07% [8] AI行业动态 - DeepSeek开源新版R1模型,代码生成与复杂推理能力媲美OpenAI顶级o3模型,编程任务中首次运行通过率接近100% [10] - 中信证券认为2025年下半年科技产业投资主线将继续围绕AI展开,AI正从技术进步迈向生产力落地阶段,已在广告、游戏、智能汽车等领域改变行业格局 [10] - DeepSeek R2、GPT-5预计下半年发布,中国科技产业价值重估过程尚未结束 [10] 指数成分与权重 - 中证沪港深线上消费主题指数前十大权重股包括阿里巴巴-W、腾讯控股、美团-W等,合计占比56 94% [11] - 中证消费电子主题指数前十大权重股包括中芯国际、立讯精密、寒武纪等,合计占比53 78% [12] - 中证人工智能主题指数前十大权重股包括寒武纪、韦尔股份、海康威视等,合计占比50 64% [13]
多重催化来袭!恒生科技指数ETF(513180)高开高走,小鹏大涨近7%
每日经济新闻· 2025-05-29 13:41
港股市场表现 - 5月29日港股三大指数持续走高,恒生科技指数午后一度涨超2.5% [1] - 科网股、生物技术股、中资券商股普涨,恒生科技指数ETF(513180)强势上扬 [1] - 小鹏汽车午后一度涨近7%,美团、同程旅行、舜宇光学科技、金蝶国际等持仓股涨幅居前 [1] 科技行业动态 - DeepSeek R1模型完成小版本试升级,用户可通过官方网页、APP、小程序测试,API接口和使用方式保持不变 [1] - DeepSeek在Hugging Face开源新版R1模型(R1-0528),市场等待DeepSeek R2发布,有望成为科技板块新一轮启动契机 [1] 小鹏汽车新品发布 - 5月28日晚小鹏MONA M03 Max版正式上市,分为502km续航版(售价12.98万元)和600km续航版(售价13.98万元) [2] - 加推515长续航Plus版(售价11.98万元)和620超长续航Plus版(售价12.98万元) [2] - 上市1小时大定12566台,超过去年同期,Max版订单占比83% [2] 恒生科技指数ETF优势 - 恒生科技指数ETF(513180)在A股同赛道ETF中规模和流动性领先,支持T+0交易 [2] - 标的指数涵盖AI、机器人等稀缺中国核心科技资产,腾讯、小米、京东等科技龙头Q1财报亮眼 [2] - 内外形势改善叠加多重正面催化,恒生科技或具备更大向上动能 [2]
DeepSeek上新,又一次“开源的巨大胜利”
第一财经· 2025-05-29 12:52
DeepSeek-R1-0528模型升级 - DeepSeek-R1模型完成小版本试升级并于5月29日凌晨在HuggingFace开源平台发布 但官方未更新模型卡及公告介绍[1] - 海外开发者评价此次升级"并不小" 体现公司一贯低调风格[1] - 代码能力提升最为明显 在Live CodeBench测试平台性能接近OpenAI重量级o3-high模型[1] 模型性能测试数据 - 在LiveCodeBench平台454个问题测试中 DeepSeek-R1-0528以73.1%的Pass@1得分排名第四 仅次于04-Mini(High)的80.2% 03(High)的75.8%和04-Mini(Medium)的74.2%[4] - 在Easy-Pass@1测试中达到98.7% 接近排名第一的04-Mini(High)99.1%[4] - Medium-Pass测试得分85.2% 优于03(High)的84.4%但略低于04-Mini(Medium)的86.5%[4] 开发者实测反馈 - 在橙色小球撞击物体模拟测试中 新模型在平面橙色漫反射和撞击效果方面优于Claude-4-Sonnet[6] - 写作任务改进明显 输出更自然且格式规范 减少之前存在的"量子力学元素"问题[6] - 文本召回测试显示32K上下文内表现显著提升 但60K上下文效果下降明显[6] 行业对比与期待 - 开发者群体公认编程能力最强的Claude-4系列未出现在测试榜单中 可能受测试速率限制[6] - 海外网友对R2版本预期高涨 推测当前R1版本已展现强大潜力[7] - 开发者期待未来R2版本能大幅提升上下文长度和多模态能力 这两点对生产使用至关重要[7] 公司技术迭代特点 - 延续3月DeepSeek-V3-0324的迭代模式 在HuggingFace平台低调更新[7] - 新版V3模型借鉴R1强化学习技术 显著提升推理类任务表现 并优化前端开发和中文写作能力[7] - 业内猜测公司可能将架构不变的更新定义为小版本升级 与同业明显版本迭代形成差异化[7]
连续9日获资金净流入,计算机ETF(159998)半日涨超2.3%,机构:国内外算力需求有望迎来共振
21世纪经济报道· 2025-05-29 12:01
市场表现 - A股三大指数高开高走 算力概念表现活跃 计算机ETF(159998)涨2.36% 成交额超5000万元 溢折率0.52% 云计算ETF沪港深(517390)涨1.51% [1] - 成分股中朗新集团涨停 云从科技-UW、千方科技、新大陆、广电运通等跟涨 [2] - 计算机ETF(159998)连续9日获资金净流入 累计"吸金"超1.25亿元 最新规模27.91亿元 是同标的规模最大的ETF [2] 行业动态 - 计算机ETF(159998)跟踪中证计算机指数(930651.CSI) 成分股涉及信息技术服务、应用软件、系统软件、电脑硬件等业务 前十大重仓股包括海康威视、科大讯飞、金山办公、恒生电子、润和软件等计算机龙头 [2] - 国产自主可控空间广阔 第一梯队芯片厂商正加速突破性能、产能、生态瓶颈 国产芯片厂商加快解决国内晶圆代工等供应链问题 同时通过自研及兼容策略突破CUDA生态壁垒 [3] - 国内外算力需求有望迎来共振 基建需求景气度依旧 看好国产算力为首的生态及整个AIDC产业链表现 [4] 公司新闻 - 英伟达2026财年第一财季整体营收同比增长69%至441亿美元(高于预期的431亿美元) 净利润187.75亿美元(预期207.67亿美元) 调整后每股收益0.96美元(预期0.93美元) [3] - DeepSeek R1模型完成小版本试升级 官方网页、APP、小程序可测试 API接口和使用方式保持不变 [3] 政策环境 - 美国国际贸易法院裁定特朗普越权 阻止其4月2日宣布的关税政策生效 [3]
实测思维链大变!DeepSeek R1一个“小升级”性能直逼o3,但仍“过度思考”?
AI前线· 2025-05-29 11:58
DeepSeek-R1-0528版本升级 - 公司在Huggingface平台开源了新版本DeepSeek-R1-0528,主要升级推理精度和代码生成速度[1][2] - 新版本在Live CodeBench基准测试中性能媲美OpenAI的o3(High)版本[2] - 官方称此次为"小版本试升级",未发布训练方法技术报告[3] 模型性能表现 - 在8/1/2024测试中,DeepSeek-R1-0528以Pass@1 73.1排名第四,优于Groq-3-Mini(66.7)和Gemini-2.5-Flash-Preview(60.6)[3] - Easy-Pass@1达98.7,与排名第一的04-Mini(High)(99.1)接近[3] - Medium-P表现与多数竞品持平(8分),优于Grok-3-Mini(7分)和Gemini-2.5-Flash-Preview(7分)[3] 用户实测反馈 - 唯一能正确回答"9.9-9.11"问题的模型[7] - 推理能力接近Google模型,写作任务更自然且格式优化[8] - 编程能力显著提升但仍落后于o3和Claude 4[9] - 存在"过度思考"问题,如解答高中数学题耗时6分钟[9] 思维链改进 - 思维链(CoT)行为发生重大变化,从类似o系列转向类似Gemini风格[9] - 新版CoT被评价为"更加面向用户"[9] - 任务处理时间延长至每项30-60分钟[8] 行业动态 - AICon北京站将聚焦AI Agent构建、多模态应用等前沿议题[12] - Claude 4发布全球最强编码模型,可实现自主编码7小时[12] - Grok 3被质疑套壳Claude,xAI工程师遭批评[12] - 印度国家级大模型上线两天仅300余次下载,远低于韩国大学生模型(20万次)[12]
DeepSeek-R1今天一次「小更新」,颠覆了大模型格局,网友:尽快放R2
机器之心· 2025-05-29 11:04
机器之心报道 昨晚,DeepSeek 官方宣布其 R1 推理模型升级到了最新版本(0528),并在今天凌晨公开了模型及权重。 编辑:泽南、Panda 超出所有人的期待。 千呼万唤始出来,DeepSeek 迎来了推理模型更新。 HuggingFace 链接:https://huggingface.co/deepseek-ai/DeepSeek-R1-0528 模型文件上传时间是凌晨 1 点,不知 DeepSeek 工程师们是不是加班到了最后一刻。也有网友表示,这回又在端午节假期前发新模型,简直比放假通知还靠谱。 这次更新的升级版 R1 参数量高达 6850 亿,体量巨大,虽然开源了出来,但大多数人只能围观。如果「满血版」不进行蒸馏,是肯定无法在消费级硬件上本地运 行的。 不过这种不说话直接放链接的态度还是引来了网友们的普遍欢迎。 根据 DeepSeek 的小范围通知,更新后的 R1 版本采用 MIT 许可证,这意味着它可以用于商业用途,从版本号看来这是一个「小」升级,不过人们大量实测后发 现,新版大模型的性能提升颇为明显。 我们也能在新版 DeepSeek-R1 模型的配置文件中看到更多但并不出人意料的信息,包 ...