Workflow
Seek .(SKLTY)
icon
搜索文档
腾讯多业务全面接入DeepSeek R1-0528
快讯· 2025-05-30 13:25
5月29日,腾讯旗下腾讯元宝、ima、搜狗输入法、QQ浏览器、腾讯文档、腾讯地图、腾讯乐享等多款 AI应用宣布接入DeepSeek R1-0528,用户在不同产品中,选择DeepSeek模型R1深度思考,都可以体验 到DeepSeek R1-0528最新的深度思考、编程和长文本处理等能力,免费且不限量使用。同时,腾讯云也 上线了DeepSeek-R1-0528,企业和开发者可以通过腾讯云直接调用API接口,获得稳定优质的服务;也 可以通过腾讯云智能体开发平台内置的RAG、工作流和智能体开发的能力,快速搭建专属智能体应 用;此外,还能通过腾讯云TI平台对模型进行精调。(全天候科技) ...
DeepSeek再出手!R1升级版性能大提升,美国对手慌了?
金十数据· 2025-05-30 11:52
DeepSeek的R1模型自1月发布以来,曾因多项指标优于西方竞争对手而引发全球关注,并导致科技股暴 跌。然而,自V3模型发布后,DeepSeek的热度有所下降,市场更关注其R2模型的发布。此前有消息 称,R2将采用混合专家模型(MoE),参数量预计达1.2万亿,单位推理成本较GPT-4大幅降低。但截 至目前,DeepSeek仍未正式确认R2的发布时间。 R1推理模型的最新版本R1-0528再次引发了全球媒体的广泛关注。 路透社报道称,此次发布加剧了与美国竞争对手如OpenAI的竞争。在由加州大学伯克利分校、麻省理 工学院和康奈尔大学研究人员开发的LiveCodeBench排行榜中,DeepSeek的R1-0528在代码生成方面仅 略低于OpenAI的o4 mini和o3推理模型,但超过了xAI的Grok 3 mini和阿里巴巴的Qwen 3。 CNBC指出,DeepSeek此次升级模型发布低调,但其推理能力使其能够执行更复杂的任务。《华尔街日 报》中文版则提到,DeepSeek的低成本、高性能R1模型自年初以来吸引了全球目光,推动了中国科技 股的上涨,也显示出市场对中国AI能力的乐观预期。 DeepSeek ...
早报 (05.30)| 关税重大变数!暂时恢复;特朗普第二任期首次会见鲍威尔;DeepSeek完成R1更新:思考更深,推理更强
格隆汇· 2025-05-30 08:10
特朗普政府关税的命运一波三折,先是被美国国际贸易法院的裁决"叫停",特朗普政府很快提起上诉, 之后上诉法院又"叫停"了贸易法院的裁决。美东时间周四,美国联邦上诉法院批准了特朗普政府的请 求,暂时中止前一日一家下级法院禁止执行美政府多个关税行政令的裁决。 美国总统特朗普在其第二任期内首次会见了美联储主席鲍威尔。特朗普批评鲍威尔未能降低借贷成本。 鲍威尔则坚称,任何决定都不会基于总统的要求。根据美联储的一份声明,特朗普邀请鲍威尔与他会 面,"讨论经济发展,包括增长、就业和通胀。"鲍威尔没有讨论他对货币政策的预期,只是强调政策路 径将完全取决于即将发布的经济信息及其对前景的意义。鲍威尔表示,他和FOMC的同事们将完全基于 谨慎、客观和非政治的分析做出政策决定。 美股方面,道指涨0.28%,纳指涨0.39%,标普500指数涨0.4%。 大型科技股多数上涨,亚马逊、Meta、特斯拉涨幅不足1%,英伟达涨超3%,博通涨超1%。 热门中概股多数收涨,纳斯达克中国金龙指数涨1.44%,京东涨4.31%,小鹏涨3.98%,新东方涨 3.61%,再鼎医药涨3.4%,百胜中国涨2.97%,携程涨2.2%,理想涨1.1%,阿特斯太阳 ...
宇树科技从有限公司变更为股份公司;DeepSeek开源新版R1模型丨数智早参
每日经济新闻· 2025-05-30 07:24
每经记者|可杨 每经编辑|张海妮 丨 2025年5月30日 星期五 丨 NO.1 宇树科技从有限公司变更为股份公司 5月29日,宇树科技向合作伙伴发布通知称,因公司发展需要,杭州宇树科技有限公司即日起名称变更 为"杭州宇树科技股份有限公司"。原公司所有业务由"新公司"继续经营,原公司签订的所有合同继续有 效。 点评:宇树科技从有限责任公司到股份有限公司的转身,是企业自身发展壮大的必然选择,也是科技行 业创新发展的生动缩影。在新的股份制架构下,期待宇树科技凭借更强大的资本实力、更灵活的运营机 制与更高效的治理结构,在科技领域开启新的征程。 大模型明星企业DeepSeek深夜"上新"。5月29日凌晨,DeepSeek开源了R1最新0528版本。DeepSeek目前 没有对该版本进行任何说明,只是"悄悄"地开放了模型。著名代码测试平台Live CodeBench显示,其性 能可以媲美OpenAI最新的o3模型的高版本。也有网友对新版R1的风格进行了测试,结果几乎和OpenAI 的o3差不多。 点评:开源是推动技术进步和生态发展的重要方式。DeepSeek R1新版本的开源,为开发者提供了更多 选择和创新机会,有助于 ...
“新版DeepSeek-R1”的深度测评
2025-05-29 23:25
纪要涉及的公司和行业 涉及大模型行业,具体公司模型包括 Deepseeker R1、Claude 3.7、Claude 4、CosmoFlow、Readcloud 3.7、Readcloud 4、Grok 3、Gemini 2.5 Pro、Cloud 3.7、Cloud 4、GPT、Devsec、谷歌 Jennifer 2.5 Pro、OpenAI [1][3][4][7][8][12][15][18] 纪要提到的核心观点和论据 - **Deepseeker R1 新版本表现**:最新版本 0.528 在 CLion 中正确率从 4/8 提升至 6/8 有进步,但低于 Claude 3.7(7/8)和 CosmoFlow 加 Claude 4(8/8);agent 能力提升,包括调用工具正确率、上下文长度和规划思考长度增加;代码生成对指令遵从更明显,但质量有瑕疵,与 Claude 系列有差距 [1][3][4][17][19] - **Deepseeker R1 问题解决情况**:0.528 版通过更精准查找资料和增加上下文长度(客户端最长 128K)解决老版本爬取过多网页内容致上下文超出限制问题 [1][5] - **特定任务处理挑战**:最新版 R1 使用 fetch 工具查找过去十年中国 GDP 数据受阻,fetch 成功率低且世界银行无 API 支持,编写 Python 代码效果不佳,表明 MCP 工具与大模型存在适配性问题;Readcloud 3.7、Readcloud 4、Grok 3 和 Gemini 2.5 Pro 能完成该任务,调用 MCP 工具和参数设置更成熟,适配性更强 [1][6][7] - **FetchAPI 使用问题及解决方案**:使用 FetchAPI 失败率高,可能与 RPC 机制有关,多次修改代码问题仍存在;Fair Crawl 工具无此问题,FirePro 和 BRAVE search 稳定性更好可替代 [8] - **上下文长度影响**:上下文长度增加显著提升任务完成质量,新版 R1 长时间运行和修改尝试后解决复杂问题且质量提升 [1][9] - **Cloud 4 与 Cloud 3.7 对比**:Cloud 4 在处理非规范化网站数据爬取和整理、生成旅游规划网页等方面优于 Cloud 3.7,速度更快、准确率更高,能成功部署网页且排版精美 [4][10] - **第二道题目挑战及解决**:需调用多个 MCP 工具协同工作,通过选择合适工具和细致规划完成任务,显示更新后模型推理和执行效率增强 [11] - **R1 与 Claude 模型性能差异**:R1 有调用 function card 能力但生成质量不完美,工具调用可能失败仍能给出完整答案;Claude 尤其是 Claude 4 在速度和准确性上优于 R1,能避免调用易出错 MCP 工具,表现更稳定高效 [12] - **MCP 工具问题及解决**:MCP 工具出错时替代方案选择不理想,Readcloud 熟悉小函数能快速找到替代方案,如用百度地图获取天气功能替代 [13][14] - **Devsec 处理错误特点及改进**:Devsec 初始选择正确后续一般没问题,初始错误找备选 MCP 易出错,需提高备选方案识别和调用能力 [15] - **Claude 4 优势**:Claude 4 追平谷歌 Jennifer 2.5 Pro 以及 OpenAI,编程量较大时速度快且能直接运行代码,Claude 系列代码生成表现优异 [18] 其他重要但是可能被忽略的内容 - **测试框架**:包括测试调用 MCP 类 agent 工具准确率和评估代码生成质量与效率,此次更新提升推理、深度思考文本生成质量和代码生成优化,agent 方面代码能力重要 [2] - **老版本 R1 问题**:老版本使用工具易出错,选备用 CSP 也易出错,整体表现不稳定 [16]
DeepSeekR1幻觉率最高降低50%,用户喊话想要R2模型
第一财经· 2025-05-29 22:10
报告显示此前 R1模型幻觉率在21%左右。 在开源平台HuggingFace上发布R1模型的更新后,5月29日晚,DeepSeek终于发布了官方公告介绍这次版本的具体能力迭代细节,其中包括深度思考能力强 化、幻觉改善和创意写作更好等。 值得一提的是,DeepSeek提到,新版DeepSeek R1 针对"幻觉"问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻 觉率降低了 45%-50% 左右,能够提供更为准确可靠的结果。 所谓幻觉即大模型的"胡说八道",此前DeepSeek的幻觉率并不低,也被不少用户和开发者所讨论。5月15日,SuperCLUE曾发布最新一轮中文大模型忠实性 幻觉测评结果,显示此前的DeepSeek-R1模型幻觉率在21%左右,在测评的国内模型中排名第五。 doubao-1.5-pr 在测评数据上,官方表示,更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的成绩,并且在整体表现上已 接近其他国际顶尖模型,如 o3 与 Gemini-2.5-Pro。 gemini-2.5-pro-p1 gemini-2.5-flash-t ...
DeepSeek-R1更新,官方说明来了!多项表现已接近其他国际顶尖模型
每日经济新闻· 2025-05-29 21:13
5月29日晚间,深度求索微信公众号公布了 DeepSeek-R1-0528 更新的详细升级内容,DeepSeek-R1-0528 仍然使用 2024年12月所发布的 DeepSeek V3 Base 模型作为基座,但在后训练过程中投入了更多算力,显著提升了模型的思维深度与推理能力。更新后的 R1 模型在数学、编程与通用逻辑 等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如 o3 与 Gemini-2.5-Pro。 其他能力更新比如: 1.幻觉改善:新版 DeepSeek R1 针对"幻觉"问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降 低了 45~50% 左右,能够有效地提供更为准确、可靠的结果。 2.创意写作:在旧版 R1 的基础上,更新后的 R1 模型针对议论文、小说、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完整的 长篇作品,同时呈现出更加贴近人类偏好的写作风格。 3.工具调用:DeepSeek-R1-0528 支持工具调用(不支持在 thinking 中进行工具调用)。当前模型 Tau-Ben ...
DeepSeek-R1-0528更新官方详解:思考更深、推理更强
智通财经网· 2025-05-29 20:55
这一进步得益于模型在推理过程中的思维深度增强:在 AIME 2025 测试集上,旧版模型平均每题使用 12K tokens,而新版模型平均每题使用 23K tokens, 表明其在解题过程中进行了更为详尽和深入的思考。 此外,新版 DeepSeek R1 针对"幻觉"问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了 45~50% 左右,能够有效地提供更为准确、可靠的结果。在旧版 R1 的基础上,更新后的 R1 模型针对议论文、小说、散文等文体进行了进一步优化,能够输出篇 幅更长、结构内容更完整的长篇作品,同时呈现出更加贴近人类偏好的写作风格。 | Benchmarks | DeepSeek-R1- | OpenAI- | Gemini-2.5- | Qwen3- | DeepSeek-R1 | | --- | --- | --- | --- | --- | --- | | | 0528 | 03 | Pro-0506 | 235B | | | AIME 2024 数学竞赛 pass@1 | 91.4 | 91.6 | 90.8 | 85.7 | 79.8 | | A ...
DeepSeek R1官宣更新:思维深度与推理能力显著提升,优化“幻觉”问题
新浪科技· 2025-05-29 20:40
新浪科技讯 5月29日晚间消息,DeepSeek今日宣布,DeepSeek R1模型已完成小版本升级,当前版本为 DeepSeek-R1-0528。用户通过官方网站、App或小程序进入对话界面后,开启"深度思考"功能即可体验 最新版本。API 也已同步更新,调用方式不变。 工具调用,DeepSeek-R1-0528 支持工具调用(不支持在 thinking 中进行工具调用); 据介绍,DeepSeek-R1-0528 仍然使用 2024 年 12 月所发布的 DeepSeek V3 Base 模型作为基座,但在后 训练过程中投入了更多算力,显著提升了模型的思维深度与推理能力。官方称更新后的 R1 模型在数 学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表 现上已接近其他国际顶尖模型,如o3与Gemini-2.5-Pro。 其他能力更新方面,包括幻觉改善,新版 DeepSeek R1 针对"幻觉"问题进行了优化。与旧版相比,更新 后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了45~50%左右,能够有效地提供更 为准确、可靠的结果; 创意写作,在旧版 R1 ...
不只是“小升级”!DeepSeek-R1新版获海外盛赞,每经记者亲测挑战三大编程任务
每日经济新闻· 2025-05-29 18:46
每经记者|宋欣悦 每经编辑|兰素英 5月29日凌晨,DeepSeek-R1-0528正式在Hugging Face平台开源。此前一日(5月28日),DeepSeek官方宣布DeepSeek-R1模型已完成小版本试升级,用户可 通过官方网页、App、小程序进行测试(打开深度思考),API接口和使用方式保持不变。 在此次更新中,模型代码能力的提升最为显著。知名代码测试平台LiveCodeBench显示,更新后的R1性能可以媲美OpenAI o3模型的高版本。 除代码能力外,R1新版本模型的文本理解与推理能力亦实现跨越式升级。其上下文长度拓展至128k,长文本提取的准确率也有显著提升。 《每日经济新闻》记者(以下简称"每经记者")通过俄罗斯方块游戏开发、太阳系模拟与交互展示,以及设计英伟达最新财报网页这三项任务对R1新版本 进行了实测,发现DeepSeek-R1-0528的编程能力确实强大,对物理世界的理解以及文本的提取都相当准确。 知名AI评论人Haider在社交媒体上评价称,这是开源的一大胜利。 瑞士IT咨询公司CTOL Digital Solutions首席执行官Max Zhang则表示,在这一"小"进步之后 ...