Seek .(SKLTY)

搜索文档
小猿AI与DeepSeek、腾讯元宝共同跻身AI应用Top10
央广网· 2025-05-30 16:39
行业趋势 - 2025年3月移动端AI应用月活用户突破6.47亿 超半数中国网民进入"AI原生应用"时代 [1] - 教育AI在技术浪潮中表现突出 成为行业突围方向 [1] 公司表现 - 小猿AI上线首月即登顶教育领域AI用户新增榜首 并跻身全网AI应用新增下载TOP 10 [1][3] - 作业批改功能持续发挥技术标杆作用 1V1个性化讲解功能实现渗透率跨越式提升 [5] 技术优势 - 底层数据包括500万小时+教学视频 20亿+题库 1万+知识点 100万+试卷 以及300亿学情数据 [3] - 自研猿力大模型与Deepseek-R1推理大模型协同进化 构建独特模型矩阵 [5] - Deepseek精准定位错题根源 猿力大模型实现引导式教学 [5] 产品特点 - 覆盖作业检查 学情诊断 错因分析 1v1讲解等100多个关键学习场景 [5] - 结合教师核心教学策略与学生中心行为路径策略 回归启发思考教育本质 [5]
腾讯多业务全面接入DeepSeek R1-0528
快讯· 2025-05-30 13:25
腾讯AI应用接入DeepSeek R1-0528 - 腾讯旗下多款AI应用包括腾讯元宝、ima、搜狗输入法、QQ浏览器、腾讯文档、腾讯地图、腾讯乐享等宣布接入DeepSeek R1-0528模型 [1] - 用户可在不同产品中选择DeepSeek模型R1深度思考功能,体验最新的深度思考、编程和长文本处理等能力 [1] - 该服务免费且不限量使用 [1] 腾讯云上线DeepSeek-R1-0528 - 腾讯云上线DeepSeek-R1-0528模型,企业和开发者可通过腾讯云直接调用API接口 [1] - 开发者可通过腾讯云智能体开发平台内置的RAG、工作流和智能体开发能力快速搭建专属智能体应用 [1] - 开发者还能通过腾讯云TI平台对模型进行精调 [1]
DeepSeek再出手!R1升级版性能大提升,美国对手慌了?
金十数据· 2025-05-30 11:52
模型升级内容 - 公司完成DeepSeek R1模型小版本升级 主要强化语义理解精准性 复杂逻辑推理能力 长文本处理稳定性 [1] - 网友测评显示模型理解能力显著提升 激活参数部分可制作交互动画展示 关键信息逻辑更清晰 [1] - 编程能力大幅提升 可一次性生成1000多行无错误代码 性能接近Claude 4 [1] - Hugging Face研究员指出升级后模型在减少幻觉方面有重大改进 显示与顶级模型竞争实力 [1] 模型性能对比 - DeepSeek-V3-0324模型在数学 代码类评测集上超越GPT-4 5和Claude-3 7-Sonnet [1] - V3模型性价比极高 输入价格为Claude-3 7-Sonnet的1/11 GPT-4 5的1/277 且开源可免费商用 [1] - R1-0528版本在LiveCodeBench代码生成排行榜中略低于OpenAI o4 mini和o3推理模型 但超过xAI Grok 3 mini和阿里巴巴Qwen 3 [2] 市场影响 - R1模型1月发布时因多项指标优于西方竞争对手引发全球关注 导致科技股暴跌 [2] - V3模型发布后市场热度下降 焦点转向未发布的R2模型 [2] - R1-0528版本发布再次引发全球媒体关注 被指加剧与OpenAI等美国竞争对手的竞争 [2] - 低成本高性能R1模型推动中国科技股上涨 显示市场对中国AI能力的乐观预期 [2] 未来产品规划 - R2模型预计采用混合专家模型(MoE) 参数量达1 2万亿 单位推理成本较GPT-4大幅降低 [2] - 公司尚未正式确认R2模型发布时间 [2]
早报 (05.30)| 关税重大变数!暂时恢复;特朗普第二任期首次会见鲍威尔;DeepSeek完成R1更新:思考更深,推理更强
格隆汇· 2025-05-30 08:10
特朗普政府关税动态 - 美国联邦上诉法院批准特朗普政府请求,暂时中止下级法院禁止执行多个关税行政令的裁决 [2] - 白宫国家经济委员会主任哈塞特称关税裁决将被推翻,三项贸易协议已接近达成 [8] - 芝加哥联储主席古尔斯比表示若贸易政策回到关税前状态,将为利率下调创造条件 [9][10] 美联储与货币政策 - 特朗普批评美联储主席鲍威尔未能降低借贷成本,鲍威尔强调政策决定将基于经济数据而非政治因素 [2] - 美联储声明显示鲍威尔与特朗普讨论经济增长、就业和通胀,但未透露货币政策预期 [2] 美股市场表现 - 道指涨0.28%至42215.73点,纳指涨0.39%至19175.87点,标普500涨0.4%至5912.17点 [3][5] - 大型科技股多数上涨,英伟达涨超3%,博通涨超1%,亚马逊、Meta、特斯拉涨幅不足1% [3][5] - 热门中概股普涨,纳斯达克中国金龙指数涨1.44%,京东涨4.31%,小鹏涨3.98% [4][5] 全球资产与大宗商品 - 现货黄金涨0.92%至3317.94美元/盎司,现货白银涨1%至33.3148美元/盎司 [5] - WTI原油跌1.45%至60.94美元/桶,布伦特原油跌1.15%至64.15美元/桶 [5][7] - 高盛预测金价明年中期将达4000美元/盎司,认为黄金比比特币更具对冲作用 [11] 公司动态与财报 - 英伟达CEO黄仁勋计划出售至多600万股股票,价值约8.09亿美元 [12] - 戴尔科技一季度营收233.8亿美元超预期,AI服务器订单积压增长至144亿美元 [13] - 理想汽车Q1营收259.3亿元同比增1.1%,预计Q2交付12.3万-12.8万辆 [17] - 哪吒汽车债转股失败,欠供应商约60亿元,投资方要求罢免CEO方运舟 [15][16] 行业合作与创新 - 京东与小红书推出"红京计划",品牌商家可在小红书投放广告并直接跳转京东APP [18] - 特斯拉计划6月首次交付自动驾驶Model Y车型,测试期间未发生事故 [19] - DeepSeek R1模型升级至0528版本,在数学、编程等基准测评中表现接近国际顶尖模型 [10] 全球市场与指数 - A股沪指涨0.7%至3363点,创业板指涨1.37%,全天成交1.21万亿元 [32] - 恒生科技指数涨2.46%,美团大涨6.6%,快手涨近5%,京东涨超4% [32][34] - 日经225涨1.88%,韩国KOSPI涨1.89%,印度孟买Sensex涨0.39% [34] 行业趋势与政策 - 中国1-4月造船新接订单量全球第一,部分船企订单排至2029年 [28] - 4月中国皮卡市场销售5万辆同比增14%,1-4月累计销售18.8万辆同比增9% [29] - 商务部回应欧盟对中国轮胎反倾销调查,称将坚决维护中国企业合法权益 [30]
宇树科技从有限公司变更为股份公司;DeepSeek开源新版R1模型丨数智早参
每日经济新闻· 2025-05-30 07:24
宇树科技公司变更 - 宇树科技从有限公司变更为股份有限公司 公司名称由"杭州宇树科技有限公司"变更为"杭州宇树科技股份有限公司" 原业务和合同继续有效 [1] - 股份制架构有望提升资本实力和运营效率 新架构可能带来更灵活的运营机制和更高效的治理结构 为科技领域发展提供新动力 [1] DeepSeek开源R1模型 - DeepSeek开源R1最新0528版本 新版本性能媲美OpenAI o3高版本 风格测试结果与o3相似 [2] - 开源促进技术交流与生态发展 为开发者提供更多选择和创新机会 但需平衡开源与商业利益 [2] 英伟达第一财季业绩 - 英伟达第一财季营收441亿美元 同比增长69% 超出市场预期的432 9亿美元 数据中心收入391亿美元 同比增长73% [3] - 第一财季净利润187 8亿美元 同比增长26% 公司预计第二财季收入在450亿美元上下浮动2% 略低于分析师预期的455亿美元 [3]
“新版DeepSeek-R1”的深度测评
2025-05-29 23:25
纪要涉及的公司和行业 涉及大模型行业,具体公司模型包括 Deepseeker R1、Claude 3.7、Claude 4、CosmoFlow、Readcloud 3.7、Readcloud 4、Grok 3、Gemini 2.5 Pro、Cloud 3.7、Cloud 4、GPT、Devsec、谷歌 Jennifer 2.5 Pro、OpenAI [1][3][4][7][8][12][15][18] 纪要提到的核心观点和论据 - **Deepseeker R1 新版本表现**:最新版本 0.528 在 CLion 中正确率从 4/8 提升至 6/8 有进步,但低于 Claude 3.7(7/8)和 CosmoFlow 加 Claude 4(8/8);agent 能力提升,包括调用工具正确率、上下文长度和规划思考长度增加;代码生成对指令遵从更明显,但质量有瑕疵,与 Claude 系列有差距 [1][3][4][17][19] - **Deepseeker R1 问题解决情况**:0.528 版通过更精准查找资料和增加上下文长度(客户端最长 128K)解决老版本爬取过多网页内容致上下文超出限制问题 [1][5] - **特定任务处理挑战**:最新版 R1 使用 fetch 工具查找过去十年中国 GDP 数据受阻,fetch 成功率低且世界银行无 API 支持,编写 Python 代码效果不佳,表明 MCP 工具与大模型存在适配性问题;Readcloud 3.7、Readcloud 4、Grok 3 和 Gemini 2.5 Pro 能完成该任务,调用 MCP 工具和参数设置更成熟,适配性更强 [1][6][7] - **FetchAPI 使用问题及解决方案**:使用 FetchAPI 失败率高,可能与 RPC 机制有关,多次修改代码问题仍存在;Fair Crawl 工具无此问题,FirePro 和 BRAVE search 稳定性更好可替代 [8] - **上下文长度影响**:上下文长度增加显著提升任务完成质量,新版 R1 长时间运行和修改尝试后解决复杂问题且质量提升 [1][9] - **Cloud 4 与 Cloud 3.7 对比**:Cloud 4 在处理非规范化网站数据爬取和整理、生成旅游规划网页等方面优于 Cloud 3.7,速度更快、准确率更高,能成功部署网页且排版精美 [4][10] - **第二道题目挑战及解决**:需调用多个 MCP 工具协同工作,通过选择合适工具和细致规划完成任务,显示更新后模型推理和执行效率增强 [11] - **R1 与 Claude 模型性能差异**:R1 有调用 function card 能力但生成质量不完美,工具调用可能失败仍能给出完整答案;Claude 尤其是 Claude 4 在速度和准确性上优于 R1,能避免调用易出错 MCP 工具,表现更稳定高效 [12] - **MCP 工具问题及解决**:MCP 工具出错时替代方案选择不理想,Readcloud 熟悉小函数能快速找到替代方案,如用百度地图获取天气功能替代 [13][14] - **Devsec 处理错误特点及改进**:Devsec 初始选择正确后续一般没问题,初始错误找备选 MCP 易出错,需提高备选方案识别和调用能力 [15] - **Claude 4 优势**:Claude 4 追平谷歌 Jennifer 2.5 Pro 以及 OpenAI,编程量较大时速度快且能直接运行代码,Claude 系列代码生成表现优异 [18] 其他重要但是可能被忽略的内容 - **测试框架**:包括测试调用 MCP 类 agent 工具准确率和评估代码生成质量与效率,此次更新提升推理、深度思考文本生成质量和代码生成优化,agent 方面代码能力重要 [2] - **老版本 R1 问题**:老版本使用工具易出错,选备用 CSP 也易出错,整体表现不稳定 [16]
DeepSeekR1幻觉率最高降低50%,用户喊话想要R2模型
第一财经· 2025-05-29 22:10
模型性能提升 - 更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得国内领先成绩,接近国际顶尖模型如o3与Gemini-2 5-Pro [4] - 新版模型在AIME 2025数学测试中准确率从旧版70%提升至87 5% [18] - 代码能力显著提升,在Live CodeBench平台性能媲美OpenAI的o3-high模型 [18] 幻觉问题优化 - 新版R1模型在改写润色、总结摘要、阅读理解等场景中幻觉率降低45%-50%,此前旧版幻觉率为21% [4][18] - SuperCLUE测评显示推理模型平均幻觉率为22 95%,非推理模型为13 52% [18] 文本生成能力 - 针对议论文、小说、散文等文体优化,能输出篇幅更长、结构更完整的长篇作品,写作风格更贴近人类偏好 [18] - 深度思考能力与创意写作能力得到强化 [1] 技术细节与开源策略 - 新模型参数为685B,开源版本上下文长度128K(网页端/App/API提供64K),仍采用MIT License允许商用与二次训练 [19] - 基于DeepSeek V3 Base模型基座,后训练投入更多算力提升思维深度与推理能力 [18] 行业动态与用户反馈 - 用户对下一代R2模型期待强烈,X平台评论区出现"We want R2"呼声 [19] - 业界猜测R1更新可能延迟R2发布,或与基准测试未超越OpenAI o3有关 [19] - 海内外基座模型竞争持续,DeepSeek更新后行业关注下一家突破者 [19]
DeepSeek-R1更新,官方说明来了!多项表现已接近其他国际顶尖模型
每日经济新闻· 2025-05-29 21:13
5月29日晚间,深度求索微信公众号公布了 DeepSeek-R1-0528 更新的详细升级内容,DeepSeek-R1-0528 仍然使用 2024年12月所发布的 DeepSeek V3 Base 模型作为基座,但在后训练过程中投入了更多算力,显著提升了模型的思维深度与推理能力。更新后的 R1 模型在数学、编程与通用逻辑 等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如 o3 与 Gemini-2.5-Pro。 其他能力更新比如: 1.幻觉改善:新版 DeepSeek R1 针对"幻觉"问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降 低了 45~50% 左右,能够有效地提供更为准确、可靠的结果。 2.创意写作:在旧版 R1 的基础上,更新后的 R1 模型针对议论文、小说、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完整的 长篇作品,同时呈现出更加贴近人类偏好的写作风格。 3.工具调用:DeepSeek-R1-0528 支持工具调用(不支持在 thinking 中进行工具调用)。当前模型 Tau-Ben ...
DeepSeek-R1-0528更新官方详解:思考更深、推理更强
智通财经网· 2025-05-29 20:55
模型升级概述 - DeepSeek-R1-0528 基于 DeepSeek V3 Base 模型进行升级,显著提升了思维深度与推理能力 [1] - 新版模型在数学、编程与通用逻辑等基准测评中取得国内领先成绩,接近国际顶尖模型如 o3 与 Gemini-2.5-Pro [1] 性能表现 - 在 AIME 2024 数学竞赛 pass@1 中得分为 91.4,略低于 OpenAI-03 的 91.6,但高于 Gemini-2.5-Pro-0506 的 90.8 [2] - 在 AIME 2025 数学竞赛 pass@1 中得分为 87.5,较旧版 R1 的 70.0 提升 17.5 个百分点 [2] - GPQA Diamond 科学测试 pass@1 得分为 81.0,略低于 OpenAI-03 的 83.3 和 Gemini-2.5-Pro-0506 的 83.0 [2] - LiveCodeBench 代码生成 pass@1 得分为 73.3,低于 OpenAI-03 的 77.3,但高于 Gemini-2.5-Pro-0506 的 71.8 [2] 技术优化 - 新版模型在 AIME 2025 测试中每题平均使用 23K tokens,较旧版的 12K tokens 增加近一倍,显示思维深度增强 [3] - 针对"幻觉"问题优化,在改写润色、总结摘要等场景中幻觉率降低 45~50% [3] - 对议论文、小说、散文等文体进行优化,能输出更长、结构更完整的长篇作品,写作风格更贴近人类偏好 [3]
DeepSeek R1官宣更新:思维深度与推理能力显著提升,优化“幻觉”问题
新浪科技· 2025-05-29 20:40
新浪科技讯 5月29日晚间消息,DeepSeek今日宣布,DeepSeek R1模型已完成小版本升级,当前版本为 DeepSeek-R1-0528。用户通过官方网站、App或小程序进入对话界面后,开启"深度思考"功能即可体验 最新版本。API 也已同步更新,调用方式不变。 工具调用,DeepSeek-R1-0528 支持工具调用(不支持在 thinking 中进行工具调用); 据介绍,DeepSeek-R1-0528 仍然使用 2024 年 12 月所发布的 DeepSeek V3 Base 模型作为基座,但在后 训练过程中投入了更多算力,显著提升了模型的思维深度与推理能力。官方称更新后的 R1 模型在数 学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表 现上已接近其他国际顶尖模型,如o3与Gemini-2.5-Pro。 其他能力更新方面,包括幻觉改善,新版 DeepSeek R1 针对"幻觉"问题进行了优化。与旧版相比,更新 后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了45~50%左右,能够有效地提供更 为准确、可靠的结果; 创意写作,在旧版 R1 ...