DeepSeek

搜索文档
DeepSeek小版本大升级,新R1模型代码能力媲美OpenAI o3
第一财经· 2025-05-29 11:04
模型升级与性能表现 - DeepSeek-R1-0528模型完成小版本试升级并在HuggingFace开源平台发布,但官方未更新模型卡及公告 [1] - 海外开发者测试发现该版本代码能力提升显著,在Live CodeBench平台性能接近OpenAI的o3-high模型 [1] - 在代码测试排名中,DeepSeek-R1-0528以Pass@1 73.1、Easy-Pass@1 98.7、Medium-Pass 85.2位列第四,优于Grok-3-Mini和Claude-3系列模型 [3][4] - 开发者实测显示新模型在32K上下文内的文本召回效果优于旧版R1,但60K上下文表现下降 [7] 开发者反馈与横向对比 - 开发者认为新模型写作任务改进明显,输出更自然且减少"量子力学元素"等异常内容 [7] - AI博主测试显示新模型在橙色小球撞击模拟中,漫反射和撞击效果优于Claude-4-Sonnet [5] - 部分开发者认为个案测试不具代表性,需等待评测榜单和长期口碑验证 [7] - Claude-4系列因测试速率限制未参与榜单排名,但其公认编程能力未被纳入直接比较 [5] 版本迭代策略与行业观察 - 公司延续低调更新风格,类似3月发布的DeepSeek-V3-0324也未高调宣传,该版本曾通过强化学习技术提升推理任务表现 [7] - 业内猜测公司可能仅通过调整训练数据实现能力提升,因此不定义为大版本升级,而其他厂商的版本号迭代或为营销需求 [8] - 开发者期待下一代R2模型能显著提升上下文长度和多模态能力,以满足生产需求 [8]
24小时环球政经要闻全览 | 5月29日
搜狐财经· 2025-05-29 11:04
全球股市表现 - 道琼斯工业平均指数下跌244.95点至42098.7点,跌幅0.58% [2] - 纳斯达克指数下跌98.22点至19100.94点,跌幅0.51% [2] - 标普500指数下跌32.99点至5888.55点,跌幅0.56% [2] - 欧洲斯托克50指数下跌37.06点至5378.39点,跌幅0.68% [2] - 英国富时100指数下跌52.04点至8726.01点,跌幅0.59% [2] - 德国DAX指数下跌188.3点至24038.19点,跌幅0.78% [2] - 俄罗斯RTS指数上涨19.36点至1102.21点,涨幅1.79% [2] - 韩国KOSPI指数上涨32.93点至2670.15点,涨幅1.25% [2] 美国政策动态 - 美国国际贸易法院阻止特朗普4月2日关税政策生效,裁定其越权 [2] - 美国国务院宣布将开始撤销中国留学生签证,加强签证审查 [3] - 特朗普要求哈佛大学将国际学生比例上限设为15%,目前约为31% [4] - 美联储会议纪要显示决策者认为经济不确定性增加,对降息持谨慎态度 [5] 国际军事动态 - 北约计划将作战旅总数从80个增至120-130个,可能新增35万名士兵 [6] - 北约拟将成员国国防开支目标从GDP的2%提高至5% [6] 科技公司动态 - 英伟达2026财年Q1营收441亿美元,同比增长69%,数据中心业务营收391亿美元 [7] - 马斯克宣布将结束在特朗普政府的特殊雇员身份 [8] - 苹果计划全面重命名操作系统,采用年份而非版本号 [8] - OpenAI首席财务官表示公司重组为未来IPO铺路 [9] - DeepSeek开源R1最新0528版本,性能接近OpenAI o3模型 [10]
DeepSeek,突传大消息!
证券时报· 2025-05-29 09:46
DeepSeek模型升级 - 公司完成R1模型小版本试升级 用户可通过官网 APP 小程序直接体验 无需切换操作 [1] - 本次升级未公布具体更新内容 但实测显示编程能力显著提升 在网页生成 游戏制作 Bug修复等任务中表现突出 [3] - 新模型在LiveCodeBench测试中表现接近OpenAI o3高版本 用户实测世界时钟面板等项目完成度与审美大幅提升 [3][4] 行业竞争格局 - OpenAI拟30亿美元收购编程公司Windsurf 创其收购金额纪录 旨在弥补编程能力短板以对抗微软 Anthropic等对手 [4] - 谷歌推出Gemini2 5Pro"I/O"特别版 被CEO称为"最强编程模型" Anthropic的Claude4以"自动写代码7小时"刷新纪录 [5] - 行业头部厂商近期密集升级编程能力 模型迭代焦点集中在软件工程 自主代理等方向 [4][5] DeepSeek技术进展 - R1模型参数规模达6710亿 传闻R2模型参数将翻倍至1 2万亿 原预计5月发布但尚未落地 [5] - 本次R1升级虽称"小版本" 但能力提升幅度达到国际厂商整数代命名标准 展现追赶一线水平的竞争力 [6] - 模型提供更适合中国用户需求的服务 国内开发者可低成本使用接近国际前沿的技术 [6] 行业动态 - 编程能力成为大模型核心竞争维度 头部厂商通过收购与模型迭代持续加码该领域 [4][5] - 国际厂商模型性能对标中 Claude4与OpenAI o3高版本成为当前编程能力标杆 [4][5]
DeepSeek新版R1直追OpenAI o3!实测来了:“小版本升级”着实不小
量子位· 2025-05-29 09:08
DeepSeek-R1-0528模型升级 - 新版本DeepSeek-R1-0528在LiveCodeBench上的表现几乎与OpenAI o3-high相当,被网友称为"R2级别更新"[1] - 模型在HuggingFace平台以MIT协议开源,包含163个safetensors文件,单个文件最大5.23GB[6][7] - 官方未更新模型卡,但社区已总结出四大亮点:深度推理能力、写作改进、独特推理风格、支持30-60分钟长时思考[10] 性能实测表现 - 成功解决"9.9-9.11=?"等难倒o3、Gemini 2.5 pro、Claude 4的数学难题[4] - 在"7米甘蔗过2米高1米宽门"测试中思考151秒,提供可执行方案并考虑答案趣味性[11][13][14] - 编程能力显著提升,仅用24秒完成Three.js太阳系模拟的代码设计[17][19][20] - 前端设计能力突出,可根据论文快速生成介绍网页[22] 技术演进背景 - 此次更新可能基于3月发布的V3-0324版本进行优化[28][30] - 延续公司"小版本大升级"的传统,类似V3升级时网友反馈"远超预期"[29] - 推动开源模型性能首次与o3、Claude 4等闭源顶级模型比肩[31] 社区反响 - 模型发布前曾因Unsloth文章模板泄露引发"DeepSeek-V3-0526"乌龙事件[25][27] - 实测结果引发广泛讨论,被视作"开源社区的重大胜利"[31] - 官方渠道(网站/App/小程序)已同步更新新模型[9]
5月29日证券之星早间消息汇总:DeepSeek宣布 R1模型已完成小版本试升级
证券之星· 2025-05-29 09:03
宏观要闻 - 中国副总理何立峰表示中国坚持高水平开放推动高质量发展 欢迎美资金融机构和长期资本深化对华合作 积极参与中国资本市场建设发展 [1] - 中方决定扩大免签国家范围 对沙特、阿曼、科威特、巴林持普通护照人员试行免签政策 实现海合会国家免签全覆盖 [1] 保险资金长期投资改革试点 - 第三批保险资金长期投资试点新增多家中小保险公司 参与机构数量和类型实现新突破 [2] - 金融监管总局拟批复600亿元新增试点规模 险资长期投资试点总规模将增至2220亿元 [2] 行业新闻 - DeepSeek R1模型完成小版本试升级 但未披露具体升级细节 [3] - 1—4月中国可再生能源新增装机1.28亿千瓦 其中风电1996万千瓦 光伏1.05亿千瓦 预计全年风电光伏新增装机2.8亿千瓦 [3] - C919商业运营两周年 航线网络覆盖16个城市 18架飞机执飞20余条航线 累计运输旅客超205万人次 [3] 海外要闻 - 美股三大指数全线下跌 道指跌0.58% 标普500跌0.56% 纳指跌0.51% 热门科技股多数下跌 中概股纳斯达克中国金龙指数跌0.71% [4] - 美国国际贸易法院裁定特朗普关税政策越权 认为总统紧急权力不凌驾于国会贸易监管权 [4]
DeepSeek R1模型完成“小版本试升级”,编程、逻辑理解上了一个层次!
华尔街见闻· 2025-05-29 08:57
DeepSeek R1模型更新 - DeepSeek发布R1模型小版本试升级 更新内容包括语义理解精准性、复杂逻辑推理、长文本处理稳定性等方面的强化 [1][2] - 用户测评显示模型理解能力显著提升 可制作交互动画展示激活参数 关键信息逻辑清晰 [3] - 编程能力大幅增强 可一次性生成1000多行无bug代码 性能媲美Claude 4 [4][5] DeepSeek-V3模型表现 - DeepSeek-V3-0324模型全面超越Claude-3.7-Sonnet 在数学和代码类评测中超过GPT-4.5 [6] - 新版DeepSeek-V3与Grok-3并列传统对话类模型榜首 推理任务表现突出 [6] - 性价比优势显著 输入价格仅为Claude-3.7-Sonnet的1/11、GPT-4.5的1/277 且开源免费商用 [6][7] R1模型市场影响 - R1模型性能优于西方竞争对手 成本仅数百万美元 采用低版本英伟达芯片 [7] - R1的崛起引发全球科技股暴跌 市场质疑巨头高投入AI模型的必要性 [8] R2模型预期与进展 - R2原计划5月初发布 目标提升代码生成能力 支持多语言推理 [9] - 公司联合清华大学提出SPCT学习方法 构建DeepSeek-GRM系列模型 引入元奖励模型提升推理扩展性 [9] - 传闻R2将采用混合专家模型 参数量达1.2万亿 较R1提升约1倍 单位推理成本较GPT-4降低97.4% [10] - R2训练全程使用昇腾910B芯片集群 计算性能512 PetaFLOPS 芯片利用率82% 性能达A100集群的91% [10] 市场反应与猜测 - V3模型升级后公司热度下降 市场关注焦点转向R2发布 [9] - 社交媒体猜测R1小升级可能意味着R2尚未准备好 [11]
山东经销商爆雷?比亚迪:网传不实!山东一村22岁就分100平楼房!DeepSeek重磅发布!黄金直线跳水,美股全线收跌!
新浪财经· 2025-05-29 08:37
比亚迪山东经销商事件 - 比亚迪否认山东经销商集团济南乾城汽车贸易有限公司资金链问题的传闻 称网传信息不属实 [2] - 公司表示经销商政策连续稳定 该经销商问题源于盲目扩张和加杠杆运营 [2] - 部分4S店已被当地其他经销商收购 公司正协助处理客户及员工问题 [2] - 5月28日比亚迪A股股价下跌2 56%至362 88元 股 总市值1 12万亿元 [3] 山东南村社区分房政策 - 山东省沂南县南村社区连续16年免费分配楼房 累计分配218套 今年6名22岁青年各获100平方米住房 [4][5] - 分房条件为本村居民且年满22周岁 采用二次抓阄确保公平 [7] - 社区通过发展集体经济实现共同富裕 固定资产达20多亿元 年集体收入超亿元 人均可支配收入3 9万元 [7] DeepSeek模型升级 - DeepSeek宣布完成R1模型小版本试升级 未公布具体更新内容 [9][11] - 用户反馈显示升级后模型思维链行为显著变化 包括深度推理能力提升 写作任务改进等 [11] - 此前传闻R2模型参数规模达1 2万亿 但未获官方证实 [11] 美股及黄金市场动态 - 5月28日美国三大股指全线下跌 道指跌0 58% 标普500跌0 56% 纳指跌0 51% [13] - 现货黄金短线跳水至3259 62美元 盎司 [15] - 美联储5月会议纪要显示维持利率4 25%-4 5%区间 强调将根据数据调整政策 [17][18]
DeepSeek-R1,升级;近万亿元规模金融机构,换帅!上海乐高乐园门票开售→
新华网财经· 2025-05-29 08:27
今日导读 - DeepSeek-R1模型完成小版本试升级,API接口和使用方式保持不变 [1] - 中国平安集团任命王欣为平安信托党委书记,待资格获批后将出任董事长 [1][11] - 上海乐高乐园度假区开启一日票及酒店销售,开园首日标准票549元,儿童和老人票439元 [1][8] 宏观消息 - 1—4月全国国有企业营业总收入与上年持平,利润总额同比下降1.7% [3] - 市场监管总局起草《网络销售重点工业产品质量安全监督管理规定(草案征求意见稿)》,要求平台收集质量安全信息并开展自查 [3] - 电子信息制造业数字化转型方案提出,到2027年规模以上企业关键工序数控化率超过85% [3] - 4月全国发行新增地方政府债券2534亿元,再融资债券4399亿元,合计6933亿元 [4] - 国家开发银行1—4月向长江经济带发放贷款超4000亿元,支持生态治理、基础设施等领域 [4] - 国家医保局筛查发现24个省份23997家定点零售药店存在药师信息被假冒或"挂证"情况 [5] 市场热点 - 国际机器人技能大赛在上海举行,聚焦技术落地与生态构建 [6] - 14家上市公司推出股东福利活动,构建"投资—消费"双向循环生态 [6] - 国泰海通向国泰君安期货增资15亿元,用于补充净资本 [7] - 工银中证港股通高股息精选ETF联接基金成立,募集规模3.43亿元 [7] - 量化交易走向普通投资者,20余家券商推出T0算法服务 [7] - 友阿股份拟15.8亿元收购深圳尚阳通科技100%股权 [8] - 嘉应制药因涉嫌信息披露违法违规被证监会立案 [8] 大公司动态 - 比亚迪回应山东经销商资金链问题,称系盲目扩张导致,部分4S店已被收购 [11] - 字节跳动6月30日起禁用第三方AI开发软件,改用自研工具Trae [12] - 深蓝汽车就车机广告争议致歉,承诺不再通过车机推送权益提醒 [12] - SpaceX"星舰"第九次试飞失败,火箭第二级飞船失控 [12] - 中广核成立揭阳核电公司,注册资本1亿元 [12] - 苹果计划开发游戏应用,取代现有Game Center [13] - 小马智行与广州公交集团签署战略协议,合作自动驾驶业务 [13] - 五芳斋向股东赠送粽子礼盒,持股1000股以上可申领 [14] - 宝武镁业与江淮汽车签署战略协议,加速产研融合 [15] - 福耀科技大学2025年招生五省,学费5460元/学年 [15] - 中国石油发布3000亿参数昆仑大模型,覆盖100个应用场景 [15] - 苹果遭加州公务员退休基金减持510万股,年内股价跌近20% [15] - 金山软件第一季度营收23.4亿元,同比增长9% [16] - 美的成立新零售公司,经营范围含智能机器人销售等 [16]
中国对沙特等4国试行免签;中欧半导体上下游企业座谈会召开……盘前重要消息还有这些
证券时报· 2025-05-29 07:58
外交政策与签证便利化 - 中方宣布对沙特、阿曼、科威特、巴林试行单方面免签政策,实施时间为2025年6月9日至2026年6月8日,覆盖商务、旅游等短期停留活动 [2] - 加上此前已实现全面互免签证的阿联酋和卡塔尔,海合会国家实现免签全覆盖 [2] 公共卫生与疫情动态 - 全国新冠疫情上升趋势减缓,多数省份疫情达高点或呈下降趋势,优势流行株为XDV变异株亚分支NB.1.8.1,致病力未明显变化 [2] 金融市场与指数调整 - MSCI全球指数新纳入5只A股样本(沪市3只、深市2只),调整后MSCI纳A样本总数达394只,中国市场为MSCI新兴市场指数第一大权重市场 [3] - 本次为常规季度调整,未涉及A股纳入因子变化 [3] 国有企业经济运行 - 2025年1—4月全国国有及国有控股企业营业总收入26.28万亿元,同比持平,利润总额1.35万亿元,同比下降1.7% [3] 半导体产业合作 - 中欧半导体企业座谈会强调深化合作,反对单边主义,维护全球供应链安全稳定 [4] - 中国承诺扩大高水平对外开放,提供公平透明的政策环境 [4] 消费与产业政策 - 福建省推动大宗消费升级,扩大以旧换新覆盖装修材料、卫生洁具等优势产品 [5] - 广东省计划培育数据产业,提升广深数据交易所能级,推进数据要素集聚区建设 [5] 科技与反诈动态 - 假冒"腾讯支付"APP以数字货币名义实施诈骗,微信支付无独立APP [6] - DeepSeek-R1模型完成试升级,官方渠道开放测试 [7] 上市公司动态 - 中旗股份氯虫苯甲酰胺项目未正式投产 [9] - 通达电气提示非理性炒作风险 [9] - *ST龙津将于6月6日进入退市整理期 [9] - 亚星化学子公司拟引入战略投资者 [9] - 中国黄金控股股东计划增持1.68亿—3.35亿元 [9] - ST华西签订2.9亿美元重大合同 [9] - 山推股份、合合信息筹划H股上市 [10] - 德邦股份澄清无人驾驶物流车概念不影响业绩 [10] - *ST吉药5月29日摘牌 [10] - ST联合拟收购润田实业100%股份 [10] - 太极实业计划回购1亿—1.2亿元股份 [10] - 中国能建子公司联合中标145.86亿元煤电EPC项目 [10] 券商行业观点 - 东兴证券认为快递行业处于周期底部,价格战缓和后盈利弹性较大 [11] - 浙商证券建议配置大盘股,关注煤炭、医药(创新药)、军工、金融(银行和非银) [12]
DeepSeek开源新版R1,媲美OpenAI o3模型;英伟达Q1营收441亿美元,超预期 丨全球科技早参
每日经济新闻· 2025-05-29 07:57
DeepSeek开源新版R1 - DeepSeek开源R1最新0528版本 性能可媲美OpenAI o3模型高版本 [2] - 著名代码测试平台Live CodeBench验证其性能 预计很快会放出模型卡介绍更多功能 [2] - 该版本表明DeepSeek在技术上取得显著进步 未来有望在AI领域占据更重要的地位 [2] OpenAI重组计划 - OpenAI首席财务官表示重组计划为未来可能的IPO奠定基础 [3] - 是否推进IPO取决于公开市场状况及公司自身准备程度 [3] - 去年12月公布重组计划 拟转型为公益企业以吸引更多投资并摆脱非营利架构限制 [3] 特斯拉Robotaxi服务 - 特斯拉或于6月12日在得克萨斯州奥斯汀推出无人驾驶出租车服务 [4] - 该服务是马斯克围绕无人驾驶汽车和人工智能重塑公司业务的重要里程碑 [4] - 推出日期已在内部讨论过 但仍可能发生变动 [4] 苹果操作系统重命名 - 苹果计划从今年开始所有操作系统统一采用年份标识 [5] - 当前iOS 18将直接跳跃至"iOS 26" 其他操作系统版本也将同步更新 [5] - 预计在6月9日全球开发者大会上正式宣布这一变革 [5] 英伟达Q1业绩 - 英伟达2026财年Q1营收441亿美元 同比增长69% 超出分析师预期的4329亿美元 [6] - 业绩表现受到美国政府出口限制压力 但整体好于预期 [6] - CEO黄仁勋强调中国是全球最大人工智能市场之一 赢得中国平台将引领全球 [6]