Workflow
Seek .(SKLTY)
icon
搜索文档
DeepSeek新版R1模型实际性能如何?第三方评测来了
南方都市报· 2025-06-05 20:26
模型性能提升 - 新版R1模型总体表现超过OpenAI的o3模型,但相比o4-mini(high)和Gemini 2 5 Pro Preview 05-06仍有差距 [1] - 新版R1模型在SuperCLUE测评中总分63 55分,比旧版提升1 61分,排名第四 [2] - 新版R1模型在数学推理能力测试中准确率从70%提升至87 5% [1] 技术优化与改进 - 新版R1模型基于DeepSeek V3基座,通过增加算力投入提升了思维深度与推理能力 [1] - 新版R1模型在数学、编程与通用逻辑等多个基准测评中领先国内其他模型 [1] - 新版R1模型针对"幻觉"问题优化,幻觉率降低45%-50% [4] 测评数据对比 - 新版R1模型指令遵循能力得分48 46分,比旧版高17 09分,但仍低于o3(66 95分)和o4-mini(high)(68 07分) [4] - 新版R1模型中文幻觉率降至13 86%,下降7 16个百分点,但相比豆包doubao-1 5-pro-32k(4 11%)仍有差距 [5] - 文本摘要和阅读理解任务的幻觉率优化最显著,分别降低9 27%和14 49% [5] 国际模型对比 - o4-mini(high)在SuperCLUE测评中得分最高(70 51分) [2] - Gemini 2 5 Pro preview 05-06得分66 48分,排名第二 [2]
DeepSeek发源地再推人工智能创新高地方案!科创板人工智能ETF(588930)现涨超2%,实时成交额突破6000万元
每日经济新闻· 2025-06-05 14:55
杭州市人工智能发展目标 - 杭州市即将出台《杭州市加快建设人工智能创新高地实施方案》,目标到2025年全市投入市场的智算规模超50EFLOPS [1] - 计划培育国际一流基础大模型2个、行业重大影响力垂直应用大模型25个以上 [1] - 力争人工智能核心产业营业收入超3900亿元,规模以上企业超700家 [1] - 投向人工智能的产业基金组建规模突破1000亿元 [1] A股人工智能板块表现 - 6月5日A股人工智能题材大幅上攻,科创板人工智能指数成份股中优刻得-W、芯原股份涨超7%,道通科技、云天励飞-U涨超5%,乐鑫科技、澜起科技、云从科技-UW涨超3% [1] - 科创板人工智能ETF(588930)过去20个交易日获得超1.26亿元资金净流入 [1] - 科创板人工智能ETF跟踪的指数布局30只科创板人工智能龙头,覆盖AI全产业链,前五大成分股合计权重47% [1] AI算力市场前景 - 全球AI算力需求持续增长,大模型训练和推理侧双重驱动为国产AI及服务器厂商带来发展机遇 [2] - 国内互联网大厂和智算中心对AI算力需求旺盛,IDC预测2028年中国加速服务器市场规模将达到253亿美元 [2] - 2024-2028年中国加速服务器市场年均复合增速超过20% [2] - DeepSeek R1降低AI应用开发门槛,推理侧需求将成为AI算力增长主要驱动力 [2]
美的空调怎么样?DeepSeek看起来是真的香!
财富在线· 2025-06-04 14:39
产品功能 - 美的鲜净感空气机T6集空调、新风、空气净化、消毒、除湿、加湿六大功能于一体,被称为全能"空气管家"[3] - 制冷时通过细密微孔设计柔化强风,1.5米外体感无风,气流细腻如蒲公英绒毛[3] - 秋冬季配备3升大水箱实现450ml/h独立加湿,持续6小时润泽[5] - 梅雨季具备5.03kg/h强力除湿能力,有效解决潮湿问题[5] - 净化和新风功能可在十几分钟内清除火锅味、宠物浮尘等异味[7] - 具备杀菌功能,可灭杀大肠杆菌、甲流H1N1等常见病菌[8] 智能技术 - 接入DeepSeek系统,自动感知并调节空气湿度、温度、风力等参数[8] - 具备超强语音交互能力,支持模糊语义识别和自由对话[8] - 可替代家长进行儿童陪伴功能,如讲述睡前故事[8] 用户体验 - 产品设计注重亲子场景,实现无风感制冷,提升家庭互动体验[3] - 解决现代家居环境中纸箱味、厨房异味、甲醛等"呼吸隐患"[1] - 被用户评价为"空气教养学",重新定义生活品质标准[10] 市场定位 - 产品瞄准高端健康家电市场,主打母婴家庭场景[1][10] - 通过多功能集成和智能交互形成差异化竞争优势[3][8]
DeepSeek与ChatGPT:免费与付费背后的选择逻辑
搜狐财经· 2025-06-04 14:29
技术差异 - DeepSeek采用混合专家模型,训练成本仅550万美元,远低于ChatGPT的几亿美元投入,在Chatbot Arena测试中排名第三与ChatGPT-4o并列 [2] - DeepSeek在数学推理方面表现突出,MATH-500测试准确率达97.3% [2] - ChatGPT基于传统Transformer架构,在多模态交互和创意内容生成方面更成熟 [2] 性能表现 - DeepSeek中文语义理解准确率92.7%高于ChatGPT的89.3%,支持古典文学解析和方言识别 [17] - 在金融领域应用使投资决策效率提升40%,医疗领域疾病鉴别诊断准确率85%,编程辅助错误率比GPT-4.5低23%且响应速度快40% [18][19][20] - 数据分析支持128K tokens长文本处理,某制造企业故障预测准确率从75%提升至92% [20] 成本优势 - 定价比ChatGPT低30%,处理效率高20%,能耗降低25% [8] - 百万token仅需8元,相比ChatGPT Pro月费200美元显著节省成本 [9] - 私有化部署前期投入约20万元服务器,长期无需持续API费用 [9] 应用场景 - DeepSeek适合深度推理、专业领域和数据隐私保护场景,某高校实验室用32B一体机支持240名学生实训 [22][23] - ChatGPT在多模态交互、创意内容生成和多语言翻译方面更具优势 [24] - 两者形成互补关系,共同推动AI行业发展 [21][53] 使用技巧 - AI输出质量70%取决于提示词设计,需掌握"提示词链"、"反向思考"和"多重角色"等高级技巧 [4][13][14][15] - 结构化提示词可显著提升效果,如分步引导分析市场进入策略 [14] - 专业领域提示词设计需结合具体场景需求,如医疗诊断需避免AI幻觉 [14][16] 生态发展 - DeepSeek通过算法创新降低算力依赖,已与华为、荣耀、阿里云等企业达成合作 [53] - ChatGPT持续进化多模态和记忆功能,两者共同推动AI技术民主化 [53] - 提示词工程能力将成为AI时代核心竞争力,包含AI思维、引导力、整合力与判断力 [54]
DeepSeek-R1 再进化,这次的更新好强啊...
36氪· 2025-06-04 11:32
模型升级 - DeepSeek-R1-0528 是 DeepSeek R1 的升级版本,沿用了 DeepSeek V3 Base 模型架构,但通过增加算力提升了性能 [3][4] - 新版模型在复杂推理、前端开发和降低幻觉等方面有显著改进 [3] - 模型命名延续了 DeepSeek 的低调风格,仅添加日期后缀 [3] 性能提升 - 在 AIME 2025 测试中,新版模型的 tokens 使用量从 12K 增加到 23K,准确率从 70% 提升至 87.5% [4] - 在 AIME 2024 数学竞赛 pass@1 测试中得分为 91.4,接近 OpenAI-03 的 91.6 [5] - 在 GPQA Diamond 科学测试 pass@1 中得分为 81.0,略低于 OpenAI-03 的 83.3 [5] - 在 LiveCodeBench 代码生成 pass@1 中得分为 73.3,接近 04-Mini (High) 的 79.5 [11] 编程与推理能力 - 新版模型在代码生成任务中一次性输出 728 行代码,优于 Claude 4 Sonnet 的 542 行 [11] - 在数学推理测试中,是唯一能稳定回答"9.9 - 9.11 等于多少"的模型 [13] - 在编程挑战中能生成干净代码和工作测试文件,且首次运行即完美无误 [14] 语言与创意能力 - 作为本土 AI,新版模型在中文语境下的表现优于国外模型 [16][17] - 幻觉率降低 45%~50%,输出内容更可靠 [18] - 在创意写作中能一气呵成生成逻辑顺畅的论文、小说和散文 [19] 行业影响 - 新版模型在国内 AI 领域处于领先地位,并接近国际顶尖模型如 o3 和 Gemini 2.5 Pro [15] - 部分用户认为更新"雷声大雨点小",但更多人期待其成为"国产之光" [22][23] - 模型在细节处理上优于 Claude 4 Sonnet,如光影反射和物理模拟 [13]
中国创新药的“DeepSeek时刻”!可T+0交易的港股创新药ETF(159567)现涨3.7%,实时换手率突破32%排名同指数第一
每日经济新闻· 2025-06-04 10:30
港股创新药板块表现 - 6月4日港股创新药板块高开高走 信达生物涨超15% 再鼎医药 泰格医药涨超7% 石药集团 中国生物制药 君实生物涨超6% 诺诚健华 百济神州涨超4% [1] - 港股创新药ETF(159567)连续3个交易日成交额超11亿元 市场热度较高 [1] 行业研发优势 - 中国团队在创新药研发中拥有2-3倍成本优势和约2倍速度优势 人工研发效率堪比美国团队用AI辅助研发 [1] - 中国和美国创新药研发成本差距与两国大模型API服务价格差异相似 [1] 估值与基本面 - 港股创新药指数市盈率从2月21日64倍降至6月4日29倍 不足3个月前一半 当前布局性价比突出 [1] - 头部创新药企业进入盈利周期 多个创新产品实现商业化推动收入快速增长 全球突破性临床数据带动海外授权市场活跃 [2] 政策与市场环境 - 2025年5月将落地重磅创新管线授权交易 强化行业基本面信心 [2] - 2025年为首个丙类医保目录推出元年 有望推动创新药市场规模持续扩容 药品价格形成机制和支持政策不断深化 [2] 相关ETF产品 - 港股创新药ETF(159567)跟踪国证港股通创新药指数 创新药企业权重90%为全市场医药主题类指数中最高 [2] - 创新药ETF(159992)跟踪创新药指数 布局创新药产业链龙头企业 包含全球CXO龙头和国内仿创药企龙头 [2]
中国创新药,正让美国担心会是下一个DeepSeek、无人机、电动车
虎嗅· 2025-06-04 09:57
中国创新药的"DeepSeek时刻" - 美国制药巨头正加大对中国创新药的投入,辉瑞以60亿美元总金额获得三生制药PD-1/VEGF双抗海外权益,首付款12.5亿美元;百时美施贵宝以111亿美元总金额从BioNTech获得相同靶点药物共同开发权,首付款15亿美元 [1] - PD-1/VEGF双抗成为代表性领域,全球在研35款中中国占20款,临床进展最快的几乎都来自中国 [2] - 中国创新药海外权益交易总额近300亿美元,包括康方生物对Summit的50亿美元、Instil对宜明昂科的20亿美元、默沙东对礼新医药的32亿美元等 [3] 研发效率与成本优势 - 中国团队在已验证靶点研发上拥有2-3倍成本优势和约2倍速度优势,人工效率堪比美国AI辅助研发 [6] - 工程优化是当前阶段的核心竞争力,国内企业通过双抗/多抗及ADC等"饱和式"排列组合实现突破 [4] - 2025年Q1全球首付款5000万美元以上交易中37%来自中国企业,较两年前接近翻倍,在肿瘤领域占比达67% [7][10] 临床进展与全球占比 - ASCO年会上中国团队73项研究以口头报告亮相(10年前仅1项),国产ADC与双抗管线占比近半 [10] - 中国企业启动的临床试验占全球30%(美国35%),10年前仅占3% [10] - 中国创新药从同质化抗体转向多模式创新,未来五年将在各领域与美国全面竞争 [10] 细分领域竞争格局 - 中国在ADC、双抗、T细胞接合器及传统小分子药物领先,美国在细胞与基因疗法、基因编辑等前沿领域占优 [6] - 德琪医药比美国Pheast早两年推进CD24抗体临床,翰森制药口服GLP-1受体药物以20亿美元被默沙东收购,价格低于美国同类研发企业 [11][12] 交易价值差异与挑战 - 同一开发阶段的中国资产交易金额仅为海外的1/8至1/2,如普米斯生物近10亿美元交易与BioNTech超110亿美元的差距 [12] - 创新药仍依赖生物学机制突破,单纯工程优势可能面临商品化风险 [13][14]
为什么DeepSeek还未能撼动OpenAI
虎嗅· 2025-06-04 08:27
AI行业竞争格局 - 2025年1月DeepSeek发布推理模型R1被视为AI全球竞争展开的标志事件 [2] - DeepSeek R1以开源和更高性价比达到OpenAI o1性能 导致英伟达股价单日下跌6000亿美元 [3] - OpenAI在DeepSeek R1发布后迎来爆发期 估值达3000亿美元 活跃用户从4亿增至8亿 年化收入从37亿美元增至127亿美元 [10] - DeepSeek R1在2月访问量一度超过OpenAI 但后续指标下滑 0528版本性能打平Gemini 2.5 Pro [11] - Anthropic的Claude 3.7成为最佳编程模型 Claude Opus 4支持智能体连续工作7小时 [11] 公司差异化竞争 - OpenAI凭借品牌优势和全球用户心智地位保持领先 [12] - Anthropic成为编程智能体首选 推出模型上下文协议(MCP)推动智能体生态 [11][12] - Gemini凭借统一多模态和视频生成能力 在谷歌用户生态中占据独特地位 [12] - DeepSeek最大程度开源推动AI在中国和国际推广 但模型性能差异性开始不明显 [12] 行业发展趋势 - AI商业化仍处早期 上半年DeepSeek和OpenAI用户均大幅增长 [13] - AI商业化下一阶段可能不是"赢家通吃" 而是融合与重构 关键在于掌握"工作逻辑" [14] - 大模型进入同质化和商品化竞争 性能差距缩小 差异性体现在应用层面 [12] - DeepSeek使命是实现AGI 需通过基础设施和产品验证 或成为超级横向平台 [15]
BIM应用领军者分享:前瞻探索基于 DeepSeek 的BIM与人工智能融合新机遇
财富在线· 2025-06-03 11:40
行业动态 - 第三届BIM创新应用与数字化建造技术交流会在长沙举办,聚焦智能建造,推动建筑工业化、数字化、绿色化转型升级,汇集160余位行业代表 [1] - 会议探讨BIM与数字化建造前沿技术、最新趋势及数智化应用实践,重点关注BIM与人工智能深度融合 [2] - 行业正加速推进BIM、大数据、物联网、人工智能等数字技术与建筑业深度融合,激发新质生产力 [1] 技术创新 - 薛翔团队在淮南金融广场项目实现BIM技术深度应用,项目总建筑面积28万m2,总造价7.13亿元,工期1200天,包含10栋单体建筑,最高119.8m [3] - 项目采用分层建模方式搭建建筑和结构模型,机电模型分专业分系统搭建,施工前进行方案模拟论证 [5] - 通过BIM技术实现三维场地布置、图纸会审、可视化技术交底等10项常规应用,以及机房安装指导和信息化平台开发2项创新应用 [5] - 项目应用BIM技术发出预警信息200多条,上传质量安全问题89条,节省工期1个多月,产生经济效益65余万元 [5] 项目成果 - 淮南金融广场项目荣获第十四届BIM联盟"斯维尔杯"全国优秀工程应用大赛特等奖 [6] - 项目成为BIM技术提升精细化管理应用的典范,斩获多个全国及区域建设工程质量最高奖项 [6] - 项目为复杂工程管理提供可借鉴经验,特别是大基坑数字化实践树立行业典范 [6] 人才培养 - 建立完善的人才培养体系,通过培训课程、案例分析、模拟投标等活动培养专业人才 [6] - 培养的人才已成为企业核心骨干和行业领军人物,推动行业可持续发展 [7] - 积极组织行业交流活动,搭建企业与高校、科研机构沟通桥梁,促进产学研深度融合 [7] 未来展望 - 探索BIM与AI等前沿科技深度融合,提高工作效率,保障建筑质量,降低人工错误 [7] - 推动建筑施工行业向数字化、智能化、高效化和可持续化方向发展 [7] - 为BIM技术多元化应用开辟新路径,期待更多行业先锋加入技术融合探索 [7]
百度AI搜索全面接入DeepSeek R1-0528,推理能力升级
搜狐财经· 2025-06-02 02:15
百度AI搜索接入DeepSeekR1-0528模型 - 百度AI搜索宣布全面接入深度思考模型DeepSeekR1-0528 用户可通过PC端和App端免费使用升级后的搜索服务 [1] - 百度智能云千帆大模型平台已于5月30日正式上架DeepSeekR1-0528大模型 为企业用户和开发者提供新选择 [1] DeepSeekR1-0528模型升级进展 - 5月28日晚DeepSeekR1模型完成小版本试升级 在模型架构、推理能力和开放性等方面取得显著进展 [1] - 腾讯旗下元宝和ima等AI应用迅速响应 率先完成升级并接入DeepSeekR1-0528最新版 [1] 模型性能提升 - DeepSeekR1-0528模型推理能力显著提升 能更精准理解用户意图 提供更具个性化和准确性的搜索结果 [1] - 该模型在复杂推演任务中展现强大逻辑推理能力 用户只需一条指令即可按清晰逻辑步骤完成操作 [2] - 生成内容信息丰富且格式规范 在学术研究资料搜索中能快速梳理研究脉络并定位关键文献 [2] 应用场景优化 - 生活类问题如旅游攻略和美食推荐 模型可根据用户偏好生成详细个性化方案 [2] - 百度AI搜索接入该模型将提升智能搜索体验 帮助用户在信息爆炸时代更便捷获取所需信息 [2][3] 行业影响 - 此次接入有望在智能搜索领域树立新标杆 推动行业进一步发展 [3]