Seek .(SKLTY)
搜索文档
DeepSeek-R1论文登上《自然》封面,AI人工智能ETF(512930)涨超0.6%冲击3连涨
新浪财经· 2025-09-18 10:04
行业突破 - DeepSeek-R1成为全球首个经过独立同行评审的主流大语言模型 研究成果登上《自然》期刊封面 [1] - 国产AI生态加速完善 产业链在模型、算力及应用环节均呈现加速发展态势 [1] 市场表现 - 中证人工智能主题指数(930713)上涨0.65% 成分股均胜电子大涨9.99% 瑞芯微涨5.82% 德赛西威涨3.79% 中科曙光涨3.76% 寒武纪涨3.33% [2] - AI人工智能ETF(512930)上涨0.66% 实现三连涨 最新报价2.13元 近一周累计涨幅达8.08% [2] - 该ETF管理费率0.15% 托管费率0.05% 为同业最低水平 近三月跟踪误差仅0.008% 跟踪精度行业最优 [2] 指数构成 - 中证人工智能主题指数选取50只人工智能基础资源、技术及应用支持领域上市公司证券 [2] - 前十大权重股合计占比60.82% 包含新易盛(6.52%)、中际旭创(6.71%)、寒武纪(6.45%)等企业 [3][5] - 权重股寒武纪当日涨3.33% 中科曙光涨3.76% 澜起科技涨1.96% 浪潮信息涨1.49% [2][5]
DeepSeek-R1登上Nature封面:朝着AI透明化迈出的可喜一步
36氪· 2025-09-18 10:02
研究突破 - DeepSeek-R1 论文以封面文章形式发表于权威科学期刊 Nature 证明其研究价值获得学术界高度认可[1] - 研究团队提出无限制强化学习 RL 训练可激发大语言模型 LLM 新推理能力涌现 减少对人类标注数据的依赖[3] - 实验证明纯 RL 训练在数学 编程竞赛和 STEM 研究生水平问题等任务上表现优于传统方法训练的 LLM[3] 技术方法 - 提出群体相对策略优化 GRPO 算法 基于基础模型 DeepSeek-V3 Base 训练 DeepSeek-R1 系列模型[10] - 采用多阶段训练 pipeline 包括拒绝采样 RL 和监督微调 SFT 逐步提升模型能力[12] - RL 训练使模型自然学会输出推理过程 通过评分系统验证答案正确性进行自我改进[9] 模型表现 - DeepSeek-R1 在 GitHub 上获得 91100 个 star 显示全球开发者广泛认可[4] - 在 MMLU MMLU-Pro C-Eval GPQA Diamond 等 21 个主流基准测试中几乎全部取得更好成绩[15] - 模型展现出高级推理模式如自我反思 验证和动态策略适应 并能指导增强小型模型[16] 行业影响 - Nature 社论肯定 DeepSeek-R1 是首个经同行评审后发表的主流 LLM 推动行业透明化[5] - 同行评审机制可澄清 LLM 工作原理 评估模型真实性 避免基准测试被操控[6][17] - 开源模型使更广泛社区能理解修复缺陷 但需加强安全性测试应对潜在风险[18] - Nature 呼吁更多 AI 公司提交模型评审 用证据支持言论 验证相关主张[18]
DeepSeek登上Nature封面,梁文锋带队回应质疑,R1训练真29.4万美金
36氪· 2025-09-18 09:32
学术成就与行业认可 - DeepSeek-R1论文登上全球顶刊Nature封面,通讯作者梁文锋带队通过强化学习为大模型推理能力开辟全新路径[2] - Nature在封面推荐中高度赞扬DeepSeek-R1成就,该模型成为全球首个经过同行评审的主流大模型[4] - 开源后R1在Hugging Face平台成为最受欢迎模型,下载量突破1090万次[4] - 审稿人Lewis Tunstall认为这是非常值得欢迎的先例,有助于评估系统风险;Huan Sun表示通过严格同行评审验证模型有效性和实用性,其他公司应效仿[7][46] 技术创新与训练方法 - 研究团队彻底抛开对人类推理轨迹依赖,选择强大基础模型DeepSeek-V3 Base,跳过传统SFT阶段[8][10] - 采用简洁强化学习框架,只告知任务格式和奖励信号,模型在AIME 2024解题准确率从15.6%提升至77.9%,配合自洽解码技术达86.7%[10] - 训练过程中模型自发学会用更长思维链探索解题策略,展现出自我反思和系统性探索替代解法等高级能力[14][15] - 观察到明显"顿悟时刻",模型在反思过程中使用"wait"词频率急剧增加,标志推理模式转变[16][17] 成本效益与资源优化 - R1训练成本仅294,000美元,加上基础模型成本约600万美元,远低于OpenAI和谷歌训练成本[5][6] - 具体训练成本分解:DeepSeek-R1-Zero耗202,000美元,SFT数据创建10,000美元,DeepSeek-R1训练82,000美元[6] - GPU资源使用:总147,000 H800 GPU小时,其中R1-Zero占101,000小时,SFT数据创建5,000小时,R1训练41,000小时[6] 算法创新与训练优化 - 采用GRPO算法替代传统PPO,通过组内竞争择优机制简化复杂约束过程,显著降低资源消耗[22][24][26] - 设计双轨制奖励系统:推理任务使用严格基于规则奖励,通用任务引入基于模型奖励让输出更符合人类偏好[27][28][30] - 训练分为多阶段,包括冷启动、两轮强化学习和大规模监督微调,扩展模型知识面和通用能力[19][20] - 关键训练参数:学习率3×10⁻⁶,KL散度系数0.001,GRPO裁剪比率10,推理采样温度1[37] 性能提升与能力表现 - 经过多轮训练,DeepSeek-R1在AlpacaEval 2.0和Arena-Hard等基准上性能提升17%-25%,数学编程等高难度推理保持顶尖水准[25] - 训练第8,200步时将最大文本长度从32,768 Token增至65,536,模型性能和回答长度出现大幅跃升[36] - 针对语言混合问题创造性引入语言一致性奖励,提升中文问题处理时思维链的中文词汇比例[38] 行业影响与未来展望 - 审稿人Lewis Tunstall认为证据表明仅使用强化学习即可获得非常高性能,其他实验室复制尝试验证方法有效性[46] - 研究人员正尝试应用R1方法改进现有大语言模型推理能力,并将其扩展到数学编码以外领域,开启一场革命[48] - 尽管存在结构化输出和工具使用方面局限,但R1为零样本直接提问场景提供高效解决方案[43]
DeepSeek-R1论文登上Nature封面,通讯作者梁文锋
36氪· 2025-09-18 08:45
论文核心观点与行业意义 - DeepSeek-R1模型是首个通过权威学术期刊《自然》同行评审的大语言模型,其论文通讯作者为梁文锋[4][6] - 该研究采用强化学习方法训练模型进行推理,使模型学会逐步解决问题并自我验证,显著提高了在编程和研究生水平科学问题上的表现[6] - 将大模型纳入独立同行评审体系被视为从“技术竞赛”迈向“科学纪律”的关键一步,有助于遏制行业乱象、建立公众信任[7][8] 模型训练方法与技术创新 - 开发团队开辟了新思路:即使不用监督微调作为冷启动,通过大规模强化学习也能显著提升模型推理能力[10] - DeepSeek-R1-Zero采用群组相对策略优化降低训练成本,使用准确度和格式两种互补的奖励机制,并设计简单模板引导基础模型先推理后给出答案[10] - 模型在训练中展现出自我进化能力,学会生成数百到数千个推理token,并自然产生反思能力和探索不同解题方法的高级行为[11] - 针对R1模型构建了少量长思维链数据作为冷启动,解决了DeepSeek-R1-Zero可读性差、语言混杂的问题[12][13] - 训练流程包含推理导向的强化学习、拒绝采样和监督微调、用于所有场景的强化学习等多个阶段[14][15][16] 模型性能表现与基准测试 - DeepSeek-R1采用混合专家架构,激活参数370亿,总参数6710亿[20] - 在多项基准测试中表现优异:MMLU-Pro得分84.0,DROP得分92.2,GPQA Diamond得分71.5,AIME 2024得分79.8[20] - 编码能力突出:LiveCodeBench得分65.9,Codeforces评分2029,百分位96.3[20] - 中文任务表现强劲:C-Eval得分91.8,CLUEWSC得分92.8[20] 知识蒸馏与小模型应用 - 通过使用DeepSeek-R1整理的80万个样本对Qwen和Llama等开源模型进行微调,使小模型具备推理能力[18] - 蒸馏效果显著:DeepSeek-R1-Distill-Qwen-32B在AIME 2024达到72.6分,MATH-500达到94.3分[20] - 即使是1.5B小模型也展现出不错推理能力,在AIME 2024获得28.9分,Codeforces评分达到954[20]
美联储宣布降息25个基点;欧盟宣布对以色列实施制裁,以外长回应;DeepSeek-R1开创历史,梁文锋论文登上《自然》封面|早报
第一财经· 2025-09-18 08:20
美联储货币政策 - 美联储宣布降息25个基点 将联邦基金利率目标区间下调至4.00%-4.25% 为2024年12月以来首次降息 [2] - 美股市场出现分化 道指上涨0.57%至46018.32点 纳指下跌0.33% 标普500指数下跌0.10% [24] - 国际金价高位震荡 COMEX黄金期货下跌0.19%至3681.80美元/盎司 [24] 中国财政与经济数据 - 前8月全国一般公共预算收入148198亿元 同比增长0.3% 税收收入121085亿元同比微增0.02% 为今年以来首次由负转正 [5] - 8月新能源汽车国内销量117.1万辆 环比增长13% 同比增长18.3% 1-8月累计销量808.8万辆同比增长30.1% [10] - 8月新能源汽车出口22.4万辆 环比下降0.6% 同比增长1倍 1-8月出口153.2万辆同比增长87.3% [10] - 上海8月非银行业金融机构存款增加2780亿元 同比多增2858亿元 [12] 产业政策与企业发展 - 商务部将在全国选择约50个城市开展消费新业态、新模式、新场景试点建设 [6] - 国务院国资委将大力推动国资央企战略性专业化重组整合 提升国有资本配置和运营效率 [7][8] - 工信部就《智能网联汽车组合驾驶辅助系统安全要求》强制性国家标准公开征求意见 [9] - 万科完成近年来最大规模组织架构调整 撤销开发经营本部 将"5+2+2"架构调整为16个地区公司由总部直管 [22] - 东风集团成立新合资公司 注册资本84.7亿元 聚焦猛士品牌 与华为合作采用新模式 [23] 科技创新与研发突破 - DeepSeek团队研发的DeepSeek-R1推理模型论文登上《自然》封面 成为全球首个经过同行评审的主流大语言模型 [4] - WTO报告预测到2040年AI将使跨境商品和服务流动增加近40% [21] 资本市场动态 - 9月17日龙虎榜显示机构净买入豪恩汽电9598万元 蔚蓝锂芯9217万元 峰岹科技7130万元 [25][26] - 机构净卖出均胜电子1.66亿元 双环传动1.21亿元 天际股份1.13亿元 [27]
8点1氪|西贝回应“公筷喂狗”事件;美联储宣布降息25个基点;DeepSeek梁文锋论文登上《自然》封面
36氪· 2025-09-18 08:06
西贝餐饮事件 - 西贝餐厅因顾客使用公筷喂狗引发卫生争议 涉事餐具已全部丢弃并进行全面消杀 [1] - 温州市市场监督管理局表示国家及地方层面暂无法律依据认定商家允许宠物入内违规 顾客喂狗属个人行为且未造成直接损害暂不涉及行政处罚 [1] - 西贝品牌传播主管等岗位已停止招聘 月薪10-13K的招聘信息由企业官方发布且真实有效 [10][11][12] 美联储政策动向 - 美联储宣布降息25个基点 联邦基金利率目标区间降至4.00%-4.25% 为2024年12月以来首次降息 [1] 人工智能与科技 - DeepSeek团队梁文锋通讯作者的DeepSeek-R1推理模型论文登上《自然》封面 披露更多训练细节并回应蒸馏质疑 [2][3] - DeepSeek-R1成为全球首个经过同行评审的主流大语言模型 Nature评价其打破主流模型未独立评审的空白 [3] - AI芯片初创公司Groq完成7.5亿美元新一轮融资 投后估值达69亿美元 由Disruptive领投且三星等机构继续参与 [14] 企业动态与融资 - 蔚来集团完成11.6亿美元融资 资金将用于智能电动汽车研发、技术平台开发及充换电基础设施扩展 [14] - 青昀新材完成数亿元C轮融资 由元禾璞华领投 资金用于新一代鲲纶超材料研发及全球化产能扩张 [14] - 一星机器人完成数亿元种子轮融资 投资方包括BV百度风投、同创伟业及银河通用等产业化投资者 [15] 行业政策与消费 - 全国国庆文旅消费月启动 各地发放超3.3亿元消费补贴 银联及金融机构推出消费券和支付满减优惠 [6] - 香港加大鼓励生育力度 初生子女可享两年额外免税额26万港元 适用于2026/27课税年度末所有未满两岁子女 [9] - 职工医保个人账户余额支持转账至近亲属医保钱包 实现跨省医保个人账户共济使用 [4][5] 公司经营与市场 - 匹克被曝全员降薪 总部员工按薪资分档降薪10%-30% 直营分公司办公室职员降薪50% 董事长称整体降幅不到10% [6][7] - 合众新能源管理人否认山子高科重组哪吒汽车 山子高科仅为意向投资人之一 合众新能源破产重整案尚未确定重组投资人 [10] - 中国自行车和电动自行车社会保有量约5.8亿辆 其中电动自行车约3.8亿辆 全国每日因两轮出行减少碳排放约1万吨 [12][13] 金融市场表现 - 美股三大指数收盘涨跌不一 道指涨0.57% 纳指跌0.33% 标普500跌0.1% 热门中概股多数上涨且百度涨超11% [13] 消费与产业趋势 - 月饼行业向全年消费场景转型 中国现存月饼相关企业达2.01万家 广东以超2000家注册量位居第一 [16] - 海底捞多款儿童套餐标注部分预加工 产品由中央厨房统一生产配送至门店再烹制 以确保安全与口味稳定性 [8][9] - 绿茶餐厅撤下本店无预制菜现点现做广告语 外卖餐具上无预制菜字样被涂黑 但工作人员称烤鸡等招牌菜为现做 [4][5]
DeepSeek-R1开创历史,梁文锋论文登上《自然》封面
第一财经· 2025-09-18 07:09
公司里程碑 - DeepSeek-R1研究论文登上国际权威期刊《自然(Nature)》封面,通讯作者为梁文锋[1] - DeepSeek-R1成为全球首个经过独立同行评审的主流大语言模型[1] - 与今年1月发布的初版论文相比,本次论文披露了更多模型训练细节[1] 行业影响 - 目前几乎所有主流大模型都尚未经过独立同行评审,这一空白被DeepSeek打破[1] - 论文正面回应了模型发布之初关于蒸馏技术的质疑[1]
DeepSeek-R1开创历史 梁文锋论文登上《自然》封面
第一财经· 2025-09-18 07:07
公司成就 - DeepSeek-R1推理模型研究论文登上国际权威期刊《自然(Nature)》封面 [1] - 论文由DeepSeek团队共同完成,梁文锋担任通讯作者 [1] - 与今年1月发布的初版论文相比,本次论文披露了更多模型训练细节并正面回应了模型发布之初的蒸馏质疑 [1] 行业地位 - DeepSeek-R1是全球首个经过同行评审的主流大语言模型 [1] - 《自然》评价指出目前几乎所有主流大模型都还没有经过独立同行评审,这一空白终于被DeepSeek打破 [1]
仿制药→创新药,中国生物医药领域迎来“DeepSeek时刻”
搜狐财经· 2025-09-17 23:23
(央视财经《经济信息联播》)在生物医药领域,部分国产创新药在疗效上展现出了能媲美 国际药企 明星药品的表现。近年来,有越来越多的国际制药企业斥巨资和中国药企展开合作。 今年年初,中国的人工智能模型DeepSeek以极低的开发成本和强大的性能获得了世界的瞩目,而其实 在生物技术领域,中国也正在迎来类似的"DeepSeek时刻",中国药企正在从过去的仿制药时代进入到创 新药时代,并且吸引了众多的国际合作。合作的主要形式是授权合作:外方获得在中国以外市场对中方 药品或相关技术,开发、生产及商业化权利。 宏观上来看,美国生物医药数据公司DealForma在今年5月份发布的报告显示:中国生物医药企业在全球 大型授权交易,也就是首付款达到5000万美元或以上的交易中,按数量看占比已达42%,这一比例与去 年的27%和前年的20%相比显著增加。 一些亮眼案例,就例如今年5月辉瑞支付了12.5亿美元的首付款,获得了三生制药一款创新药在海外市 场的授权。此外,今年上半年,美国制药公司艾伯维、默沙东和再生元等和中国药企总计签署了价值数 十亿美元的授权合作协议。 值得一提的是药企阿斯利康,在过去两年间已和十多家中国创新药企达成了授 ...
中国创新药授权出海跑出加速度!中国生物技术领域迎来DeepSeek时刻
新浪财经· 2025-09-17 23:00
行业趋势 - 中国创新药行业呈现爆发式增长态势,授权出海交易金额大幅增长 [1] - 生物技术领域正迎来类似人工智能模型DeepSeek的突破时刻,标志着从仿制药时代进入创新药时代 [1] - 创新药授权出海交易势头迅猛,仅2024年上半年交易金额已超过660亿美元,超过去年全年总额 [1] 交易与合作 - 2024年5月,辉瑞支付12.5亿美元首付款获得三生制药一款创新药在海外市场的授权 [1] - 2024年上半年,美国制药公司艾伯维、默沙东和再生元等与中国药企总计签署了价值数十亿美元的授权合作协议 [1] - 中国药企的创新成果吸引了众多国际合作 [1]