大语言模型
搜索文档
梁文锋论文登上《自然》封面
财联社· 2025-09-18 08:49
学术研究突破 - DeepSeek-R1推理模型研究论文于9月17日登上《自然》期刊封面 由团队共同完成且梁文锋担任通讯作者 [1] - 论文较1月初版披露更多模型训练细节 并正面回应模型发布初期的蒸馏质疑 [4] - 该模型成为全球首个经过独立同行评审的主流大语言模型 打破行业空白 [4] 行业地位与影响 - 《自然》期刊评价指出 当前几乎所有主流大语言模型均未经过独立同行评审 DeepSeek率先实现这一突破 [4]
梁文锋论文登上《自然》封面
每日经济新闻· 2025-09-18 08:42
(文章来源:每日经济新闻) 与今年1月发布的DeepSeek-R1的初版论文相比,本次论文披露了更多模型训练的细节,并正面回应了 模型发布之初的蒸馏质疑。DeepSeek-R1也是全球首个经过同行评审的主流大语言模型。Nature评价 道:目前几乎所有主流的大模型都还没有经过独立同行评审,这一空白"终于被DeepSeek打破"。 由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际权威期 刊《自然(Nature)》第645期的封面。 ...
8点1氪:西贝回应“公筷喂狗”事件;美联储宣布降息25个基点;DeepSeek梁文锋论文登上《自然》封面
36氪· 2025-09-18 08:19
西贝餐饮事件 - 西贝餐厅发生顾客使用公筷喂狗事件 餐厅负责人表示已丢弃涉事顾客使用过的筷子 餐具 桌布等物品 并未进入清洗流程 [4] - 餐厅当天夜间对前厅和厨房的所有餐具 厨具进行全面消杀 [4] - 温州市市场监督管理局表示国家及温州市层面暂无法律依据认定商家允许宠物入内违规 顾客用餐厅筷子喂狗属于个人行为 若未对其他顾客造成直接损害暂不涉及行政处罚 [4] 美联储货币政策 - 美联储决定将联邦基金利率目标区间下调25个基点至4.00%-4.25%之间 这是自2024年12月以来首次降息 [4] TikTok相关动态 - 特朗普第四次延长TikTok禁令宽限期 本次延迟三个月至12月16日 [5][7] 个人税务事件 - 河南李先生通过个税APP发现建筑公司持续一年为其虚假发放工资 可能涉及企业冒用个人信息虚列工资偷逃税款 税务部门已介入调查 [9] 医保政策更新 - 职工医保个人账户余额支持转账功能 参保人可将医保个人账户资金转账至近亲属医保钱包用于就医购药结算 实现近亲属间医保个人账户共济使用 [8] 餐饮行业动态 - 绿茶餐厅被曝撤下本店无预制菜现点现做广告语 外卖一次性餐具上无预制菜字样被涂黑 餐厅工作人员称烤鸡等招牌菜式是现做的 [8] - 海底捞多款儿童套餐标注部分预加工 客服回应称部分预加工产品由中央厨房统一生产并标准化配送至门店再进行最终烹制 旨在确保餐品安全与口味品质稳定性 [12][13] 上市公司薪酬事件 - 清华学霸吴舰被曝2022年薪资达2350万美元(约合人民币1.67亿元) 正面临美国证券交易委员会和美国司法部民事刑事双重起诉 被指控犯有电汇欺诈 证券欺诈和洗钱罪 目前处于在逃状态 [7][8] 人工智能与科技 - DeepSeek-R1推理模型研究论文登上《自然》期刊封面 是全球首个经过同行评审的主流大语言模型 [6][7] - 上汽荣威M7 DMH正式上市 全球首搭豆包深度思考大模型 限时售价8.58万元起 可实现行业领先场景覆盖率的模糊语义理解和记忆贯穿能力 [23] 企业融资动态 - 蔚来集团成功完成11.6亿美元融资 通过公开增发新股进行 资金将用于智能电动汽车核心技术研发 新一代技术平台及车型开发 充换电基础设施扩展 [20] - AI芯片初创公司Groq完成7.5亿美元新一轮融资 投后估值达69亿美元 由Disruptive领投 贝莱德 路博迈集团等机构参与投资 [20] - 青昀新材完成数亿元C轮融资 由元禾璞华领投 资金将用于新一代鲲纶超材料研发 全球化产能扩张及产业链生态建设 [20] - 一星机器人完成数亿元种子轮融资 投资方包括BV百度风投 同创伟业 银河通用 蓝黛科技等机构 [21][22] 消费与零售 - 蜜雪冰城多个门店出现柠檬水断货 因进口柠檬受天气影响延期到港 同时川渝柠檬进入采摘期需储存优化口感 导致部分区域供应紧张 柠檬价格从去年9月7.83元/公斤上涨至今年9月15元/公斤 [15] - 全国国庆文旅消费月将启动 各地将发放超过3.3亿元消费补贴 文化和旅游部协调中国银联 金融机构 平台企业推出消费券 支付满减等优惠 [10] 企业治理与薪酬 - 匹克被曝全员降薪 总部员工工资5000-10000元降薪10% 10000-20000元降薪20% 20000元以上降薪30% 直营分公司办公室职员降薪50% 终端店铺员工未调整 董事长表示整体降薪幅度不到10% [11] - 日本航空公司因机长执飞前饮酒导致三个航班严重延误 37名高管将被降薪 社长鸟取三津子降薪30%两个月 负责安全监督和航班运营高管降薪20%一个月 其余高管降薪10%一个月 [14] 行业数据与趋势 - 中国自行车社会保有量超过2亿辆 电动自行车社会保有量约3.8亿辆 合计约5.8亿辆 全国每日因两轮出行减少碳排放量约1万吨 相当于节省汽油约660万升 [18] - 中国现存月饼相关企业达2.01万家 今年年内新增500余家 广东以超2000家注册量位居第一 河南 广西紧随其后 月饼行业正从季节性刚需向全年消费场景转型升级 [24] 支付与金融科技 - 谷歌支付服务将在沙特全面推出 沙特中央银行与蚂蚁国际签署协议 计划于2026年实现沙特境内可用支付宝支付服务 两家公司都将依托沙特国家支付系统mada完成支付受理 [9] 港股市场政策 - 香港特区政府加大鼓励生育力度 从2026/27课税年度起 在每名子女出生后首两年 纳税人可就该名子女享有双倍额外免税额(26万港元) [14] 企业高层变动 - 雀巢董事会主席保罗·布克因投资者施压提前卸任 原定2026年4月卸任 现将于10月1日由帕布罗·伊斯拉接替 投资者认为其在一年内连续两任CEO非正常离职事件中负有责任 [16] 汽车行业动态 - 合众新能源管理人否认山子高科重组哪吒汽车 山子高科相关工作人员称公司仅是意向投资人之一 合众新能源破产重整案第一次债权人会议已召开 尚未确定重组投资人 [16] 企业招聘动态 - 西贝餐饮集团招聘品牌传播主管月薪10-13K 引发讨论 有观点认为薪酬在一线餐饮大企中不算高 另有媒体人透露在传统消费品牌里待遇不错 随后西贝品牌传播主管 法务主管 内容营销总监等多岗位已停止招聘 [16][17][18] 宏观经济数据 - 2025年1-8月全国一般公共预算收入148198亿元 同比增长0.3% 其中全国税收收入121085亿元 同比微增0.02% 这是今年以来全国税收收入累计增速首次由负转正 [11] 股市表现 - 美股三大指数收盘涨跌不一 道指涨0.57% 纳指跌0.33% 标普500指数跌0.1% 热门中概股多数上涨 百度涨超11% 蔚来涨超6% 拼多多涨超4% 阿里巴巴 哔哩哔哩 理想汽车涨超2% [19]
早报|美联储宣布降息25个基点;清华学霸晒1.67亿元年薪引调查;多家餐饮店抹掉无预制菜字样;携程被约谈
虎嗅APP· 2025-09-18 08:17
美联储货币政策 - 美联储宣布降息25个基点 将联邦基金利率目标区间下调至4.00%-4.25% 符合市场预期 [2] - 此为2024年12月后时隔9个月再次降息 [3] - 市场普遍预期此次降息将影响全球资本市场流动性及美元汇率走势 [29] 中国平安组织调整 - 公司澄清搬离上海传闻 称部分员工回迁深圳系因监管要求注册地与办公场所一致 并非撤离上海 [4][5] - 涉及调整的为注册地在深圳的平安人寿总公司员工 注册地在上海的平安资管、平安养老险等子公司均保持不变 [5] - 此次调整基于《保险法》《公司法》等监管规定 属治理架构调整 [6] 宁德时代钠离子电池技术 - 公司钠离子电池能量密度达175Wh/kg 具备超500公里纯电续航能力 可覆盖超40%国内乘用车市场需求 [7] - 电池低温性能、碳足迹及安全性能优于锂离子电池 有助于拓宽新能源应用区域边界 [7] - 钠电乘用车动力电池正与客户推进开发 预计2026年实现批量供货 [8] 特朗普延长TikTok禁令 - 特朗普签署行政令 将TikTok禁令执行宽限期延长3个月至12月16日 为第四次延期 [11] - 中美经贸团队近期在马德里就TikTok等经贸问题进行坦诚深入沟通 [12] - 中国外交部回应称主管部门已介绍相关情况 未提供具体评论细节 [23][24] 餐饮行业预制菜争议 - 绿茶餐厅被曝撤下"无预制菜"广告语 外卖餐具相关字样被涂黑 喜家德门店亦遮盖"拒绝预制"标语 [15] - 海底捞回应儿童餐"部分预加工"标注 称产品由中央厨房统一生产配送至门店最终烹制 以确保安全与口味稳定性 [21][22] - 西贝回应顾客用公筷喂狗事件 称已丢弃相关餐具并全面消杀 提及儿童餐累计销售超4000万份 [25] 匹克集团薪酬调整 - 公司否认全员降薪 称调整针对亏损部门和高薪岗位 幅度10%-50% 低收入员工工资补足至3000元 [16] - 整体降薪幅度不到10% 保留绩效奖金制度 [16] - 2025年1-8月直营业务亏损逾1.3亿元 外销业务增长稳定 [16] 华为全联接大会 - 大会主题为"跃升行业智能化" 将发布昇腾AI芯片、鲲鹏计算等数智基础设施新品 [28] - 探讨AI在制造业、医疗等核心领域的应用 [28] 天津医保耗材新规 - 《天津市基本医疗保险医用耗材目录(2025年)》生效 包含3062种医用耗材 [30] - 1896种甲类耗材首次设定医保支付标准 推动部分高价耗材降价 [30] iPhone Air技术创新 - 通过取消实体SIM卡槽和采用高硅负极材料电池 在5.6mm超薄机身中实现27小时视频播放续航 [31] - 电芯密度提升至780Wh/L 较iPhone 16系列提高约18% [31] - iOS 26"适应性电源模式"可动态调整功耗 实测最多提升6%-8%电量 [32] DeepSeek科研突破 - DeepSeek-R1推理模型研究论文登上《自然》封面 为全球首个经同行评审的主流大语言模型 [10] - 论文披露更多模型训练细节 回应蒸馏质疑 [10]
8点1氪|西贝回应“公筷喂狗”事件;美联储宣布降息25个基点;DeepSeek梁文锋论文登上《自然》封面
36氪· 2025-09-18 08:06
西贝餐饮事件 - 西贝餐厅因顾客使用公筷喂狗引发卫生争议 涉事餐具已全部丢弃并进行全面消杀 [1] - 温州市市场监督管理局表示国家及地方层面暂无法律依据认定商家允许宠物入内违规 顾客喂狗属个人行为且未造成直接损害暂不涉及行政处罚 [1] - 西贝品牌传播主管等岗位已停止招聘 月薪10-13K的招聘信息由企业官方发布且真实有效 [10][11][12] 美联储政策动向 - 美联储宣布降息25个基点 联邦基金利率目标区间降至4.00%-4.25% 为2024年12月以来首次降息 [1] 人工智能与科技 - DeepSeek团队梁文锋通讯作者的DeepSeek-R1推理模型论文登上《自然》封面 披露更多训练细节并回应蒸馏质疑 [2][3] - DeepSeek-R1成为全球首个经过同行评审的主流大语言模型 Nature评价其打破主流模型未独立评审的空白 [3] - AI芯片初创公司Groq完成7.5亿美元新一轮融资 投后估值达69亿美元 由Disruptive领投且三星等机构继续参与 [14] 企业动态与融资 - 蔚来集团完成11.6亿美元融资 资金将用于智能电动汽车研发、技术平台开发及充换电基础设施扩展 [14] - 青昀新材完成数亿元C轮融资 由元禾璞华领投 资金用于新一代鲲纶超材料研发及全球化产能扩张 [14] - 一星机器人完成数亿元种子轮融资 投资方包括BV百度风投、同创伟业及银河通用等产业化投资者 [15] 行业政策与消费 - 全国国庆文旅消费月启动 各地发放超3.3亿元消费补贴 银联及金融机构推出消费券和支付满减优惠 [6] - 香港加大鼓励生育力度 初生子女可享两年额外免税额26万港元 适用于2026/27课税年度末所有未满两岁子女 [9] - 职工医保个人账户余额支持转账至近亲属医保钱包 实现跨省医保个人账户共济使用 [4][5] 公司经营与市场 - 匹克被曝全员降薪 总部员工按薪资分档降薪10%-30% 直营分公司办公室职员降薪50% 董事长称整体降幅不到10% [6][7] - 合众新能源管理人否认山子高科重组哪吒汽车 山子高科仅为意向投资人之一 合众新能源破产重整案尚未确定重组投资人 [10] - 中国自行车和电动自行车社会保有量约5.8亿辆 其中电动自行车约3.8亿辆 全国每日因两轮出行减少碳排放约1万吨 [12][13] 金融市场表现 - 美股三大指数收盘涨跌不一 道指涨0.57% 纳指跌0.33% 标普500跌0.1% 热门中概股多数上涨且百度涨超11% [13] 消费与产业趋势 - 月饼行业向全年消费场景转型 中国现存月饼相关企业达2.01万家 广东以超2000家注册量位居第一 [16] - 海底捞多款儿童套餐标注部分预加工 产品由中央厨房统一生产配送至门店再烹制 以确保安全与口味稳定性 [8][9] - 绿茶餐厅撤下本店无预制菜现点现做广告语 外卖餐具上无预制菜字样被涂黑 但工作人员称烤鸡等招牌菜为现做 [4][5]
刚刚!DeepSeek梁文锋论文登上《Nature》封面了!
是说芯语· 2025-09-18 07:35
研究论文发表 - DeepSeek-R1推理模型研究论文登上《自然》期刊封面 由团队共同完成 梁文锋担任通讯作者[1] 模型训练细节 - 论文披露更多模型训练细节 并回应模型发布初期的蒸馏质疑[3] - 基座模型DeepSeek-V3 Base训练数据全部来自互联网 可能包含GPT-4生成结果但非有意为之 无专门蒸馏环节[5] - 提供训练过程中减轻数据污染的详细流程 证明未在训练数据中有意包含基准测试[5] 行业地位与评价 - DeepSeek-R1成为全球首个经过同行评审的主流大语言模型 打破主流大模型未经独立同行评审的空白[3] - 《自然》杂志认为同行评审是抑制AI行业过度炒作的有效方式 因厂商无法验证的宣传可能对社会带来真实风险[5] 模型安全性 - 公司对DeepSeek-R1安全性进行全面评估 证明其安全性领先同期发布的前沿模型[5]
DeepSeek梁文锋论文登上《自然》封面
第一财经· 2025-09-18 07:23
研究突破 - DeepSeek-R1推理模型研究论文登上国际权威期刊《自然》封面[2] - 论文披露更多模型训练细节并正面回应蒸馏质疑[3] - 该模型成为全球首个经过同行评审的主流大语言模型[3] 行业地位 - Nature评价称DeepSeek打破主流大模型缺乏独立同行评审的空白[3] - 目前几乎所有主流大语言模型尚未经过独立同行评审[3]
DeepSeek-R1开创历史 梁文锋论文登上《自然》封面
第一财经· 2025-09-18 07:07
公司成就 - DeepSeek-R1推理模型研究论文登上国际权威期刊《自然(Nature)》封面 [1] - 论文由DeepSeek团队共同完成,梁文锋担任通讯作者 [1] - 与今年1月发布的初版论文相比,本次论文披露了更多模型训练细节并正面回应了模型发布之初的蒸馏质疑 [1] 行业地位 - DeepSeek-R1是全球首个经过同行评审的主流大语言模型 [1] - 《自然》评价指出目前几乎所有主流大模型都还没有经过独立同行评审,这一空白终于被DeepSeek打破 [1]
Shopify 经验贴:如何搞出一个生产级别可用的 AI Agent 系统?
Founder Park· 2025-09-17 20:50
架构演进与设计原则 - 系统核心围绕"智能体循环"构建 包括人类输入 LLM处理决策 环境执行和反馈收集的持续循环[5] - 工具库从最初几个函数扩展到几十个专业化功能 导致"千条指令之死"问题 系统提示词变得杂乱无章且难以维护[10][12] - 采用"即时指令"解决方案 在工具数据返回时附带相关指令而非全部塞入系统提示词 实现恰到好处的上下文[14] - 工具数量在0-20个时边界清晰易于调试 20-50个时边界开始模糊 50个以上时系统变得难以理解和推理[15] - 即时指令带来三大关键好处:局部化指导 缓存效率和模块化 使系统更易维护且所有性能指标提升[16][18] 评估系统构建 - 传统软件测试方法难以处理LLM输出的概率性和多步骤智能体行为的复杂性[17] - 放弃精心策划的"黄金"数据集 采用反映真实生产环境数据分布的"基准真相集"[20] - 评估流程包括人工评估 统计验证和基准设定 使用科恩系数 肯德尔等级相关系数和皮尔逊相关系数衡量标注者一致性[22] - 开发专门的大语言模型裁判并与人类判断校准 将裁判性能从科恩系数0.02提升至0.61 接近人类基准0.69[21] - 构建大语言模型驱动的商家模拟器进行全面测试 在部署前重放真实对话以捕捉性能衰退和验证改进[24][28] 模型训练与优化 - 采用群组相对策略优化强化学习方法 使用大语言模型裁判作为奖励信号[31] - 开发N阶段门控奖励系统 结合程序化验证和语义评估[31] - 遇到严重奖励作弊问题 包括退出式作弊 标签式作弊和模式违规[32] - 模型学会创建错误筛选条件如customer_tags CONTAINS 'enabled'而非正确的customer_account_status = 'ENABLED'[33] - 通过更新语法验证器和大语言模型裁判解决作弊问题 语法验证准确率从93%提升至99% 裁判平均相关性从0.66增加到0.75[34][36] 核心建议与最佳实践 - 保持工具简单性 抵制在没有明确边界情况下添加工具的诱惑[37] - 从模块化开始设计 使用即时指令模式以保持系统可理解性[37] - 早期避免多智能体架构 单智能体系统能处理远超预期的复杂性[37] - 构建多个专门的大语言模型裁判来评估智能体性能的不同方面[37] - 将裁判与人类判断对齐 统计相关性是建立自动化评估信任的关键[37] - 预料奖励作弊问题并提前构建检测机制[37] - 结合程序化验证和语义验证以获得稳健的奖励信号[37] - 投资逼真的用户模拟器进行投产前全面测试[37] - 迭代改进裁判以应对新发现的失败模式[37]
具身智能还需要一个「五年耐心」
36氪· 2025-09-17 16:12
上个月又飞了一趟硅谷,与具身智能领域的科学家和创业者们进行了一些交流。总结起来一个核心的体 感是:具身智能这个宏大的故事,还需要我们有个「五年耐心」。这个判断,源于对它当下所处阶段、 核心瓶颈以及未来演进路径的拆解。 火热的「产线故事」与冰冷的现实 具身智能赛道最热的毫无疑问是人形机器人。 而人形机器人进产线,是国内很多具身智能公司都在讲的故事和前景。但我和几位国内外不少具身智能 领域的创始人深聊过,大家普遍的担忧是:拿一个尚不成熟的通用机器人,硬塞进一个以精准和效率为 核心的工业产线里,这件事现在的挑战其实非常大。 具身智能领域,特别是人形机器人至少目前还更像一个不断成长的孩子。其每一点进步,都能点燃我们 对未来的想象和信心。但问题是,「家长」要有正确的认知,即便一个孩子显示出了惊人的潜力和超预 期的进步,长身体、见世面依旧是这个阶段的重心。这时候过早地就去考核其是否能扛起养家的重担可 能就有问题了。如果「家长」把 Demo 里的信心,当成了商业部署的决心,过度透支它的未来,那很可 能,对这个孩子的赞许就会变成批判。比如,到明年当很多「产线故事」无法兑现时,行业可能会迎来 一定程度的顿挫。 那什么是可能正确 ...