大语言模型幻觉 - 财报，业绩电话会，研报，新闻

大语言模型幻觉

搜索文档

ICLR 2026 放榜了！28%接收率，欢迎投稿机器之心

机器之心· 2026-01-27 17:45

ICLR 2026会议概况 - 机器学习顶级会议ICLR 2026将于2026年4月23日至27日在巴西里约热内卢举行 [1] - 本届会议收到有效投稿约19000篇，总录取率约为28% [1] 投稿与录取结果 - 论文录取结果公布后，社交媒体上涌现大量研究者分享的成绩单 [2][3] - 有研究者不止一篇论文被录取 [4] - 甚至有实验室在本届会议中一口气拿下8篇论文 [6] 审稿过程中的争议与问题 - 第三方机构统计发现，有21%的审稿意见完全由AI生成 [7] - OpenReview评审“开盒”事件波及了ICLR 2026超过10000篇投稿 [7] - AI生成内容检测平台GPTZero扫描了300篇投稿论文，发现其中50篇在论文引用上至少包含一处明显幻觉内容 [7] - 研究者展示离谱审稿意见，审稿人要求与不存在的“FlexPrune”方法进行比较，领域主席采信此错误意见并将其定性为论文“致命缺陷”并拒稿 [8][10] - 该事件引发大量讨论，矛头指向LLM在同行评审中的滥用，学者质疑审稿意见由GPT或Grok等AI工具自动生成 [10][11] - 另有案例显示，在评分分别为8/6/6/6且评审意见整体偏正面的情况下，论文仍被拒稿，原因是领域主席无视评审支持，提出新的存在事实错误的质疑 [12] 行业讨论与反响 - 研究者对审稿中AI幻觉的传播及系统性问题表示担忧与讽刺，认为系统近乎“自动驾驶” [11] - 有研究者表示在Neurips等其他顶级会议中也遭遇过类似情况，即使向程序委员会投诉，问题也未被纠正 [11]

中泰资管天团 | 王路遥：投研人员的DeepSeek打开方式

中泰证券资管· 2025-03-06 16:58

文章核心观点 - DeepSeek-R1性能追平行业top级别模型并开源权重引发关注，虽存在问题但在内容创造性和思考深度上有帮助，同时阐述使用心得并指出AI发展带来的影响和挑战 [1][6] 公司产品情况 - 今年春节前DeepSeek公司发布推理模型DeepSeek - R1，性能追平OpenAI的O1模型并同步开源模型权重，APP累计下载量超1.1亿次，周活跃用户规模最高近9700万 [1] 使用心得启发思考 - DeepSeek可展示完整“思维链”，能将复杂问题结构化拆解，帮助连接大问题和具体解决方案之间的思维桥梁 [1][2] 提好问题 - 问题设计要在角度、范围上做减法，问“是不是”好于问“为什么”，还可利用模型“联系上下文”能力追问修正思考方向，提高寻求第一性的效率 [3] 定位助手 - 大语言模型有“幻觉”问题，DeepSeek - R1幻觉发生频率达14.3%，对于有客观答案的问题要核实信息源和校验推理过程，发散性问题可让模型提供思路和潜在方向 [4][5] AI发展影响 - AI离工作和生活越来越近，虽有不足但实力强大，重复性工作会被机器替代，投研场景下信息跟踪转述和随波逐流的投资观点价值将大打折扣，独立自主思考和判断是AI和人的差异分野 [6]