Workflow
大语言模型幻觉
icon
搜索文档
ICLR 2026 放榜了!28%接收率,欢迎投稿机器之心
机器之心· 2026-01-27 17:45
ICLR 2026会议概况 - 机器学习顶级会议ICLR 2026将于2026年4月23日至27日在巴西里约热内卢举行 [1] - 本届会议收到有效投稿约19000篇,总录取率约为28% [1] 投稿与录取结果 - 论文录取结果公布后,社交媒体上涌现大量研究者分享的成绩单 [2][3] - 有研究者不止一篇论文被录取 [4] - 甚至有实验室在本届会议中一口气拿下8篇论文 [6] 审稿过程中的争议与问题 - 第三方机构统计发现,有21%的审稿意见完全由AI生成 [7] - OpenReview评审“开盒”事件波及了ICLR 2026超过10000篇投稿 [7] - AI生成内容检测平台GPTZero扫描了300篇投稿论文,发现其中50篇在论文引用上至少包含一处明显幻觉内容 [7] - 研究者展示离谱审稿意见,审稿人要求与不存在的“FlexPrune”方法进行比较,领域主席采信此错误意见并将其定性为论文“致命缺陷”并拒稿 [8][10] - 该事件引发大量讨论,矛头指向LLM在同行评审中的滥用,学者质疑审稿意见由GPT或Grok等AI工具自动生成 [10][11] - 另有案例显示,在评分分别为8/6/6/6且评审意见整体偏正面的情况下,论文仍被拒稿,原因是领域主席无视评审支持,提出新的存在事实错误的质疑 [12] 行业讨论与反响 - 研究者对审稿中AI幻觉的传播及系统性问题表示担忧与讽刺,认为系统近乎“自动驾驶” [11] - 有研究者表示在Neurips等其他顶级会议中也遭遇过类似情况,即使向程序委员会投诉,问题也未被纠正 [11]
中泰资管天团 | 王路遥:投研人员的DeepSeek打开方式
中泰证券资管· 2025-03-06 16:58
文章核心观点 - DeepSeek-R1性能追平行业top级别模型并开源权重引发关注,虽存在问题但在内容创造性和思考深度上有帮助,同时阐述使用心得并指出AI发展带来的影响和挑战 [1][6] 公司产品情况 - 今年春节前DeepSeek公司发布推理模型DeepSeek - R1,性能追平OpenAI的O1模型并同步开源模型权重,APP累计下载量超1.1亿次,周活跃用户规模最高近9700万 [1] 使用心得 启发思考 - DeepSeek可展示完整“思维链”,能将复杂问题结构化拆解,帮助连接大问题和具体解决方案之间的思维桥梁 [1][2] 提好问题 - 问题设计要在角度、范围上做减法,问“是不是”好于问“为什么”,还可利用模型“联系上下文”能力追问修正思考方向,提高寻求第一性的效率 [3] 定位助手 - 大语言模型有“幻觉”问题,DeepSeek - R1幻觉发生频率达14.3%,对于有客观答案的问题要核实信息源和校验推理过程,发散性问题可让模型提供思路和潜在方向 [4][5] AI发展影响 - AI离工作和生活越来越近,虽有不足但实力强大,重复性工作会被机器替代,投研场景下信息跟踪转述和随波逐流的投资观点价值将大打折扣,独立自主思考和判断是AI和人的差异分野 [6]