Workflow
AI偏见
icon
搜索文档
我们让GPT玩狼人杀,它特别喜欢杀0号和1号,为什么?
虎嗅· 2025-05-23 13:32
从技术上说,所谓的偏见(bias),就是在特定的场景下,大模型的过度自信现象。在AI领域,偏见其实非常普遍,并不仅仅局限于性别和种族。 大家好,我叫吴翼。之前在OpenAI工作,现在在清华大学交叉信息研究院做助理教授,同时也是一个博士生导师,研究的方向是强化学习。 很高兴又来一席了,这是我第二次来一席。第一次来是五年前,那时刚从OpenAI回国,回到清华大学。当时的演讲标题叫《嘿!AGI》。我今天还特地穿 了五年前的衣服,找一找年轻的感觉。 五年间其实发生了很多事情。五年前,我还需要跟大家解释一下什么是AGI、我工作的公司OpenAI是一家什么样的公司。今天应该不用再介绍了。 岂止是不用再介绍,我这两天搜了一下,发现有人说,AI要统治世界了: 还有人说,AI要毁灭世界: 著名科学家杰弗里·辛顿教授,诺贝尔奖和图灵奖的双料得主,他多次在公开媒体上说,我们需要正视AI给人类社会带来的危险。 我们知道AI有一些问题,它有幻觉的问题、偏见的问题,但是好像距离毁灭社会还有点远。为什么像杰弗里·辛顿教授这样的大科学家,还要反复站出来 说AI是有危险的呢? 我们可以做一个类比。假如30年之后火星要撞地球,那么我们是应该现在 ...
速递|Llama 4突袭周末发布!Meta用2万亿参数怪兽硬刚GPT-4.5,却暗禁欧盟用户
Z Finance· 2025-04-06 15:45
文章核心观点 Meta发布新一代AI模型集合Llama 4,该系列模型有新特性和优势,但授权条款或引发争议,且在应答策略上有调整以应对行业问题 [1][2][9] 模型发布情况 - Meta在周六发布Llama 4系列,含Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth四款新模型 [1] - Scout和Maverick已通过Llama.com及Hugging Face等平台开放获取,Behemoth仍在训练阶段 [1] - Meta旗下AI助手Meta AI完成升级,将在40个国家启用Llama 4技术,多模态功能仅限英语版美国用户使用 [1] 研发推动因素 - 中国AI实验室深度求索开源模型成功,性能超Meta前代旗舰Llama模型,推动Llama研发进程加速 [1] - 据传Meta紧急组建战情室,试图破译深度求索降低模型运行和部署成本的技术路径 [1] 授权条款情况 - 欧盟境内注册或主要营业地的用户及企业被禁止使用或分发Llama 4模型,受该地区AI与数据隐私法规合规要求影响 [2] - 月活用户超7亿的企业须向Meta申请特殊授权,Meta拥有绝对审批权 [2] 模型架构特点 - Llama 4是Meta首个采用混合专家(MoE)架构的模型系列,能提升训练及查询应答的算力效率 [4] - MoE架构将数据处理任务分解为子任务,交由小型专业化“专家”模型处理 [4] 模型参数情况 - Maverick总参数量达4000亿,通过128个“专家”模型仅激活170亿参数 [4] - Scout激活170亿参数,包含16个专家模型,总参数量1090亿 [4] - Behemoth激活参数达2880亿,包含16个专家模型,总参数近2万亿 [6] 模型性能表现 - Maverick在编程、推理等测试中超越OpenAI的GPT - 4o和谷歌Gemini 2.0,但逊色于部分最新顶级模型 [5] - Scout在文档摘要和大规模代码库推理任务有优势,拥有1000万token的超大上下文窗口 [5] - Behemoth在数学解题等STEM能力评估中表现优于部分模型,但不及Gemini 2.5 Pro [6] 模型架构差异 - Llama 4全系均未采用类似OpenAI o1和o3 - mini的专用“推理”架构 [9] 模型应答策略调整 - Meta对Llama 4全系模型调优,使其更少拒绝回答“争议性”问题,回应涉及政治社会议题的提问 [9] - Meta表示新模型在拒绝回答的提示词选择上“显著更平衡” [9] 行业相关问题 - AI偏见是行业公认的技术难题,马斯克自创的xAI公司也未能造出完全政治中立的聊天机器人 [9] - OpenAI等公司持续调整模型策略,使其能应答更多过往被规避的问题 [10]