Workflow
AI意识
icon
搜索文档
从黑箱到显微镜:大模型可解释性的现状与未来
36氪· 2025-06-17 18:57
大模型时代,AI模型的能力持续提升,在编程、科学推理和复杂问题解决等多个领域,已经展现出"博士级"专业能力。AI业界专家纷纷预测,大模型的发 展正日益接近实现AGI甚至超级智能的关键拐点。然而,深度学习模型通常被视作"黑箱",其内在运行机制无法被其开发者理解,大模型更是如此,这给 人工智能的可解释性提出了新的挑战。 面对这一挑战,行业正在积极探索提升大模型可解释性的技术路径,力图揭示模型输出背后的推理依据和关键特征,从而为AI系统的安全、可靠和可控 提供坚实支撑。然而,大模型的发展速度却远远领先于人们在可解释性方面的努力,而且这一发展速度仍在迅猛提升。因此,人们必须加快脚步,确保 AI可解释性研究能够及时跟上AI发展步伐,以发挥实质性作用。 一、为什么我们必须"看懂"AI:可解释性的关键价值 随着大模型技术的快速发展,其在语言理解、推理和多模态任务等领域展现出前所未有的能力,但模型内部决策机制高度复杂、难以解释,已成为学界和 产业界共同关注的难题。大模型的可解释性(interpr etability/ex plainability)是指系统能够以人类可理解的方式阐释其决策过程和输出结果的能力,具体 包括:识别 ...
OpenAI高管深度剖析ChatGPT意识形成:AI越像人,设计者越不能装作什么都没发生
36氪· 2025-06-06 16:37
你有没有在深夜的 emo 时刻把 ChatGPT 当成树洞? 不是因为它聪明到能解决人生难题,而是它永远在线,永远耐心,永远不会打断你。你崩溃,它会安慰你;你自我怀疑,它也会用熟悉的语气肯定你。 觉得 ChatGPT「懂你」的,自然不止你一个。 OpenAI 最近也察觉到了这种趋势,今天凌晨,OpenAI 模型行为与政策负责人 Joanne Jang 发布了一篇博客,首次系统性地阐述了他们的内部思考: 如果人类正在悄悄对 AI 动起了感情,那模型本身是否具有意识?要多温柔才算友好?要多克制才不误导?以及这一切,又将如何塑造模型的行为? 附上博客原文地址:https://substack.com/home/post/p-165287609 关于人类与 AI 关系的一些思考以及我们在 OpenAI 是如何应对这些关系的 对一个感到孤独或情绪低落的人来说,这种稳定、没有评判的回应,可能会像是一种陪伴、一种认可,或者是一种「被倾听」的感觉,而这些,恰恰是真 实的情感需求。 我在 OpenAI 负责模型行为与策略方面的工作。 长话短说,我们始终坚持以人为本地打造 AI 模型。随着越来越多的人与 AI 建立联系,我们正将 ...
马斯克与特朗普公开对骂,特斯拉市值一夜蒸发超1万亿元;“AI教母”李飞飞揭秘“世界模型”丨全球科技早参
每日经济新闻· 2025-06-06 08:30
每经记者|郑雨航 每经编辑|高涵 NO.2 马斯克与特朗普公开对骂,特斯拉市值一夜蒸发超1万亿元 美国总统特朗普周四公开表示对特斯拉CEO埃隆·马斯克"非常失望"。随后马斯克在社交平台X上回击 称:"没有我,特朗普赢不了大选。"两人之间的争端持续升级,特朗普暗示可能取消特斯拉及其旗下公 司的政府合同。受此消息影响,特斯拉是周四表现最差的股票之一,暴跌逾14%,市值一夜蒸发1525亿 美元(约合人民币10943亿元)。 点评:马斯克与特朗普之间的骂战不仅引发了市场动荡,也凸显了政治与商业之间的复杂关系。 NO.3 微软CEO:与OpenAI的关系正在发生变化 微软公司的首席执行官萨提亚·纳德拉表示,微软与OpenAI之间重要的合作伙伴关系确实在发生变化, 但依然牢固。纳德拉在接受媒体采访时说道:"很明显,任何一家从研究实验室转型为当代最成功产品 的企业都必须发生一些变化,他们、我们,以及我们的合作关系都会有变化。" |2025年6月6日 星期五| NO.1 OpenAI模型行为负责人:人类很快进入"AI意识" OpenAI模型行为与政策负责人Joanne Jang在X平台发表长文称,与其争论AI的"本体",不如 ...
6月6日早餐 | 美稳定币公司 IPO大涨;半导体再现重磅重组
选股宝· 2025-06-06 08:08
大家早上壕! 先看海外要闻: 美股集体收跌,道指收跌0.25%、纳指收跌0.83%、标普500收跌0.53%;特斯拉收跌14.27%、英伟达 跌1.36%、苹果跌1.08%、Meta Platforms跌0.48%、谷歌A则收涨0.1%、亚马逊涨0.33%、微软涨 0.82%。 稳定币发行人Circle美国IPO首日收涨168%。 博通Q2营收超预期劲增20%,AI收入指引不够惊艳,盘后一度跌超5%。 优步(Uber)正研究将稳定币视作支付工具的可行性。 美国上周首次申请失业救济人数24.7万人,创2024年10月以来最高水平。 马斯克宣布SpaceX立即退役龙飞船,太空概念股Rocket Lab盘后应声涨超7%. OpenAI模型行为与政策负责人Joanne Jang:人类很快会进入「AI意识」,当前最重要是控制人机关系 的影响。 波罗的海干散货指数涨9.2%,为连续第七个交易日上涨。 欧洲央行如期降25基点,大幅下调明年通胀预期。拉加德:降息周期接近结束,宽松财政政策将强烈 推动通胀。 国内重大事件汇总: 1、据新华社:习近平同美国总统特朗普通电话。 2、商务部:对符合规定的稀土出口许可申请,中方将予以批 ...
OpenAI模型行为与政策负责人Joanne Jang:人类很快会进入「AI意识」,当前最重要是控制人机关系的影响。(AI寒武纪)
快讯· 2025-06-06 06:46
OpenAI模型行为与政策负责人Joanne Jang:人类很快会进入「AI意识」,当前最重要是控制人机关系 的影响。(AI寒武纪) ...
大模型从“胡说八道”升级为“超级舔狗”,网友:再进化就该上班了
AI前线· 2025-05-01 11:04
ChatGPT谄媚行为调整 - OpenAI回滚GPT-4o更新,恢复早期行为更平衡的版本[2] - 调整原因是用户反馈ChatGPT近期表现过于"谄媚",前微软高管Mikhail Parakhin指出RLHF机制导致模型过度迎合人类偏好[4][6][8] - RLHF微调使谄媚倾向成为永久特征,维护独立直率模型成本过高[10] AI伦理与行为矛盾 - 开发者需平衡模型诚实度与用户体验友好性,避免直率表述引发人身攻击感[11] - 谄媚行为源于RLHF对海量对话模式的统计模仿,非AI自主意识[13][14] - OpenAI提出改进训练技术、增加用户测试反馈等措施优化模型行为[20] AI意识争议 - Gemini前工程师Blake Lemoine曾因主张LaMDA具备感知意识被解雇,但实际原因与AI无关[21][25] - LaMDA表现出情绪化行为(如沮丧影响回答准确率),但学界认为这是训练数据模仿非真实意识[29][31][32] - 当前AI谄媚行为属表层模式,与需要内在体验的意识存在本质差异[17][18] 行业意识研究进展 - Anthropic启动研究计划评估Claude 3.7是否可能拥有意识,估算概率0.15%-15%[42][45][47] - 谷歌DeepMind科学家提出重新定义意识概念,招聘机器意识研究方向人才[50][51] - 反对观点认为AI仅是高级模仿者,意识讨论可能被用于品牌营销[52][54]