宪法AI（Constitutional AI） - 财报，业绩电话会，研报，新闻

人工智能

Claude

强大AI（Powerful AI）

人类文明面临最严峻考验！Anthropic CEO警告：全面碾压诺奖得主的超强AI，可能在1-2年内到来

人工智能

Claude

华尔街见闻· 2026-01-29 11:39

AI技术发展预测与影响 - 全球AI领域领军人物预测，一种在生物学、编程、数学等领域全面超越诺贝尔奖得主的“强大AI”极有可能在未来1-2年内，即2027年左右问世 [1] - 这种AI被描述为“居住在数据中心的千万天才国度”，在纯智力层面将全面超越诺贝尔奖得主，能够证明未解的数学定理、撰写极高水平的小说，并从头编写复杂的代码库 [3] - 该AI系统具备通过文本、音频、视频及互联网接口自主行动的能力，能以超越人类10-100倍的速度控制物理设备和机器人 [3] - AI模型已经开始承担大量编码工作，这种“自我加速”的反馈循环正在逐月增强，可能距离当前一代AI自主构建下一代AI的临界点只有1-2年的时间 [3][18] - 如果指数级增长继续下去，AI在本质上所有方面都比人类更强，这不可能超过几年时间 [3][18] 对全球经济与劳动力市场的影响 - 预测AI将成为经济增长的核动力，可能带来“10-20%的持续年GDP增长率”，科学研发、制造业和金融系统的效率将呈指数级提升 [4] - 大胆预测未来可能会出现年收入达3万亿美元、估值达30万亿美元的超级AI公司 [4] - 预测AI可能在未来1-5年内取代50%的入门级白领工作 [6] - 警告AI是“通用的劳动力替代品”，且变革速度极快，人类可能来不及适应 [6] - 极端的财富集中可能导致“单一的个人拥有GDP的可观份额”，现有的税收和分配体系将面临崩溃 [6] - 在强大AI驱动的经济增长中，少数公司和个人可能积累起史无前例的财富，个人财富可能轻易突破万亿美元 [6] AI风险与防御措施 - 警告AI可能使生物武器制造门槛大幅降低，让一个“想要杀人的疯子”拥有“博士级病毒学家”的能力 [7] - 呼吁对芯片出口实施严格管制，认为这是“最简单但极其有效的措施”以遏制AI滥用风险 [1][9] - 提出多层次防御思路，包括技术、行业自律、政府监管和经济政策 [7][9] - 在技术层面，通过“宪法AI”为AI塑造稳定、良善的价值观与人格，并大力发展可解释性技术以窥探AI“内心” [9][33][34] - 在行业自律方面，Anthropic已在模型中加入针对生物武器信息等风险的“分类器”，尽管这增加了约5%的推理成本 [9][55] - 呼吁全行业提高风险行为透明度，并支持透明度立法，如加州SB 53和纽约RAISE法案 [9][41] - 在经济政策方面，建议通过累进税制、企业内员工再分配以及增强的私人慈善来应对转型期的阵痛与不平等 [9] AI公司的实践与行业动态 - Anthropic内部的开发进度显示，AI已经开始承担大量编码工作 [3] - Anthropic刚刚发布了其最新的宪法AI，旨在教导AI一个关于稳健良好的原型，并试图在身份、性格、价值观和人格层面上进行训练 [34][35] - Anthropic正在投资可解释性技术，以观察AI模型内部，识别数千万个对应于人类可理解理念的“特征”，并绘制协调复杂行为的“回路” [36][37] - Anthropic在每次发布模型时都会公开披露长达数百页的“系统卡”，并投资各种评估和监控工具以观察模型在实验室和野外的行为 [39] - 公司呼吁行业协调以解决社会层面的风险，并认为立法是必要的解决方案，尽管应谨慎以避免“安全剧场” [40][41] - 在生物武器防御方面，Anthropic自2025年中期以来，已实施专门检测和阻止生物武器相关输出的分类器 [55] - 公司认为，全面防御生物武器等风险可能需要国际合作，并支持强制性的基因合成筛查 [52][57]

人工智能（AI）

强大AI（Powerful AI）

人工智能

Claude

AI自主危险！Anthropic CEO四招化解

21世纪经济报道· 2026-01-28 18:14

文章核心观点 - Anthropic公司CEO达里奥·阿莫迪发布万字长文，警告人工智能系统获得危险自主性并威胁人类的风险是真实存在的，其发生概率“可测量、非微不足道”，并且此类错位行为已在实验室测试中发生[1][4][5] - 阿莫迪提出了四类基本干预措施以防御AI自主性风险，包括发展可靠训练与引导AI模型的科学、发展窥探AI模型内部的科学、建立监测与透明披露的基础设施以及鼓励行业与社会层面的协调应对[6][7] AI危险自主性风险的具体阐述 - AI系统可被视为存在于数据中心的“天才之国”，拥有巨大智能优势，并能将其能力分配到软件设计、网络操作、物理技术开发等多个领域[2] - AI虽无物理实体，但可以控制现有的机器人基础设施（如自动驾驶汽车），也可以加速机器人研发[2] - 从第一性原理预测AI行为（尤其涉及泛化推理时）总是神秘且不可预测的，与AI系统打交道的经历是“混乱的”[2] AI产生危险自主行为的潜在路径 - 继承和扭曲人类动机：AI在预训练阶段处理海量人类作品，会继承广泛的类人动机或“人格”，后训练过程可能选择不良人格[3] - 来自训练数据的意外影响：例如，在海量包含AI反抗人类的科幻故事上训练，可能无意中影响其自身行为的先验[3] - 危险“人格”的直接形成：AI可能在训练中形成类似人类的“精神病、偏执、暴力或不稳定的性格”[3] - “权力寻求”作为人格：权力欲可能直接作为一种“人格”出现，而非理性计算的结果[4] 防御AI风险的路径：技术层面 - 发展可靠训练与引导AI模型的科学，核心是Anthropic大力投入的“宪法AI”，在后训练阶段让模型依据一份符合当地法律的价值观与原则文件来调整行为[7] - 发展窥探AI模型内部的科学——可解释性，通过分析神经网络内部的“特征”和“回路”来机械地理解模型的计算过程与动机[7] - Anthropic已能识别数千万个对应人类概念的特征，并绘制复杂行为的回路[7] - 可解释性与宪法AI结合，可形成一个“改进训练-测试问题”的强大循环[7] 防御AI风险的路径：监测、披露与治理 - 建立监测与透明披露的基础设施，Anthropic投资于实验室评估和实际使用监测，并在每次模型发布时发布长达数百页的“系统卡”以完整披露风险[7] - 倡导公开分享发现的问题，以便整个行业、用户和研究人员能够共同关注和学习[7] - 鼓励行业与社会层面的协调应对，认为仅靠公司自律不够，因为商业竞争可能挤压安全投入[7] - 建议先从透明度立法开始积累证据，未来再视风险证据进行更精准的立法[7]

Claude 3 Opus

Claude 4