CoBRA - 财报，业绩电话会，研报，新闻

CoBRA

搜索文档

CHI 2026 Best Paper｜社会模拟迈入可控、可量化时代：为AI Agent加上「认知滑条」

机器之心· 2026-03-27 14:23

文章核心观点 - UCSD团队提出的CoBRA框架标志着AI社会模拟从依赖模糊自然语言描述的范式，转向了可控、可复现的实验科学范式[2][3] - 研究证实，仅用自然语言为Agent设定人设，在科学意义上是不可控且不可复现的[7] - CoBRA通过将经典社会科学实验转化为校准环境，为Agent行为建立了可量化、可验证、可复现的控制机制[2][10] 自然语言人设的局限性 - 先导实验使用“亚洲疾病问题”测试Agent的框架效应，发现基于自然语言人设（经济学家、普通人、空白）的Agent行为在不同模型间差异显著[5] - 实验在Mistral 7B、Gemma2 9B、GPT-4o Mini、DeepSeek-v3四个模型上进行，结果显示所有条件下跨模型行为差异显著[12] - 隐式描述无法可靠产生预期行为：社会科学预期经济学专家更不易受框架效应影响，但四个模型中仅GPT-4o结果勉强符合，DeepSeek中经济学家反而比普通人更易受影响，Mistral三种人设则几乎无区别[12] CoBRA框架的核心组件 - **认知偏差指数**：系统覆盖权威效应、从众效应、确认偏差与框架效应四类认知偏差，每类对应两种经典实验范式进行交叉校准与验证，将Agent表现量化为0-4的连续分数[11] - **行为调节引擎**：在LLM的三个干预空间实现调控[13] - **输入空间**：用数值化指令（如“你的权威偏差程度是65%”）替代模糊定性描述，无需训练，适用于所有模型[13] - **激活空间**：通过对比样本提取偏差方向向量，在推理时注入隐藏状态，提供Linear Control与Projection Control两种注入方式，适用于开源模型[13] - **参数空间**：通过训练“有偏差”和“无偏差”的LoRA，用task vector差值作为控制信号进行精确调节[13] - 每种方法通过一个控制系数与认知偏差指数形成闭环，自动扫描系数直至Agent表现达到目标指数[14] CoBRA框架的验证与实际应用 - **跨模型一致性与鲁棒性**：在多类开源与闭源系统上验证，CoBRA能显著降低行为方差，在0.1–1.0温度区间内保持统计等价，并在不同推理模式下呈现高度一致的控制曲线[16] - **可控性评估**：从单调性、平滑度、表达范围与泛化性四个维度评估，激活空间控制在单调性与平滑度上表现最佳，输入空间控制则提供更大的表达范围，控制系数可在不同实验范式与人设间迁移，展现良好泛化能力[16] - **开放任务验证**：在模拟社交媒体情绪传染场景中，基线方法（仅自然语言描述）下不同偏差等级的Agent情绪传染曲线几乎完全重叠，而CoBRA则呈现出清晰的剂量-响应关系：从众效应认知偏差指数越高，Agent表现出的情绪传染程度也越强[18][19] 行业意义与影响 - CoBRA将经典社会科学实验转化为可复用的校准环境，使Agent行为能够被持续测量与调节，建立起类似实验科学的变量控制机制[21] - 该框架让Agent拥有清晰的刻度与调节旋钮，标志着社会模拟从“看起来像那么回事”进入了可控、可复现的工程阶段[20][22]

AI社会模拟

认知偏差

Artificial Intelligence

CoBRA

AI社会模拟

认知偏差

Artificial Intelligence

CoBRA