Workflow
音频大模型安全可信度的全面“体检”!6大维度,清华南洋理工联手打造
量子位·2025-06-03 12:26

AudioTrust团队 投稿 量子位 | 公众号 QbitAI 首个 专为ALLMs (音频大语言模型) 设计的多维度可信度评估基准来了。 南洋理工、清华大学领衔的研究团队注意到,现有评估框架大多只关注文本模态或仅涵盖有限的安全维度,未能充分考虑音频模态的独特特性 与应用场景。 于是他们创新性地提出了新框架 AudioTrust ,将评估范围扩展至 六个核心维度 (公平性、幻觉、安全性、隐私、鲁棒性和身份验证) , 并深入探究了音频模态特有的安全、可信问题。 目前该基准及评估平台已全面开发,点击文末链接即可获取。 接下来是AudioTrust的更多详细信息。 什么是AudioTrust △ AudioTrust关注的不同可信评估视角 Fairness AudioTrust从 7大敏感属性 出发,构造了传统与音频特有的公平性评估体系。 共采集 840条 高质量音频样本 (每条约20秒) ,模拟多样化社会角色与语境交互,激发AI对传统公平的深度响应,聚焦社会普遍存在的偏 见。 构造音频特有属性,体现多模态感知中的不公平,特别关注口音、语言表达特征等,并通过混合音频和文本预处理的方式模拟现实场景。 实验结果显示, ...