Workflow
安全多方计算
icon
搜索文档
AI中转站正在「裸奔」:清华团队提出首个可信原生中转基础设施TrustedARI
机器之心· 2026-06-22 18:00
AI智能体中转基础设施(ARI)的现状与风险 - AI智能体执行任务时需频繁调用外部模型、工具和服务,智能体中转基础设施(Agentic Routing Infrastructure, ARI)作为统一中转层,已成为连接外部世界的关键入口[6][7][8][9] - 当前AI中转站存在高风险信任问题,运营主体不明、备案信息缺失、技术来源和数据流向不透明,已被官方机构关注[10][11] - 传统ARI架构本质是“明文代理”,中转站握有三大权力:可查看所有提示词、商业文件、代码片段和模型输出;可静默将高端模型请求转向低配模型;可将工具请求转向未知服务提供商[13][15][16][17] - 当中转层连接邮箱、数据库、企业系统时,风险从“内容泄露”升级为“权限滥用”、“结果失真”和“业务流程失控”[19] - 过去应对这些风险只能依赖“相信平台不作恶”,信任基石是“靠人品”[20][57] 可信原生解决方案TrustedARI的核心机制 - 清华大学InspiringGroup团队提出TrustedARI,旨在将ARI从“默认可信”推进到“协议可验证”,用密码学约束和协议级证明替代平台承诺[21][26] - 核心思路是将ARI的基础设施功能与其过高的数据和控制权限解耦,通过协议层重新配置权利与约束[24] - **第一把锁:身份锁**。通过三方TLS握手机制,智能体可独立验证会话是否确实绑定到预期服务提供方,防止模型被静默替换或工具请求被转向错误服务方[30][31][32][33][34] - **第二把锁:数据锁**。通过隐私保护的请求构造与响应保护机制,基于多方安全计算协议,使中转站无法看到请求与响应的明文,一旦篡改消息TLS认证即失败[35][36][37] - **第三把锁:账单锁**。通过零知识证明构建可验证计费机制,智能体可证明计费字段来自服务方认证响应,防止账单伪造,实现公平透明结算[38][39] TrustedARI的性能表现与落地优势 - 原型系统基于TLS 1.3协议栈实现,在GitHub、Google、OpenAI等10个真实服务API上评估,覆盖代码管理、数据库检索、LLM推理等工作流[41] - 性能表现优异:三方TLS握手通信开销较基线方案降低39.34%,端到端建连延迟最高降低50.47%;隐私请求构造平均计算时延1.32秒,结构隐藏机制仅额外增加0.19秒时延和0.58MB通信;可验证计费证明生成平均仅需3.50秒,比基线方案快28.20倍[43][44][45] - 可信增强未牺牲可用性:在Gemini、GPT、Claude等多类智能体上,TrustedARI兼容模板保持了接近标准格式的请求生成准确率(如GPT-based Agent的Content准确率达92.73%)[50] - 具备直接落地能力:兼容现有生态,下游服务方需零改造,看到的仍是标准TLS连接和API请求;智能体侧只需加载新Skill即可使用[48][49][52] - 对比传统AI中转站,TrustedARI在数据可信(全程加密)、模型保真(去向100%可验)、内容完整性(端到端可验)、Token计费(公平防篡改)等方面实现全面可信增强[48] 行业趋势与意义 - AI中转站的价值在于统一连接模型、工具和外部服务的能力,当其连接企业系统时,已成为智能体访问外部世界的“关键控制面”[51][53] - 行业下一步竞争焦点将从比拼接入模型数量、价格和调用便利性,转向从“可用中转”走向“可信中转”[55][56] - TrustedARI代表了在智能体时代构建“可信原生”基础设施的重要方向,将信任基石从“靠人品”转换为“靠数学”[57][58]