Hallucinations in AI: How GSK is addressing a critical problem in drug development
生成式AI在医疗行业的应用 - 生成式AI已成为多个行业的关键基础设施,医疗行业也不例外 [1] - 医疗应用对准确性和可靠性要求极高,错误可能带来严重后果 [2] - 生成式AI在医疗领域的应用包括科学文献综述、基因组分析和药物发现 [2] GSK应对生成式AI幻觉问题的策略 - GSK采用先进的推理时间计算策略,包括自我反思机制、多模型采样和迭代输出评估 [3] - 测试时间计算扩展允许在AI系统的推理阶段增加计算资源,以进行更复杂的操作 [4] - GSK通过增加迭代周期来提高AI系统的准确性和可靠性 [5] 减少幻觉的具体技术 - 自我反思技术使大型语言模型能够批判或编辑自己的响应以提高质量 [7] - 多模型采样通过使用多个LLM或不同配置的单一模型来交叉验证输出 [9] - 这些技术需要更多的计算资源,但能显著减少幻觉并提高最终答案的可信度 [10] 推理战争与硬件创新 - GSK的策略依赖于能够处理更重计算负载的基础设施 [11] - AI基础设施公司如Cerebras、Groq和SambaNova正在竞争提供硬件突破 [11] - 专用芯片和架构使复杂的推理例程(如多模型采样和迭代自我反思)能够大规模运行 [12] 挑战与未来方向 - 扩展计算资源面临推理时间延长和成本增加的挑战 [14] - GSK计划继续完善其AI驱动的医疗解决方案,测试时间计算扩展是首要任务 [16] - 这种方法为其他组织提供了路线图,展示了如何协调准确性、效率和可扩展性 [17]