2024面向教育的生成式AI的负责任发展：评价驱动的方法（英译中）

报告研究的公司和行业概述 - 报告研究的公司是谷歌DeepMind,谷歌研究,谷歌LearnX,谷歌创意实验室,YouTube Learning等组成的跨项目团队 [429] - 该团队致力于为教育领域开发负责任的生成式人工智能技术 [1][2][3] 报告的核心观点 1. 生成式人工智能技术在教育领域有巨大潜力,但目前仍存在一些局限性 [4][9] 2. 该团队提出了一种评估驱动的方法来开发教育用途的生成式人工智能,包括参与式研究、多学科合作和全面的教学评估 [1][10] 3. 该团队开发了一个名为LearnLM-tutor的对话式AI导师,并使用七个不同的教学评估基准对其进行了评估,结果显示其在大多数教学维度上优于基准模型 [5][6][10] 报告的主要内容 1. 参与式方法: - 通过研讨会、访谈和用户研究等方式与学习者和教育工作者进行了广泛参与 [19][20][21][22][29] - 确定了一套教学原则和能力,作为开发工作的指导 [76][136][146] 2. 教学评估: - 开发了七个全面的教学评估基准,包括定量、定性、自动和人工评估 [72][76][89][98][99][100][103][104] - 将LearnLM-tutor与基准模型进行了比较,结果显示LearnLM-tutor在大多数教学维度上表现更优 [89][90][91][92][93][94][95][96][97][98][99][100][101][102][103][104][105][106] 3. 负责任的发展: - 进行了影响评估,识别了相关的风险和缓解措施 [182][183][184] - 制定了针对LearnLM-tutor的特定政策,并进行了额外的安全微调 [185][186][187][188][189][190][191] - 采用了自动和人工红队方法来测试模型的安全性 [191][192][193]