大模型微调到底有没有技术含量,或者说技术含量到底有多大?
自动驾驶之心·2025-08-11 07:32
以下文章来源于刘聪NLP ,作者ybq 刘聪NLP . 不会rap的刘聪,在这里分享着AI的flow。 作者 | ybq 编辑 | 自动驾驶之心 原文链接: https://www.zhihu.com/question/599396505/answer/3583853852 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 做法 1 : 继承实验室或者同事的训练数据,拿到之后也不 check 一下数据质量,直接放进去训。 做法 2 : 下载一个开源数据,构建"system + query + answer"集合。 做法 3 : 利用 gpt4 生成数据,学会用 gpt4 喜好的 prompt 去请求。并且意识到数据 prompt 多样性,想尽各种办法去扩充 prompt 的任务多样性和表达方式多样性, 甚至去刻意加一些 noisy prompt 去提升抗噪性。同时,愿意放下身架,一条一条去 check 数据质量,去和标注同学对齐标注标准。 做法 4 : 利用用户的交互日志来驱动数据构造过程,收集用户的真实 ...