AI向善语料库

搜索文档
AI时代没有旁观者|AI向善语料库开放发布会实录
腾讯研究院· 2025-07-11 15:20
人工智能赋能社会困弱群体 - 高质量语料在AI训练中至关重要 但老年人、残障人士等社会困弱群体相关语料稀缺 导致服务他们的AI产品难以优化 加剧"弱者恒弱"现象 [1] - 腾讯与百余家社会组织公益共创AI向善语料库(老年文本库) 包含8047组老年人日常生活问答对 涵盖健康、心理、关系等多方面 面向公益组织和非营利性研究机构开放申请 [1][6][8] - 这是国内外首个通过社会公益共创构建又面向公益组织开放的老年语料库 探索创新了中文公共语料库构建与开放的新方法 [1] 语料库构建与效果 - 语料库构建采用"先共创 再共享 先爱 再AI"的行动路径 通过公共协作收录一线专家的人文关怀 助力公益组织提升AI能力 [6] - 清华大学未来实验室评测显示 搭载AI向善语料库后 大模型在老年人"情感互动与共情"和"社会适应性与文化敏感性"方面有明显提升 [13][16] - 复旦大学老龄研究院教授申琦介绍面向高校、非营利性研究机构的申请办法 [29] 应用案例与研究成果 - AI4Good团队试用语料库开发"长者智慧绘本" 显著提升交互能力 包括深度共情与肯定、主动关怀与陪伴 缓解长者情感孤独 [34][36][38][40] - 北京邮电大学张为威老师研究发现 语料库展示老年人深层情感诉求 需求常具交织性 情境具整体性 提出AI适老黄金法则:先共情再解答、口语化表达、身份明示 [44][46][48] - 浙江大学学生团队基于语料库研究 推翻传统"温和劝导"模式 建立PRAAM框架 使AI回答关键信息聚焦度更高、行动意愿转化率提升 [54][56][57] 社会价值与未来展望 - 预计2035年我国60岁及以上老年人口将突破4亿 占比超30% 进入重度老龄化阶段 养老服务业既是民生事业也是朝阳产业 [8] - AI向善语料库开放8047组语料数据 为构建包容性长寿社会提供支持 连接技术与人文 [52][59] - 语料库收录边缘群体声音 让科技普惠拥有跳动的脉搏 映出银发浪潮中每一朵浪花的美丽容颜 [60][61]
AI向善语料库开放发布会倒计时3天!超下饭的「研究综艺」全新亮相啦啦啦!
腾讯研究院· 2025-07-09 16:30
核心观点 - 腾讯与数百家社会组织共同发起【AI向善语料库】社会共创计划,首个主题聚焦老年人群体,包含8047组日常生活问答对 [7][10][20] - 该语料库旨在解决AI训练中弱势群体数据缺失问题,防止"弱者恒弱"现象,通过公益共创方式构建专业级数据集 [7][10] - 语料库将面向高校/研究机构和公益组织开放申请,提供差异化服务支持 [11][16][24] 项目背景 - 当前AI训练缺乏老年人、残障人士等弱势群体相关语料,导致针对性产品开发困难 [7] - 2024年8月启动的共创计划联合数百家社会组织,首个老年人语料库已完成建设 [7] - 语料库采用专家级问答对形式,首期规模达8047组老年人日常生活场景数据 [10][20] 产品特点 - 包含多维标签体系,清华大学未来实验室将发布专业测评报告验证使用效果 [12][13] - 数据覆盖各类老年人生活场景和人群细分需求,注重细微差异处理 [12] - 强调"人情味、同理心"特性,包含百万token级别的语义理解数据 [34] 开放计划 - 公益组织可通过腾讯SSV益仔平台获得语料申请及AI助手孵化一站式服务 [16][21] - 高校/研究机构将与复旦大学老龄研究院合作提供学术交流平台 [24][25] - 申请通道分设不同入口,支持零基础机构使用 [22][23][26] 应用案例 - 已有公益组织和高校研究团队完成语料库实际应用案例 [28] - 浙江大学医学生将分享针对老年人需求的延伸思考 [31] - 发布会将展示语料库从数据采集到产品落地的完整闭环 [28][35] 活动信息 - 发布会定于7月11日14:00-16:00通过腾讯新闻等平台直播 [5][6] - 活动采用"研究综艺"形式,包含语料库建设历程、使用案例和神秘嘉宾环节 [1][33][35]