古籍数字化
搜索文档
古籍数字化十年,已形成可观的数据资产
经济观察网· 2025-10-26 21:40
公司十年成就 - 古联公司10年间构建了百亿余字古籍大数据,打造了涵盖110亿字的古籍大数据中心 [1][2] - 公司研发了国家级古籍数字化平台,制定了行业广泛采用的古籍数字化标准体系 [1][2] - 公司承担了行业标准制定与人才培养任务,与高校共建数字人文实验室、设立“古联奖学金” [1][2] 未来发展规划 - 公司计划利用未来10年时间,打造涵盖15亿字的1万种明代集部文献的数字化整理项目 [3] - 公司将贯彻国家文化数字化战略,探索可持续发展路径,加快AI技术应用,实现从数据资源到知识服务的跨越 [1] - 公司期待推动古籍数字资源“走出去”,在国际舞台上讲好中国故事 [2] 行业背景与政策支持 - 全国古籍整理出版规划领导小组印发《2021—2035年国家古籍工作规划》,对统筹古籍数字化建设等工作进行了部署 [3] - 2015年是中国古籍出版行业积极探索数字化转型的关键时期,如何让典籍在互联网时代活化是全行业重大课题 [2] - 古籍数字化是通过现代科技手段系统性地挖掘、激活和传播中华优秀传统文化 [1] 技术应用与创新 - 公司从2016年组建重点实验室至今,在自动标点到大语言模型等技术方面取得了长足进展 [3] - 公司打造的古籍大数据资源为后续训练人工智能工具提供了坚实基础 [2] - 行业需要针对古籍整理研究痛点不断创新,提供更高效的研究工具和更丰富的研究资源 [1] 人才培养与产学研合作 - 全国高等院校古籍整理研究工作委员会40年来培养的古籍整理人才超1.1万人 [2] - 未来古委会将与古联公司深化AI时代的产学研合作 [2] - 古籍数字化、智能化手段可以进行创造性解释和现代表达,使其与当代文化相适应 [1]
解锁“典籍里的齐鲁”,山东这样干
齐鲁晚报· 2025-06-03 11:44
转自:大众新闻 5月29日,全省古籍工作座谈会在聊城召开。来自省直有关部门单位、有关高校负责同志,古籍领域专家学者,各市党委宣传部、文化和旅游局(文物 局)负责同志,古籍文化创意企业和出版单位代表等参加会议,围绕高标准做好我省古籍保护、整理、研究、出版、活化等工作进行实地调研、座谈交 流。 山东聊城西南隅的杨氏宅院内,古色古香的"海源阁"就坐落其中。海源阁藏书精善广博,历史上藏书曾经达到4300余种、28万余卷,涵盖经史子集、诗词 歌赋、小说笔记等各类典籍。清末四大藏书楼中,唯有海源阁崛起于北方。在创始人杨以增的努力带动下,杨家四代人前后相继,百余年致力于精品图书 的搜集、保管与整理,对历史文化的传承保护发挥了重要作用。 上午,与会同志现场调研海源阁藏书楼、海源阁古籍文化中心,了解海源阁的历史,了解聊城市以强化古籍保护传承活化工作促进城市文化能级提升的具 体实践。 东 《齐鲁文库》第2辑 中宣部出版局有关负责同志在座谈会上表示,山东在系统推进古籍工作走在全国前列,在深化古籍传承利用方面干在实处,"山东古籍工作力度大、举措 实、效果好,古籍工作可持续发展有活力。" 图源:好客山 历史上,海源阁经历战乱,楼阁受损 ...
中国科学院自然科学史研究员孙显斌:字节跳动“识典古籍”平台用AI持续推动古籍数字化进程
财富在线· 2025-04-28 16:52
中华文明拥有数千年的悠久历史,典籍是传承中华文明最重要的载体。它们是中国古典学不可或缺的研 究基础,是社会大众继承和发扬传统文化的宝贵资源,同时也是世界理解中华文明的重要途径。 近日,《2024字节跳动企业社会责任报告(中国)》发布。这份报告围绕"科技让生活更美好",介绍了过 去一年字节跳动用科技连接社会善意的实践成效。近年来,字节跳动运用AI等技术持续推动古籍数字 化进程。 在当今时代,要完成这项壮举,向数字技术借力无疑是必由之路。识典古籍除了古籍文本识别校对功能 以外,还充分利用自动标点、自动分段、自动校勘、自动结构整理等AI技术,使其成为古籍整理和研 究的数字人文平台。在传统古籍整理过程中,文本的录入和校勘是耗费工作量最大的环节,而且还极容 易出错,而引入数字整理平台之后,据专家测算,至少可以提高五倍效率,将极大加快古籍整理工作的 进程。同时数字整理平台可以方便保留所有过程文档,易于追溯和查证。《儒藏》工程是新中国成立以 来最大规模地系统整理海内外儒学典籍的一项基础性文化建设工程,收录自先秦至清末重要儒学文献。 2024年12月,《儒藏》数字化项目启动,字节跳动公益捐赠2500万元,支持北京大学开展《儒 ...