古籍数字化
搜索文档
豆包大模型对古籍下手!“识典古籍”首次尝试古籍智能化挖掘
新浪科技· 2025-11-13 16:36
产品功能与定位 - 古籍数字化平台"识典古籍"上线"深度研究助手"功能,该功能是一款自主型AI智能体,基于字节跳动豆包大模型等技术 [2] - 该功能可对平台已收录的3.6万部古籍进行深度挖掘与智能分析研究,能自主完成从研究计划制定、知识系统挖掘,到表格整理与研究报告生成的全流程工作 [2] - 相较于传统大模型工具,该助手不仅能直接生成答案,还能制定研究计划,在数字化的古籍中挖掘信息并整理成表格,生成含图表的研究报告 [2] - 该助手可作为内容创作者的"灵感库",快速生成准确、有趣的文史素材,并为大众爱好者提供生动有趣又不失专业高效的在线导师功能 [3] 技术优势与行业意义 - "深度研究助手"是古籍数字化领域的首个深度知识挖掘尝试,填补了AI在深度古籍研究应用中的空白 [2] - 该功能旨在解决传统古籍研究需从海量文献中人工提取信息的繁琐耗时痛点,通过AI技术实现穷尽式挖掘与智能分析 [3] - 以"云南盐井"研究为例,助手生成的研究报告梳理出不同朝代单井产量数据,并通过折线图展示盐井数量动态变化 [3] 平台发展与迭代 - "识典古籍"平台自2022年上线后持续优化,从初期的基础阅读功能逐步升级至古籍智能整理功能 [2] - "深度研究助手"功能的上线源于学者在平台使用过程中的反馈 [3] - 目前该助手已开放试用,平台不断邀请用户及专家体验并反馈建议,团队将据此持续迭代优化以提升学术适配性 [3]
古籍数字化十年,已形成可观的数据资产
经济观察网· 2025-10-26 21:40
公司十年成就 - 古联公司10年间构建了百亿余字古籍大数据,打造了涵盖110亿字的古籍大数据中心 [1][2] - 公司研发了国家级古籍数字化平台,制定了行业广泛采用的古籍数字化标准体系 [1][2] - 公司承担了行业标准制定与人才培养任务,与高校共建数字人文实验室、设立“古联奖学金” [1][2] 未来发展规划 - 公司计划利用未来10年时间,打造涵盖15亿字的1万种明代集部文献的数字化整理项目 [3] - 公司将贯彻国家文化数字化战略,探索可持续发展路径,加快AI技术应用,实现从数据资源到知识服务的跨越 [1] - 公司期待推动古籍数字资源“走出去”,在国际舞台上讲好中国故事 [2] 行业背景与政策支持 - 全国古籍整理出版规划领导小组印发《2021—2035年国家古籍工作规划》,对统筹古籍数字化建设等工作进行了部署 [3] - 2015年是中国古籍出版行业积极探索数字化转型的关键时期,如何让典籍在互联网时代活化是全行业重大课题 [2] - 古籍数字化是通过现代科技手段系统性地挖掘、激活和传播中华优秀传统文化 [1] 技术应用与创新 - 公司从2016年组建重点实验室至今,在自动标点到大语言模型等技术方面取得了长足进展 [3] - 公司打造的古籍大数据资源为后续训练人工智能工具提供了坚实基础 [2] - 行业需要针对古籍整理研究痛点不断创新,提供更高效的研究工具和更丰富的研究资源 [1] 人才培养与产学研合作 - 全国高等院校古籍整理研究工作委员会40年来培养的古籍整理人才超1.1万人 [2] - 未来古委会将与古联公司深化AI时代的产学研合作 [2] - 古籍数字化、智能化手段可以进行创造性解释和现代表达,使其与当代文化相适应 [1]
解锁“典籍里的齐鲁”,山东这样干
齐鲁晚报· 2025-06-03 11:44
古籍保护与传承工作 - 全省古籍工作座谈会在聊城召开,围绕古籍保护、整理、研究、出版、活化等工作进行调研交流 [1] - 海源阁作为清末四大藏书楼之一,历史上藏书达4300余种、28万余卷,涵盖各类典籍 [1] - 通过“归阁工程”已确定2664种旧藏的分布信息,完成13种宋版古籍和42卷232本古籍复制,实现14种旧藏数字化成果共享 [3] - 山东是古籍大省,收藏古籍约12万部近200万册,并承担多项国家重大古籍整理项目 [5] 古籍修复与人才建设 - 山东创新采用“人上门”和“书上门”模式,历经14年普查基本摸清古籍家底 [9] - 培育省级修复站点,在“山东省文物保护修复师”门类中专门设置古籍修复序列,构建全省修复人才网络 [9] - 计划建设“山东省古籍保护与修复重点实验室”,设立全省古籍人才培训库,重点培养高层次专业人才 [9] 古籍整理出版与数字化 - 山东出版集团以齐鲁书社为主体,形成国内知名古籍出版方阵,出版《儒典》《齐书》《黄河大系》等图书 [10] - 推进纸数一体出版,推动古籍内容实现智能检索、深度分析、可视化展示 [10] - 山东省古籍数字资源平台正式上线,推动古籍资源数字化保护、公益化使用 [11] - 济宁扫描上传古籍108种1771册,发布数字古籍59部;枣庄开放珍贵古籍数字化资源28万页,收录古籍220种、2100册 [11] 古籍活化利用与大众传播 - 创新形式如漫画《半小时漫画中国史》和电视节目《典籍里的中国》(豆瓣评分9.0)使古籍知识通俗化 [12] - 山东广播电视台打造《黄河文化大会》《墨子》《文脉中华》等节目,对古籍进行通俗化解读 [13] - 聊城将藏书文化与现代读书文化结合,建设77处海源书房,举办晒书、经典诵读等活动促进古籍传播普及 [13]
中国科学院自然科学史研究员孙显斌:字节跳动“识典古籍”平台用AI持续推动古籍数字化进程
财富在线· 2025-04-28 16:52
识典古籍平台项目 - 字节跳动公益于2022年10月上线完全公益的古籍智能阅读和整理平台“识典古籍” [2] - 平台利用OCR技术和人工校对扩容古籍图文库,已免费公开1.6万余部古籍,月访问量超240万用户 [2] - 平台计划到2025年底发布3至4万部古籍,预计2026年底发布品种数量将超过现有所有商业和公益古籍图文库总和 [2] 技术与效率提升 - 识典古籍采用自动标点、自动分段、自动校勘等AI技术,成为古籍整理和研究的数字人文平台 [4] - 引入数字整理平台后,据专家测算至少可提高五倍效率,极大加快古籍整理进程并方便保留过程文档 [4] - 平台创建大字符集解决方案,利用人工智能等新技术成果推动古籍数字化 [2][4] 大众参与与协作 - 2024年发起“我是校书官”活动,联合高校古籍研究机构,1000余所高校1万余名学生参与,整理1600余部古籍,校对总字数超过6亿 [3] - 2025年3月“我用AI校古籍”活动发起机构扩大到全国20余所高校,倡议社会公众和学生参与 [3] - “众筹建设”是公益古籍数字化项目的重要路径,平台得益于科技力量与大众力量 [3] 文化传承与拓展 - 2024年12月,字节跳动公益捐赠2500万元,支持北京大学开展《儒藏》编纂与研究工作,相关数字化成果将在识典古籍上线 [4] - 公司通过抖音平台支持非遗传承,过去一年有上千名非遗代表性传承人活跃,1379万网友分享非遗体验,非遗团购商品订单量同比增长356% [5] - 公司联动全国各大博物馆、创作者,通过直播、短视频普及文物知识,大多数国家三级以上博物馆内容可在抖音找到 [5] 行业背景与意义 - 中华典籍文化遗产总量估计为传世古籍约20万种,50万个版本 [1] - 最方便使用的古籍图文库多为商业数据库,限制了普通公众访问,且商业库扩容边际收益断崖式下跌 [1] - 教育部等九部门发布意见,指出需聚焦集成化、智能化、国际化,促进人工智能助力教育变革 [5]