Logo 热线
2024年面授班
2024年档案培训面授班 2024年档案培训就业班 24年档案高级研修班 2024年档案修裱班
2024年网络班
2024年档案人员岗位培训(直播) 2024年档案人才培养高研班(直播) 2024年档案职称辅导班(录播) 专业档案培训专题
在线试听
文书档案整理试听 人事档案管理试听 工程档案试听 档号编制规则试听
新闻分类
底部
留言咨询
招贤纳士
联系我们
档案管理培训信息网
手机:13241838330
手机:18601298758
固话:010-62700072
传真:010-62700072
邮箱:2087217266@qq.com
总部地址:北京大学南门科城大厦附楼208室
底部
新闻内容 您现在的位置:网站首页 >> 新闻中心 >> 档案快讯 >> 详细信息

荷兰国家档案馆使用手写文本识别技术自动转录超300万页文件

发布者:  发布时间:2022-12-13  阅读:1758次
内容摘要:荷兰国家档案馆使用手写文本识别技术自动转录超300万页文件
 为使馆藏扫描文件更易于利用,荷兰国家档案馆采用Transkribus软件自动转录手写文本并将其转换为数字文本文件,目前已成功转录了超300万页文件。

    荷兰国家档案馆拥有极为丰富的馆藏资源,排架长度超过140公里,但其中大部分为纸质文件,利用较为困难且耗时。按照其制定的数字化战略,其计划在15年内扫描10%的馆藏档案,平均每年需扫描1000万页以上。档案数字化工作产生了大量数字扫描文件,为便于对手写文本扫描文件的访问和使用,荷兰国家档案馆启用了手写文本识别软件Transkribus进行识别和转录。

    荷兰国家档案馆数字化团队利用该软件创建了自定义的人工智能模型,并通过数据训练不断提升模型准确度。团队原本预估的目标字符错误率为20%,但在创建了6000页训练数据后,实际字符错误率仅为7%,文本识别效果大大超出了团队预期。

    Transkribus的使用有效降低了转录工作的难度。目前,该团队已利用智能手写文本识别技术转录了来自17世纪和18世纪荷兰东印度公司档案以及19世纪公证人档案,数字扫描文件超300万页,并为其创建了一个临时网站,供研究人员和公众进行访问和检索。此外,团队还为网站添加了命名实体识别功能,采用人工智能标记个人姓名、地点和时间,以丰富转录内容。现阶段荷兰国家档案馆的数字化战略仍在推进,未来将有更多手写纸质档案实现数字化、文本化、数据化,满足社会公众的多元利用需求。

                                           原载于《中国档案报》总第3919期 第三版


上一篇: 山东青岛市档案馆助力历史城区保护更新工作
下一篇: 会议通知|2022年全国档案工作者年会

Copyright © 2008-2036 档案管理培训信息网 All Rights Reserved 版本所有
24小时服务热线:13241838330/18601296758固定电话:010-62700072  报名邮箱:
2087217266@qq.com
档案管理基础知识  企业档案管理培训  人事档案管理培训  会计档案管理培训  建设项目档案管理培训  档案室建设
档案管理人员学习交流QQ群 :869546062    档案服务公司QQ联盟群:908606669

档案教育培训总部地址:北京大学南门科城大厦附楼208室
山东地址:山东省济南市槐荫区青岛路与齐州路中建锦绣广场2号楼1209室
适用于18岁以上成人
京ICP备14023321号-6


京公网安备 11010802037382号

收缩
  • QQ咨询

  • 档案管理信息网
  • 档案管理信息网
  • 档案管理信息网
  • 档案管理信息网
  • 档案管理信息网
  • 电话咨询

  • 18601296758