——研究人员利用人工智能解开古代文献的秘密

图 1 瑞士的圣加勒修道院图书馆

在瑞士的圣加勒修道院图书馆收藏了大约16万卷,可追溯到八世纪的文学和历史手稿。所有这些手稿都是用现代很少使用的语言手工写在羊皮纸上的。

为了保存这些人类的历史记录,这些数量高达数百万的文本被安全地保存在世界各地的图书馆和修道院中。这些藏品中的很大一部分可以通过数字图像提供给公众,但专家们说,有非常多的材料从未被阅读过,这是一个隐藏在世界历史中的洞察力宝库。

现在,圣母大学的研究人员正在开发一个人工神经网络,根据人类的感知来阅读复杂的古代笔迹,以提高深度学习转录的能力。

图 2 在这项工作中,为深度学习引入了一种新的损失表述,它包含了人类视觉的测量,可以应用于手写文档转录的不同处理管道。

“我们面对的是以早已过时的风格书写的历史文件,可以追溯到许多个世纪以前,而且是用拉丁语这样的语言书写的,现在已经很少有人使用了,”圣母大学计算机科学与工程系的丹尼斯-O-杜特迪学院副教授沃尔特-谢勒说。“你可以得到这些材料的漂亮照片,但我们要做的是以一种模仿通过专业读者的眼睛来感知页面的方式来自动转录,并提供快速、可搜索的文本阅读。”

图 3 注释平台的行和词的选择功能被用于一个文件的屏幕截图。e-codices档案中的一份文件

在电气和电子工程师协会期刊《模式分析和机器智能》上发表的研究中,Scheirer概述了他的团队如何将传统的机器学习方法与视觉心理物理学相结合--这是一种测量物理刺激和心理现象之间联系的方法,例如专家读者识别一个特定字符、衡量笔迹质量或识别使用某些缩写所需的时间。

Scheirer的团队研究了数字化的拉丁文手稿,这些手稿是由圣加尔回廊的文士在九世纪写的。读者将他们的手工抄写输入一个专门设计的软件界面。然后,该团队测量了抄写过程中的反应时间,以了解哪些单词、字符和段落是容易或困难的。Scheirer解释说,包括这种数据创造了一个与人类行为更一致的网络,减少了错误,并提供了一个更准确、更现实的文本阅读。

"这是一种通常不用于机器学习的策略,"Scheirer说。"我们通过这些心理物理测量来标记数据,这直接来自于感知的心理学研究--通过采取行为测量。然后我们将这些字符的感知中常见的困难告知网络,并可以根据这些测量结果进行修正。"

使用深度学习来抄写古代文本是人文科学领域的学者们非常感兴趣的事情。

"仅仅拍摄照片和阅读它们,与有一个程序提供可搜索的阅读是有区别的,"圣母大学古典学系副教授Hildegund Mller说。"如果你考虑到这项研究中使用的文本--九世纪的手稿--那是中世纪的一个早期阶段。这是在印刷术之前的很长一段时间。那是一个产生了大量手稿的时代。这些手稿中隐藏着各种各样的信息--以前没有人见过的不明文字"。

Scheirer说挑战依然存在。他的团队正在努力提高转录的准确性,特别是在损坏或不完整的文件的情况下,以及如何解释插图或页面的其他方面,这可能会使网络混淆。

然而,该团队能够调整该程序以转录埃塞俄比亚文本,使其适应一种具有完全不同字符集的语言--这是开发一个具有为用户转录和翻译信息能力的程序的第一步。

"在文学领域,它可能真的有帮助。每一部优秀的文学作品都被大量的历史文献所包围,但它真正有用的地方是历史档案研究,"穆勒说。"现在非常需要推动数字人文科学的发展。当你谈论中世纪和早期现代时,如果你想了解历史事件的细节和后果,你必须通过书面材料来寻找,而这些文本是我们唯一拥有的东西。在西方世界之外,这个问题可能更加严重。想想那些在受到威胁的文化中正在消失的语言。我们首先必须保存这些作品,使它们能够被使用,并在某些时候纳入翻译,使它们成为仍在进行的文化进程的一部分--我们正在与时间赛跑"。

深度学习推动数字人文科学发展相关推荐

  1. DL:听着歌曲《成都》三分钟看遍主流的深度学习的神经网络的发展框架(1950~2018)

    DL:听着歌曲<成都>三分钟看遍主流的深度学习的神经网络的发展框架(1950~2018) 视频链接:听着歌曲<成都>三分钟看遍主流的深度神经网络的发展框架(1950~2018) ...

  2. 基于深度学习的目标检测发展历程:deep_learning_object_detection

    目标检测论文从 2014-2018 模型表现表格 Detector VOC07 (mAP@IoU=0.5) VOC12 (mAP@IoU=0.5) COCO (mAP) Published In R- ...

  3. 基于深度学习的数字识别GUI的设计

    基于深度学习的数字识别GUI的设计 用matlab的deeplearning工具箱搭建了CNN来识别手写数字的GUI. 一.训练CNN 采用的是matlab自带的数字训练集和验证集,搭建的CNN的代码 ...

  4. 2018年的人工智能和深度学习将会如何发展?

    本文系网易智能工作室(公众号 smartman 163)出品.聚焦AI,读懂下一个大时代! [网易智能讯12月30日消息]随着我们的日常生活与各种各样的技术越来越紧密地交织在一起,有时候,似乎未来已经 ...

  5. 仿真的数据能否用来深度学习_数字孪生弥合了深度学习的数据鸿沟

    点击上方"蓝色字体",选择 "设为星标" 关键讯息,D1时间送达! 随着企业开始使用可将其数据投入使用的深度学习(DL)项目,他们必须保护这些数据,而数字孪生是 ...

  6. 毕业设计-基于深度学习的数字病理图像分割

    目录 前言 课题背景和意义 实现技术思路 一.数字病理相关学科研究 二.病理图像特点与分割挑战 三.深度学习病例图像分割方法 四.基于深度学习的病理图像分割 实现效果图样例 最后 前言

  7. 深眸科技|机器视觉、深度学习等技术快速发展,助力企业智造升级

    近年来,我国机器视觉行业市场规模不断增长,据相关数据显示,中国机器视觉器件和系统的销售额,已经由2012年的19.8亿美元增长至2021年的161亿美元,年复合增长率约为31.7%,总体呈快速发展趋势 ...

  8. Matlab深度学习-手写体数字识别

    Matlab深度学习 文章目录 Matlab深度学习 前言 一.MNIST手写体数字数据 二.用到的深度学习框架-LeNet5 2-0 LeNet5的网络架构 2-1 框架实现-通过Matlab GU ...

  9. 基于深度学习的图像识别模型发展

    一.简介 AlexNet:(2012)主要贡献扩展 LeNet 的深度,并应用一些 ReLU.Dropout 等技巧.AlexNet 有 5 个卷积层和 3 个最大池化层,它可分为上下两个完全相同的分 ...

最新文章

  1. Java逆向基础之简单的补丁
  2. 修改openssh源代码,添加操作记录审记功能
  3. MB1A MB1B MB1C MB11 MIGO的区别解析
  4. a股用计算机模拟走势,咬牙跺脚!A股牛市不改的铁证!
  5. (DBA之路【十一】)master-slave 机制原理
  6. mybatis中修改了数据,控制台显示成功,数据库没有修改
  7. Javascript之ES7详解
  8. 关键字--static
  9. 一些mootools的资源
  10. 【渝粤教育】国家开放大学2018年春季 0239-21T电子商务物流管理 参考试题
  11. 浮窗 动画特效 android,悬浮窗能实现自定Animation动画效果吗?
  12. 时速云与炎黄盈动强强联手,打造企业 IT 变革新未来
  13. 小米发布了10款可以免费商用的字体MiSans字体(含下载地址)
  14. 解决android SDK不能更新,appium测试混合app无法返回webview问题
  15. Apple Pay支付流程详解
  16. win10专业版和win10家庭版的区别浅谈
  17. AD19 基础应用技巧(差分线的添加走线与蛇形等长)
  18. 使用jquery.validate.js,当onfocusout: true,同时focus验证失败元素时会导致$(#form).valid()总是返回true?...
  19. 【零基础学STM32】CubeMX+HAL 喂狗小教程
  20. 统计找出一千万以内,一共有多少质数?(优化过程,效率更快)

热门文章

  1. fink sql 读取 kafka 的数据写到 kafka
  2. Keras深度学习实战(41)——语音识别
  3. 小程序之下载文件 —— wx.downloadFile
  4. Allegro如何打印光绘层操作指导Plot模式
  5. VNC Server远程桌面配置详解
  6. 不为彼岸,只为大海-----海贼王
  7. 使用astyle进行代码格式化
  8. java对象Json序列化,修改Json序列化后字段名
  9. 计算机二级填空题输出,计算机二级编程填空题
  10. “雷军董明珠新赌约”没啥,起底币圈10大赌约,巴菲特也中枪