原标题:为什么语言技术工具还不能处理《权力的游戏》

来自阿姆斯特丹自由大学和荷兰皇家科学院人文学科集群的研究人员评估了四种最先进的识别文本名称的工具,以评估和提高他们在通俗小说中的表现。他们找到了一些解决方案,提高了该工具识别一本小说名字的能力,准确率从7%提高到90%。

自然语言处理NLP工具在Siri和谷歌等日常应用中得到了广泛的应用,但这些技术的有效性还没有得到充分的认识。来自阿姆斯特丹自由大学和荷兰皇家科学院人文学院的研究人员对包括《权力的游戏》在内的40部畅销小说的四种不同的名字识别工具进行了全面评估。他们的分析发表在《计算机科学》杂志上,强调了对这些工具来说,识别和缓解这一问题的解决方案特别具有挑战性的名称和文本类型。此外他们从小说中提取社交网络来探索故事结构的差异。这些可以帮助这些技术更有效地对抗类型差异,例如可以帮助希望分析大型数据集的记者更好地利用这些技术。

许多NLP工具都是基于机器学习的。也就是说一个计算机程序经过训练,可以根据先前输入的示例识别文本中的模式。例如为了识别文本中的名字,它向许多报纸文章提供了人类精心标记名字的信息。然后该程序的任务是根据上下文或单词的形状学习一个名字是什么样子的。现在,当把这种以报纸为训练对象的系统应用到小说中时,问题是小说作者在叙述方面比那些需要坚持事实的记者有更多的自由。小说作者可以自己起名字,比如泰温或R'hllor,也可以直接使用字典里的描述性人物名字,比如Grey Worm。这些名称的行为不像普通名称,因此NLP系统很难在文本中识别它们。

尼尔斯德克尔,托拜厄斯库恩和马里克的实验也强调了语言的灵活性,以及名字在故事中的语境。例如丹妮莉丝坦格利安可以被称为丹妮莉丝和她,但她也被称为丹妮,丹妮莉丝暴风女,龙之母,卡丽熙,未焚者和姆莎。例如为《权力的游戏》创建的社交网络显示,丹妮被她的朋友使用,而她的全名丹妮莉丝只被她的敌人使用。研究表明,应该更多地关注NLP工具的性能,在文本被计算机完全理解之前还有很多工作要做。返回搜狐,查看更多

责任编辑:

权力的游戏 曲 计算机,为什么语言技术工具还不能处理《权力的游戏》相关推荐

  1. CCAI 2017 | 专访德国语言技术领军者 Hans Uszkoreit:深度学习还不足以解决 NLP 核心问题...

    7 月 22 - 23 日,由中国人工智能学会.阿里巴巴集团 & 蚂蚁金服主办,CSDN.中国科学院自动化研究所承办,云栖社区作为独家直播合作伙伴的第三届中国人工智能大会(CCAI 2017) ...

  2. 【架构】技术-工具-平台-语言框架

    技术-工具-平台-语言&框架 Techniques | Technology Radar | ThoughtWorks 转载于:https://www.cnblogs.com/junneyan ...

  3. 软考考c语言还是java,计算机程序设计工程师技术水平(java)证书就是计算机技术与软件专业技术资格考试的程序员证书么?...

    满意答案 rfhenry 2013.09.04 采纳率:47%    等级:12 已帮助:9852人 计算机程序设计工程师技术水平(java)证书就是计算机技术与软件专业技术资格考试的程序员证书. 计 ...

  4. 北大计算机语言学研究所,北京大学软件与微电子学院与北京大学计算语言学研究所联合新建语言技术系...

    [8] C.L.uu,M.Ko ,H.Fujisawa.Le~dcon-Driven Segmentation and Recognition of Handwriten Character Stri ...

  5. 对话微软黄学东:语音语言技术是镶在 AI 皇冠上的明珠

    来源:AI科技评论 AI 科技评论按:上一次你和你的电脑进行有意义的对话,并感受到它能真正地理解你,是什么时候?如果微软技术研究员.微软的语言语音小组组长黄学东博士做到了的话,那么你也将可以做到.并且 ...

  6. c++整理程序 dev_C编程从入门到实践:C语言开发工具详解(2)

    DEV C++是一款经典的轻量级C语言开发工具,其安装大小只有几十兆,并且具有图形视图界面,操作比较容易.在DEV C++编码界面中可以使用复制和粘贴等命令,这提高了开发效率. 2.3.1安装DEV ...

  7. r语言处理数据集编码_在强调编码语言或工具之前,请学习这3个基本数据概念

    r语言处理数据集编码 重点 (Top highlight) I got an Instagram DM the other day that really got me thinking. This ...

  8. 机器翻译先驱 Jaime Carbonell 去世,创立卡内基梅隆大学语言技术学院

    整理 | 伍杏玲 出品 | CSDN(ID:CSDNnews) 2月28日,机器翻译先驱 Jaime Guillermo Carbonell 因病去世,享年67岁. 1985年,Carbonell 作 ...

  9. 对超级计算机的认识有关论文,计算机科与技术专业的认识与思考.docx

    计算机科与技术专业的认识与思考 计算机科学与技术专业的认识与思考(xxxxxxxxxx)摘要:计算机在现如今的生活中愈发普遍,然而,人们对计算机的了解并不深.计算机是什么?计算机的发展史.计算机的应用 ...

最新文章

  1. thinkphp整合极验滑动验证码源码演示下载
  2. ssh可以连接但sftp不可以连接解决方案
  3. c++构建工具之make使用小结
  4. boost::fusion::flatten用法的测试程序
  5. win10磁盘检查命令
  6. window实用快捷键
  7. 华为P50系列外观正式官宣:双圆形后置相机模组实锤
  8. 建立efi分区_电脑维修不求人之几条命令无损增加分区的方法
  9. Servlet的API(一)
  10. 093-PHP数组比较
  11. 计算机平面和应用,计算机平面设计中软件的相互结合与应用
  12. kindle文件转PDF文件
  13. 模糊聚类及matlab实现,matlab模糊聚类程序
  14. 3.STC15W408AS单片机GPIO
  15. 研究生从事学术研究的赫曼法则(The Laws of Herman)。
  16. 股份有限公司按规定注销库存股时,对被注销库存股的账面余额超过面值总额的部分
  17. 如何制作一个高转化的广告落地页(文末有福利)
  18. 我的世界java1.15更新了什么动物_我的世界:原来1.15版本的更新“主题”不是蜜蜂,而是这些东西?...
  19. Pixel-level Extrinsic Self Calibration of High Resolution LiDAR and Camera in Targetless Environment
  20. axure生成的html不能用360浏览器打开

热门文章

  1. springboot配置i18n国际化
  2. 【多轮对话】任务型多轮对话状态跟踪-NBT原理
  3. FPGA信号处理系列文章——FIR半带插值滤波器-1个时钟2个采样点的优化处理
  4. 人脸检测、人脸跟踪、人脸识别、OpenCV(特征脸、LBPH、费歇脸)
  5. ❤️ 程序员【代码管理】工具介绍❤️,热门语言更新这么快,你绕不过这一关的!
  6. spark on k8s: master pod kube-proxy-mkbp7 Evicte -- The node was low on resource: ephemeral-storag
  7. cocoapods安装完成后 执行pod search失败
  8. 百度云服务器安装Mysql 5.6
  9. 聚类的方法(层次聚类,K-means聚类)
  10. HTML 弹出框功能