在CS224n的一个Spotlight中提到了一词多义的问题,比如句子中出现了一个tie,到底是比赛平局,还是领带,还是绳子打结的意思?虽然说在w2v中相似的词被映射到相邻近的位置,但是一个词在词向量空间不会对应n多个向量,只有一个。经证明,一个词的词向量是所有义项的平均,也就是映射到了这些义项的中间。

那么问题来了,如何还原这些义项呢?

论文里说,义项是由以下函数进行的sparse coding:

这里的A就是词对应的某一义项的向量前边乘以一个系数,称为是hard sparsity contraint,这些参数可用标准k-SVD求出。

Spotlight1 一词多义(Polysemy)相关推荐

  1. 腾讯抗黑灰产——自监督发现行话黑词识别一词多义

    本文作者:lorenzwang ,腾讯 TEG 安全工程师 常见的中文 NLP 下游任务一般都是以分词作为起点(以 transformer 为核心的算法除外),对每个词取 embedding,作为模型 ...

  2. 莫烦nlp——ELMO一词多义

    李宏毅介绍过ELMO,但我已经忘记它是个啥东西了.说明不看代码,是无法牢固地记住一样东西的.我的笔记>> 莫烦简洁地介绍了该模型,结合之前笔记效果更佳.莫烦视频>> 预训练的作 ...

  3. 词汇课程——一词多义与合成词(3)

    文章目录 前言 1. 一词多义 1.1 scale 1.2 borad 1.3 cell 1.4 sharp 2. 义项 2.1 magpie 2.2 weed 3. 词类转换 3.1 及物动词转为非 ...

  4. 从词向量衡量标准到全局向量的词嵌入模型GloVe再到一词多义的解决方式

    衡量标准Evaluation 此处的衡量标准主要是针对单词向量而言. 内部标准Intrinsic 固定任务 (specific subtask) 运行时间 (time taken to compute ...

  5. CS224N研究热点2_Linear Algebraic Structure of Word Senses, with Applications to Polysemy(对于一词多义的向量表示研究)

    Paper:Linear Algebraic Structure of Word Senses, with Applications to Polysemy 源代码 词向量编码的相似性 相似的单词的词 ...

  6. 45个高频词的一词多义和固定搭配

    1.cost (1) The ticket cost me ten dollars.(此句中cost用作及物动词,意为"花费",这是cost的常用法之一.) (2) The cos ...

  7. NLP-词向量(Word Embedding)-2013:Word2vec模型(CBOW、Skip-Gram)【对NNLM的简化】【层次Softmax、负采样、重采样】【静态表示;无法解决一词多义】

    一.文本的表示方法 (Representation) 文本是一种非结构化的数据信息,是不可以直接被计算的.因为文本不能够直接被模型计算,所以需要将其转化为向量. 文本表示的作用就是将这些非结构化的信息 ...

  8. Latent semantic analysis note(LSA)

    1 LSA Introduction LSA(latent semantic analysis)潜在语义分析,也被称为LSI(latent semantic index),是Scott Deerwes ...

  9. LSA(潜在语义分析)

    转载https://blog.csdn.net/fkyyly/article/details/84665361 link LSA最初是用在语义检索上,为了解决一词多义和一义多词的问题: 1.一义多词: ...

最新文章

  1. 半木夏低风险交易记录二
  2. 从服务器上传和下载文件方法
  3. leetcode 27. 移除元素(双指针)
  4. C# 有什么惊艳到你的地方?
  5. python logger设置信息取得_shell 脚本中如何获取 python logging 打印的信息?
  6. 兼容多浏览器的CSS背景透明
  7. matlab跟maxwell联合优化,sim-sim-maxwell联合仿真遇到问题及解决方法
  8. 使用shell编写九九乘法表,mysql分库备份
  9. 文本区域css,如何知道文本从一个CSS区域溢出到另一个区域?
  10. SWAT模型学习(三)
  11. 学习笔记 JavaScript ES6 声明方式const(二)
  12. python中怎么取小数点后两位函数_python中round函数保留两位小数的方法
  13. 谈谈个人网站的建立(五)—— 小集群的部署
  14. 小马哥----高仿三星note3 N9006主板型号A202 高通芯片刷机拆机图示
  15. 2021年危险化学品经营单位主要负责人最新解析及危险化学品经营单位主要负责人新版试题
  16. 我的王姨!YYDS!富婆这套路实在是太深了...
  17. 公关人员活用Koomail给客户群发邮件
  18. LeetCode 2021 力扣杯全国秋季编程大赛(第384名)
  19. 手把手教你实现聚光灯效果
  20. WLAN需要集中管理

热门文章

  1. CSS3动画制作的旋转风车,大家五一节日快乐
  2. redis批量删除key命令
  3. 东南大学计算机专硕缩招,被称大三本的985,曾扩招千人招调剂,如今2.2万人扎堆,不好考了...
  4. 【数字IC手撕代码】Verilog自动售卖饮料机|题目|原理|设计|仿真
  5. 格力电器年营收1889.9亿:净利245亿 高瓴为大股东
  6. 网鱼网咖-利用数加快速搭建大数据平台,极致洞察,为客户带来从所未有的体验。
  7. 影响IPSec的网络问题
  8. lustre文件系统部署流程
  9. 从键盘输入0-255之间的十进制数,将其转换成十六进制数,并在屏幕上显示出
  10. 2021三中高考成绩查询,2021柳州市地区高考成绩排名查询,柳州市高考各高中成绩喜报榜单...