也就是通过三百个维度,每个维度我们都赋予值,就算有299个维度值相同,有一个维度值不同,我们就可以判别为不同的词。通过这个方法,仅需要300维度,我们就可以表示所有的词汇。

一般的我们在我们平常输出的句子中会发现,有一些词的输出频率会特别高,比如‘the’,我们一般会通过二次采样来降低此类词出现的概率:对于出现在训练文中的每个单词,都会有一个从文本删除的概率,这个概率取决于相应单词的词频。

nagative sampling(负采样)
如果 vocabulary 大小为1万时, 当输入样本 ( “fox”, “quick”) 到神经网络时(fox为input, quick为output), “ fox” 经过 one-hot 编码,在输出层我们期望对应 “quick” 单词的那个神经元结点输出 1,其余 9999 个都应该输出 0。在这里,这9999个我们期望输出为0的神经元结点所对应的单词我们为 negative word. negative sampling 的想法也很直接 ,将随机选择一小部分的 negative words,比如选 10个 negative words 来更新对应的权重参数。

在论文中作者指出指出对于小规模数据集,建议选择 5-20 个 negative words,对于大规模数据集选择 2-5个 negative words.

如果使用了 negative sampling 仅仅去更新positive word- “quick” 和选择的其他 10 个negative words 的结点对应的权重,共计 11 个输出神经元,相当于每次只更新 300 x 11 = 3300 个权重参数。对于 3百万 的权重来说,相当于只计算了千分之一的权重,这样计算效率就大幅度提高。

词嵌入进阶:

Task07:优化算法进阶;word2vec;词嵌入进阶相关推荐

  1. DL-Pytorch Task07:优化算法进阶;word2vec;词嵌入进阶

    目录 优化算法进阶 An ill-conditioned Problem Maximum Learning Rate Supp: Preconditioning Solution to ill-con ...

  2. 《动手学深度学习》组队学习打卡Task7——词嵌入进阶

    词嵌入进阶 在"Word2Vec的实现"一节中,我们在小规模数据集上训练了一个 Word2Vec 词嵌入模型,并通过词向量的余弦相似度搜索近义词.虽然 Word2Vec 已经能够成 ...

  3. 《动手学深度学习》task7_3 词嵌入进阶

    系统学习<动手学深度学习>点击下面这个链接,有全目录哦~ https://blog.csdn.net/Shine_rise/article/details/104754764 本篇目录 词 ...

  4. L25词嵌入进阶GloVe模型

    词嵌入进阶 在"Word2Vec的实现"一节中,我们在小规模数据集上训练了一个 Word2Vec 词嵌入模型,并通过词向量的余弦相似度搜索近义词.虽然 Word2Vec 已经能够成 ...

  5. MATLAB优化模型例子,MATLAB优化算法案例分析与应用(进阶篇)

    导语 余胜威编著的<MATLAB优化算法案例分析与应用(进阶篇)>基本包括了所有常见的MATLAB优化算法及应用,包括贝叶斯分类器.期望最大化算法.K最近邻密度估计.朴素贝叶斯分类器.背景 ...

  6. word2vec python实现_教程 | 在Python和TensorFlow上构建Word2Vec词嵌入模型

    原标题:教程 | 在Python和TensorFlow上构建Word2Vec词嵌入模型 选自adventuresinmachinelearning 参与:李诗萌.刘晓坤 本文详细介绍了 word2ve ...

  7. 在Python和TensorFlow上构建Word2Vec词嵌入模型

    本文详细介绍了 word2vector 模型的模型架构,以及 TensorFlow 的实现过程,包括数据准备.建立模型.构建验证集,并给出了运行结果示例. GitHub 链接:https://gith ...

  8. 【自然语言处理-2】word2vec词嵌入算法“男人”+“女人”=“爱情的坟墓”

    词嵌入算法 通俗易懂的理解: 词嵌入算法就是使用一个低维度的向量来表示一个词,并且距离相近的向量在实际的词含义上也是相近的.比如: "男人"的向量与"女人"向量 ...

  9. Word2Vec词嵌入向量延伸-原理剖析

    传送:基于Hierarchical Softmax的word2vec模型原理 基于Negative Sampling的word2vec模型原理 一.基本概念准备 稀疏向量(one-hot repres ...

最新文章

  1. Oracle时间函数
  2. 程序员眼中的UML(2)--克服用例图的恐惧
  3. python 列表list
  4. mysql可以靠索引,而我只能靠打工,加油,打工人!
  5. 英雄联盟手游锐雯有多么强大,新手教程全给你,瑞文很简单
  6. 解决ASP.Net第一次访问慢的处理 IIS 7.5
  7. git初使用(本地创建后第一次提交到git)
  8. VS2015:安装适用于windows桌面的visual c++2015
  9. 【线段树】扇形面积并(P3997)
  10. 需求调研的方法及过程_培训需求调研方法
  11. 关于判断后该数据类型是否发生了转变
  12. 设计模式的C语言应用-建造者模式-第七章
  13. java Hibernate
  14. CISA 称SolarWinds黑客或通过密码猜测攻陷目标,CISA 前局长受聘
  15. linux搜索命令有哪些,linux五大搜索命令学习
  16. windows10-seaslog安装笔记
  17. 使用Windows系统的几个好的习惯
  18. 如何让计算机查找不到无线网络,笔记本电脑搜索不到无线网络怎么办?
  19. Java中使用字符流读取UTF-8和写出txt文件 乱码 问题
  20. EXCEL公式引用得是空的单元格,但是却不返回空““,而是返回0是怎么回事? 怎么处理呢?

热门文章

  1. 拼车网站系统源码,拼车小程序
  2. 区块链技术对电商的影响
  3. Krpano 全景生成-droplet
  4. 同城艺龙2018秋招Java笔试之newInstance()--Binrry(冰蕊)
  5. 字符串函数length求字符串长度upper,lower大小写转换ltrim,rtrim移除字符串左侧右侧的空白字符或其它预定义字符trim删除字符串前后的空格left,right,subtring
  6. 互联网+让农业也按耐不住了 村官涉足电商
  7. linux离线安装docker和docker-compose
  8. android实现推送功能实现,android教你怎么轻松实现手机推送功能,一步一步教你Mob+MobPush...
  9. WebGIS系列(一):坐标系
  10. 教程 | 校徽头像制作小程序前端实现