python word2vec的使用

发布时间:2018-06-27 10:45,

浏览次数:299

, 标签:

python

word

vec

引用块内容

#-*- coding:utf-8 -*- import sys from gensim.models import word2vec import

gensimimport codecs from textrank4zh import TextRank4Keyword, TextRank4Sentence

from nltk.tokenize import WordPunctTokenizer import chardet reload(sys)

sys.setdefaultencoding('utf-8') #测试gensim的基本功能 def testGensimFeatures(): print

'gensim' # s1=model.most_similar(positive=["woman", "king"], negative=["man"],

topn=1) # print s1 #model.save(r'D:\PythonFiles\gensimData\test\text88.model')

#model =

gensim.models.Word2Vec.load(r'D:\PythonFiles\gensimData\test\text8.model')

#model =

gensim.models.KeyedVectors.load_word2vec_format(r'D:\PythonFiles\gensimData\test\GoogleNews-vectors-negative300.bin',binary=True)

#model.wv.save_word2vec_format(r'D:\PythonFiles\gensimData\test\text88.model.bin',

binary=True)

#model.wv.save_word2vec_format(r'D:\PythonFiles\gensimData\test\wiki.enae.model.bin',

binary=True) #model =

gensim.models.KeyedVectors.load_word2vec_format(r'D:\PythonFiles\gensimData\test\text8.model.bin',

binary=True) #print model.most_similar(['girl', 'father'], ['boy'], topn=3) #

print '以上比较出类似的数据' # print '=======================' #print '以上比较两个单词的相似度是多少

%f' % model.similarity(["boy","woman"], ["girl",'father']) model =

word2vec.load_word2vec_format(

u'/data1/yuhai/sameQuestion/GoogleNews-vectors-negative300.bin', binary=True)

#model =

word2vec.load_word2vec_format(u'/data1/yuhai/sameQuestion/GoogleNews-vectors-negative300.bin',

binary=True) w1="boy" w2="girl" print model.similarity(w1, w2) w3=['boy',

'father','dog'] w4=['girl','mother','you'] print model.n_similarity(w3,w4) print

'结束' # if __name__ == '__main__': # testGensimFeatures()

1.1 Storing and loading models

您可以使用标准的gensim方法存储/加载模型:

model.save(‘/tmp/mymodel’)

new_model = gensim.models.Word2Vec.load(‘/tmp/mymodel’)

它内部使用pickle(python的pickle模块实现了基本的数据序列和反序列化。通过pickle模块的序列化操作我们能够将程序中运行的对象信息保存到文件中去,永久存储;通过pickle模块的反序列化操作,我们能够从文件中创建上一次程序保存的对象。),可选地将模型的内部大型NumPy矩阵从磁盘文件直接转换为虚拟内存,用于进程间内存共享。

此外,您可以加载由原始C工具创建的模型,使用其文本和二进制格式:

model = Word2Vec.load_word2vec_format('/tmp/vectors.txt', binary=False) #using

gzipped/bz2 input works too, no needto unzip: model =

Word2Vec.load_word2vec_format('/tmp/vectors.bin.gz', binary=True)

python word2vec库_python word2vec的使用相关推荐

  1. Python gensim库使用word2vec 加载和保存模型、在预训练基础上训练自己的预料

    Python gensim库使用word2vec 常见: gensim.models.word2vec.Word2Vec(size=300, sg=1, min_count=1) 加载和保存模型 ge ...

  2. python加密库_python基于pyDes库实现des加密的方法

    本文实例讲述了python基于pyDes库实现des加密的方法.分享给大家供大家参考,具体如下: 下载及简介地址:https://twhiteman.netfirms.com/des.html 如需要 ...

  3. python argparse库_Python的argparse库使用详解

    argparse是python标准库里面用来处理命令行参数的库 命令行参数分为位置参数和选项参数: 位置参数就是程序根据该参数出现的位置来确定的 如:[root@openstack_1 /]# ls ...

  4. python pillow库_python pillow模块用法

    pillow Pillow是PIL的一个派生分支,但如今已经发展成为比PIL本身更具活力的图像处理库.pillow可以说已经取代了PIL,将其封装成python的库(pip即可安装),且支持pytho ...

  5. python解析库_Python命令行解析库argparse

    原博文 2014-08-13 05:48 − 2.7之后python不再对optparse模块进行扩展,python标准库推荐使用argparse模块对命令行进行解析. 1.example 有一道面试 ...

  6. 列出5个python标准库_Python常用标准库使用(一)

    自学python一段时间,之前总是学习基本语法,对Python标准库没怎么接触,所以计划从常用的标准库开始,大体了解一遍,下面是学习过程中的笔记. 一.OS模块 主要对目录.或者文件操作.常用方法如下 ...

  7. python机器学习库_Python机器学习库 Top 10,你值得拥有!

    随着人工智能技术的发展与普及,Python超越了许多其他编程语言,成为了机器学习领域中最热门最常用的编程语言之一.有许多原因致使Python在众多开发者中如此受追捧,其中之一便是其拥有大量的与机器学习 ...

  8. python没有库_Python开发者必备6个基本库,这个都没有怎么做开发呢

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理 以下文章来源于腾讯云 作者:py3study ( 想要学习Python?Pytho ...

  9. python网络库_python的网络库

    最近新功能上线,帮忙加了几个监控脚本.上次用的perl,语法太随意了,看起来很是不整洁,自己写的都觉得不好,更不要说给别人看.好久没用python了,反正这次准备使用新的监控设计方案,刚好换一下. 用 ...

最新文章

  1. Android开发高手课笔记--如何打造高质量应用?
  2. ubuntu12.04 升级 automake
  3. Python基础知识(第二天)
  4. MyBatisPlus中updateById与updateAllColumnById方法区别
  5. Win的cmd中文乱码
  6. MacOSX下的BaiduPCS-Go的安装及使用说明
  7. 小米集团本周再回购1920万港元股票
  8. mui封装的ajax请求
  9. 如何上好网课 — 老师录课和在线上课教学经验谈
  10. 盘点那些跨界玩到飞起的程序员们!
  11. python 以行为单位进行字符串的切割
  12. 负载均衡与分布式网络存储技术简介
  13. ceph更换硬盘操作步骤
  14. 复变函数(1)-复数及其几何属性
  15. python名片管理系统_用python实现名片管理系统
  16. php 小程序即时聊天,网易云IM小程序聊天室集成。PHP版SDK API使用示例
  17. 在线客服系统源码(外贸多语言带翻译网页在线客服系统源码完整搭建)
  18. 使用ICMP协议检测网络状态
  19. GPS失锁和丢包区别
  20. 离轴高数值孔径抛物面反射镜的聚焦

热门文章

  1. 知道等级保护测评都有哪些工作内容吗?
  2. Spring boot admin 监控配置
  3. EUI卡牌游戏的制作全过程
  4. 三星Android p 卡,购买经历 篇二:三星S10 半个月使用心得
  5. linux 重启服务器脚本_使用简单脚本诊断Linux服务器负载问题
  6. fwr171改无线服务器,迅捷FWR171无线路由器的无线AP模式怎么设置
  7. 关晓彤同款无米寿司,让你感受一下远离碳水也无敌幸福~
  8. 为什么大头书老是看不进去?
  9. 2023年春节跨年烟花网页特效
  10. GitHub项目分享:2021年5月精选项目推荐