官方github

参考博客

环境已保存到矩池云

将 多个句子(str list) -> 多个特征向量(numpy array dtype=float32 shape=[n, 4800])

理论部分

参照word2vec的skip-gram模型思想,拓展到句子级别,用中间的句子来预测上下文两个句子,上图中虚线框内隐藏层输出即为整个输入句子的4800d特征。

安装环境

conda create -n SkipThoughts python=2.7
conda activate SkipThoughts
pip install theano==1.0.4
pip install scikit-learn==0.20.4
pip install nltk==3.1
pip install keras==2.9.0
pip install gensim==3.8.3

下载项目

二选一:

  1. 按照参考博客或官方github中的完整步骤

  2. 从下方百度网盘中下载2个压缩包,解压后进入skip-thoughts-master目录

    链接:https://pan.baidu.com/s/12x_6hrEX-rWw1TluQO5UdQ?pwd=x555
    提取码:x555

测试

运行data目录下的main.py

# main.pyimport skipthoughtsmodel = skipthoughts.load_model()
encoder = skipthoughts.Encoder(model)
x = ['Hello world', 'This is a test sentence']
vec = encoder.encode(x)
print vec
print vec.shape
# 运行结果
# numpy array dtype=float32 shape=[n, 4800][[ 0.00759725 -0.02385723 -0.00653511 ... -0.00756364 -0.000801560.00343018][ 0.01462886 -0.00813354  0.00445716 ... -0.05013087 -0.042036230.01157508]]
(2, 4800)

安装skip-thoughts提取句子特征相关推荐

  1. 使用 skip-thoughts 提取句子特征

    文章目录 1. 原理 2. 使用 2.1 环境要求 2.2 步骤 3. 结果 1. 原理 参考以下博客学习原理, https://blog.csdn.net/liujh845633242/articl ...

  2. 使用skip-thoughts提取句子特征

    我搜集了两种方法来实现,一种方法基于theano,另一种方法基于tensorflow. 方法一参考: [1]https://github.com/ryankiros/skip-thoughts [2] ...

  3. 安装C3D v1.0提取视频特征

    文章目录 前言 理论部分 贡献 动机 结构 安装CUDA&CUDNN 安装依赖 安装Opencv 默认Python2 安装boost 安装C3D C3D测试 保存环境 使用C3D提特征 (提特 ...

  4. python 使用jieba.analyse提取句子级的关键字

    安装所需要的库 jieba(pip install jieba) 方法参数解释 jieba.analyse.extract_tags(sentence, topK=5, withWeight=True ...

  5. Python代码提取时间序列特征基于tsfeature

    Python代码提取时间序列特征基于tsfeature 随着时间的推移,组织收集了非常大量的数据,并需要识别异常的时间序列.Python库tsfeature帮助计算每个时间序列上的特征向量,计算各种不 ...

  6. 批量提取 caffe 特征 (python, C++, Matlab)(待续)

    本文参考如下: Instant Recognition with Caffe Extracting Features Caffe Python特征提取 caffe 练习4 --利用python批量抽取 ...

  7. 深度学习-CNN提取图像特征

    一.卷积层 1.卷积操作 2.特征提取-"X" or "O"? 二.池化(Pooling) 三.Relu 层 四.全连接层(Fully connected la ...

  8. 图像处理中提取中间特征是干什么_PyTorch提取中间层特征?

    点击上方"MLNLP",选择"星标"公众号 重磅干货,第一时间送达 编辑:忆臻 https://www.zhihu.com/question/68384370 ...

  9. 基于混合高斯分布的EM算法提取声音特征并识别男女性别

    EM algorithm based on GMM to extract voice features and identify male and female voices 文章目录 EM algo ...

最新文章

  1. android 顺序执行任务
  2. 扫描过程_PLC的循环扫描工作过程
  3. 在线音乐用户寄望用爱发电,资本不愿无米之炊
  4. libiconv库简单裁剪支持CP437编码
  5. python中的构造函数_python构造函数init实例方法解析
  6. 计算机学校综合管理系统论文,学校综合管理系统的设计与实现毕业设计论文.doc...
  7. OpenShift Security (5) - 评估部署中的风险
  8. 1043 幸运号码 数位DP
  9. mysql排序优化_Mysql 排序优化
  10. iis7连接mysql_windows2008中正确使用IIS7配置PHP与MySQL
  11. Lasso估计学习笔记(二)
  12. mysql innodb 分区_MySQL 表分区详解MyiSam引擎和InnoDb 区别(实测)
  13. 清华姚班毕业生开发新特效编程语言,99行代码实现《冰雪奇缘》,网友:大神碉堡!创世的快乐...
  14. python数据可视化:使用dash给博客制作一个dashboard
  15. 华为事件对我们个人成功的启示:为什么自强自立不是出路?
  16. Linux--RAID磁盘阵列与阵列卡
  17. 企业邮箱客户端服务器异常,企业邮箱使用客户端连接提示“不知道这样的主机”的解决...
  18. SRS之SrsConfig类
  19. 从0带您打造企业级 Vue 服务器渲染 Nuxt.js (一) 入门
  20. Linux挂载Windows共享文件夹

热门文章

  1. miui android 8.0 彩蛋,关于小米8探索版的13个隐藏彩蛋:只有真爱米粉看得懂
  2. 2021山西孕博会|山西产康展会|山西月子展会
  3. Android一串数字分两段,底部对齐字号不同
  4. 解决问题--MYSQL服务无法启动
  5. 安全日记—零基础开始学安全(2)
  6. Turbo intruder插件代码
  7. 【第一季】Vue2.0视频教程-内部指令(共8集)
  8. magento 赠品_免费赠品发布:Rainbow UI Kit(PSD)
  9. java-三元表达式详解
  10. 光伏“分化”日臻凸显 新一轮价格暗战将起