安装skip-thoughts提取句子特征
官方github
参考博客
环境已保存到矩池云
将 多个句子(str list) -> 多个特征向量(numpy array dtype=float32 shape=[n, 4800])
理论部分
参照word2vec的skip-gram模型思想,拓展到句子级别,用中间的句子来预测上下文两个句子,上图中虚线框内隐藏层输出即为整个输入句子的4800d特征。
安装环境
conda create -n SkipThoughts python=2.7
conda activate SkipThoughts
pip install theano==1.0.4
pip install scikit-learn==0.20.4
pip install nltk==3.1
pip install keras==2.9.0
pip install gensim==3.8.3
下载项目
二选一:
按照参考博客或官方github中的完整步骤
从下方百度网盘中下载2个压缩包,解压后进入skip-thoughts-master目录
链接:https://pan.baidu.com/s/12x_6hrEX-rWw1TluQO5UdQ?pwd=x555
提取码:x555
测试
运行data目录下的main.py
# main.pyimport skipthoughtsmodel = skipthoughts.load_model()
encoder = skipthoughts.Encoder(model)
x = ['Hello world', 'This is a test sentence']
vec = encoder.encode(x)
print vec
print vec.shape
# 运行结果
# numpy array dtype=float32 shape=[n, 4800][[ 0.00759725 -0.02385723 -0.00653511 ... -0.00756364 -0.000801560.00343018][ 0.01462886 -0.00813354 0.00445716 ... -0.05013087 -0.042036230.01157508]]
(2, 4800)
安装skip-thoughts提取句子特征相关推荐
- 使用 skip-thoughts 提取句子特征
文章目录 1. 原理 2. 使用 2.1 环境要求 2.2 步骤 3. 结果 1. 原理 参考以下博客学习原理, https://blog.csdn.net/liujh845633242/articl ...
- 使用skip-thoughts提取句子特征
我搜集了两种方法来实现,一种方法基于theano,另一种方法基于tensorflow. 方法一参考: [1]https://github.com/ryankiros/skip-thoughts [2] ...
- 安装C3D v1.0提取视频特征
文章目录 前言 理论部分 贡献 动机 结构 安装CUDA&CUDNN 安装依赖 安装Opencv 默认Python2 安装boost 安装C3D C3D测试 保存环境 使用C3D提特征 (提特 ...
- python 使用jieba.analyse提取句子级的关键字
安装所需要的库 jieba(pip install jieba) 方法参数解释 jieba.analyse.extract_tags(sentence, topK=5, withWeight=True ...
- Python代码提取时间序列特征基于tsfeature
Python代码提取时间序列特征基于tsfeature 随着时间的推移,组织收集了非常大量的数据,并需要识别异常的时间序列.Python库tsfeature帮助计算每个时间序列上的特征向量,计算各种不 ...
- 批量提取 caffe 特征 (python, C++, Matlab)(待续)
本文参考如下: Instant Recognition with Caffe Extracting Features Caffe Python特征提取 caffe 练习4 --利用python批量抽取 ...
- 深度学习-CNN提取图像特征
一.卷积层 1.卷积操作 2.特征提取-"X" or "O"? 二.池化(Pooling) 三.Relu 层 四.全连接层(Fully connected la ...
- 图像处理中提取中间特征是干什么_PyTorch提取中间层特征?
点击上方"MLNLP",选择"星标"公众号 重磅干货,第一时间送达 编辑:忆臻 https://www.zhihu.com/question/68384370 ...
- 基于混合高斯分布的EM算法提取声音特征并识别男女性别
EM algorithm based on GMM to extract voice features and identify male and female voices 文章目录 EM algo ...
最新文章
- android 顺序执行任务
- 扫描过程_PLC的循环扫描工作过程
- 在线音乐用户寄望用爱发电,资本不愿无米之炊
- libiconv库简单裁剪支持CP437编码
- python中的构造函数_python构造函数init实例方法解析
- 计算机学校综合管理系统论文,学校综合管理系统的设计与实现毕业设计论文.doc...
- OpenShift Security (5) - 评估部署中的风险
- 1043 幸运号码 数位DP
- mysql排序优化_Mysql 排序优化
- iis7连接mysql_windows2008中正确使用IIS7配置PHP与MySQL
- Lasso估计学习笔记(二)
- mysql innodb 分区_MySQL 表分区详解MyiSam引擎和InnoDb 区别(实测)
- 清华姚班毕业生开发新特效编程语言,99行代码实现《冰雪奇缘》,网友:大神碉堡!创世的快乐...
- python数据可视化:使用dash给博客制作一个dashboard
- 华为事件对我们个人成功的启示:为什么自强自立不是出路?
- Linux--RAID磁盘阵列与阵列卡
- 企业邮箱客户端服务器异常,企业邮箱使用客户端连接提示“不知道这样的主机”的解决...
- SRS之SrsConfig类
- 从0带您打造企业级 Vue 服务器渲染 Nuxt.js (一) 入门
- Linux挂载Windows共享文件夹
热门文章
- miui android 8.0 彩蛋,关于小米8探索版的13个隐藏彩蛋:只有真爱米粉看得懂
- 2021山西孕博会|山西产康展会|山西月子展会
- Android一串数字分两段,底部对齐字号不同
- 解决问题--MYSQL服务无法启动
- 安全日记—零基础开始学安全(2)
- Turbo intruder插件代码
- 【第一季】Vue2.0视频教程-内部指令(共8集)
- magento 赠品_免费赠品发布:Rainbow UI Kit(PSD)
- java-三元表达式详解
- 光伏“分化”日臻凸显 新一轮价格暗战将起