FastText

参考链接:传送门
安装方法:传送门
官方文档:传送门

文本预处理

text = text.decode("utf-8").encode("utf-8")
seg_text = jieba.cut(text.replace("\t"," ").replace("\n"," ")) # 去掉\t \n然后用jieba分词切分
outline = " ".join(seg_text) # combined into a outline
outline = outline.encode("utf-8") + "\t__label__" + e + "\n" # add label

模型训练

#模型训练,输入内容"news_fasttext_train.txt",输出模型"news_fasttext.model.bin",标签的前缀"__label__"
classifier = fasttext.supervised("news_fasttext_train.txt","news_fasttext.model",label_prefix="__label__")

输入样式:

模型加载

#'news_fasttext.model.bin'模型路径;label_prefix='__label__':标签的前缀
classifier = fasttext.load_model('news_fasttext.model.bin', label_prefix='__label__')

模型预测

#每个文本获得的内容(分布处理)
texts = ['example very long text 1', 'example very longtext 2']
labels = classifier.predict(texts) # gain [label1, label2]labels = classifier.predict_proba(texts) # gain [(label1,probs_label1),(label2,probs_label2)]labels = classifier.predict(texts, k=3) # gain top3
labels = classifier.predict_proba(texts, k=3) # gain top3+probs#整体文本获得的内容(统一处理),只能获得整体的R and P
result = classifier.test('test.txt')
print 'P@1:', result.precision
print 'R@1:', result.recall
print 'Number of examples:', result.nexamples

fasttext使用指南相关推荐

  1. fastText、TextCNN、TextRNN……这里有一套NLP文本分类深度学习方法库供你选择 作者:机器人圈 / 微信号:ROBO_AI发表时间 :2017-07-28 图:pixabay

    fastText.TextCNN.TextRNN--这里有一套NLP文本分类深度学习方法库供你选择 「机器人圈」编译:嗯~阿童木呀.多啦A亮 这个库的目的是探索用深度学习进行NLP文本分类的方法. 它 ...

  2. 斯坦福NLP名课带学详解 | CS224n 第12讲 - NLP子词模型(NLP通关指南·完结)

    作者:韩信子@ShowMeAI,路遥@ShowMeAI,奇异果@ShowMeAI 教程地址:https://www.showmeai.tech/tutorials/36 本文地址:https://ww ...

  3. 斯坦福NLP名课带学详解 | CS224n 第13讲 - 基于上下文的表征与NLP预训练模型(ELMo, transformer)(NLP通关指南·完结)

    作者:韩信子@ShowMeAI,路遥@ShowMeAI,奇异果@ShowMeAI 教程地址:https://www.showmeai.tech/tutorials/36 本文地址:https://ww ...

  4. Python 迁移学习实用指南:1~5

    原文:Hands-On Transfer Learning with Python 协议:CC BY-NC-SA 4.0 译者:飞龙 本文来自[ApacheCN 深度学习 译文集],采用译后编辑(MT ...

  5. PyTorch 深度学习实用指南:1~5

    原文:PyTorch Deep Learning Hands-On 协议:CC BY-NC-SA 4.0 译者:飞龙 本文来自[ApacheCN 深度学习 译文集],采用译后编辑(MTPE)流程来尽可 ...

  6. 超详细中文预训练模型ERNIE使用指南-源码

    作者 | 高开远,上海交通大学,自然语言处理研究方向 最近在工作上处理的都是中文语料,也尝试了一些最近放出来的预训练模型(ERNIE,BERT-CHINESE,WWM-BERT-CHINESE),比对 ...

  7. 入门指南目录页 -PaddlePaddle 飞桨 入门指南 FAQ合集-深度学习问题

    入门指南目录页 -PaddlePaddle 飞桨 入门指南 FAQ合集 GT_Zhang关注 0.1012019.08.01 18:43:34字数 1,874阅读 795 Hi,欢迎各位来自Paddl ...

  8. ASIC设计-终极指南

    ASIC设计-终极指南 ASIC Design – The Ultimate Guide ASIC设计-终极指南 ASICs代表特定于应用的集成电路,指的是针对特定应用而设计的半导体解决方案,与其他解 ...

  9. Python神经网络集成技术Guide指南

    Python神经网络集成技术Guide指南 本指南将介绍如何加载一个神经网络集成系统并从Python运行推断. 提示 所有框架的神经网络集成系统运行时接口都是相同的,因此本指南适用于所有受支持框架(包 ...

最新文章

  1. 2018年英语计算机职称考试,2018年职称计算机考试报考指南大全
  2. 09-Maximum Power Mitigation Mechanism (MPMM)
  3. ParaEngine 一个同事的公司的开源引擎
  4. android必须服务,说说在Android如何使用服务(Service)的方法
  5. python开发中遇到的难题_初学者在Python开发中常见的问题(上)
  6. java 链表算法_数据结构算法Java版(一) 链表
  7. 深度学习TF—2.TensorFlow2高阶操作
  8. Python编程:从入门到实践
  9. Eclipse安装WindowsBuilder失败的解决办法
  10. Android 接入穿山甲SDK之插屏广告
  11. Pytorch——如何创建一个tensor与索引和切片(二)
  12. 计算机网络 交换机工作原理
  13. 选择的串口 _ 不存在或开发板没有连接_PC 和开发板之间传输文件
  14. 解决EMC、EMI传导干扰的八大方法
  15. 初步掌握MapReduce的架构及原理
  16. 木马 万能 删除法
  17. Python Tkinter Canvas该如何使用
  18. centos 6下apache kudu安装报错Error during hole punch test问题解决
  19. epic怎么添加本地游戏_Epic游戏商城本周免费游戏:无主之地 帅杰克合集
  20. IM消息送达保证机制实现

热门文章

  1. 系统设计 - 短链接系统 short url
  2. STM32F411核心板固件库开发(三) 按键检测
  3. centos 7升级内核,yum方式升级内核,编译方式升级内核
  4. CentOS 7 升级内核
  5. 嵌入式计算机系统简述,嵌入式系统简述
  6. python爬虫需要cookie_python爬虫(六) Cookie
  7. 下拉电阻阻值选多大?
  8. 天翼云 Ubuntu 22.04.1 LTS apt换源 (阿里云)
  9. Linux C语言调用C++动态链接库-改
  10. 探索R包plyr:脱离R中显式循环