黄聪:Python+NLTK自然语言处理学习(三):计算机自动学习机制
本文演示使用NLTK让计算机学习如何通过名字识别性别。
1、导入NLTK:
import nltkfrom nltk.book import *
2、定义学习方法
def gender_features(word):return {'last_letter':word[-1]}
3、导入学习的姓名-性别名单:
from nltk.corpus import namesimport randomnames=([(name,'male') for name in names.words('male.txt')] + [(name,'female') for name in names.words('female.txt')])random.shuffle(names)
4、开始学习
f = [(gender_features(n),g) for (n,g) in names]trainset,testset = f[500:],f[:500]c = nltk.NaiveBayesClassifier.train(trainset)
5、测试:
c.classify(gender_features('Neo'))c.classify(gender_features('Trinity'))
转载于:https://www.cnblogs.com/huangcong/archive/2011/08/29/2158447.html
黄聪:Python+NLTK自然语言处理学习(三):计算机自动学习机制相关推荐
- Python NLTK 自然语言处理入门与例程
Python NLTK 自然语言处理入门与例程 在这篇文章中,我们将基于 Python 讨论自然语言处理(NLP).本教程将会使用 Python NLTK 库.NLTK 是一个当下流行的,用于自然语言 ...
- 医用计算机基础学习心得,计算机基础学习心得.doc
计算机基础学习心得 计算机基础学习心得一:计算机基础学习心得 当今社会,到处充满机会与挑战.知识是我们面对这一切的筹码,而计算机知识则更为重要.如何在本科函授这样一种形式下,学好计算机课程,这是摆在我 ...
- 《用Python进行自然语言处理》第6章 学习分类文本
1. 我们怎样才能识别语言数据中能明显用于对其分类的特征? 2. 我们怎样才能构建语言模型,用于自动执行语言处理任务? 3. 从这些模型中我们可以学到哪些关于语言的知识? 6.1 有监督分类 性别鉴定 ...
- 计算机图形学学习报告,计算机图形学学习报告.pdf
精选公文范文 计算机图形学学习 报告 篇一:计算机图形学学习心得体会 计算机图形学学习心得体会 计算机科学与技术与技术 班 学号: 1.计算机图形学 计算机图形学(Computer Graphics, ...
- 计算机图形学学习报告,计算机图形学学习报告.doc
计算机图形学学习报告 篇一:计算机图形学学习心得体会 计算机图形学学习心得体会 计算机科学与技术与技术 班 学号: 1.计算机图形学 计算机图形学(Computer Graphics,简称CG),狭义 ...
- 计算机专业学习规划,计算机专业学习计划.doc
2019年计算机专业学习计划 如今在中国考研之风渐热,而计算机恐怕是最热门的专业了,对于考生来说,选一个心仪的学校,不仅仅是能够学到真实的本领,更为以后的就业奠定了基础.下面是帮大家整理的计算机专业学 ...
- 计算机课程学习小结,计算机课程学习心得5篇___.docx
计算机课程学习心得5篇___ 计算机技术的进展,促进了教学媒体的开发和利用,训练资源和资料能得到共享.在教学上应用计算机,能向同学供应更多的.更现代化的科学学问和技能训练,让同学对学习有更多的选择,使 ...
- 速成pytorch学习——3天自动微分机制
神经网络通常依赖反向传播求梯度来更新网络参数,求梯度过程通常是一件非常复杂而容易出错的事情. 而深度学习框架可以帮助我们自动地完成这种求梯度运算. Pytorch一般通过反向传播 backward 方 ...
- 黄聪:Python+NLTK自然语言处理学习(二):常用方法(similar、common_contexts、generate)...
一.similar 用来识别文章中和搜索词相似的词语,可以用在搜索引擎中的相关度识别功能中. text1.similar("monstrous") 查询出了text1中与monst ...
最新文章
- NC:中国药科郝海平和郑啸发现饮食-微生物互作缓解肠损伤
- 使用JestClient操作ElasticSearch
- sts 明明导包正确却报错_这真是危险的关系,明明你错了,但是她认了!
- Android Weekly Notes Issue #218
- Git笔记(15) 远程分支
- linux buffer cache 过高_你真的理解Linux的内存监控吗?
- Compiler and Linker
- python批量查询IP物理地址输出到Exel
- MIPI CSI转TTL/LVDS/BT656/BT601/BT1120
- linux系统论文题目大全_计算机应用专业毕业论文题目大全选题
- Vue引入Froala-Editor富文本编辑器
- ubuntu 10.04安装 sopcast player
- C#实现Omron欧姆龙PLC的Fins Tcp协议[转]
- mongodb默认的用户名密码_MongoDB 用户名密码登录
- 士兵 POJ1723
- 2018,这一年的腾讯优图,我们总结一下!
- [转] 大三下,我们该做什么?
- 【Vue 组件化开发 三】父组件给子组件传递数据、组件通信(父传子、子传父)、父访问子(children、ref)、动态组件(is、component)
- 修复pd16虚拟机在big sur 的usb无法使用和无法联网问题!
- 《网络攻防》 MSF基础应用