本文演示使用NLTK让计算机学习如何通过名字识别性别。

1、导入NLTK:

import nltkfrom nltk.book import *

2、定义学习方法

def gender_features(word):return {'last_letter':word[-1]}

3、导入学习的姓名-性别名单:

from nltk.corpus import namesimport randomnames=([(name,'male') for name in names.words('male.txt')] + [(name,'female') for name in names.words('female.txt')])random.shuffle(names)

4、开始学习

f = [(gender_features(n),g) for (n,g) in names]trainset,testset = f[500:],f[:500]c = nltk.NaiveBayesClassifier.train(trainset)

5、测试:

c.classify(gender_features('Neo'))c.classify(gender_features('Trinity'))

转载于:https://www.cnblogs.com/huangcong/archive/2011/08/29/2158447.html

黄聪:Python+NLTK自然语言处理学习(三):计算机自动学习机制相关推荐

  1. Python NLTK 自然语言处理入门与例程

    Python NLTK 自然语言处理入门与例程 在这篇文章中,我们将基于 Python 讨论自然语言处理(NLP).本教程将会使用 Python NLTK 库.NLTK 是一个当下流行的,用于自然语言 ...

  2. 医用计算机基础学习心得,计算机基础学习心得.doc

    计算机基础学习心得 计算机基础学习心得一:计算机基础学习心得 当今社会,到处充满机会与挑战.知识是我们面对这一切的筹码,而计算机知识则更为重要.如何在本科函授这样一种形式下,学好计算机课程,这是摆在我 ...

  3. 《用Python进行自然语言处理》第6章 学习分类文本

    1. 我们怎样才能识别语言数据中能明显用于对其分类的特征? 2. 我们怎样才能构建语言模型,用于自动执行语言处理任务? 3. 从这些模型中我们可以学到哪些关于语言的知识? 6.1 有监督分类 性别鉴定 ...

  4. 计算机图形学学习报告,计算机图形学学习报告.pdf

    精选公文范文 计算机图形学学习 报告 篇一:计算机图形学学习心得体会 计算机图形学学习心得体会 计算机科学与技术与技术 班 学号: 1.计算机图形学 计算机图形学(Computer Graphics, ...

  5. 计算机图形学学习报告,计算机图形学学习报告.doc

    计算机图形学学习报告 篇一:计算机图形学学习心得体会 计算机图形学学习心得体会 计算机科学与技术与技术 班 学号: 1.计算机图形学 计算机图形学(Computer Graphics,简称CG),狭义 ...

  6. 计算机专业学习规划,计算机专业学习计划.doc

    2019年计算机专业学习计划 如今在中国考研之风渐热,而计算机恐怕是最热门的专业了,对于考生来说,选一个心仪的学校,不仅仅是能够学到真实的本领,更为以后的就业奠定了基础.下面是帮大家整理的计算机专业学 ...

  7. 计算机课程学习小结,计算机课程学习心得5篇___.docx

    计算机课程学习心得5篇___ 计算机技术的进展,促进了教学媒体的开发和利用,训练资源和资料能得到共享.在教学上应用计算机,能向同学供应更多的.更现代化的科学学问和技能训练,让同学对学习有更多的选择,使 ...

  8. 速成pytorch学习——3天自动微分机制

    神经网络通常依赖反向传播求梯度来更新网络参数,求梯度过程通常是一件非常复杂而容易出错的事情. 而深度学习框架可以帮助我们自动地完成这种求梯度运算. Pytorch一般通过反向传播 backward 方 ...

  9. 黄聪:Python+NLTK自然语言处理学习(二):常用方法(similar、common_contexts、generate)...

    一.similar 用来识别文章中和搜索词相似的词语,可以用在搜索引擎中的相关度识别功能中. text1.similar("monstrous") 查询出了text1中与monst ...

最新文章

  1. NC:中国药科郝海平和郑啸发现饮食-微生物互作缓解肠损伤
  2. 使用JestClient操作ElasticSearch
  3. sts 明明导包正确却报错_这真是危险的关系,明明你错了,但是她认了!
  4. Android Weekly Notes Issue #218
  5. Git笔记(15) 远程分支
  6. linux buffer cache 过高_你真的理解Linux的内存监控吗?
  7. Compiler and Linker
  8. python批量查询IP物理地址输出到Exel
  9. MIPI CSI转TTL/LVDS/BT656/BT601/BT1120
  10. linux系统论文题目大全_计算机应用专业毕业论文题目大全选题
  11. Vue引入Froala-Editor富文本编辑器
  12. ubuntu 10.04安装 sopcast player
  13. C#实现Omron欧姆龙PLC的Fins Tcp协议[转]
  14. mongodb默认的用户名密码_MongoDB 用户名密码登录
  15. 士兵 POJ1723
  16. 2018,这一年的腾讯优图,我们总结一下!
  17. [转] 大三下,我们该做什么?
  18. 【Vue 组件化开发 三】父组件给子组件传递数据、组件通信(父传子、子传父)、父访问子(children、ref)、动态组件(is、component)
  19. 修复pd16虚拟机在big sur 的usb无法使用和无法联网问题!
  20. 《网络攻防》 MSF基础应用

热门文章

  1. 通俗易懂的Redis数据结构基础教程
  2. 蓝松短视频经验分享----抠图和动画设计
  3. [hdu5225][BC#40]Tom and permutation
  4. ADO.NET中带参数的Sql语句的陷阱
  5. CheckBox UITableViewCell
  6. NYOJ 单调递增子序列(二)
  7. Google浏览器(您的连接不是私密连接)解决方案
  8. SpringBoot运行异常时捕获
  9. Python学习之解决python下载第三方依赖速度慢的问题
  10. 如何解决ajax重复提交的问题