链表
-sent1=['Call','me','Ishmael','.']
  这个方括号内的东西在Python中叫做链表(list,也叫做列表),他就是我们存储文本的方式。
  我们可以对链表使用加法运算,创造一个新的链表。
  也可以对链表进行追加操作。sent1.append("Some")
索引列表
-使用数字位置索引text4[173]
-使用index,返回第一次出现的索引。text4.index('awaken')
-切片:子链表。从大文本中任意抽取语言片段,术语叫做切片。
 text5[16715:16735],text6[1600:1625],sent[:3],text2[141525:]
 text[m:n]指的是从m到n-1
变量
-变量名命名规则:开头由字母开始,总体可以有数字、下划线组成。大小写敏感。在排序中,大写字母总是出现在小写字母之前。
字符串
-给字符串赋值,name='Monty',可以通过下标单独访问name[0]
-乘法和加法操作,name*2,name+'!'
-链表连接组成单个字符串,''.join(['Monty','Python']),最终效果为'Monty Python'
-字符串分割操作'Monty Python'.split()

转载于:https://www.cnblogs.com/createMoMo/archive/2013/05/14/3078336.html

【语言处理与Python】1.2将文本当作词链表相关推荐

  1. 《Python自然语言处理》——第1章 语言处理与Python 1.1 语言计算:文本和词汇...

    本节书摘来自异步社区<Python自然语言处理>一书中的第1章,第1.1节,作者[美]Steven Bird,Ewan Klein,Edward Loper, 陈涛,张旭,崔杨,刘海平 译 ...

  2. 《用Python进行自然语言处理》第 1 章 语言处理与 Python

    1. 将简单的程序与大量的文本结合起来,我们能实现什么? 2. 我们如何能自动提取概括文本风格和内容的关键词和短语? 3. Python 编程语言为上述工作提供了哪些工具和技术? 4. 自然语言处理中 ...

  3. python与excel结合能做什么-Python网络爬虫与文本数据分析

    原标题:Python网络爬虫与文本数据分析 课程介绍 在过去的两年间,Python一路高歌猛进,成功窜上"最火编程语言"的宝座.惊奇的是使用Python最多的人群其实不是程序员,而 ...

  4. Python语言学习:Python常用自带库(imageio、pickle)简介、使用方法之详细攻略

    Python语言学习:Python常用自带库(imageio.pickle)简介.使用方法之详细攻略 目录 imageio简介及其常见使用方法 pickle简介及其常见使用方法 简介 使用方法 简介及 ...

  5. 【Python 自然语言处理 第二版】读书笔记1:语言处理与Python

    文章目录 前言 语言处理与Python 一.语言计算:文本和单词 1.NLTK入门 (1)安装(nltk.nltk.book) (2)搜索文本 (3)词汇计数 2.列表与字符串 (1)列表操作 (2) ...

  6. object如何转换为int_如何使用Python将语音转换为文本

    语音识别是计算机软件识别口语中的单词和短语,并将其转换为可读文本的能力.那么如何在 Python 中将语音转换为文本?如何使用 SpeechRecognition 库在 Python 中将语音转换为文 ...

  7. Python源代码文件的文本编码

    Python源代码文件的文本编码 源代码的编码问题对于任何语言的源文件都是存在的,只不过对于脚本语言,这个问题更突出一些. 有的人可能会说,既然源代码在文本编辑器中可以正常显示,说明编码没有问题,编辑 ...

  8. python文件都是脚本吗_脚本语言系列之Python | Python文件IO

    Python是做自动化工作首选的一门语言,与更复杂的语言相比,Python 非常便于快速学习.语法很少,具有良好的 可读性,即使测试工程师们没有丰富的编码经验,也能快速学会:Python 的极简风格对 ...

  9. 《Python自然语言处理(第二版)-Steven Bird等》学习笔记:第01章 语言处理与Python

    第01章 语言处理与Python 1.1 语言计算:文本和单词 Python入门 NLTK 入门 搜索文本 计数词汇 1.2 近观Python:将文本当做词链表 链表(list,也叫列表) 索引列表 ...

最新文章

  1. 细鹏系列裸金属服务器多核算力,鲲鹏凌云,开启多元计算新架构_外发版(40页)-原创力文档...
  2. 莫烦老师的tensorflow降级方法
  3. vs2015 ctrl 单击 转到定义
  4. SAP Hybris的build callback和SAP ABAP的SGEN事务码
  5. MSN Messenger终于好使了
  6. sql 注入神器sqlmap 源码分析之调试sqlmap
  7. P6242-[模板]线段树3【吉司机线段树】
  8. 流言终结者——C语言内存管理
  9. python解释器的工作原理_Python GIL全局解释器锁详解(深度剖析)
  10. thinkphp中的__DIR__ __ROOT__ __APP__ __MODULE__ APP_PATH LIB_PATH MODULE_PATH 等是在哪里定义的?...
  11. 【练习8.7】cvGoodFeaturesToTrack确定图像强角点、cvFindCornerSubPix亚像素级角点检测...
  12. Hvv近期0day总结五
  13. 反编译工具Luyten地址
  14. c语言除法计算和取模计算
  15. 小白入门必学——时间复杂度
  16. ssm项目实战------------OA管理项目
  17. 问题 K: [入门OJ]开会时间(初中生请多多指教)
  18. ccf 命令行选项 java,DiskPart 命令行选项
  19. ECCV2022 | 生成对抗网络GAN论文汇总(图像转换-图像编辑-图像修复-少样本生成-3D等)...
  20. Typora 0.11.18版不能使用:This beta version of Typora is expired, please download and install a newe

热门文章

  1. java的内存管理机制
  2. POJ 2186 挑战 --牛红人 强连通分量——Tarjan
  3. Eclipse 工作目录被破坏,导致Eclipse 打不开
  4. KR C 传统C语言的函数定义
  5. (032) Linux之shell流控制for循环
  6. 《软件架构师的12项修炼》读书笔记-技术之天花板
  7. mysql主从同步单个表实验记录
  8. 附加数据库失败,版本为655,此服务器支持611及更低版本。不支持降级路径。...
  9. 论面向对象方法与软件复用关系-z
  10. J2EE后台UI系统框架搭建-EXTJs使用(4.1 GPL版本)