【python】词性标注结合镜像分词

>>> import jieba
>>> import jieba.posseg as pseg
>>> f = open('E:/序言.txt','r')
>>> f.read()
'美国版序言\n\n-----------------------------------\n\n\u3000\u3000目前已经有不少部哲学史了，我的目的并不是要仅仅在它们之中再加上一部。我的目的是要揭示，哲学乃是社会生活与政治生活的一个组成部分：它并不是卓越的个人所做出的孤立的思考，而是曾经有各种体系盛行过的各种社会性格的产物与成因。这一目的就要求我们对于一般历史的叙述，比通常哲学史家所做的为多。我还发觉这一点对于一般读者未必是很熟悉的那几段时期，尤其必要。经院哲学的大时代乃是十一世纪改革的产物，而这些改革又是对于前一个时期的颓废腐化的反作用。如果对于罗马灭亡与中古教权兴起之间的那几个世纪没有一些知识的话，就会难于理解十二、三世纪知识界的气氛。在处理这段时期时，正如处理其他时期一样，我的目的仅仅在于提供——就造成哲学家们的时代而言，以及哲学家们对于其形成也与有力焉的那些时代而言，——我认为是若想对哲学家有同情的理解时，有必要加以叙述的一般历史。\n 这种观点的后果之一就是：它给予一个哲学家的地位，往往并不就是他的哲学的优异性所应得的地位。例如，就我来说，我认为斯宾诺莎是比洛克更伟大的哲学家，但是他的影响却小得多；因此我处理他就要比处理洛克简略得多。有些人——例如卢梭和拜伦——虽然在学术的意义上完全不是什么哲学家，但是他们却是如此深远地影响了哲学思潮的气质，以致于如果忽略了他们，便不可能理解哲学的发展。就这一方面而论，甚至于纯粹的行动家们有时也具有很大的重要性；\n 很少哲学家对于哲学的影响之大是能比得上亚力山大大帝、查理曼或者拿破仑的。莱库格斯如果确有其人的话，就更是一个显著的例子了。\n 企图包罗的时期既然是如此之广，就必须要有大刀阔斧的选择原则。我读过一些标准的哲学史之后，得到了这样一个结论：过分简短的叙述是不会给读者以什么有价值的东西的；因此我就把那些我以为似乎不值得详尽处理的人物（除了极少数的例外）完全略过不提。在我所讨论的人物中，我只提到看来是与他们的生气以及他们的社会背景有关的东西；有时候，我甚至于把某些本身无关重要的细节也记录下来，只要我认为它们足以说明一个人或者他的时代。\n 最后，对研究我的庞大题材中的任何一部分的专家们，我还该说几句辩解的话。关于任何一个哲学家，我的知识显然不可能和一个研究范围不太广泛的人所能知道的相比。我毫不怀疑，很多人对于我所述及的任何一个哲学家，——除了莱布尼兹之外——都比我知道得多。然而，如果这就成为应该谨守缄默的充分理由，那末结果就会没有人可以论述某一狭隘的历史片断范围以外的东西了。斯巴达对于卢梭的影响、柏拉图对于十三世纪以前基督教哲学的影响、奈斯脱流斯教派①对于阿拉伯人以及从而对于阿奎那的影响、自从伦巴底诸城的兴起直到今天为止圣安布洛斯对于自由主义的政治哲学的影响，这都是一些只有在一部综合性的历史著作里才能处理的题材。根据这些理由，我要求发现我对于自己题目中某些部分的知识显得不足的读者们鉴谅，如果不需要记住“时间如飞车”的话，我在这些方面的知识本来是会比较充分的。\n 本书得以问世要归功于巴恩斯（AlbertC．Barnes）博士，原稿是为宾夕法尼亚大学的巴恩斯基金讲座而写的，其中有一部分曾讲授过。\n 正如在最近十三年以来我的大部分工作一样，我的妻子巴特雷西亚·罗素在研究方面以及在许多其他方面都曾大大地帮助过我。\n \n 伯特兰·罗素'

----------------------------------------

>>> def fuc():
... for w in words:
... return(w.word,w.flag)
...
>>> s = fuc()
>>> print(s)
None

>>>

-----------------------------------------

>>> def fuc():
... f = open('E:/序言.txt','r').read()
... words = pseg.cut(f)
... for w in words:
... return(w.word,w.flag)
...
>>> print(fuc)
<function fuc at 0x00000138AC568598>
>>> print(fuc())
('美国版', 'nz')
>>> d = fuc()
>>> print(d)
('美国版', 'nz')

>>>

--------------------------------------------

-------------------------------------------------------

>>> def fuc():
...   f = open('E:/序言.txt','r').read()
...   words = pseg.cut(f)
...   l = []
...   for w in words:
...     l.append((w.word,w.flsg))
...   for e in l:
...     return(e[0],e[1])
...
>>>

------------------------------------------------------

>>> def fuc():
...   f = open('E:/序言.txt','r').read()
...   words = pseg.cut(f)
...   for w in words:
...     x = w.word
...     y = w.flag
...     return(x,y)
...
>>> print(fuc())
('美国版', 'nz')
>>> fuc()
('美国版', 'nz')
>>>

-----------------------------------------------------

>>> def fuc():
...   l = []
...   f = open('E:/序言.txt','r').read()
...   words = pseg.cut(f)
...   for w in words:
...     x = w.word
...     y = w.flag
...     l.append((x,y))
...   return(l)
...
>>> s = fuc()
>>> print(s)

--------------------------------------------------------------

问题来了，怎么一句一句的，读取

>>> for e in s:
... print(e[0],e[1])
...
美国版 nz
序言 n

---------------------------------------------

排列到一条= =，怎么这么困难呢，菜鸟飞

【python】词性标注结合镜像分词相关推荐

基于Python实现的词典分词方法或统计分词方法
资源下载地址:https://download.csdn.net/download/sheziqiong/85787813 资源下载地址:https://download.csdn.net/downl ...
python用jieba进行分词并可视化
python用jieba进行分词并可视化 import jieba import pandas as pd import matplotlib.pyplot as plt txt = open(&qu ...
python openCV 实现镜像翻转flip()
python openCV 实现镜像翻转flip() 文章目录: 一.基本认知二.代码实现一.基本认知图像的几何变换是指在不改变图像像素值的前提下对图像像素进行空间几何变换. 常见的几何变换有: ...
python pip配置镜像源：douban不能下载aliyun可以下载
python pip配置镜像源:douban不能下载aliyun可以下载 [global] timeout = 6000 index-url = https://mirrors.aliyun.com/ ...
结巴分词python安装_“结巴”分词：做最好的Python分词组件
python 结巴分词学习 https://www.toutiao.com/a6643201326710784520/ 2019-01-06 10:14:00 结巴分词(自然语言处理之中文分词器) j ...
Python pip 修改镜像源为豆瓣源的两种方法
Python pip 修改镜像源为豆瓣源常常遇到 pip 装包时速度过慢或者无法安装(请求超时)等问题,这个时候你就需要考虑一下给 pip 换源了一.临时的方法参数如下 -i https://p ...
python提取高频词_cygwin下用Python+jieba给文本分词并提取高频词
本文信息本文由方法SEO顾问发表于2015-05-3023:05:55,共 2000 字,转载请注明:cygwin下用Python+jieba给文本分词并提取高频词_[方法SEO顾问],如果我网站的文 ...
Python修改pip镜像源为国内镜像源（永久方法）
文章目录 Python修改pip镜像源为国内镜像源(永久方法) 01. 更换为国内镜像源 02. 将镜像源设置为信任写在最后的话: 这里是一段防爬虫文本,请读者忽略. 本文原创首发于CSDN,作者I ...
1. python快速下载镜像
python快速下载镜像 npm.taobao.org/mirrors/python/ 这是淘宝的镜像,可以实现快速下载!

【python】词性标注结合镜像分词

【python】词性标注结合镜像分词相关推荐

最新文章

热门文章