代码也是在网上找的,效率挺不错的,特别适合字典文件的去重

#coding=utf-8

import sys

def open_txt(): #打开TXT文本写入数组

try:

xxx = file(sys.argv[1], 'r')

for xxx_line in xxx.readlines():

passlist.append(xxx_line)

xxx.close()

except:

return 0

def write_txt(): #打开TXT文本写入数组

try:

yyy = file(sys.argv[2], 'w')

for i in list_passwed:

yyy.write(i)

yyy.close()

except:

return 0

global passlist #声明全局变量

passlist = [] #用户名:anonymous 密码为空

open_txt() #TXT导入数组

#passlist = list(set(passlist)) #python 列表去重

global list_passwed #列表去重,不打乱原来的顺序

list_passwed=[]

for i in passlist:

if i not in list_passwed:

list_passwed.append(i)

write_txt()

python 读取TXT到数组 列表去重,不打乱原来的顺序

####################################################################

#qq:316118740

#BLOG:http://hi.baidu.com/alalmn

# python 读取TXT到数组 列表去重,不打乱原来的顺序

# 刚学写的不好请大家见谅

####################################################################

def open_txt(): #打开TXT文本写入数组

try:

infile = file('admin.txt', 'r')

xxx = file('admin.txt', 'r')

for xxx_line in xxx.readlines():

passlist.append(xxx_line)

xxx.close()

except:

return 0

def list_del(): #清空list列表

try:

i = 0 #得到list的第一个元素

while i < len(passlist):

del passlist[i]

del list_passwed[i]

except:

return 0

######################################

global passlist #声明全局变量

passlist = [] #用户名:anonymous 密码为空

www_cj(www) #域名拆解

open_txt() #TXT导入数组

#passlist = list(set(passlist)) #python 列表去重

global list_passwed #列表去重,不打乱原来的顺序

list_passwed=[]

for i in passlist:

if i not in list_passwed:

list_passwed.append(i)

###################################### 遍历数组组合出 密码

I1 = 0 #得到list的第一个元素

while I1 < len(list_passwed):

print "WWWWWWWWWWW",I1

if I1==len(list_passwed):

break #退出循环

I2 = 0 #得到list的第一个元素

while I2 < len(list_passwed):

print "1111:",list_passwed[I1],"2222:",list_passwed[I2]

I2 = I2 + 1 #二层

I1 = I1 + 1 #一层

######################################

补充

# -*- coding: utf-8 -*-

'''

只使用与较小的文件,比较大的文件运行时间长

'''

def quchong(infile,outfile):

infopen = open(infile,'r',encoding='utf-8')

outopen = open(outfile,'w',encoding='utf-8')

lines = infopen.readlines()

list_1 = []

for line in lines:

if line not in list_1:

list_1.append(line)

outopen.write(line)

infopen.close()

outopen.close()

quchong("源文件路径","目标文件路径")

本文实例讲述了python读取TXT到数组及列表去重后按原来顺序排序的方法。分享给大家供大家参考。

python去重且顺序不变_python实现文本去重且不打乱原本顺序相关推荐

  1. java 大数据文本去重_python实现文本去重且不打乱原本顺序

    摘要:这篇Python开发技术栏目下的"python实现文本去重且不打乱原本顺序",介绍的技术点是"Python实现.Python.文本去重.去重.顺序.文本" ...

  2. hashset去重原理_基于simhash的文本去重原理

    互联网网页存在着大量重复内容,必须有一套高效的去重算法,否则爬虫将做非常多的无用功,工作时效性无法得到保证,更重要的是用户体验也不好.业界关于文本指纹去重的算法众多,如 k-shingle 算法.go ...

  3. python字符串去重保持原顺序_python实现文本去重且不打乱原本顺序

    代码也是在网上找的,效率挺不错的,特别适合字典文件的去重 #coding=utf-8 import sys def open_txt(): #打开TXT文本写入数组 try: xxx = file(s ...

  4. python去重且顺序不变_Python中list去重且保持原顺序不变的方法

    1.list去重,顺序乱掉 l1 = ['b','c','d','b','c','a','a'] l2 = list(set(l1)) print l2 另一种写法: l1 = ['b','c','d ...

  5. python 英语词频统计软件_Python数据挖掘——文本分析

    作者 | zhouyue65 来源 | 君泉计量 文本挖掘:从大量文本数据中抽取出有价值的知识,并且利用这些知识重新组织信息的过程. 一.语料库(Corpus) 语料库是我们要分析的所有文档的集合. ...

  6. python词频统计完整步骤_Python中文文本分词、词频统计、词云绘制

    本文主要从中文文本分词.词频统计.词云绘制方面介绍Python中文文本分词的使用.会使用到的中文文本处理包包括:wordcloud,jieba,re(正则表达式),collections. 1 准备工 ...

  7. python英文字符频率统计_python统计文本字符串里单词出现频率的方法

    本文实例讲述了python统计文本字符串里单词出现频率的方法.分享给大家供大家参考.具体实现方法如下: # word frequency in a text # tested with Python2 ...

  8. python写入文件没反应_python写入文本 如何用python将变量及其值写入文本文件?...

    如何用python将变量及其值写入文本文件?直到今天,你依然是小编拒绝别人的原因,其实小编也没有在等你,小编就是无法喜欢上别人而已. python中中的字典怎么写入文本文件? {('dsaa', 'd ...

  9. python输出到语音播放_python将文本转化成语音并播放

    一.问题 在学习的过程中,我们会涉及到将文本信息,转化成语音的过程,比如:我爬取了一个小说的网站,我要将里面的内容进行语音处理. 目前能够进行语音的方法还是很多,比如win32com,百度ai. 二. ...

  10. python怎么变成竖行_python 处理文本 列变成行

    输入转成字典会把?随便写个e68a8462616964757a686964616f31333337616538横着输出的简单函数.#encoding=utf-8 #!/usr/bin/env pyth ...

最新文章

  1. 26QTimer定时器的使用
  2. 【Win32API】SendInput ERROR_BUSY 错误原因
  3. 2018中国互联网企业100强揭晓!阿里巴巴名列榜首
  4. 关于Linux的修复(重新引导)
  5. vant自定义二级菜单
  6. sqlserver 导入/导出Excel
  7. 转.h和.cpp文件的区别
  8. Coursera自动驾驶课程第9讲:Visual Features Detection Description and Matching
  9. C语言课后习题(7)
  10. Qt总结之六:QPaintEvent绘制雷达图
  11. C语言:判断三角形是否为直角三角形
  12. 解压文件win10自动删除
  13. linux基于i2c-tools快速搭建设备读写环境
  14. lammps教程:group命令详解
  15. Python常用模块库
  16. How to compile a node file?如何编译一个节点文件?
  17. Vue Mapbox 发布高德瓦片地图
  18. 【VM】权限不足,无法访问文件
  19. 芯旺微 CHIPON 32位机GPIO使用,以KF32A156 IO口的基本使用为例
  20. March 4 2017 Week 10 Saturday

热门文章

  1. 数字信号处理(1)- 频谱分析
  2. php解析乱码字符串,php中文字符串截取方法防止乱码解析
  3. 安装kafka+golang操作kafka
  4. web前端开发基础入门教程之HTML5 浏览器支持
  5. 使用360优化修复系统后导致无法上网 维护笔记
  6. ppt —— 矢量图标库
  7. oracle基本操作语句大全
  8. 隐藏IP地址的三种方法
  9. 深度学习面试题之LSTM补充
  10. UG NX重用库汉化版本