输入数据:身份证号码


# -*- coding:utf-8*-
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
import time
import requests
from lxml import etree
time1=time.time()
import pandas as pddf = pd.read_csv('F:/shen.txt', sep='\t', header=None, dtype=str, na_filter=False)
print df
idcard=[]
sex1 = []
birthday1 = []
address1 = []length=len(df)
for i in range(0,length):try:print df.iloc[i,0]idcard.append(df.iloc[i,0])url="http://qq.ip138.com/idsearch/index.asp?action=idcard&userid="+df.iloc[i,0]+"&B1=%B2%E9+%D1%AF"html=requests.get(url).contentselector=etree.HTML(html)sex=selector.xpath('//td[@class="tdc2"][1]/text()')for each in sex:print eachsex1.append(each)birthday=selector.xpath('//td[@class="tdc2"][2]/text()')for each in birthday:print eachbirthday1.append(each)address=selector.xpath('//td[@class="tdc2"][3]/text()')for each in address:print eachaddress1.append(each)except Exception, ex:print Exception, ":", exdata=pd.DataFrame({'idcard':idcard,'sex':sex1,'birthday':birthday1,'address':address1})
print (data)
pd.DataFrame.to_excel(data,"F:\\person_card.xlsx",header=True,encoding='gbk',index=False)
time2=time.time()
print u'ok,爬虫结束!'
print u'总共耗时:'+str(time2-time1)+'s'

【python 爬虫】身份证归属地爬虫相关推荐

  1. python简单爬虫手机号_python手机号前7位归属地爬虫代码实例

    需求分析 项目上需要用到手机号前7位,判断号码是否合法,还有归属地查询.旧的数据是几年前了太久了,打算用python爬虫重新爬一份 单线程版本 # coding:utf-8 import reques ...

  2. Python网络爬虫学习实战:爬虫快速入门

    很多同学私信问爬虫的相关教程,想了想,还是专门跟大家出些Python爬虫学习相关的教程,从零开始阐述如何编写Python网络爬虫,以及网络爬虫中容易遇到的问题,比如具有反爬加密的网站,还有爬虫拿不到数 ...

  3. python urllib post请求_python爬虫(五)_urllib2:Get请求和Post请求

    本篇将介绍urllib2的Get和Post方法,更多内容请参考:python学习指南 urllib2默认只支持HTTP/HTTPS的GET和POST方法 urllib.urlencode() urll ...

  4. Python实现信息自动配对爬虫排版程序(附下载)

    授权自AI科技大本营(ID:rgznai100) 本文约2800字,建议阅读7分钟. 本文为你介绍Python实现信息自动配对爬虫排版程序. 公众号(DatapiTHU)后台回复"20200 ...

  5. python爬虫图片-如何用Python来制作简单的爬虫,爬取到你想要的图片

    原标题:如何用Python来制作简单的爬虫,爬取到你想要的图片 在我们日常上网浏览网页的时候,经常会看到一些好看的图片,我们就希望把这些图片保存下载,或者用户用来做桌面壁纸,或者用来做设计的素材. 我 ...

  6. Python 网络爬虫 001 (科普) 网络爬虫简介

    Python 网络爬虫 001 (科普) 网络爬虫简介 1. 网络爬虫是干什么的 我举几个生活中的例子: 例子一: 我平时会将 学到的知识 和 积累的经验 写成博客发送到CSDN博客网站上,那么对于我 ...

  7. python爬虫开发环境_python爬虫开发教程下载|Python爬虫开发与项目实战(范传辉 著)pdf 完整版_ - 极光下载站...

    Python爬虫开发与项目实战pdf扫描版下载.Python爬虫开发是一个Pthyon编程语言与HTML基础知识引领读者入门知识,重点讲述了云计算的相关内容及其在爬虫中的应用,进而介绍如何设计自己的爬 ...

  8. python爬虫基础(一)~爬虫概念和架构

    目录 1. 爬虫 1.1 概念 1.2 分类 2. 爬虫架构 2.1 url管理器 2.2 网页(html)下载(download)器 2.2.1 urllib下载html源码 2.2.2 reque ...

  9. python爬虫自学路线_python 爬虫学习路线:从入门到进阶

    大家好,我是凉拌 今天给大家详解一下我的爬虫学习路线. 对于小白来说,爬虫可能是一件非常复杂.技术门槛很高的事情.比如有的人则认为先要掌握网页的知识,遂开始 HTML\CSS,结果入了前端的坑,浪费了 ...

最新文章

  1. R语言dataframe数据列中的缺失值NA的个数统计实战:特定数据列的NA值统计、所有特征的NA值统计
  2. shutter 无法设置快捷键的解决方法
  3. python atm作业详解_python day4 作业 ATM
  4. 网络虚拟化技术(一): linux网络虚拟化,网络虚拟化技术(一): Linux网络虚拟化...
  5. JavaScript模态对话框类(拖拽时动画)
  6. 互联网+工业,从哪里开始?
  7. POJ-2262 Goldbach's Conjecture
  8. Spring、Ibatis结合MySQL数据库的使用方法
  9. 创建显示特殊文档的视图:$FormulaClass的奥秘
  10. 贪吃蛇(C语言实现)
  11. UE4 蓝图切换玩家控制
  12. 年会抽奖----java
  13. 计算机磁盘空间分区管理,还在用Win10自带磁盘管理? 这款软件轻松管理分区!...
  14. 俺博士三年的一点体会
  15. 【NoteBook】莫瑞亚(Ash Maurya):精益创业实战(一、二部分)
  16. 汇编达人视频学习4(MOVS、STOS、REP、PUSH、POP、JMP、CALL、RET指令)
  17. HEIC图片如何批量转换成jpg格式
  18. 20200322零基础入门数据挖掘 - 二手车交易价格预测笔记(2)
  19. Java小白修炼手册--第二阶段Java SE--IO流
  20. ML:阿里云计算平台之搜索推荐演讲分享《多场景智能推荐助力业务增长》、《阿里云智能推荐应用实践:PAI-EasyRec Framework》、《新一代数仓架构漫谈》

热门文章

  1. 云天售后服务软件-手机APP介绍
  2. -- 7、查询学过“张三“老师授课的同学的信息
  3. 软件工具:ubuntu adb shell无法识别设备
  4. 布鲁克斯法则解释及论证
  5. 如何使用Azure的托管MariaDB
  6. 产品ajax无刷新kesion,科讯商业版中用到的ajax空间与分页函数
  7. AndroidManifest.xml详解(转)
  8. 制作一个含文字和图片的轮播图
  9. Python_OOP1
  10. 整理:ACM相关好的网站 OJ Blog (不断更新)