利用Python爬唯一图库网上的漂亮妹子图

写在前面

学习了很多Python知识,敲写了千万行代码,感觉学Python语言太枯燥乏味了。但是呢,本着美女是学习动力的第一原则,啊哈哈。写个程序把妹子们都下载下来吧。
今天咱们就利用Python爬取唯一图库(http://www.mmonly.cc/mmtp/)上的漂亮的妹子图,给大家一波福利。O(∩_∩)O。

福利时刻

妹子图片质量整体上还是不错呦,放三张不同风格的图大家感受下,O(∩_∩)O哈哈~

爬取结果

程序框架

import urllib.request
from bs4 import BeautifulSoup
import osdef Download(url,picAlt,name):
...
def run(targetUrl, beginNUM ,endNUM):
...if beginNUM ==endNUM
...
if __name__ == '__main__':

程序思路

  1. 群定目标网站
  2. 提取该网页的HTML代码
  3. 运用BeautifulSoup获取想要的内容
  4. 保存数据

程序步骤

  • (1)确定目标网站:http://www.mmonly.cc/mmtp
  • (2)分析该网页的HTML代码
  • (3)运用BeautifulSoup获取内容
  • (4)保存数据

程序实现

该程序利用Beautiful Soup实现的,它其实是Python的一个库,主要功能是从网页抓取数据,可参考这篇详细文章(https://cuiqingcai.com/1319.html/comment-page-1#comments)
安装Beautiful Soup

pip install beautiful soup4

导包

from bs4 import BeautifulSoup

建立保存路径

def Download(url,picAlt,name):path = 'D:\\pythonD爬虫妹子图\\'+picAlt+'\\'if not os.path.exists(path):os.makedirs(path)urllib.request.urlretrieve( url, '{0}{1}.jpg'.format(path, name))

完整代码如下

import urllib.request
from bs4 import BeautifulSoup
import osdef Download(url,picAlt,name):path = 'D:\\pythonD爬虫妹子图\\'+picAlt+'\\'if not os.path.exists(path):os.makedirs(path)urllib.request.urlretrieve( url, '{0}{1}.jpg'.format(path, name)) header = {"User-Agent":'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.116 Safari/537.36','Accept': '*/*','Accept-Language': 'en-US,en;q=0.8','Cache-Control': 'max-age=0','Connection': 'keep-alive'}def run(targetUrl, beginNUM ,endNUM):req = urllib.request.Request(url=targetUrl,headers=header)response = urllib.request.urlopen(req)html = response.read().decode('gb2312','ignore')soup = BeautifulSoup(html, 'html.parser')Divs = soup.find_all('div',attrs={'id':'big-pic' })nowpage = soup.find('span',attrs={'class':'nowpage'}).get_text()totalpage= soup.find('span',attrs={'class':'totalpage'}).get_text()if beginNUM ==endNUM :returnfor div in Divs:beginNUM = beginNUM+1if div.find("a") is None :print("没有下一张了")returnelif div.find("a")['href'] is None or div.find("a")['href']=="":print("没有下一张了None")returnprint("下载信息:总进度:",beginNUM,"/",endNUM," ,正在下载套图:(",nowpage,"/",totalpage,")")if int(nowpage)<int(totalpage):nextPageLink ="http://www.mmonly.cc/mmtp/qcmn/" +(div.find('a')['href'])elif int(nowpage)==int(totalpage):nextPageLink = (div.find('a')['href'])picLink = (div.find('a').find('img')['src'])picAlt = (div.find('a').find('img'))['alt']print('下载的图片链接:',picLink)print('套图名:[ ', picAlt , ' ] ')print('开始下载...........')Download(picLink,picAlt, nowpage)print("下载成功!")print('下一页链接:',nextPageLink)run(nextPageLink,beginNUM ,endNUM)returnif __name__ == '__main__':targetUrl ="http://www.mmonly.cc/mmtp/qcmn/237269.html"run(targetUrl,beginNUM=0,endNUM=70)print(" OVER")

利用Python爬虫唯一图库网上的漂亮妹子图相关推荐

  1. python 爬虫爬取煎蛋网妹子图,我1T的硬盘装满了!

    前言 大家好,这里是「brucepk」爬虫 系列教程.此系列教程以实例项目为材料进行分析,从项目中学习 python 爬虫,跟着我一起学习,每天进步一点点. 煎蛋网站 image 很多朋友都反应学 p ...

  2. 利用Python爬虫网上的漂亮妹子图

    最近学完Python,写了几个爬虫练练手,网上的教程有很多,但是有的已经不能爬了,主要是网站经常改,可是爬虫还是有通用的思路的,即下载数据.解析数据.保存数据.下面一一来讲. 1.下载数据 首先打开要 ...

  3. Python爬虫 - 抓取divnil动漫妹子图

    目标网站 https://divnil.com 首先看看这网站是怎样加载数据的; 打开网站后发现底部有下一页的按钮,ok,爬这个网站就很简单了; 我们目标是获取每张图片的高清的源地址,并且下载图片到桌 ...

  4. Python爬虫-教抓取动漫妹子图

    目标网站 https://divnil.com 首先看看这网站是怎样加载数据的; 打开网站后发现底部有下一页的按钮,ok,爬这个网站就很简单了; 我们目标是获取每张图片的高清的源地址,并且下载图片到桌 ...

  5. 手把手教你利用 python 爬虫分析基金、股票

    手把手教你利用 python 爬虫分析基金.股票 文章目录 手把手教你利用 python 爬虫分析基金.股票 第一步:基金数据爬取 第二步:股票增持计算 第三步:好股基金选取 桌面程序 exe 从前大 ...

  6. python爬虫怎么赚钱-个人利用Python爬虫技术怎么挣钱-10万被动收入...

    我利用Python爬虫技术年挣10万被动收入的方式,在正式聊Python爬虫技术之前,先来说说挣钱的事,说说作为一个自由职业或兼职者怎么利用爬虫来挣钱. 个人爬虫挣钱方法大致如下 爬虫技术挣钱方法1: ...

  7. python爬虫赚钱的经历-个人利用Python爬虫技术怎么挣钱-10万被动收入

    我利用Python爬虫技术年挣10万被动收入的方式,在正式聊Python爬虫技术之前,先来说说挣钱的事,说说作为一个自由职业或兼职者怎么利用爬虫来挣钱. 个人爬虫挣钱方法大致如下 爬虫技术挣钱方法1: ...

  8. 02-分享:个人利用 Python 爬虫技术怎么挣钱-1万被动收入

    你好,我是悦创. 今天我来分享一篇,猿人学的文章.原文链接:https://www.yuanrenxue.com/crawler/earn-money-python-crawler.html 我利用 ...

  9. python爬虫怎么赚钱-个人利用Python爬虫技术怎么挣钱-10万被动收入

    我利用Python爬虫技术年挣10万被动收入的方式,在正式聊Python爬虫技术之前,先来说说挣钱的事,说说作为一个自由职业或兼职者怎么利用爬虫来挣钱. 个人爬虫挣钱方法大致如下 爬虫技术挣钱方法1: ...

最新文章

  1. 二次创业成功人士的19个经验与教训
  2. 1.8 分割字符串(spilt())
  3. IOS遍历未知对象属性、函数
  4. 为静态博客生成器WDTP移植了一款美美哒主题
  5. Java反梯形图案_梯形法求定积分(一)设计梯形法求积分的类模板,梯形法
  6. 非阻塞线程安全列表——ConcurrentLinkedDeque应用举例
  7. activex控件 新对象 ocx 初始化_Office已经支持64位的树控件Treeview了
  8. 【Java】探究Java数组的本质
  9. VB获取快捷方式原文件路径
  10. 【LeetCode】124. Binary Tree Maximum Path Sum
  11. 国内主流短信验证码平台收费价格对比「一」:阿里云、梦网云通讯、容联云通讯、互亿无线
  12. LaTeX数学公式 合集
  13. 【网络】4G、5G频段汇总
  14. MyScript基础功能
  15. java读取目录下所有txt_java读取同目录下的txt文件
  16. Java实现CCF/CSP 201312-2 ISBN编号(零分!!!
  17. 回归分析中f多少合适_spss回归分析F值很大,有100多,这样合理吗
  18. PC端浏览器如何设置无图模式
  19. vue的进阶v-on 事件
  20. #P00603. 倒水

热门文章

  1. 概率论-随机变量的数字特征
  2. js的对象和java的类的简单区别
  3. 【用户行为研究】产品思维下的明星与网友
  4. 嵌入式软件设计(定时器中断)
  5. Docker安装制作
  6. java 复杂报表_Java报表比较之中国式报表(复杂报表)篇
  7. 如何选择一套适合你的办公系统?泛微国内专业OA系统,其中E-office和E-cology的区别了解下
  8. 蓝桥杯 试题 历届试题 小数第n位(同余公式模板
  9. 面试之抽象类和接口的区别
  10. android手机赚钱软件排行2014-05-08更新