Python爬虫之美女图片分类
对爬取到的图片进行分类命名,下面开始了。
一、首先给出URL地址www.wmpic.me/touxiang/nvsheng
![](https://yqfile.alicdn.com/img_781fcd3b42c2237ed41839ae4a550aba.png)
二、下载图片,进行分析,并保存图片至本地,直接上代码
import requests
from bs4 import BeautifulSoup
import random
user_agent = [
'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.1; WOW64; Trident/5.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; .NET4.0C; .NET4.0E)',
'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.64 Safari/537.11',
]
Yes_or_Not = ['y','n']
def download(url,folder,count=0): #下载图片
headers = {'User-Agent':random.choice(user_agent)}
content = requests.get(url,headers=headers).content
typ = random.choice(Yes_or_Not) #机器随机选择是Y还是N
path = folder + "\\" + typ + '_'+str(count)+'.jpg' #图片格式
with open(path,'wb') as f:
f.write(content) #写入并保存图片至本地文件
base_url = 'http://www.wmpic.me/touxiang/nvsheng/page/'
count = 1
for i in range(1,10):
url = base_url + str(i) #url地址
headers = {'User_Agent':random.choice(user_agent)}
html = requests.get(url,headers=headers).text
soup = BeautifulSoup(html,'lxml') #通过BeautifulSoup的lxml方法解析html
for item in soup.select('li img'): #解析定位到li img
picture_url = item['src']
if picture_url.find('215x185') != -1: #215x185图片的宽度和高度
if count <= 300:
download(picture_url,'train_pictures',count) #保存图片至train_pictures文件夹下
print(picture_url)
count += 1
else:
download(picture_url,'test_pictures',count) #保存图片至test_pictures文件夹下
print(picture_url)
count += 1
三、运行结果
![](https://yqfile.alicdn.com/img_c5ecf8da173ac8e63113263a7aa2fbd0.png)
![](https://yqfile.alicdn.com/img_87088a847dbb30ae49f43f2a4330cc2c.png)
![](https://yqfile.alicdn.com/img_b46038a3bb18ac5d2ffe1717109e695d.png)
详细请参考(七)美女分类器
Python爬虫之美女图片分类相关推荐
- python爬虫之美女图片爬取
由于个人水平暂时有限,先写成这样,大家可以参考一下. 本教程分为两部分: 1.获取图片的路径,存储到指定的文本文件中 2.调用上述的文本,进行图片的下载 第一部分: 1.分析网页源码找到规律 框里的h ...
- python爬虫爬美女图片:“小甲鱼056节轮一只爬虫的自我修养4:OOXX” 最终更新2021.6.27日,更新后可用!!!
目录 2020.10.25日更新 代码: 2020.11.10日更新 代码 2021.6.27日更新,更新后可用 2020.10.25日更新 需要改动有两个方面: 第一方面,网址编码有变化,如http ...
- Python爬虫 | Python爬虫获取女友图片
Python爬虫 | Python爬虫获取女友图片 前言 程序说明 二次元女友获取程序 观察网页结构 页面解析 创建图片保存路径 图片下载 格式转换 爬取结果展示 完整程序 前言 (又到了常见的无中生 ...
- Python爬虫之gif图片抓取
Python爬虫之gif图片抓取 标签:图片爬虫 这几天,对于怎么去爬取图片很感兴趣,就研究了一下,图片爬虫可以说是有简单,更有复杂的,今天,我做了一个比较简单的gif的图片爬虫,仅仅学习一下怎么进行 ...
- python爬取美女图片的练习
python 爬取美女图片的练习 主要使用 xpath 定位获取 图片的链接 本次练习使用到os库 ,lmxl库 , requests库 import requests from lxml impor ...
- python抓取美女图片实例
原文链接:python抓取美女图片实例 python脚本编程,和php类似,主要是作web项目及脚本抓取图片和文章.日志分析等,python比较有名的web开发框架有Django.Tornado.we ...
- python微型爬虫获取美女图片(福利满满额)
2018.03.16 author:wills 今天介绍我觉得很有用的东西,非常有趣,那就是json格式的数据存储方式.重点当然不是这个,而是利用python进行文件的读与写. def main(): ...
- Python爬虫--获取网页图片两步走:美女图片+王者荣耀皮肤
文章目录 一.目标 1.实现当前页面的图片爬取: 2.实现二级网页下的图片爬取并分别存储 二.实现截图 二.代码 1.美女图片 2.王者荣耀皮肤 指导博客(阿里嘎多!) 一.目标 1.实现当前页面的图 ...
- 【爬虫实战】手把手教你使用python爬取美女图片
本文目录 写作缘起 上代码 思路分析 效果展示 写在最后 写作缘起 用python爬虫实现的图片资源下载器,一页页下载图片过于缓慢,当我们要欣赏一些好看的图片时一页页翻太复杂了,干脆写一个图片下载器 ...
最新文章
- Xamarin.Forms的相对布局RelativeLayout
- yarn client 提交任务
- oracle中如何调用存储过程
- java 面向对象个人理解
- 微型计算机pentium或celeron,计算机综合测试答案.doc
- java二叉树求权值_百度笔试题目:二叉树路径权值和【转】
- python画动态图-Python使用matplotlib画动态图
- ffmpeg中的sws_scale算法性能测试
- java处理excel-xlsx格式大文件的解决方案
- 树中两节点的最低公共祖先
- IntentService简介
- android 修改手机型号加点,修改Android设备信息,如修改手机型号为iPhone7黄金土豪版! -电脑资料...
- CAD/CASS插件断面图批量提取横纵断面数据(左负右正、左零开始)可附加提取桩号XY坐标(北坐标东坐标)
- vue封装常用工具类
- 我的wow血精灵圣骑士,晒晒
- Lambda表达式的几种简化形式
- 杠杆炒股亏盈计算方法?
- 1.9G的视频被压缩为64K
- 1660 super安装tensorflow1.15
- gRPC大数据量消息传递方法
热门文章
- 直播 | 平安证券Kubernetes容器集群的DevOps实践
- 买电脑时,独显和集显到底有什么区别呢?
- css布局margin介绍,深入理解css中的margin属性(推荐)
- Linux | NVMe | APST 不完全总结
- linux 优先搜索树 pst,linux – PST到PDT的变化是4月1日而不是3月11日凌晨2点?
- 瘦马- 《男人装》创办人、《时尚江湖》主讲人 | 到「在行」来约见我
- 使用personal access token进行Github认证
- python画一个心形照片墙_Python 告诉你,情人节该送什么礼物?
- 如何实现mysql自动备份_如何用脚本实现mysql自动备份?
- 【unity shader案例】如何实现一个玻璃效果