Python 爬取图虫网图片
参考网址:https://www.cnblogs.com/baijifeilong/p/3708198.html
爬取图虫网上关于墨镜的照片
图虫网搜索墨镜之后的网址
https://stock.tuchong.com/search?source=tc_pc_home_search&term=“墨镜”
然后通过urllib 获取页面html的文本,对文本进行分析 发现文本中只有图片的ID
从网页中打开图片链接 发现链接规律为
由此 发现图片的URL可以使用
urllib.request.urlretrieve 获取图片
代码如下:
import re, os, time
import urllib.parse
import urllib.requestdef getHtml(url):#取得网页的html纯文本return urllib.request.urlopen(url).read().decode('utf-8')if __name__ == '__main__':print('---图虫图片抓取器---')for n in range(1, 51):pageNo = nprint(pageNo)folder = savepath+str(pageNo)if not os.path.exists(folder):os.makedirs(folder)#url汉字编码处理url = 'https://stock.tuchong.com/search?source=tc_pc_home_search&term={}&page={}'.format(urllib.parse.quote('墨镜'), str(pageNo))#获取页面HTML文本html = getHtml(url)x = 0pattern = re.compile(r'\d+')match = pattern.findall(html)num = len(match)for i in range(num):if len(match[i])>15:print(match[i])imageurl = "http://p1.pstatp.com/weili/m/"+match[i]+".webp"urllib.request.urlretrieve(imageurl,folder+'\\%s.jpg'%x)x+=1print("第 "+str(pageNo)+" 下载结束")print('下载结束。')
Python 爬取图虫网图片相关推荐
- python爬取图虫网图片
网站:https://stock.tuchong.com/ 打开调试工具发现如下关键代码 代码: import urllib.request import osdef url_open(url):re ...
- 教你用Python爬取图虫网
TuChong_Spider (新手爬虫项目大牛勿喷) 偶然的机会在抖音看到这个APP,发现有很多高质量的手机壁纸和图片,对于一个爬虫初学者,这就非常美滋滋了,好多欧美小姐姐啊,哎嘿嘿.... 图虫网 ...
- 十一、练习:爬取图虫网付费图片
十.练习:爬取图虫网免费图片 今天爬下图虫网付费的图片,比之前的免费图片简单. 这里的付费图片都是一个专辑的 这个我在一个公开课听的,说这个是:https://tuchong.com/rest/tag ...
- 利用python爬取qq个性网图片
利用python爬取qq个性网图片 网站头像布局大同小异,稍改代码即可爬取想要的头像. 不多bb,上代码. import requests from parsel import Selector im ...
- python作品_Python爬取图虫网摄影作品
准备 要爬的网站是图虫网 工具:python 2.7,BeautifulSoup4 注意:BeautifulSoup4为第三方类库,如果在cmd下用pip安装报错,可直接去官网下载,解压后拷贝到pyt ...
- python3爬虫-通过requests爬取图虫网
import requests from fake_useragent import UserAgent from requests.exceptions import Timeout from ur ...
- python爬图代码实例_Python爬虫爬取煎蛋网图片代码实例
这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...
- Python爬取不羞涩网小姐姐图片——BeautifulSoup应用
引言 今年提倡原地过年,相信很多朋友都没有回家过年,像我就被迫留在深圳过年了,无聊之余只能去看看电影爬爬山.今天给大家带来一个打发无聊时光的案例,用Python爬取不羞涩网小姐姐图片,并保存到本地,老 ...
- python爬虫图片实例-Python爬虫爬取煎蛋网图片代码实例
这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...
最新文章
- 电阻存储器为edge-AI提供了仿生架构
- 求一个字符串中连续出现的次数最多的子串
- windows server 驱动精灵_大神教你如何在Win10中检查磁盘驱动器错误
- 【转】从源码分析Handler的postDelayed为什么可以延时?
- CentOS7下zip解压和unzip压缩文件
- React 的 PureComponent Vs Component
- 【APICloud系列|37】 银联支付的实现
- eclipse 跑maven命令_eclipse中运行maven命令没有反应,console也不出现信息
- JAVA中fish什么意思,fish是什么意思_fish的翻译_音标_读音_用法_例句_爱词霸在线词典...
- 大白菜UEFI版制作u盘启动盘使用教程
- 数据库优化实践【信息跟踪篇】
- jsp java 登陆界面代码_jsp登陆界面源代码
- 万年历 源码 php,万年历 PHP
- 模糊控制(一)模糊控制简介及数学基础
- BLE(12)—— 细说 Connection
- 边下边看的BT资源搜索工具:Tribler for Mac中文免费版
- unix_timestamp时间比较引发的问题
- PCB之阻抗匹配设计
- 服务器、虚拟主机和空间的区别
- 标准韩国语第二册语法(1)
热门文章
- latex 在列宽固定的表格中换行
- java int几个字节_java中的int占几个字节
- 正当防卫4无法启动程序因为计算机中丢失,正当防卫4计算机丢失api-ms-win-core解决方法...
- html是否包含字符串,javascript字符串是否包含某字符?
- 自动驾驶行业常见的一些英文缩写
- http 400错误提示解决办法
- SSH key删除、生成方法
- oracle 差分备份,Oracle数据库RMAN备份与恢复:备份与恢复(手机搬家)
- 冒死潜入某个外包公司获得的珍贵Java基础笔试题(附答案)
- Vue中的(computed)计算属性和(watched)侦听属性以及(methods)方法