参考网址:https://www.cnblogs.com/baijifeilong/p/3708198.html

爬取图虫网上关于墨镜的照片

图虫网搜索墨镜之后的网址

https://stock.tuchong.com/search?source=tc_pc_home_search&term=“墨镜”

然后通过urllib 获取页面html的文本,对文本进行分析 发现文本中只有图片的ID

从网页中打开图片链接 发现链接规律为

由此 发现图片的URL可以使用

urllib.request.urlretrieve 获取图片

代码如下:

import re, os, time
import urllib.parse
import urllib.requestdef getHtml(url):#取得网页的html纯文本return urllib.request.urlopen(url).read().decode('utf-8')if __name__ == '__main__':print('---图虫图片抓取器---')for n in range(1, 51):pageNo = nprint(pageNo)folder = savepath+str(pageNo)if not os.path.exists(folder):os.makedirs(folder)#url汉字编码处理url = 'https://stock.tuchong.com/search?source=tc_pc_home_search&term={}&page={}'.format(urllib.parse.quote('墨镜'), str(pageNo))#获取页面HTML文本html = getHtml(url)x = 0pattern = re.compile(r'\d+')match = pattern.findall(html)num = len(match)for i in range(num):if len(match[i])>15:print(match[i])imageurl = "http://p1.pstatp.com/weili/m/"+match[i]+".webp"urllib.request.urlretrieve(imageurl,folder+'\\%s.jpg'%x)x+=1print("第 "+str(pageNo)+" 下载结束")print('下载结束。')

Python 爬取图虫网图片相关推荐

  1. python爬取图虫网图片

    网站:https://stock.tuchong.com/ 打开调试工具发现如下关键代码 代码: import urllib.request import osdef url_open(url):re ...

  2. 教你用Python爬取图虫网

    TuChong_Spider (新手爬虫项目大牛勿喷) 偶然的机会在抖音看到这个APP,发现有很多高质量的手机壁纸和图片,对于一个爬虫初学者,这就非常美滋滋了,好多欧美小姐姐啊,哎嘿嘿.... 图虫网 ...

  3. 十一、练习:爬取图虫网付费图片

    十.练习:爬取图虫网免费图片 今天爬下图虫网付费的图片,比之前的免费图片简单. 这里的付费图片都是一个专辑的 这个我在一个公开课听的,说这个是:https://tuchong.com/rest/tag ...

  4. 利用python爬取qq个性网图片

    利用python爬取qq个性网图片 网站头像布局大同小异,稍改代码即可爬取想要的头像. 不多bb,上代码. import requests from parsel import Selector im ...

  5. python作品_Python爬取图虫网摄影作品

    准备 要爬的网站是图虫网 工具:python 2.7,BeautifulSoup4 注意:BeautifulSoup4为第三方类库,如果在cmd下用pip安装报错,可直接去官网下载,解压后拷贝到pyt ...

  6. python3爬虫-通过requests爬取图虫网

    import requests from fake_useragent import UserAgent from requests.exceptions import Timeout from ur ...

  7. python爬图代码实例_Python爬虫爬取煎蛋网图片代码实例

    这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...

  8. Python爬取不羞涩网小姐姐图片——BeautifulSoup应用

    引言 今年提倡原地过年,相信很多朋友都没有回家过年,像我就被迫留在深圳过年了,无聊之余只能去看看电影爬爬山.今天给大家带来一个打发无聊时光的案例,用Python爬取不羞涩网小姐姐图片,并保存到本地,老 ...

  9. python爬虫图片实例-Python爬虫爬取煎蛋网图片代码实例

    这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...

最新文章

  1. 电阻存储器为edge-AI提供了仿生架构
  2. 求一个字符串中连续出现的次数最多的子串
  3. windows server 驱动精灵_大神教你如何在Win10中检查磁盘驱动器错误
  4. 【转】从源码分析Handler的postDelayed为什么可以延时?
  5. CentOS7下zip解压和unzip压缩文件
  6. React 的 PureComponent Vs Component
  7. 【APICloud系列|37】 银联支付的实现
  8. eclipse 跑maven命令_eclipse中运行maven命令没有反应,console也不出现信息
  9. JAVA中fish什么意思,fish是什么意思_fish的翻译_音标_读音_用法_例句_爱词霸在线词典...
  10. 大白菜UEFI版制作u盘启动盘使用教程
  11. 数据库优化实践【信息跟踪篇】
  12. jsp java 登陆界面代码_jsp登陆界面源代码
  13. 万年历 源码 php,万年历 PHP
  14. 模糊控制(一)模糊控制简介及数学基础
  15. BLE(12)—— 细说 Connection
  16. 边下边看的BT资源搜索工具:Tribler for Mac中文免费版
  17. unix_timestamp时间比较引发的问题
  18. PCB之阻抗匹配设计
  19. 服务器、虚拟主机和空间的区别
  20. 标准韩国语第二册语法(1)

热门文章

  1. latex 在列宽固定的表格中换行
  2. java int几个字节_java中的int占几个字节
  3. 正当防卫4无法启动程序因为计算机中丢失,正当防卫4计算机丢失api-ms-win-core解决方法...
  4. html是否包含字符串,javascript字符串是否包含某字符?
  5. 自动驾驶行业常见的一些英文缩写
  6. http 400错误提示解决办法
  7. SSH key删除、生成方法
  8. oracle 差分备份,Oracle数据库RMAN备份与恢复:备份与恢复(手机搬家)
  9. 冒死潜入某个外包公司获得的珍贵Java基础笔试题(附答案)
  10. Vue中的(computed)计算属性和(watched)侦听属性以及(methods)方法