pexels网站提供了大量贴图,从中搜索美女图片,编写爬虫进行下载,下载后图片中除了女人外,还包含男人,风景、静物和动物,调用百度人脸检测模块识别检测,将其中颜值大于60分的美女保存到另外一个文件夹。爬取图片共计1251张,最后过滤出的美女共计287张。上代码:

爬虫程序:

from bs4 import BeautifulSoup
import requests
import os
import time
save_path = 'F://photos/'
url_path = 'https://www.pexels.com/search/'
headers ={'accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8','user-agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.112 Safari/537.36'
}
searchWord = 'beauty'
urls = [url_path+searchWord+'/?page={}'.format(str(i)) for i in range(1,100)]if not os.path.exists(save_path):os.mkdir(save_path)
page =1
for url in urls:img_list = []wb_data = requests.get(url,headers=headers)print("当前爬取页面链接",url)soup = BeautifulSoup(wb_data.text,'lxml')imgs = soup.select('article > a > img')for img in imgs:photo_src = img.get('src')img_list.append(photo_src)print("第{}页,共计{}张图片".format(page,len(img_list)))for item in img_list:data = requests.get(item, headers=headers)fp = open(save_path+item.split('?')[0][-10:],'wb')fp.write(data.content)fp.close()page = page+1time.sleep(2)

颜值检测程序:

from aip import AipFace
import base64
import os
import time
import shutil
#接入百度AI人脸识别的参数
APP_ID="换成你自己的"
API_KEY = "换成你自己的"
SECRET_KEY = "换成你自己的"
imageType = "BASE64"
options = {}
options["face_field"] = "gender,beauty"
options["face_type"] = "LIVE"#下载图片和筛选图片的文件夹
file_path = 'F://photos/'
copy_file_path = 'F://highScore/'
file_lists=os.listdir(file_path)aipFace =AipFace(APP_ID,API_KEY,SECRET_KEY)
#将图片转换为BASE64格式,这是百度平台的要求
def get_file_content(filePath):with open(filePath,'rb') as fp:content = base64.b64encode(fp.read())return content.decode('utf-8')for file_list in file_lists:result = aipFace.detect(get_file_content(os.path.join(file_path,file_list)),imageType,options)error_code = result['error_code']if error_code == 222202:#没有人脸continueif error_code==223110:#人脸太多continuetry:sex_type = result['result']['face_list'][-1]['gender']['type']#只要美女图片if sex_type == 'male':continuebeauty = result['result']['face_list'][-1]['beauty']new_beauty = round(beauty/10,1)print(file_list,new_beauty)if new_beauty>=6:copy_src = os.path.join(file_path,str(new_beauty)+'_'+file_list)copy_dst = os.path.join(copy_file_path,str(new_beauty)+'_'+file_list)#重命名高分照片os.rename(os.path.join(file_path,file_list),copy_src)#复制高分照片到另外的照片shutil.copyfile(copy_src,copy_dst)time.sleep(1)except KeyError:passexcept TypeError:pass

爬取的图片:

过滤后的图片:

看看最高颜值的美女:

较低颜值的女性:

源码获取私信小编01哦

Python爬取图片+百度人脸检测过滤高颜值美女!相关推荐

  1. Python爬取图片+百度人脸检测过滤高颜值美女

    pexels网站提供了大量贴图,从中搜索美女图片,编写爬虫进行下载,下载后图片中除了女人外,还包含男人,风景.静物和动物,调用百度人脸检测模块识别检测,将其中颜值大于60分的美女保存到另外一个文件夹. ...

  2. 爬取pexels女性图片+百度人脸检测过滤高颜值美女

    pexels网站提供了大量贴图,从中搜索美女图片,编写爬虫进行下载,下载后图片中除了女人外,还包含男人,风景.静物和动物,调用百度人脸检测模块识别检测,将其中颜值大于60分的美女保存到另外一个文件夹. ...

  3. php百度人脸检测api测颜值评分(源码直接可用)

    有一天无意中看到,通过百度人工智能平台中的人脸检测模块,可以实现简单的人脸检测,百度人工智能平台免费注册,人脸检测模块免费使用.相关API文档在:百度AI开放平台-全球领先的人工智能服务平台-百度AI ...

  4. python 知乎美女_知乎大神用Python爬取高颜值美女(爬虫+人脸检测+颜值检测)

    原标题:知乎大神用Python爬取高颜值美女(爬虫+人脸检测+颜值检测) 1 数据源 知乎话题『美女』下所有问题中回答所出现的图片 2 抓取工具 Python 3,并使用第三方库 Requests.l ...

  5. Java爬取百度图片人脸识别下载高颜值小姐姐图片

    前言: 最近想下载一些比较好看的妹子图片,但又不想去网上一张张的看,于是就想通过爬取图片进行人脸识别下载. 1.首先:在爬取图片时,通过Java请求时会遇到百度安全认证机制,在这里可以模拟浏览器的请求 ...

  6. 用python爬取图片的一点小结

    一.原理小结 最近在学习用python的爬虫爬取网络上的图片,制作数据集并用于后续的一些实验.看了很多关于python爬取图片的介绍,并验证了相关代码,先推荐几个介绍比较好的爬虫过程: [1]小白爬虫 ...

  7. 百度人脸检测与识别项目资源

    百度人脸检测与识别项目资源 https://blog.csdn.net/PaddlePaddle/article/details/104386123?depth_1-utm_source=distri ...

  8. python爬百度翻译-Python爬取百度翻译(利用json提取数据)

    本篇文章给大家带来的内容是关于Python爬取百度翻译(利用json提取数据),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助. 工具:Python 3.6.5.PyCharm开发工具. ...

  9. python爬取百度使用kw关键字爬取时出现,百度安全验证,解决方法

    python爬取百度使用kw关键字爬取时出现,百度安全验证,解决方法 之前爬取百度用kw时的代码(没有任何问题) import requestsurl = 'http://www.baidu.com/ ...

最新文章

  1. Android 应用内存优化 之 onLowMemory onTrimMemory
  2. 一个9年的技术最近一直担心找不到工作
  3. 甲亢php,甲亢还是甲低,真亢还是真低?
  4. GIT项目管理工具(part5)--查看commit 日志记录
  5. do filtering will real delete note in DB
  6. linux系统中变量,Linux系统中的环境变量知识详解
  7. MyBatis总结五:#{}和${}的用法和区别
  8. Python接口自动化之登录接口测试
  9. 80X86CPU独立编址方式的两种寻址方式——直接寻址直接写和间接寻址DX
  10. django路由层 虚拟环境 视图层
  11. CoreJavaE10V1P3.10 第3章 Java的基本编程结构-3.10 数组(Arrays)
  12. android中文朗读包,Android 通过手说tts中文语音包实现中文朗读
  13. 【逆向工程】 disunity的使用
  14. VARCHART XGantt开发者许可证
  15. 隐马尔可夫python_隐马尔可夫模型原理和python实现
  16. 401 Unauthorized: ERROR Failed to connect to newly launched supervisor. Agen
  17. matlab投资组合权重,Matlab做投资组合最优化
  18. 死亡计算机在线使用,抖音死亡计算器寿命计算器在线测试入口 使用生命年龄计算器...
  19. html5 游戏 响应式,关于html5:响应式游戏网页有什么特点呢
  20. 产品经理|需求分析(附《需求池表格》下载)

热门文章

  1. android 默认读取硬件版本号
  2. 玩转ADB命令(ADB命令使用大全)
  3. SQL 主键和外键的定义以及使用
  4. Thingworx入门笔记
  5. Kubernets安装使用
  6. 聊城地磅称重系统如何改造为无人值守系统
  7. IC验证必备的数字电路基础知识(二):组合逻辑电路
  8. 第七届工程训练比赛之智能垃圾分类
  9. moment常用操作
  10. 程序员看世界之中关村与切糕(11)2012-12-16