Python爬取图片+百度人脸检测过滤高颜值美女!
pexels网站提供了大量贴图,从中搜索美女图片,编写爬虫进行下载,下载后图片中除了女人外,还包含男人,风景、静物和动物,调用百度人脸检测模块识别检测,将其中颜值大于60分的美女保存到另外一个文件夹。爬取图片共计1251张,最后过滤出的美女共计287张。上代码:
爬虫程序:
from bs4 import BeautifulSoup import requests import os import time save_path = 'F://photos/' url_path = 'https://www.pexels.com/search/' headers ={'accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8','user-agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.112 Safari/537.36' } searchWord = 'beauty' urls = [url_path+searchWord+'/?page={}'.format(str(i)) for i in range(1,100)]if not os.path.exists(save_path):os.mkdir(save_path) page =1 for url in urls:img_list = []wb_data = requests.get(url,headers=headers)print("当前爬取页面链接",url)soup = BeautifulSoup(wb_data.text,'lxml')imgs = soup.select('article > a > img')for img in imgs:photo_src = img.get('src')img_list.append(photo_src)print("第{}页,共计{}张图片".format(page,len(img_list)))for item in img_list:data = requests.get(item, headers=headers)fp = open(save_path+item.split('?')[0][-10:],'wb')fp.write(data.content)fp.close()page = page+1time.sleep(2)
颜值检测程序:
from aip import AipFace import base64 import os import time import shutil #接入百度AI人脸识别的参数 APP_ID="换成你自己的" API_KEY = "换成你自己的" SECRET_KEY = "换成你自己的" imageType = "BASE64" options = {} options["face_field"] = "gender,beauty" options["face_type"] = "LIVE"#下载图片和筛选图片的文件夹 file_path = 'F://photos/' copy_file_path = 'F://highScore/' file_lists=os.listdir(file_path)aipFace =AipFace(APP_ID,API_KEY,SECRET_KEY) #将图片转换为BASE64格式,这是百度平台的要求 def get_file_content(filePath):with open(filePath,'rb') as fp:content = base64.b64encode(fp.read())return content.decode('utf-8')for file_list in file_lists:result = aipFace.detect(get_file_content(os.path.join(file_path,file_list)),imageType,options)error_code = result['error_code']if error_code == 222202:#没有人脸continueif error_code==223110:#人脸太多continuetry:sex_type = result['result']['face_list'][-1]['gender']['type']#只要美女图片if sex_type == 'male':continuebeauty = result['result']['face_list'][-1]['beauty']new_beauty = round(beauty/10,1)print(file_list,new_beauty)if new_beauty>=6:copy_src = os.path.join(file_path,str(new_beauty)+'_'+file_list)copy_dst = os.path.join(copy_file_path,str(new_beauty)+'_'+file_list)#重命名高分照片os.rename(os.path.join(file_path,file_list),copy_src)#复制高分照片到另外的照片shutil.copyfile(copy_src,copy_dst)time.sleep(1)except KeyError:passexcept TypeError:pass
爬取的图片:
过滤后的图片:
看看最高颜值的美女:
较低颜值的女性:
源码获取私信小编01哦
Python爬取图片+百度人脸检测过滤高颜值美女!相关推荐
- Python爬取图片+百度人脸检测过滤高颜值美女
pexels网站提供了大量贴图,从中搜索美女图片,编写爬虫进行下载,下载后图片中除了女人外,还包含男人,风景.静物和动物,调用百度人脸检测模块识别检测,将其中颜值大于60分的美女保存到另外一个文件夹. ...
- 爬取pexels女性图片+百度人脸检测过滤高颜值美女
pexels网站提供了大量贴图,从中搜索美女图片,编写爬虫进行下载,下载后图片中除了女人外,还包含男人,风景.静物和动物,调用百度人脸检测模块识别检测,将其中颜值大于60分的美女保存到另外一个文件夹. ...
- php百度人脸检测api测颜值评分(源码直接可用)
有一天无意中看到,通过百度人工智能平台中的人脸检测模块,可以实现简单的人脸检测,百度人工智能平台免费注册,人脸检测模块免费使用.相关API文档在:百度AI开放平台-全球领先的人工智能服务平台-百度AI ...
- python 知乎美女_知乎大神用Python爬取高颜值美女(爬虫+人脸检测+颜值检测)
原标题:知乎大神用Python爬取高颜值美女(爬虫+人脸检测+颜值检测) 1 数据源 知乎话题『美女』下所有问题中回答所出现的图片 2 抓取工具 Python 3,并使用第三方库 Requests.l ...
- Java爬取百度图片人脸识别下载高颜值小姐姐图片
前言: 最近想下载一些比较好看的妹子图片,但又不想去网上一张张的看,于是就想通过爬取图片进行人脸识别下载. 1.首先:在爬取图片时,通过Java请求时会遇到百度安全认证机制,在这里可以模拟浏览器的请求 ...
- 用python爬取图片的一点小结
一.原理小结 最近在学习用python的爬虫爬取网络上的图片,制作数据集并用于后续的一些实验.看了很多关于python爬取图片的介绍,并验证了相关代码,先推荐几个介绍比较好的爬虫过程: [1]小白爬虫 ...
- 百度人脸检测与识别项目资源
百度人脸检测与识别项目资源 https://blog.csdn.net/PaddlePaddle/article/details/104386123?depth_1-utm_source=distri ...
- python爬百度翻译-Python爬取百度翻译(利用json提取数据)
本篇文章给大家带来的内容是关于Python爬取百度翻译(利用json提取数据),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助. 工具:Python 3.6.5.PyCharm开发工具. ...
- python爬取百度使用kw关键字爬取时出现,百度安全验证,解决方法
python爬取百度使用kw关键字爬取时出现,百度安全验证,解决方法 之前爬取百度用kw时的代码(没有任何问题) import requestsurl = 'http://www.baidu.com/ ...
最新文章
- Android 应用内存优化 之 onLowMemory onTrimMemory
- 一个9年的技术最近一直担心找不到工作
- 甲亢php,甲亢还是甲低,真亢还是真低?
- GIT项目管理工具(part5)--查看commit 日志记录
- do filtering will real delete note in DB
- linux系统中变量,Linux系统中的环境变量知识详解
- MyBatis总结五:#{}和${}的用法和区别
- Python接口自动化之登录接口测试
- 80X86CPU独立编址方式的两种寻址方式——直接寻址直接写和间接寻址DX
- django路由层 虚拟环境 视图层
- CoreJavaE10V1P3.10 第3章 Java的基本编程结构-3.10 数组(Arrays)
- android中文朗读包,Android 通过手说tts中文语音包实现中文朗读
- 【逆向工程】 disunity的使用
- VARCHART XGantt开发者许可证
- 隐马尔可夫python_隐马尔可夫模型原理和python实现
- 401 Unauthorized: ERROR Failed to connect to newly launched supervisor. Agen
- matlab投资组合权重,Matlab做投资组合最优化
- 死亡计算机在线使用,抖音死亡计算器寿命计算器在线测试入口 使用生命年龄计算器...
- html5 游戏 响应式,关于html5:响应式游戏网页有什么特点呢
- 产品经理|需求分析(附《需求池表格》下载)