python实战-批量查询网站权重
文章目录
- 一、前言
- 二、代码实现
- 1. 安装所需要的库
- 2. 具体实现
- 三、实现效果
- 1. 单条查询
- 2. 多条查询
- 四、总结
一、前言
刷SRC时,必不可少的就是信息收集环节,要查看域名的权重来判断是否符合平台提交规则,一个一个手动复制域名去查询很是麻烦,所以通过 python爬虫的形式,实现单个查询与批量查询的脚本工具,这样能大大简化我们工作量,提高效率。
二、代码实现
1. 安装所需要的库
pip install requests
pip install lxml
2. 具体实现
import requests
import urllib3
import argparse
from lxml import etree
from concurrent.futures import ThreadPoolExecutor
# 解决requests请求出现的InsecureRequestWarning错误
urllib3.disable_warnings(urllib3.exceptions.InsecureRequestWarning)def query(url):url = "https://www.aizhan.com/cha/{}/".format(url)headers = {'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9','Accept-Language': 'en,zh-CN;q=0.9,zh;q=0.8,vi;q=0.7','Cache-Control': 'no-cache','Connection': 'keep-alive','Pragma': 'no-cache','Referer': 'https://www.aizhan.com/','Sec-Fetch-Dest': 'document','Sec-Fetch-Mode': 'navigate','Sec-Fetch-Site': 'same-origin','Sec-Fetch-User': '?1','Upgrade-Insecure-Requests': '1','User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:40.0) Gecko/20100101 Firefox/40.1','sec-ch-ua': '"Not?A_Brand";v="8", "Chromium";v="108", "Google Chrome";v="108"','sec-ch-ua-mobile': '?0','sec-ch-ua-platform': 'linux',}response = requests.get(url=url, headers=headers)lxml_tree = etree.HTML(response.text)href_name = lxml_tree.xpath('//div[@id="webpage_title"]//text()')print("\n-> Title信息: {0}".format("".join(href_name)))br = lxml_tree.xpath('//a[@id="baidurank_br"]//img//@alt')mbr = lxml_tree.xpath('//a[@id="baidurank_mbr"]//img//@alt')pr = lxml_tree.xpath('//a[@id="360_pr"]//img//@alt')sm_pr = lxml_tree.xpath('//a[@id="sm_pr"]//img//@alt')sogou_pr = lxml_tree.xpath('//a[@id="sogou_pr"]//img//@alt')google_pr = lxml_tree.xpath('//a[@id="google_pr"]//img//@alt')print("[+] 综合权重: \n 百度权重: {0}\t移动权重:{1}\t360权重:{2}\t神马权重:{3}\t搜狗权重:{4}\t谷歌PR:{5}".format("".join(br), "".join(mbr), "".join(pr), "".join(sm_pr), "".join(sogou_pr), "".join(google_pr)))icp = lxml_tree.xpath('//ul[@id="icp"]//text()')print("[+] 备案信息: \n", repr(" ".join(icp)).replace("\\n", "").replace("\\t", "").replace("'", ""))if __name__ == "__main__":example_text = """python 1.py -u qq.compython 1.py -f 1.txt"""try:parser = argparse.ArgumentParser(description=example_text, formatter_class=argparse.RawTextHelpFormatter)parser.add_argument("-u", "--url", required=False)parser.add_argument("-f", "--files", required=False)args = parser.parse_args()url = args.urlfiles = args.filesif url:query(url=url)else:count = 0with open(files, "r", encoding="utf-8") as f:# 创建最大线程数的线程池with ThreadPoolExecutor(10) as threadPool:for url in f:try:threadPool.submit(query, url.replace("\n", ""))count += 1except Exception as e:print("[-] error: ",e)continueprint("\ntotle: [{}]".format(count))except:pass
三、实现效果
1. 单条查询
2. 多条查询
四、总结
代码实现思路是很简单的,用起来效果也很不错,当遇到重复工作时,就需要思考是否能用所学知识来,来简化我们的工作量,也可以参考别人的思路来实现自己的工具。微信公众号搜索艺说IT学习更多内容。对你有用的话请一键三连,感谢。
python实战-批量查询网站权重相关推荐
- python脚本之批量查询网站权重
爱站批量查网站权重2.0版本已经更新 爱站批量查询网址权重2.0版本 爱站批量查网站权重 相信很多人在批量刷野战的时候,会去查看网站的权重吧,然后在决定是否提交给补天还在是盒子.但是不能批量去查询,很 ...
- python脚本之批量查询网站权重2.0
2.0支持任意url,相对1.0更加方便. 比例说我们可以添加这个url https://blog.csdn.net/sun1318578251/article/details/99304612 脚本 ...
- SRC小技巧:批量查询网站权重
一.获取脚本 ip2domain ipInfoSearch 捡来的脚本 https://github.com/Sma11New/ip2domain https://github.com/Potato- ...
- 网站权重怎么批量查?怎么批量查询网站的360权重
批量查询网站360权重的操作: 第一步.打开SEO综合查询工具 第二步.添加需要查询的网站域名(有多少放多少,一行一个域名) 第三步.勾选360权重PC权重和360移动权重 第四步.点击开始查询 第五 ...
- 怎样才能批量查询网站的谷歌PR权重?把手教你批量查询网站谷歌PR权重值
谷歌PR是Google排名运算法则(排名公式)的一部分,用来标识网页的等级/重要性.在计算网站排名时,PageRank会将网站的外部链接数考虑进去.一个网站的外部链接数越多其PR值就越高:外部链接站点 ...
- python网页批量查询_批量查询网站的pr
段时间工作比较忙,博客更新的时间又慢了,前几天刚旅游回来,和部门的同事去了富春江-三清山和姚林仙境,感觉挺不错的,坐了船也爬了山.感受了大自然的秀丽景色.废话不多话,今天给大家分享个python 批量 ...
- 怎么批量查看网站的360权重情况?批量查询网站的360权重情况的几个步骤
怎么查看网站的360权重情况?批量查询网站的360权重情况的几个步骤 网站是否具有更高的诚信度,网站有详尽的联系方法.有版权说明.企业介绍.公司电话.传真.地址等等详尽的.明确的信息,使浏览者信任这个 ...
- 谷歌索引量查询,批量查询网站在谷歌RR权重值
google索引量查询 谷歌索引页面决定的了你的网页是否能够参与关键词排名.那么提高谷歌索引对于做谷歌SEO的各位站长来说是非常重要的一个工作.在提高谷歌索引中最为核心的一个环节就是向Go ...
- 搜狗权重批量查询 批量查询搜狗权重的方法
最近入职了一家SEO公司,接手管理了400多个网站,需要每天查询搜狗权重情况,但是手动一个一个非常的耗时间,但是有什么方法可以快速批量查询搜狗权重呢? 最近发现使用iis7站长之家的批量查询搜 ...
最新文章
- rman备份脚本shell版
- Mac普通用户修改了/etc/sudoers文件的解决办法
- pandas - 案例(股票分析)
- js中的自定义异常处理函数
- Python 刷题常用语法与数据结构汇总-2022.01.30
- k8s部署tomcat及web应用_k8s部署tomcat应用服务
- python elseif用法_Python关键字简介
- 【Java例题】8.2 手工编写字符串统计的可视化程序
- 破解打开Excel文件编辑的时候提示受保护输入密码
- Python编程——函数
- 远程桌面管理工具Remote Desktop Connection Manager 2.2
- 聚类算法效果衡量标准
- 分享一下我的从业经历和工作感悟
- 传说中开场晕过去一千多人的迈克杰克逊演唱会,有生之年请看下这个视频
- Error Domain=AVFoundationErrorDomain Code=-11841 (null) timeRange 和 duration 不一致
- async、await其实是generator和promise的语法糖
- vue + element 实现文件上传
- 判断输入的日期是一年的第几天或者星期几
- 无线传感器网络期末复习知识点总结资料
- 全色和多光谱融合pansharpen的尝试
热门文章
- 页面访问升级出错怎么解决
- 极速办公(PPT)如何插入艺术字
- oppo关闭充电测试软件,oppo充电提示音APP
- 无纺布袋厂的工作原理与运行维护
- 输入13V,输出5V 1.5A ,封装为TO-252-2(DPAK)的LDO芯片推荐
- Java上传png格式无法显示,java – 使用LibGDX Gdx.files.internal加载.png文件时遇到问题...
- Android Studio 2.3 更新,你应该知道的新点
- npm安装vue报错npm ERR code EPERM npm ERR syscall mkdir npm ERR path D:\Program Files\node_cache
- Hbuilder-h5打包APP
- Squid 代理服务之透明代理服务器架构搭建