文章目录

  • 一、前言
  • 二、代码实现
    • 1. 安装所需要的库
    • 2. 具体实现
  • 三、实现效果
    • 1. 单条查询
    • 2. 多条查询
  • 四、总结

一、前言

  刷SRC时,必不可少的就是信息收集环节,要查看域名的权重来判断是否符合平台提交规则,一个一个手动复制域名去查询很是麻烦,所以通过 python爬虫的形式,实现单个查询与批量查询的脚本工具,这样能大大简化我们工作量,提高效率。

二、代码实现

1. 安装所需要的库

pip install requests
pip install lxml

2. 具体实现

import requests
import urllib3
import argparse
from lxml import etree
from concurrent.futures import ThreadPoolExecutor
# 解决requests请求出现的InsecureRequestWarning错误
urllib3.disable_warnings(urllib3.exceptions.InsecureRequestWarning)def query(url):url = "https://www.aizhan.com/cha/{}/".format(url)headers = {'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9','Accept-Language': 'en,zh-CN;q=0.9,zh;q=0.8,vi;q=0.7','Cache-Control': 'no-cache','Connection': 'keep-alive','Pragma': 'no-cache','Referer': 'https://www.aizhan.com/','Sec-Fetch-Dest': 'document','Sec-Fetch-Mode': 'navigate','Sec-Fetch-Site': 'same-origin','Sec-Fetch-User': '?1','Upgrade-Insecure-Requests': '1','User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:40.0) Gecko/20100101 Firefox/40.1','sec-ch-ua': '"Not?A_Brand";v="8", "Chromium";v="108", "Google Chrome";v="108"','sec-ch-ua-mobile': '?0','sec-ch-ua-platform': 'linux',}response = requests.get(url=url, headers=headers)lxml_tree = etree.HTML(response.text)href_name = lxml_tree.xpath('//div[@id="webpage_title"]//text()')print("\n-> Title信息: {0}".format("".join(href_name)))br = lxml_tree.xpath('//a[@id="baidurank_br"]//img//@alt')mbr = lxml_tree.xpath('//a[@id="baidurank_mbr"]//img//@alt')pr = lxml_tree.xpath('//a[@id="360_pr"]//img//@alt')sm_pr = lxml_tree.xpath('//a[@id="sm_pr"]//img//@alt')sogou_pr = lxml_tree.xpath('//a[@id="sogou_pr"]//img//@alt')google_pr = lxml_tree.xpath('//a[@id="google_pr"]//img//@alt')print("[+] 综合权重: \n 百度权重: {0}\t移动权重:{1}\t360权重:{2}\t神马权重:{3}\t搜狗权重:{4}\t谷歌PR:{5}".format("".join(br), "".join(mbr), "".join(pr), "".join(sm_pr), "".join(sogou_pr), "".join(google_pr)))icp = lxml_tree.xpath('//ul[@id="icp"]//text()')print("[+] 备案信息: \n", repr(" ".join(icp)).replace("\\n", "").replace("\\t", "").replace("'", ""))if __name__ == "__main__":example_text = """python 1.py -u qq.compython 1.py -f 1.txt"""try:parser = argparse.ArgumentParser(description=example_text, formatter_class=argparse.RawTextHelpFormatter)parser.add_argument("-u", "--url", required=False)parser.add_argument("-f", "--files", required=False)args = parser.parse_args()url = args.urlfiles = args.filesif url:query(url=url)else:count = 0with open(files, "r", encoding="utf-8") as f:# 创建最大线程数的线程池with ThreadPoolExecutor(10) as threadPool:for url in f:try:threadPool.submit(query, url.replace("\n", ""))count += 1except Exception as e:print("[-] error: ",e)continueprint("\ntotle: [{}]".format(count))except:pass

三、实现效果

1. 单条查询

2. 多条查询

四、总结

  代码实现思路是很简单的,用起来效果也很不错,当遇到重复工作时,就需要思考是否能用所学知识来,来简化我们的工作量,也可以参考别人的思路来实现自己的工具。微信公众号搜索艺说IT学习更多内容。对你有用的话请一键三连,感谢。

python实战-批量查询网站权重相关推荐

  1. python脚本之批量查询网站权重

    爱站批量查网站权重2.0版本已经更新 爱站批量查询网址权重2.0版本 爱站批量查网站权重 相信很多人在批量刷野战的时候,会去查看网站的权重吧,然后在决定是否提交给补天还在是盒子.但是不能批量去查询,很 ...

  2. python脚本之批量查询网站权重2.0

    2.0支持任意url,相对1.0更加方便. 比例说我们可以添加这个url https://blog.csdn.net/sun1318578251/article/details/99304612 脚本 ...

  3. SRC小技巧:批量查询网站权重

    一.获取脚本 ip2domain ipInfoSearch 捡来的脚本 https://github.com/Sma11New/ip2domain https://github.com/Potato- ...

  4. 网站权重怎么批量查?怎么批量查询网站的360权重

    批量查询网站360权重的操作: 第一步.打开SEO综合查询工具 第二步.添加需要查询的网站域名(有多少放多少,一行一个域名) 第三步.勾选360权重PC权重和360移动权重 第四步.点击开始查询 第五 ...

  5. 怎样才能批量查询网站的谷歌PR权重?把手教你批量查询网站谷歌PR权重值

    谷歌PR是Google排名运算法则(排名公式)的一部分,用来标识网页的等级/重要性.在计算网站排名时,PageRank会将网站的外部链接数考虑进去.一个网站的外部链接数越多其PR值就越高:外部链接站点 ...

  6. python网页批量查询_批量查询网站的pr

    段时间工作比较忙,博客更新的时间又慢了,前几天刚旅游回来,和部门的同事去了富春江-三清山和姚林仙境,感觉挺不错的,坐了船也爬了山.感受了大自然的秀丽景色.废话不多话,今天给大家分享个python 批量 ...

  7. 怎么批量查看网站的360权重情况?批量查询网站的360权重情况的几个步骤

    怎么查看网站的360权重情况?批量查询网站的360权重情况的几个步骤 网站是否具有更高的诚信度,网站有详尽的联系方法.有版权说明.企业介绍.公司电话.传真.地址等等详尽的.明确的信息,使浏览者信任这个 ...

  8. 谷歌索引量查询,批量查询网站在谷歌RR权重值

      google索引量查询     谷歌索引页面决定的了你的网页是否能够参与关键词排名.那么提高谷歌索引对于做谷歌SEO的各位站长来说是非常重要的一个工作.在提高谷歌索引中最为核心的一个环节就是向Go ...

  9. 搜狗权重批量查询 批量查询搜狗权重的方法

    最近入职了一家SEO公司,接手管理了400多个网站,需要每天查询搜狗权重情况,但是手动一个一个非常的耗时间,但是有什么方法可以快速批量查询搜狗权重呢?     最近发现使用iis7站长之家的批量查询搜 ...

最新文章

  1. rman备份脚本shell版
  2. Mac普通用户修改了/etc/sudoers文件的解决办法
  3. pandas - 案例(股票分析)
  4. js中的自定义异常处理函数
  5. Python 刷题常用语法与数据结构汇总-2022.01.30
  6. k8s部署tomcat及web应用_k8s部署tomcat应用服务
  7. python elseif用法_Python关键字简介
  8. 【Java例题】8.2 手工编写字符串统计的可视化程序
  9. 破解打开Excel文件编辑的时候提示受保护输入密码
  10. Python编程——函数
  11. 远程桌面管理工具Remote Desktop Connection Manager 2.2
  12. 聚类算法效果衡量标准
  13. 分享一下我的从业经历和工作感悟
  14. 传说中开场晕过去一千多人的迈克杰克逊演唱会,有生之年请看下这个视频
  15. Error Domain=AVFoundationErrorDomain Code=-11841 (null) timeRange 和 duration 不一致
  16. async、await其实是generator和promise的语法糖
  17. vue + element 实现文件上传
  18. 判断输入的日期是一年的第几天或者星期几
  19. 无线传感器网络期末复习知识点总结资料
  20. 全色和多光谱融合pansharpen的尝试

热门文章

  1. 页面访问升级出错怎么解决
  2. 极速办公(PPT)如何插入艺术字
  3. oppo关闭充电测试软件,oppo充电提示音APP
  4. 无纺布袋厂的工作原理与运行维护
  5. 输入13V,输出5V 1.5A ,封装为TO-252-2(DPAK)的LDO芯片推荐
  6. Java上传png格式无法显示,java – 使用LibGDX Gdx.files.internal加载.png文件时遇到问题...
  7. Android Studio 2.3 更新,你应该知道的新点
  8. npm安装vue报错npm ERR code EPERM npm ERR syscall mkdir npm ERR path D:\Program Files\node_cache
  9. Hbuilder-h5打包APP
  10. Squid 代理服务之透明代理服务器架构搭建