本文章来介绍如何通过Python来控制桌面实现自动化操作。桌面自动化操作是通过定位鼠标在桌面的位置,然后根据定位的位置执行对应的操作。
文章目录
GUI控制神器
鼠标操作
鼠标信息
鼠标移动
鼠标点击
鼠标点击与释放
鼠标拖动
鼠标滚动
键盘操作
键盘控制
特殊符号
快捷键
屏幕处理
获取屏幕截屏
信息框
自动点赞实战

pyautogui 是一个纯 Python 的 GUI 自动化工具,通过它可以让程序自动控制鼠标和键盘的一系列操作来达到自动化测试的目的。

模块安装,打开cmd,输入:pip install pyautogui

导包:import pyautogui

鼠标操作
鼠标信息
pyautogui.position() 获取鼠标位置
pyautogui.onScreen(x,y) 判断坐标(x,y)是否在屏幕内,返回True,Flase
以右上角为(0,0)点
鼠标移动
桌面操作最基本的就是鼠标操作了,我们可以控制鼠标的移动:

pyautogui.moveTo(x,y) 绝对位置移动 ,移动到x,y
pyautogui.moveRel(x,y) 相对位置移动 ,从当前位置移动
# 移动鼠标
pyautogui.moveTo(200,400,duration=2)
pyautogui.moveRel(200,500,duration=2)
整个桌面是以左上角为坐标轴的原点,所有的操作都以这个原点,来确定操作位置。

第一行是将鼠标移动到指定的像素(200,400)位置;
第二行代码是将鼠标按照当前点向右移动200px,向下移动500px这个方向移动。

两行代码中都有一个共同的参数 duration,这个参数表示移动时间,即在指定时间内完成移动操作,单位是秒。

运行这两行代码,观察屏幕鼠标的变化,是不是很神奇?

鼠标点击
通常,我们的鼠标有左右两个按键,高级点的鼠标中间还有个按键。

我的鼠标只有两个按键,中间没有按键,唉~
pyautogui针对这三个按键操作都有相应的处理:

pyautogui.click()
(100,100, clicks=2,interval=0.5,button=‘right’,duration=0.2)
位置,点击次数,间隔时间,右键(默认左键),移动间隔
left:左键 right:右键 middle:中键
# 鼠标点击,默认左键
pyautogui.click(100,100)   
# 单击左键
pyautogui.click(100,100,button='left')  
# 单击右键
pyautogui.click(100,300,button='right') 
# 单击中间 
pyautogui.click(100,300,button='middle')

鼠标点击,如果不指定 button 参数,默认是点击左键,前面两个参数就是点击坐标的位置。

运行这段代码,看看你的桌面会发生什么?

鼠标除了点击操作,还有双击操作:

pyautogui.doubleClick() #双击右键
pyautogui.leftClick() #双击左键
pyautogui.middleClick() #双击中键
pyautogui.tripleClick() #双击屏幕
# 双击左键
pyautogui.doubleClick(10,10)  
# 双击右键
pyautogui.rightClick(10,10)   
# 双击中键
pyautogui.middleClick(10,10) 
# 双击屏幕
pyautogui.tripleClick(10,10)

操作函数也很简单,相信大家一眼就能看明白,如果一眼看不明白,请多看几眼!

熟悉前端的小伙伴可能会马上联想到,鼠标操作有按下和释放的过程,我们屏幕操作也有对应的控制:

鼠标点击与释放
pyautogui.mouseUp() #释放
pyautogui.mouseDown() #点击 只需要输入键就可
# 鼠标按下
pyautogui.mouseDown()   
# 鼠标释放
pyautogui.mouseUp()

鼠标拖动
pyautogui.dragTo() #绝对位置拖动
pyautogui.dragRel() #相对位置拖动
例:pyautogui.dragRel(-100,200,duration=0.5,button=‘right’)
我们可以控制鼠标拖动到指定坐标位置,并且设置操作时间和按键:

pyautogui.dragTo(100,300,duration=1,button='right')   
这个运行效果和前面移动类似。

根据前面移动的经验,我们也有按照方向拖动鼠标:

pyautogui.dragRel(100,300,duration=4,button='left') 
鼠标滚动
在桌面操作中,我们有时候需要滚动鼠标到达向上或者向下的位置,这时候我们可以使用 scroll 这个函数来控制:

pyautogui.scroll() #(,x,y) 滑动距离(+上 , -下),位置
pyautogui.scroll(30000)

参数是整数,表示向上或向下滚动多少个单位,这个单位根据不同的操作系统可能不一样。如果向上滚动,传入正整数,向下滚动传入负整数。

键盘操作
键盘控制
pyautogui.keyDown() #模拟按键放下,内容为按键符
pyautogui.keyUp() #模拟按键松开
pyautogui.press() #模拟一次按键过程,即keyDown和keyUP的组合
pyautogui.hotkey() #press一样 区别:可以组合按键
pyautogui.typewrite() #模拟键盘输出内容
举个例子,大家平时输入感叹号(!)是怎么操作键盘的?

按住 shift 按键,然后再按住 1 按键,就可以了。用pyautogui控制就是:

pyautogui.keyDown('shift')    
pyautogui.press('1')    
pyautogui.keyUp('shift')

运行上面的代码,如果你的鼠标是放在编辑框中,你会得到一个感叹号!

我们还可以直接输出内容:

pyautogui.typewrite('python', 1)
第一个参数是输出的内容,第二个参数是间隔时间,单位是秒。

运行上面代码,你的编辑器里面就会每隔1秒钟按顺序输出 python 的6个字母。

特殊符号
有时我们需要输入键盘的一些特殊的符号按键,比如 换行、方向键等,这些有相对应的键盘字符串表示:

pyautogui.typewrite(['p','y','t','h','o','n','enter'])   
pyautogui.typewrite(['p','y','t','h','o','n',' '])   
运行上面代码,编辑器里面就会输出 python 之后换行。

其他特殊按键对应的字符串请参考官方说明。

快捷键
如果我要复制一个内容,大部分情况下会使用快键键 ctrl + c,按照上面讲的,我们应该这么实现:

pyautogui.keyDown('ctrl')
pyautogui.keyDown('c')
pyautogui.keyUp('c')
pyautogui.keyUp('ctrl')
实现的效果和上面的4行代码相同。

键盘字符串 说明
enter(或return 或 \n) 回车
esc ESC键
shiftleft, shiftright 左右SHIFT键
altleft, altright 左右ALT键
ctrlleft, ctrlright 左右CTRL键
tab (\t) TAB键
backspace, delete BACKSPACE 、DELETE键
pageup, pagedown PAGE UP 和 PAGE DOWN键
home, end HOME 和 END键
up, down, left,right 箭头键
f1, f2, f3…. f12 F1…….F12键
volumemute, volumedown,volumeup 声音变大变小静音(有些键盘没有)
pause PAUSE键,暂停键
capslock CAPS LOCK 键
numlock NUM LOCK 键
scrolllock SCROLLLOCK 键
insert INSERT键
printscreen PRINT SCREEN键
winleft, winright Win键(windows )
command command键(Mac OS X )
option option(Mac OS X)

屏幕处理
获取屏幕截屏
我们先来假设一个场景:我现在要在屏幕上找到一个红色的点,你会怎么做?通常的做法是拿到这个红色点的颜色值,然后再对屏幕上的点逐个进行比较,直到找到为止。

pyautogui 为我们这个操作场景提供了支持,分别有三个函数可以完成这三件事情。

img = pyautogui.screenshot() #默认是全屏,可是输入截屏大小
img.save(‘img.jpg’)
pyautogui.screenshot(‘image’,region=(x,y,w,h) # 返回屏幕的截图,是一个Pillow的image对象
pyautogui.pixelMatchesColor(500,500,(12,120,400)) # 是一个对比函数,对比的是屏幕上(500,500)这一点像素的颜色,与所给的元素是否相同;
pyautogui.locateCenterOnScreen(‘image’, region=(x,y,w,h) ) #图片匹配功能,查找image图片在屏幕中的位置,region限制查找范围
im = pyautogui.screenshot()
im.save('screenshot.png')
rgb = im.getpixel((100, 500))
print(rgb)
match = pyautogui.pixelMatchesColor(500,500,(12,120,400))
print(match)

第一个是获取屏幕截图函数,它可以返回一个 Pillow 的 image 对象; 第二个是获取屏幕截图中指定坐标点的颜色,返回 rgb 颜色值;第三个是将指定坐标点的颜色和目标的颜色进行比对,返回布尔值。

我们再来升级一下需求:

我现在要在屏幕上找到 edge 浏览器的图标,你会怎么做?

通常的做法是先知道 edge 浏览器的图标长啥样,是绿色还是蓝色,是胖的还是瘦的,对吧?然后再在屏幕上去进行图标的匹配,直到找到一个图标跟我们目标图标一样,就得到了结果。

于是,我们的代码如下:

# 图像识别(一个)
oneLocation = pyautogui.locateOnScreen('1.png')
print(oneLocation)

# 图像识别(多个)
allLocation = pyautogui.locateAllOnScreen('1.png')
print(list(allLocation))

你可以在桌面上将某个应用的图标截取下来,保存为图片,然后使用上面几行代码来识别,识别成功,你会返回类似下面的结果:

Box(left=20, top=89, width=33, height=34)
[Box(left=20, top=89, width=33, height=34)]

这就是图片在桌面的位置,如果找不到图片,就会返回 None。

信息框
当你在模拟一个桌面操作的时候,如果有分支操作需要根据实际情况来判断,你是不是需要有一个地方可以让你选择走哪个分支?

pyautogui 贴心地考虑到了这种情况,你可以通过弹出一个选择框来中断当前的操作,选择操作分支。

pyautogui.alert(text=,title=,button=) #按钮框 文本,标题,按钮名
pyautogui.confirm(text=,title=,buttons=) #组合按钮框(多个按钮)
pyautogui.prompt(text=,title=,default=) #输入框 #文本,标题,默认文字
pyautogui.password(text=,title=,default=,mask=) #密码输入框 #输入框 #文本,标题,默认文字,掩码样式
pyautogui.mouseInfo() #获取鼠标的信息
way = pyautogui.confirm('领导,该走哪条路?', buttons=['农村路', '水路', '陆路'])
print(way)

这里就是我们 HTML 页面的 confirm 选择框,选择了选项之后,我们可以获取到选择的选项,然后基于这个选项做判断,进入相应的操作分支。

除了选择确认框之外,还有其他一些提示信息框:

# 警告框
alert = pyautogui.alert(text='警告!敌军来袭!', title='警告框')
print(alert)
# 密码框
password = pyautogui.password('请输入密码')
print(password)
# 普通输入框
input = pyautogui.prompt('请输入指令:')
print(input)

pyautogui 的基本知识就给大家介绍到这里,这个 python 模块的功能十分强大,函数都非常简单,对 python 初学者比较友好。学了这些基本知识之后,你可以运用这些基本知识的组合,去实现一些有趣的桌面自动化操作,快去尝试一把吧!

自动点赞实战
我们通过今天的基础知识的学习,我们可以通过pyautogui+PIL结合来实现网页自动点赞的实战练习。

我们先介绍一个PIL库下一个裁剪图片的函数crop。

使用PIL裁切图片使用PIL需要引用Image,使用Image的open(file)方法可以返回打开的图片,使用crop((x1,y1,x2,y2))方法可以对图片做裁切。
该区域是一个元组,(x1,y1)是图片左上角的坐标,(x2,y2)是图片右下角的坐标。
Python Imaging Library 使用左上角为 (0, 0)的坐标系统。
首先我们要知道点赞的图片的样子

# 截取整个屏幕
im=pyautogui.screenshot()
# 截取点赞图片
om=im.crop((1754,595,1803,631)) 
#将图片保存供pyautogui.locateOnScreen()使用
om.save("dianzan.png")

根据截取的屏幕仅截取带赞的手势图片,可以用pyautogui.mouseInfo()获取图片的位置(1754,595,1803,631)
或者通过pyautogui.location()来确定首尾坐标

from PIL import Image
import pyautogui
import time

# 截取整个屏幕
im=pyautogui.screenshot()
# 截取点赞图片
om=im.crop((1754,595,1803,631)) 
#将图片保存供pyautogui.locateOnScreen()使用
om.save("dianzan.png")

# 点赞函数
def zan(count): #为了防止一直运行下去,点赞次数由自己定义
    time.sleep(0.5)
    # 寻找刚才保存点赞手势图片
    xy = pyautogui.locateOnScreen('dianzan.png')
    # 寻找图片的中心
    center = pyautogui.center(xy)
    # 点赞
    pyautogui.click(center)
    print('点赞成功')

count = 3 # 点赞次数
while range(count):
    if pyautogui.locateOnScreen('dianzan.png'):
        zan(count)   # 调用点赞函数
        count-=1
    else:
        #本页没有图片后,滚动鼠标;
        pyautogui.scroll(-500)
        print('没有找到目标,屏幕下滚~')
        count -= 1
print('点赞结束!')

【python之pyautogui桌面自动化】相关推荐

  1. pyautogui桌面自动化基础使用方法

    pyautogui桌面自动化基础使用方法 PyAutoGUI通过接管鼠标.键盘使用权,基本上模拟真人操作,可以解放人重复操作的行为. 1. 获取基础信息 1.1 屏幕信息 获取屏幕尺寸(分辨率×分辨率 ...

  2. PyAutoGUI 桌面自动化

    PyAutoGUI 是一个跨平台自动化python模块,以编程的方式控制鼠标键盘. 一.安装 pip install pyautogui 二.前置参数 1.自动 防故障功能 # 默认为True,当鼠标 ...

  3. python 安装pyautogui图形自动化

    pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pyautogui

  4. python实现桌面自动化画图

    前言 分享一个比较有趣的自动化项目,可以帮助实现将准备的图片画在桌面上,是实实在在的画出来. 预览一下效果 这个是在百度上找的图片 将图片进行二值化处理后的效果 通过画图工具画出来的效果. 核心代码 ...

  5. Python实现计算机的自动化控制!

    懒惰,让一切成为可能! 一提到自动化,想必很多人都有需求.对于一些重复的,批量的工作,我们总是感到头疼.这种时候,就不如把工作交给计算机来做了.电脑虽然很蠢,没有人的逻辑思维,你需要明确告诉它每一步需 ...

  6. python自动化报表定时跑_POINTer分享:Python如何做报表自动化

    点点写在前面: 欧阳山东 @我最帅 作为小数点Python第二期的学员又双叒叕来分享干货啦!自东哥上次分享完关于咖啡馆的分析后,后台突然冒出各种灵魂拷问,如何学习Python的鸭?还有没有别的分析案例 ...

  7. 使用 Python 实现鼠标键盘自动化

    使用 Python 实现鼠标键盘自动化 本文演示了如何使用 Python 的 pyautogui 模块实现鼠标的自动移动以及键盘的自行输入. 该模块不是 Python 自带的, 因此执行以下命令进行安 ...

  8. [转载] 使用 Python 实现鼠标键盘自动化

    参考链接: 使用Python进行鼠标和键盘自动化 使用 Python 实现鼠标键盘自动化 本文演示了如何使用 Python 的 pyautogui 模块实现鼠标的自动移动以及键盘的自行输入. 该模块不 ...

  9. 详解Python中pyautogui库的最全使用方法

    这篇文章主要介绍了详解Python中pyautogui库的最全使用方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值 在使用Python做脚本的话,有两个库可以使用,一个 ...

最新文章

  1. GO语言有哪些优势?怎样入门?
  2. JZOJ.5234【NOIP2017模拟8.7】外星人的路径
  3. python画熊猫代码_用Python Turtle 画可爱的熊猫
  4. logicaldoc 6.5 结合postgresql 9.x安装部署—基于windows平台
  5. 关于MPLS和SD-WAN的4大误解—Vecloud微云
  6. Django之模型层和ORM
  7. mysql一次性获取几十万数据_《快速念咒——MySQL自学入门指南》:第2章——从表中获取更多数据(前言)...
  8. 设计模式(二十三)—— 模板方法
  9. NXP S32K RTC模块手册中文
  10. Python代码反向解析列线图nomogram自动计算各项得分及总得分
  11. 锂电池充电原理:充电电压电流的选择方法
  12. 我的世界超能物质纳米机器人_我的世界超能物质攻略
  13. OpenCASCADE开发环境搭建之OCCT库编译
  14. MATLAB 中有哪些命令,让人相见恨晚?
  15. 【unity 3d】--- 瞄准镜效果
  16. iOS:图片的旋转方向问题
  17. iOS App 名字国际化的办法
  18. Hackthebox:Granny Walkthrough(not use metasploit)
  19. 你知道常用在PCB线路板上的元器件有哪些吗?2021-08-13
  20. Chapter3美国大选金献项目数据分析

热门文章

  1. STM32产生随机数
  2. mysql怎么加载数据库_如何导入mysql数据库
  3. 项目经理人如何做好目标管理?
  4. jdbc 与 mysql 连接 - Blod及批量数据处理
  5. 前端必读 0基础学习 一文看懂 Vue3 对比 Vue2 发生哪些变化
  6. 微信小程序实现的校园查分助手
  7. 虎扑首页html制作,仿虎扑首页四级导航
  8. MySQL数据库行级锁之行锁
  9. 从Caffe开始深度学习实战,徒手hack代码乐趣更多
  10. mysql修改排序规则