爬取网页数据是python很长干的一件事情,不过做起来基本上都是很冗长的一段代码,看起来复杂,不宜理解。今天给大家分享一个小诀窍,利用python3中的requests类库进行爬取网页数据。

我们先看一哈用这个requests类库做的效果

本节分享技术知识点:

  1. python导入三方类库的学习
  2. requests类库的简单使用
  3. 爬取网页数据

一、爬取网页数据实现代码

# -*- coding:UTF-8 -*-

import requests

if __name__ == '__main__':

target = 'http://gitbook.cn/'

req = requests.get(url=target)

print(req.text)

这就是实现爬取网页数据的全部代码,简单易操作。python的魅力,就是用最少的代码做最多的事。

二、创建一个python类,把上面的代码复制进去

1、如创建一个叫 pachong的类,如下图(文件取名,随意)

创建好以后,把上面第一步的代码复制进去,这时候会报红。要解决这个报红的问题则需要导入第三方类库。

三、导入第三方类库

1、其实导入三方类库也很简单,有下面两种方式。(此次讲解以mac为列)

3.1.1、输入requests时按alt+回车键(Mac电脑)

3.1.2、或者点击这个红色灯泡,然后install导入第三方类库

如上面两种方式,我们便可以轻松的导入类库了。

四、运行代码

1、导入成功后,点击requests不在报红,则开始点击运行代码

运行完后,就可以爬取到网页数据了,如下图所示。

到这里我们就轻松的实现了网页数据的爬取,我们后面要做的就是使用正则表达式,从上图的数据中,过滤出自己需要的数据。


python爬取网页汉字_程序小技巧:Python3借助requests类库3行代码爬取网页数据!快来...相关推荐

  1. python中拼音怎么用_实用小技巧,Python一秒将汉字转为拼音

    大家好,欢迎来到Crossin的编程教室! 有时在处理文件时候,我们需要将中文汉字转换为拼音或者拼音首字母的需求:还有的时候,我们需要对汉字进行按拼音字母排序(汉字的默认排序是编码序而非拼音序).针对 ...

  2. Python爬虫利用18行代码爬取虎牙上百张小姐姐图片

    Python爬虫利用18行代码爬取虎牙上百张小姐姐图片 下面开始上代码 需要用到的库 import request #页面请求 import time #用于时间延迟 import re #正则表达式 ...

  3. python爬上市公司信息_实战项目 1:5 行代码爬取国内所有上市公司信息

    实战项目 1:5 行代码爬取国内所有上市公司信息 Python入门爬虫与数据分析 在正式开始这门专栏课的学习之前,我们先来看一个简单的爬虫案例.兴趣是最好的老师,当你对爬虫产生兴趣的时候,才会更有动力 ...

  4. pyquery获取不到网页完整源代码_爬虫神器之PyQuery实用教程(二),50行代码爬取穷游网...

    爬虫神器之PyQuery实用教程(二),50行代码爬取穷游网 前言 上篇文章 PyQuery (一) 回顾.今天来介绍具体 PyQuery 的使用方法. 穷游网目标与分析 开始之前,按照之前的套路一步 ...

  5. python pyquery不规则数据的抓取_爬虫神器之PyQuery实用教程(二),50行代码爬取穷游网...

    爬虫神器之PyQuery实用教程(二),50行代码爬取穷游网 前言 上篇文章 PyQuery (一) 回顾.今天来介绍具体 PyQuery 的使用方法. 穷游网目标与分析 开始之前,按照之前的套路一步 ...

  6. 视频教程-微信小程序系统教程python版[3/3阶段]_微信小程序支付-手游开发

    微信小程序系统教程python版[3/3阶段]_微信小程序支付 微信企业号星级会员.10多年软件从业经历,国家级软件项目负责人,主要从事软件研发.软件企业员工技能培训.已经取得计算机技术与软件资格考试 ...

  7. 教你用python实现34行代码爬取东方财富网信息,爬虫之路,永无止境!!

    教你用python实现34行代码爬取东方财富网信息,爬虫之路,永无止境!! 代码展示: 开发环境: windows10 python3.6 开发工具: pycharm weddriver 库: sel ...

  8. python:利用20行代码爬取网络小说

    文章目录 前言 一.爬虫是什么? 二.实现过程 总结 提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 前言 今天,来给大家一个分享一下如何使用20爬虫行代码爬取网络小说(这里我们以龙 ...

  9. 微信小程序小技巧分享

    微信小程序小技巧分享 微信小程序相关编程技巧分享,内容来源是经验总结以及论坛啊,博客上收集,后续还会分享更多技巧,欢迎大家讨论. 1. 滚动加载数据方式 在滚动分页加载数据的时候,通常做法是定义一个数 ...

最新文章

  1. Leetcode 剑指 Offer 11. 旋转数组的最小数字 (每日一题 20210916)
  2. python结束循环_python中break、continue 、exit() 、pass终止循环的区别
  3. Android如何自定义Gradle插件
  4. CentOS 7 install Zabbix3.4
  5. see rebel case 无法越狱_周星驰为什么不拍喜剧,王晶:年纪大了,无法面对自己...
  6. 机器学习—XGBoost实战与调参
  7. 2006年博客之星(小废物点评版)
  8. Div总在右下角的CSS实现方法
  9. 2020电脑服务器cpu性能天梯图,CPU性能天梯图[202002版]
  10. win10linux双系统时间,win10与linux双系统切换时间不一致的调整
  11. linux查看gc日志,GC通用日志解读
  12. 2021级天狮学院经济管理学院市场营销专升本专业辅导员及新生群
  13. 修改 hosts 文件
  14. 关于flask入门教程-ajax+echarts实现矩形树图
  15. 【luogu P3426】SZA-Template(字符串)(KMP)
  16. 物流领域如何利用物联网来打造智能化物流体系
  17. Linux安装-CentOS7.x
  18. “问天号”已就位!喻京川2013年畅想的《中国空间站》,即将启航星辰大海!...
  19. Nett源码剖析(2)NioEventloopGroup的创建2021SC@SDUSC
  20. MYSQL函数 group_concat巨坑!!!

热门文章

  1. win10 mysql 启动 bat_windows系统下(如win10)如何将bat在系统开机但未登录情况下自动启动...
  2. 来自Unity的2022新年祝福
  3. Wireshark抓包使用指南
  4. 精心整理200道最新Java中高级工程师高频面试题
  5. tar打包带软连接(相对路径)
  6. UML建模—EA的使用(一)EA基本设置及类的设计
  7. Java socket详解,看这一篇就够了
  8. mysql关系运算_数据库中的关系运算
  9. shell进行nginx日志分析
  10. nginx 请求日志分析