来源:Python网红Alex的《Python超强爬虫8天速成(完整版)爬取各种网站数据实战案例》课程的P20 Day3 -5.bs4解析概述

以下为照着老师的屏幕的手敲版本:

<!DOCTYPE html>
<html lang="en">
<head><meta charset="UTF-8"><title>测试bs4</title>
</head>
<body><div><p>百里守约</p></div><div class="song"><p>李清照</p><p>王安石</p><p>苏轼</p><p>柳宗元</p><a href="http://www.song.com/" title="赵匡胤" target="_self"><span>this is span</span>宋朝是最强大的王朝,不是军队的强大,而是经济很强大,国民都很有钱</a><a href="" class="du">总为浮云能蔽日,长安不见使人愁</a><img src="https://ss1.bdstatic.com/70cFvXSh_Q1YnxGkpoWK1HF6hhy/it/u=207752506,3103804023&fm=26&gp=0.jpg" alt=""></div>
<div class="tang"><ul><li><a href="http://www.baidu.com" title="qing">清明时节雨纷纷,路上行人欲断魂。</a> </li><li><a href="http://www.163.com" title="qin">秦时明月汉时关,万里长征人未还。</a></li><li><a href="http://www.126.com" alt="qi">岐王宅里寻常见,崔九堂前几度闻。</a></li><li><a href="http://www.sina.com" class="du">杜甫</a></li><li><a href="http://www.dudu.com" class="du">杜牧</a></li><li><b>杜小月</b></li><li><i>度蜜月</i></li><li><a href="http://www.haha.com" id="feng">凤凰台上凤凰游,凤去台空江自流。</a></li></ul>
</div>
</body>
</html>

爬虫练习本地html文档相关推荐

  1. 在Ubuntu 14.04 64bit上生成ATS本地离线文档

    下面是在Ubuntu 14.04 64bit上生成ats本地离线文档的方法 首先请安装配置好sphinx环境,参见我前面的博文 http://blog.csdn.net/tao_627/article ...

  2. 一个导入到本地读取文档的方法

    一个导入到本地读取文档的方法 在网页上看到, 发现了一个比较好的插件 简悦 , 可以通过其中的一个功能, 下载为 markdown 文件. 发现是一个很不错的功能. 本来想去找一下, 有没有类似的 书 ...

  3. python爬虫爬取百度文档

    使用python爬虫爬取百度文档文字 话不多说,直接上代码! import requests import reheaders = {"User-Agent": "Moz ...

  4. Android开发——使用Jword生成本地word文档

    本文主要介绍如何使用Jword生成本地word文档,这里涉及到Jword的使用技巧,本文给出相应的代码,需要的朋友可以参考下. 为什么使用Jword呢?因为IText .Freemark在安卓平台上压 ...

  5. 如何下载腾讯在线文档?如何将腾讯在线文档导出为本地Word文档(.docx)

    使用电脑访问腾讯文档链接,如:https://docs.qq.com/doc/DRWpuSVNTeG1ZcnhG 然后依次点击:[文件]->[导出为]->[本地Word文档(.docx)]

  6. js预览本地word文档_Github+docsify打造在线文档

    效果图如下 预览链接:https://a870439570.github.io/interview-docs 快速开始 首先先安装好npm和nodejs,这里就不做过多介绍了 自信安装即可 (http ...

  7. 如何给VS2015安装MSDN本地帮助文档 - 完整教程

    简介 安装了Visual Studio 按了F1在联网的时候可以显示帮助,在没有网的情况就不好了.接下来看图说话,一步步介绍如何给VS成功安装上本地的MSDN帮助文档. MSDN MSDN即Micro ...

  8. Unity创建和修改本地Word文档

    之前做项目基本都是在本地读读数据,最多搞个截图就行了,最近客户突然提出要将实验报告(UGUI,包括图片.按钮.输入框.文字等),这就有点懵,好在经过一段时间的研究,可以在Unity内通过NPOI类库( ...

  9. js预览本地word文档_怎么免费下载百度文库付费文档?

    我们都知道百度文库中的Word文档,免费的少,大部分是需要下载券的,或者需要开通vip才能下载的!而这些券和vip都是需要钱买的,那我们有什么办法,能任意使用.下载需要的文档呢?下面我来分享一下我的方 ...

最新文章

  1. 常见的计算机视觉任务综述
  2. 前端面试题目及答案(欢迎拍砖)
  3. 统计的一个小题目python实现
  4. 深入理解 Kotlin coroutine (二)
  5. jms、amqp、mqtt区别与联系
  6. 暗黑破坏神(背包)(内部模拟)
  7. STL容器及其简单应用(stack、priority_queue、vector、deuqe、list、map/multimap、set/multiset)
  8. Python---寻找给定序列中相差最小的两个数字
  9. 1008 数组元素循环右移问题 (20)
  10. mysql事务会不会上锁_MySQL事务以及加锁机制
  11. python选择语句是什么语句_Python语言中的三种选择语句
  12. inlfuxdb版本_InfluxDB安装及配置
  13. 汇编软件DOSBox使用教程
  14. 计算机化学的dft的意义,第四章 密度泛函理论(DFT) 4.1 引言 4.2 DFT的优点 4.3 Hohenberg-Kohn定理 4.4 能量泛函公式...
  15. linux ap中继模式,小米AIoT AX3600 WiFi 6有线中继模式(AP模式)自定义局域网LAN IP地址...
  16. 局域网内查询嵌入式设备IP的几种方式
  17. 编译原理——自顶向下分析中FOLLOW集的计算
  18. Linux网卡模块,裁剪Linux并实现网卡模块的安装(附有命令移植的脚本)
  19. VxRail Cluster Expansion
  20. MyBatis中的resultMap两个association

热门文章

  1. Linux服务器性能优化,很实用
  2. 第14.3节 使用google浏览器获取网站访问的http信息
  3. 每日感悟-华杉讲解论语-2022/2/4
  4. 开源阅读书源_手机阅读app,只推荐这几款,杂志,漫画英文小说,都可以免费轻松阅读...
  5. 十字架(百度2017秋招真题)深入解析
  6. 5分钟学会Pyecharts数据可视化
  7. C++ 设计模式-装饰模式
  8. [STM32] STM32 移植 U8g2库
  9. 案例28:基于Springboot毕业设计系统开题报告设计
  10. JMETER 代理设置