爬虫练习本地html文档
来源:Python网红Alex的《Python超强爬虫8天速成(完整版)爬取各种网站数据实战案例》课程的P20 Day3 -5.bs4解析概述
以下为照着老师的屏幕的手敲版本:
<!DOCTYPE html> <html lang="en"> <head><meta charset="UTF-8"><title>测试bs4</title> </head> <body><div><p>百里守约</p></div><div class="song"><p>李清照</p><p>王安石</p><p>苏轼</p><p>柳宗元</p><a href="http://www.song.com/" title="赵匡胤" target="_self"><span>this is span</span>宋朝是最强大的王朝,不是军队的强大,而是经济很强大,国民都很有钱</a><a href="" class="du">总为浮云能蔽日,长安不见使人愁</a><img src="https://ss1.bdstatic.com/70cFvXSh_Q1YnxGkpoWK1HF6hhy/it/u=207752506,3103804023&fm=26&gp=0.jpg" alt=""></div> <div class="tang"><ul><li><a href="http://www.baidu.com" title="qing">清明时节雨纷纷,路上行人欲断魂。</a> </li><li><a href="http://www.163.com" title="qin">秦时明月汉时关,万里长征人未还。</a></li><li><a href="http://www.126.com" alt="qi">岐王宅里寻常见,崔九堂前几度闻。</a></li><li><a href="http://www.sina.com" class="du">杜甫</a></li><li><a href="http://www.dudu.com" class="du">杜牧</a></li><li><b>杜小月</b></li><li><i>度蜜月</i></li><li><a href="http://www.haha.com" id="feng">凤凰台上凤凰游,凤去台空江自流。</a></li></ul> </div> </body> </html>
爬虫练习本地html文档相关推荐
- 在Ubuntu 14.04 64bit上生成ATS本地离线文档
下面是在Ubuntu 14.04 64bit上生成ats本地离线文档的方法 首先请安装配置好sphinx环境,参见我前面的博文 http://blog.csdn.net/tao_627/article ...
- 一个导入到本地读取文档的方法
一个导入到本地读取文档的方法 在网页上看到, 发现了一个比较好的插件 简悦 , 可以通过其中的一个功能, 下载为 markdown 文件. 发现是一个很不错的功能. 本来想去找一下, 有没有类似的 书 ...
- python爬虫爬取百度文档
使用python爬虫爬取百度文档文字 话不多说,直接上代码! import requests import reheaders = {"User-Agent": "Moz ...
- Android开发——使用Jword生成本地word文档
本文主要介绍如何使用Jword生成本地word文档,这里涉及到Jword的使用技巧,本文给出相应的代码,需要的朋友可以参考下. 为什么使用Jword呢?因为IText .Freemark在安卓平台上压 ...
- 如何下载腾讯在线文档?如何将腾讯在线文档导出为本地Word文档(.docx)
使用电脑访问腾讯文档链接,如:https://docs.qq.com/doc/DRWpuSVNTeG1ZcnhG 然后依次点击:[文件]->[导出为]->[本地Word文档(.docx)]
- js预览本地word文档_Github+docsify打造在线文档
效果图如下 预览链接:https://a870439570.github.io/interview-docs 快速开始 首先先安装好npm和nodejs,这里就不做过多介绍了 自信安装即可 (http ...
- 如何给VS2015安装MSDN本地帮助文档 - 完整教程
简介 安装了Visual Studio 按了F1在联网的时候可以显示帮助,在没有网的情况就不好了.接下来看图说话,一步步介绍如何给VS成功安装上本地的MSDN帮助文档. MSDN MSDN即Micro ...
- Unity创建和修改本地Word文档
之前做项目基本都是在本地读读数据,最多搞个截图就行了,最近客户突然提出要将实验报告(UGUI,包括图片.按钮.输入框.文字等),这就有点懵,好在经过一段时间的研究,可以在Unity内通过NPOI类库( ...
- js预览本地word文档_怎么免费下载百度文库付费文档?
我们都知道百度文库中的Word文档,免费的少,大部分是需要下载券的,或者需要开通vip才能下载的!而这些券和vip都是需要钱买的,那我们有什么办法,能任意使用.下载需要的文档呢?下面我来分享一下我的方 ...
最新文章
- 常见的计算机视觉任务综述
- 前端面试题目及答案(欢迎拍砖)
- 统计的一个小题目python实现
- 深入理解 Kotlin coroutine (二)
- jms、amqp、mqtt区别与联系
- 暗黑破坏神(背包)(内部模拟)
- STL容器及其简单应用(stack、priority_queue、vector、deuqe、list、map/multimap、set/multiset)
- Python---寻找给定序列中相差最小的两个数字
- 1008 数组元素循环右移问题 (20)
- mysql事务会不会上锁_MySQL事务以及加锁机制
- python选择语句是什么语句_Python语言中的三种选择语句
- inlfuxdb版本_InfluxDB安装及配置
- 汇编软件DOSBox使用教程
- 计算机化学的dft的意义,第四章 密度泛函理论(DFT) 4.1 引言 4.2 DFT的优点 4.3 Hohenberg-Kohn定理 4.4 能量泛函公式...
- linux ap中继模式,小米AIoT AX3600 WiFi 6有线中继模式(AP模式)自定义局域网LAN IP地址...
- 局域网内查询嵌入式设备IP的几种方式
- 编译原理——自顶向下分析中FOLLOW集的计算
- Linux网卡模块,裁剪Linux并实现网卡模块的安装(附有命令移植的脚本)
- VxRail Cluster Expansion
- MyBatis中的resultMap两个association
热门文章
- Linux服务器性能优化,很实用
- 第14.3节 使用google浏览器获取网站访问的http信息
- 每日感悟-华杉讲解论语-2022/2/4
- 开源阅读书源_手机阅读app,只推荐这几款,杂志,漫画英文小说,都可以免费轻松阅读...
- 十字架(百度2017秋招真题)深入解析
- 5分钟学会Pyecharts数据可视化
- C++ 设计模式-装饰模式
- [STM32] STM32 移植 U8g2库
- 案例28:基于Springboot毕业设计系统开题报告设计
- JMETER 代理设置