Day1 前端基础(爬虫)

一、常用标签1

<!-- html版本说明!DOCTYPE  - 版本说明html - html5(最新版本)--><!DOCTYPE html><!-- 1.网页基本结构:整个网页是一个html标签。(有多少个网页就有多少个html标签,就有多少个html文件)一个html标签里面有一个head标签和一个body标签。head负责网页头部的显示body负责网页内容的显示--><!-- 2.标签语法html是通过不同的标签来给网页提供不同的内容,标签分为双标签和单标签两种双标签:<标签名 属性名1="属性值1" 属性名2="属性值2">标签内容</标签名>单标签:<标签名 属性名1="属性值1" 属性名2="属性值2"/>  或者  <标签名 属性名1="属性值1" 属性名2="属性值2">注意:双标签的内容可以是文字也可以是其他标签-->
<!-- html标签表示整个网页-->
<html><head><!-- 设置html文件的编码方式 --><meta charset="utf-8" /><!-- 设置网页标题 --><title>网页标题--WX</title><!-- 设置网页图标 link标签是用来导入外部文件的rel - 设置导入文件的作用,icon-图标,stylesheet - 样式表type - 设置被导入的文件类型和格式:文件类型/文件后缀,image/png - 表示导入的文件是图片,后缀是pnghref - 被导入的文件的路径--><link rel="icon" type="image/jpg" href="./img/JD图标.jpg"/></head><body><!-- 1.标题:h1~h6 -->你好,世界!<h1>一级标题</h1><h2>二级标题</h2><h3>三级标签</h3><h4>四级标签</h4><h5>五级标签</h5><h6>六级标签</h6><!-- 2.段落 - 自然段:p一个段落一个p标签--><p>这一天一天的</p><p>这两天两天的</p><p>这三天三天的水电费付付付付付付付付付付付付付付付付付发生的,口号卡拉的拉卡拉卡克拉里看见俺老家的客流量卡,等级案件收到了加快劳动节拉开建档立卡看了的金坷垃就立刻就打啦阿昆达捡垃圾山莨菪碱阿拉山口讲道理卡时间段开辣椒水鹿鼎记奥克兰 奥地利会计案例肯德基拉科技的卡拉建档立卡家里肯德基埃里克</p><!-- 3.普通文字:span、font --><span>发布时间:2021 0524</span><span>王新</span><br><font>发布时间:2021 0524</font><font>王新</font><!-- 4.文字相关符号和分段1)换行强制换行 - <br>2)空格&nbsp; - 一个空格(空一格像素)&emsp; - 一个空格(按一次空格键)3)加粗<b></b>、<strong></strong>4)倾斜<i></i>、<em></em>--><p><b><i>&emsp;静夜思</i></b><br>&nbsp;床前明月光,<br>&emsp;疑似地上霜。<br>举头望明月,<br>低头思故乡。</p></body>
</html>

二、常用标签2

<!DOCTYPE html>
<html><head><meta charset="utf-8"><title>常用标签2</title></head><body><!-- 1.图片scr - 图片地址title - 图片标题alt属性 - 图片显示失败的时候的显示信息--><img src="./img/JD图标.jpg" title="图片1">        <img src="https://dss0.bdstatic.com/70cFuHSh_Q1YnxGkpoWK1HF6hhy/it/u=2496571732,442429806&fm=26&gp=0.jpg" title="图片2" ><img src="https://dss0.bdstatic.com/70cFuHSh_Q1YnxGkpoWKF6hhy/it/u=2496571732,442429806&fm=26&gp=0.jpg" title="图片2" alt='图片加载失败' ><!-- 2.超链接:a标签<a href="跳转地址">可见可点击内容</a>href属性 - 跳转地址target属性 - 跳转方式,默认是_self(在当前页面中显示新的页面)、_blank(在新的窗口中显示新的页面)--><a href="https://www.baidu.com" target="_blank">百度</a><a href="https://www.jd.com"><img src="./img/JD图标.jpg" title="图片1"></a></body>
</html>

三、表单相关标签

<!DOCTYPE html>
<html><head><meta charset="utf-8"><title>表单标签</title></head><body><!-- 1.表单标签 表单标签用来对表单中所有相关标签进行重置和提交,单独使用没有价值--><form action="" method=""></form><!-- 2.表单相关标签 --><!-- 2.1 input标签type属性 - 值不同,标签的表现和作用完全不同--><!--value属性 - 输入框中的内容placeholder - 输入提示信息--><form action="" method="">普通的文本输入框:<input type="text" id='username' value="小明" placeholder="请输入手机号码" maxlength="10"/><br>密码输入框:<input type="password" value="123456" placeholder="请输入密码"/><br>普通按钮:<input type="button" value="确定"/><br><!-- 单选按钮里面的value不会显示,需要在后面写 单选按钮需要通过label标签来提供选项,当label的for和input的id值一致的时候,点击label可以选中input如果希望多个选项中有且只有一个选项处于选中状态,需要将多个选项的name属性设置成相同的值-->单选按钮:<input type="radio" value='男'/><br>单选按钮:<input type="radio" id='sex1' name='sex' checked="checked"/><label for="sex1" >男</label><input type="radio" id='sex2' name='sex'/><label for='sex2' >女</label><br>复选按钮:<input type="checkbox" id='ball1' name="ball"/><label for="ball1">篮球</label><input type="checkbox" id='ball2' name="ball"/><label for="ball2">足球</label><input type="checkbox" id='ball3' name="ball"/><label for="ball3">羽毛球</label><input type="checkbox" id='ball4' name="ball"/><label for='ball4'>乒乓球</label><br><!-- 重置按钮只能重置和重置按钮在同一个form标签里面的内容value是按钮显示的内容,默认名字为重置-->重置按钮:<input type="reset" value='还原'/><br></form>  颜色选择器:<input type="color"/><br>文件选择:<input type="file" /><br>时间选择器:<input type="datetime-local"/><br>日期选择器:<input type="date"/><br></body>
</html>

四、表单相关标签2

<!DOCTYPE html>
<html><head><meta charset="utf-8"><title>表单相关标签2</title></head><body><!-- 1.表单相关标签 --><!-- 1).多行文本输入框 --><textarea rows="4" cols="100" placeholder="请输入内容...">小明</textarea><br><!-- 2).下拉列表 --><select name="city"><option value="成都市">成都市</option><option value ="达州市">达州市</option><option value ="绵阳市">绵阳市</option><option value ="南充市">南充市</option><option value ="眉山市">眉山市</option><option value ="乐山市">乐山市</option></select><!-- 2.列表 --><!-- 1)有序列表 --><ol><li>Python</li><li>java</li><li>h5</li><li>UI</li><li>物联网</li></ol><!-- 2)无序列表 --><ul><li>Python</li><li>java</li><li>h5</li><li>UI</li><li>物联网</li></ul><!-- 3.div标签 --></body>
</html>

五、requests的使用

import requests
from re import *# 1.获取指定网页数据
response = requests.get('https://www.sohu.com/')
# 设置编码方式(如果网页的编码方式不是‘utf-8’,则需要设置)
# 查看网页 charset的值
response.encoding = 'utf-8'# 2.获取请求内容
# print(response)
# 在请求成功的时候获取网页源代码(网页内容)
# 获取搜狐网站的新闻标题和链接
if response.status_code == 200:str1 = response.textresult = findall(r'<a.*?href=".*?".*?title=[\'"].*?[\'"].*?>', str1)for x in result:result1 = findall(r'href=".*?"', x)result2 = findall(r'title=[\'"].*?[\'"]', x)print(f'标题:{str(result2)[9:-3]}    链接:{str(result1)[8:-3]}')

Day1 前端基础(爬虫)相关推荐

  1. Python进阶之前端和爬虫基础

    前端和爬虫基础 一.了解前端页面源代码 1.了解前端页面源代码的构成 html全称HyperText Mackeup Language,翻译为超文本标记语言,它不是一种编程语言,是一种描述性的标记语言 ...

  2. 大厂技术文档:Python基础+爬虫+数据分析+面试经精选

    有段时间没跟各位粉丝分享编程资源福利了,看了下自己的资料夹,就剩下我认为比较好的Python学习资料了.相信这套资料可以对你进阶高级工程师有帮助! 为什么只有Python这么火,能有机会成为通用语言? ...

  3. Day1 - Python基础1

    Day1 - Python基础1 目录 Python介绍 发展史 Python 2 or 3? 安装 Hello World程序 变量 用户输入 模块初识 python的创始人为吉多·范罗苏姆(Gui ...

  4. 大厂技术文档:Python 基础+爬虫+数据分析+面试经精选

    有段时间没跟各位粉丝分享编程资源福利了,看了下自己的资料夹,就剩下我认为比较好的Python学习资料了.相信这套资料可以对你进阶高级工程师有帮助! 为什么只有Python这么火,能有机会成为通用语言? ...

  5. python前端基础知识总结 及部分练习题

    python前端基础知识总结 知识总结 认识Python 发展历史 版本选择 python2.7是python2的最后一个版本,到2020年将不再维护 python3.6是python3最新的版本,是 ...

  6. 第二章网页前端基础与HTTP协议

    第二章 网页前端基础与HTTP协议 爬虫需要遵循网络传输协议才能与服务器进行通信,当与服务器建立通信后,爬虫才能获取网页内容,从而获取想要爬取的内容.获取到的网页内容通常为HTML(HyperText ...

  7. html表格联动,html前端基础:table和select操作

    html前端基础:table和select操作 发布时间:2020-05-13 09:58:10 来源:亿速云 阅读:196 作者:Leah 这篇文章主要为大家详细介绍html前端基础中有关table ...

  8. element ui 图片控件 排序_JAVA全栈面试前端基础之四 Vue+Element框架快速开发

    本文主要包括以下4个内容 什么是ElementUI Vue 中引入ElementUI Vue+elementUI构建后台管理系统 开源项目推荐 1.什么是ElementUI 官网:https://el ...

  9. boost log 能不能循环覆盖_前端基础进阶(十四):深入核心,详解事件循环机制...

    Event Loop JavaScript的学习零散而庞杂,很多时候我们学到了一些东西,但是却没办法感受到进步!甚至过了不久,就把学到的东西给忘了.为了解决自己的这个困扰,在学习的过程中,我一直在试图 ...

最新文章

  1. 试题 入门训练 Fibonacci数列(Java)
  2. React App项目页面进出场动画
  3. springmvc十五:数据输出
  4. 第33讲:可见即可爬,Appium 的使用
  5. 微软开放Holographic平台,意在统一VR的操作系统?
  6. 3.14 01串排序
  7. H.264视频编码在VC .Net中的实现(H264全文)
  8. suse tomcat mysql_JDK TOMCAT MYSQL SUSE LINUX 环境搭建
  9. Fiddler-弱网测试设置
  10. 剖析Disruptor:为什么会这么快?(一)Ringbuffer的特别之处
  11. [新增:鸵鸟]软件开发团队的脓包:皇帝的新装、口号党、鸵鸟、废话迷
  12. GTA5 如何替换各种人物模型
  13. python存根文件_打包存根文件
  14. 在线文档 - Google drive
  15. 合肥高中计算机课程表,合肥普通高中新课程各科目必修学分统计表
  16. 什么是AMD;什么是CMD
  17. 【干货#009】小程序如何格式化显示对象数组属性
  18. vmd安装包_【MMD相关】推荐点软件/插件
  19. [附源码]JAVA+ssm交通违章举报平台(程序+Lw)
  20. Oracle - 索引

热门文章

  1. 看过的最最最搞笑的电视剧结局
  2. Photo Album: 阳台山
  3. Windows 登录Microsoft账户一直加载
  4. 码龄0.4年的python成长之路(八):门牌数字制作
  5. 谨慎安装64位Windows Vista系统
  6. theboboy原创 随机生成器 生成伪数据 用来做测试 Java版本
  7. 招商银行的软件下载.
  8. [计算机毕设]基于java的超市综合管理信息系统设计与实现(项目报告+源代码+翻译)
  9. python中装饰器的使用教程详解(wraps)
  10. 龙——崔斯特·杜垩登