采集中常见HTML标签
数据采集中HTML常见标签及属性如下:
标签 | 说明 | 举个栗子 |
---|---|---|
html | html文档 |
<html class="" lang="zh\-cmn\-Hans">
|
head | 头部 | |
title | 文档标题 | |
body | 文档主体 | |
h1 | 标题 | " |
豆瓣电影 Top 250 | ||
" | ||
p | 段落 | " <p class=""""> |
导演: 弗兰克·德拉邦特 Frank Darabont 主演: 蒂姆·罗宾斯 Tim Robbins | ||
1994 / 美国 / 犯罪 剧情 | ||
" | ||
br | 换行 | |
hr | 水平线 | |
a | 锚 | " <a class="“nav-login”" href="“https://accounts.douban.com/passport/login?source=movie”" rel="“nofollow”"> |
登录/注册 | ||
" | ||
link | 外部链接 | |
nav | 导航链接 | |
b | 粗体字 | |
abbr | 缩写 | |
cite | 引用citation | |
blockquote | 长引用 | |
q | 短引用 | " <p class="“qrcode”"> |
扫码直接下载 | ||
" | ||
fieldset | ||
meta | <meta content=“text/html; charset=utf-8” http-equiv=“Content-Type”/> | |
script | " <script type="“text/javascript”"> | |
var _body_start = new Date(); | ||
" | ||
em | 强调文本 | " <em class=""""> |
1 | ||
" | ||
节 | ||
style | 文档样式 | " <style type="“text/css”"> |
img { max-width: 100%; } | ||
" | ||
div | 文档的节 | |
span | 文档的节 | 更多 |
section | 区域 | |
article | 文章 | |
details | 元素细节 | |
dialog | 对话框 | |
多媒体 | ||
img | 图像 | |
audio | 声音 | |
source | 媒介源 | |
表单 | ||
form | 供输入的表单 | |
input | 文本框 | |
框架 | ||
iframe | 内联框架 | |
frame | 框架集的窗口或框架 | |
列表 | ||
ul | 无序列表 | |
ol | 有序列表 | |
li | 列表项目 | " <li class="“on”"> |
电影 | ||
" | ||
表格 | ||
table | 表格 |
|
caption | 表格标题 | |
th | 表头单元格 | |
tr | 表格行 | |
td | 表格单元 | |
thead | 表头内容 | |
tbody | 表格主体内容 | |
col | 一列或多列的属性值 |
采集中常见HTML标签相关推荐
- HTML中常见的其它标签
HTML中常见的其它标签 一.头标签部分 1.<title>:指定浏览器的标题栏显示的内容. 2.<base>: href 属性:指定网页中所有的超链接的目录.可以是本地目录, ...
- 深度学习中常见的打标签工具和数据集资源
深度学习中常见的打标签工具和数据集资源 一.打标签工具 1. labelimg/labelme 1.1 搭建图片标注环境(win10) (1) 安装anaconda3 (2) 在anaconda环境p ...
- 在html中frame标签的作用,HTML中的frame标签常见的6大属性,新手一定要悉知!
HTML框架和HTML页内框架的区别? 在进行网站网页设计中,会经常碰到在一个窗口中需要显示多个独立的网页页面的问题,这时候需要用到HTML frame系列标签,而frame系列 标签是HTML框架中 ...
- 火车头如何把标题加html标签,火车头采集中内容页及标签Xpath可视化提取功能的使用...
在上一篇文章<火车头采集中列表页及标签Xpath可视化提取功能的使用>中,我们讲解了火车头采集器如何利用Xpath来采集列表页.今天,我们就说说如何火车头采集器如何利用Xpath来采集内容 ...
- android 流失标签,Android中常见的热门标签的流式布局的实现
一.概述:在日常的app使用中,我们会在android 的app中看见 热门标签等自动换行的流式布局,今天,我们就来看看如何 自定义一个类似热门标签那样的流式布局吧(源码下载在下面最后给出) 类似的自 ...
- Java中常见的单词
abstract (关键字) 抽象 ['.bstr.kt] access vt.访问,存取 ['.kses]'(n.入口 ...
- java中常见的英语单词
abstract (关键字) 抽象 ['.bstr.kt] access vt.访问,存取 ['.kses]'(n.入口 ...
- Java中常见的异常
作为一名游戏开发者,程序员,很自然必须熟悉对程序的调试方法.而要调试程序,自然需要对程序中的常见的异常有一定的了解,这些日子很多朋友都提出了很多问题,都是关于游戏中的报错,因此在这里我将一些常见的程序 ...
- 从字符串中删除HTML标签
是否有从Java字符串中删除HTML的好方法? 一个简单的正则表达式 replaceAll("\\<.*?>","") 可以使用,但& 不会 ...
最新文章
- iOS-ARC_Xcode检测循环引用
- Java模式(适配器模式)
- javascript,继承,封装
- Activity-Service-Receiver-Provider
- HTML特殊符号/特殊字符
- SQL Server 2005中NTEXT与NVARCHAR(MAX)
- Oracle Alert sid log 位置问题
- 用HTML制作个人简历
- 测试方案/测试计划/测试报告
- 使用蒙特卡罗模拟期权定价
- EXCEL复合条饼图制作
- 从CAP 到编程语言的猜想
- WebStorm下载及破解
- js 比较啷个日期的大小
- 持续交付的软件系统架构
- 使用js实现植物大战僵尸的一些基本功能
- linux ubuntu配置要求,Ubuntu Server 14.04和Kylin 14.04 Enhanced Release amd64最低硬件配置要求...
- Flappy bird 小游戏的实现
- jenkins master 通过ThinBackup进行备份和恢复
- 纯干货分享:高项论文怎么写?这些写保证能及格!!!