数据采集中HTML常见标签及属性如下:

标签 说明 举个栗子
html html文档 <html class="" lang="zh\-cmn\-Hans">
head 头部
title 文档标题
body 文档主体
h1 标题 "
豆瓣电影 Top 250
"
p 段落 " <p class="""">
导演: 弗兰克·德拉邦特 Frank Darabont 主演: 蒂姆·罗宾斯 Tim Robbins
1994 / 美国 / 犯罪 剧情
"
br 换行
hr 水平线
a " <a class="“nav-login”" href="“https://accounts.douban.com/passport/login?source=movie”" rel="“nofollow”">
登录/注册
"
link 外部链接
nav 导航链接
b 粗体字
abbr 缩写
cite 引用citation
blockquote 长引用
q 短引用 " <p class="“qrcode”">
扫码直接下载
"
fieldset
meta <meta content=“text/html; charset=utf-8” http-equiv=“Content-Type”/>
script " <script type="“text/javascript”">
var _body_start = new Date();
"
em 强调文本 " <em class="""">
1
"
style 文档样式 " <style type="“text/css”">
img { max-width: 100%; }
"
div 文档的节
span 文档的节 更多
section 区域
article 文章
details 元素细节
dialog 对话框
多媒体
img 图像 美丽人生
audio 声音
source 媒介源
表单
form 供输入的表单
input 文本框
框架
iframe 内联框架
frame 框架集的窗口或框架
列表
ul 无序列表
ol 有序列表
li 列表项目 " <li class="“on”">
电影
"
表格
table 表格
caption 表格标题
th 表头单元格
tr 表格行
td 表格单元
thead 表头内容
tbody 表格主体内容
col 一列或多列的属性值

采集中常见HTML标签相关推荐

  1. HTML中常见的其它标签

    HTML中常见的其它标签 一.头标签部分 1.<title>:指定浏览器的标题栏显示的内容. 2.<base>: href 属性:指定网页中所有的超链接的目录.可以是本地目录, ...

  2. 深度学习中常见的打标签工具和数据集资源

    深度学习中常见的打标签工具和数据集资源 一.打标签工具 1. labelimg/labelme 1.1 搭建图片标注环境(win10) (1) 安装anaconda3 (2) 在anaconda环境p ...

  3. 在html中frame标签的作用,HTML中的frame标签常见的6大属性,新手一定要悉知!

    HTML框架和HTML页内框架的区别? 在进行网站网页设计中,会经常碰到在一个窗口中需要显示多个独立的网页页面的问题,这时候需要用到HTML frame系列标签,而frame系列 标签是HTML框架中 ...

  4. 火车头如何把标题加html标签,火车头采集中内容页及标签Xpath可视化提取功能的使用...

    在上一篇文章<火车头采集中列表页及标签Xpath可视化提取功能的使用>中,我们讲解了火车头采集器如何利用Xpath来采集列表页.今天,我们就说说如何火车头采集器如何利用Xpath来采集内容 ...

  5. android 流失标签,Android中常见的热门标签的流式布局的实现

    一.概述:在日常的app使用中,我们会在android 的app中看见 热门标签等自动换行的流式布局,今天,我们就来看看如何 自定义一个类似热门标签那样的流式布局吧(源码下载在下面最后给出) 类似的自 ...

  6. Java中常见的单词

    abstract (关键字)             抽象 ['.bstr.kt]  access                            vt.访问,存取 ['.kses]'(n.入口 ...

  7. java中常见的英语单词

    abstract (关键字)             抽象 ['.bstr.kt]  access                            vt.访问,存取 ['.kses]'(n.入口 ...

  8. Java中常见的异常

    作为一名游戏开发者,程序员,很自然必须熟悉对程序的调试方法.而要调试程序,自然需要对程序中的常见的异常有一定的了解,这些日子很多朋友都提出了很多问题,都是关于游戏中的报错,因此在这里我将一些常见的程序 ...

  9. 从字符串中删除HTML标签

    是否有从Java字符串中删除HTML的好方法? 一个简单的正则表达式 replaceAll("\\<.*?>","") 可以使用,但& 不会 ...

最新文章

  1. iOS-ARC_Xcode检测循环引用
  2. Java模式(适配器模式)
  3. javascript,继承,封装
  4. Activity-Service-Receiver-Provider
  5. HTML特殊符号/特殊字符
  6. SQL Server 2005中NTEXT与NVARCHAR(MAX)
  7. Oracle Alert sid log 位置问题
  8. 用HTML制作个人简历
  9. 测试方案/测试计划/测试报告
  10. 使用蒙特卡罗模拟期权定价
  11. EXCEL复合条饼图制作
  12. 从CAP 到编程语言的猜想
  13. WebStorm下载及破解
  14. js 比较啷个日期的大小
  15. 持续交付的软件系统架构
  16. 使用js实现植物大战僵尸的一些基本功能
  17. linux ubuntu配置要求,Ubuntu Server 14.04和Kylin 14.04 Enhanced Release amd64最低硬件配置要求...
  18. Flappy bird 小游戏的实现
  19. jenkins master 通过ThinBackup进行备份和恢复
  20. 纯干货分享:高项论文怎么写?这些写保证能及格!!!

热门文章

  1. 三维重建项目中相机选型方法
  2. pyecharts安装及画2018年中国各省gdp增长地图
  3. keep2share 购买的激活码但激活不了
  4. 【激活函数】Swish激活函数详解
  5. 如何利用空余时间,慢慢提升
  6. C语言 三角函数 时钟周期,1.3.1 三角函数的周期性PPT及课堂实录内容
  7. 模型学习之T5模型初探
  8. linux内存水印,Linux图片批量加水印
  9. 《Android studio 创建生成keystore SHA1值的申请 高德地图key值申请 android studio 打包生成apk》
  10. EasyNLP中文文图生成模型带你秒变艺术家