dedecms采集功能的详细介绍(十)
dedecms采集功能的详细介绍(十)
今天来给大家讲解下dedecms的采集功能,希望大家认真学习
一.采集第一要素:确定目标网站
二.路径:后台--采集--采集节点管理--添加一个新节点----普通文章和图片集--设置新增采集节点
三.下面讲解下设置详细内容和介绍
1.
节点名称:随便写下那个站的采集就可以了
编码:查看目标站的源码,头部的charse属性就知道了该怎么填写了
区域匹配模式:一般均默认字符串;而正则表达式相当于过滤的意思
内容导入顺序:这个看你想怎么做了,正着导入还是倒序导入,你就选择相应的导入方式
防盗链模式:开启(防止刷新时间:20s)
2.列表网址获取规则
来源属性:有两种方式
(1)批量生成列表网址
匹配网址:填目标站一个栏目的第一页的网址,将其中的1改成*
然后设置*为从1到n,每页递增多少页由你自己决定,呵呵
启用多栏目通配(#):list-(#)-(*).htm
#表示采集多栏目
*表示采集多列表页面的内容
(2)手工指定网址
只指定某页面的部分文章,直接输入文章内容页面的网址就可以了
3.文章网址匹配规则
(1)区域开始的html:目标站的被采集的一个列表页的源文件的采集区域的开头的一个html标签
(2)区域结束的html:目标站的被采集的一个列表页的源文件的采集区域的结束的一个html标签
(3)如果连接中含有图片
采集为缩略图:图片采集到本机
不处理:就是不采集
(4)对区域网址进行再次筛选:这个必须包含 采集网址的共同点
四.网址获取匹配规则测试
保存进入下一步设置
五.网页内容获取规则
1.文章标题
匹配规则:
2.文章来源
匹配规则:
时间:[内容]
3.文章内容
匹配规则:
总之,这些例子就举到这里,它就是所需内容的形式,即语言的形式和 CSS 样式
4.过滤规则讲解
常用规则----随便选中一个----选择去掉中间的文字---得到如下代码
{dede:trim replace=""}{/dede:trim}
将要过滤的字放在中间就OK 了
六。采取成功后,前台不出现的原因
(1)先增加一个栏目---:核心---网站栏目管理----增加顶级栏目
(2)采集---采集节点管理---选中节点总目录---导出数据----采集管理
采集管理中有两个选项
第一个选项:默认导出栏目:选中刚才设置的栏目
第二个选项:附带选项中:选中完成后自动生成导入内容html
好了,采集功能就讲到这了,大家要在实践中操作,我在这里只是大致讲解了下dedecms采集功能设置
过程中的一些要点,重要的还是要大家去操作实践!
分享几款分页标签CSS代码(适用所有5.X版本)
dedecms
dedecms采集功能的详细介绍(十)相关推荐
- DedeCMS采集功能
DedeCMS采集功能使用基本知识讲解 2010-08-09 16:58:13| 分类:dedecms学习 | 标签:采集 规则 列表 内容 页面 |字号大中小 订阅 采集是指有着确定方 ...
- 相册服务器位置,王者荣耀游戏相册是什么 游戏相册开放服务器以及功能使用详细介绍...
王者荣耀游戏相册哪些服务器开放了?新功能怎么使用?对于这个新上线的功能,小伙伴们不太了解吧!没关系,下面是大麦子小编整理出来的游戏相册开放服务器以及功能使用详细介绍,希望可以帮到大家. 游戏相册灰度发 ...
- win10计算机管理的作用,Win10新功能的详细介绍
Win10是现在热门的系统,因此有不少用户想要装上它,不过想要装它必须先知道它有哪些新功能,以便我们日后使用,那么Win10新功能有哪些呢?如果你不知道的话,那么赶紧来看看小编对Win10新功能的详细 ...
- Arduino WString.h库功能函数详细介绍
Arduino WString.h库功能函数详细介绍 在Arduino开发框架下,String是一个很重要的数据类型.
- 1分钟搞懂MIL体系架构及功能模块详细介绍
目录 MIL体系架构 MIL核心功能模块 MIL功能模块详细描述 点对点运算 统计学运算 滤波处理 形态学运算 几何变换 快速傅里叶变换 图像分割 粒子(BLOB)分析 特征计算 图像测量 校正 JP ...
- dedecms采集功能扩展
dedecms是一个开源的网站管理系统,内含的采集器功能比较强大和易用.然而作为一个通用的采集器,它只能从一个列表页中选取合适的采集页,针对一个采集的对象下载一个网页,对该网页内容做分析,通过采集规则 ...
- Win7中语音识别功能的详细介绍
经常你会看到现在很多人开始使用手机的语音功能来交流,而不是传统上的电话,比如苹果iPhone 里的siri,或者是语音QQ.语音输入等,你想要执行什么命令,比如打开一个网页,打开一个程序等,都可以通过 ...
- tiktok协议,批量采集websocket私信详细介绍
"私域流量"简单的说就是我们自己的流量,是我们可以自由支配,可以反复使用,且几乎免费使用的流量. 讲到私域流量,第一个问题一般要问:怎样建立我的私域流量池?流量从何而来?但在问这个 ...
- 大江论坛服务器维护,Kangle“多节点服务器扩展”功能的详细介绍
Kangle多节点服务器扩展功能,可用来作"负载均衡". 当前,无论是企业网.还是园区网, 业务量的发展都超出了过去,新的应用层出不穷,即使按照当时最优配置建设的网络,也会很快感到 ...
最新文章
- 成功解决:将后缀.pyx格式文件(linux环境)编译成pyd文件(windows环境下)实现python编程加载或导入
- Nginx详细安装部署教程
- 川普签署的 H-1B 禁令昨日正式实施,最着急的是谁?
- Ubuntu实现树莓派交叉编译
- [SpringSecurity]web权限方案_用户认证_设置用户名密码
- 集合均值(逆元+数学)
- [转载] Python中pass的作用
- 用sfc命令修复Windows7的系统文件
- 一本内行人写给行内人的安全经典--全面揭秘曾经热炒一时的“入侵腾讯事件”...
- Oracle树反向查询的优化(转载)
- 求最近点对算法分析 closest pair algorithm
- 程序员除了转行做管理,还可以做什么?
- ISCSI LINUX(RHEL)的搭建与配置
- android:获取当前应用的版本
- 欧姆龙plc多轴伺服控制程序fb
- 怎么评判网络舆情分析系统好不好的指标标准详解
- 新浪UC端自动登录小工具和分析UC端登录
- CCCF“CNCC2017特邀报告”丘成桐:现代几何学与计算机科学
- HDLC和PPP协议总结
- PMP(第六版)中的沟通方法
热门文章
- 3DsMax安装教程
- 基于Android高校图书馆推荐书目系统
- python发微信提醒天气冷了注意保暖_2019天气转冷注意保暖微信 2019天气冷注意保暖的句子(图文)...
- 北海450值得入手吗?附带(越野萝莉)照片
- mysql开源内库_记一次内衣渗透测试
- 缓冲技术之三:Linux下I/O操作buffer缓冲块使用流程
- 【Spring注解驱动开发】二狗子让我给他讲讲@EnableAspectJAutoProxy注解
- 信贷审核好帮手,手机消费画像少不了
- win7和ubuntu实现相互复制粘贴文件
- 【Java专题】Java中的I/O流详解