前两天突然接到领导一个邮件,让我用八爪鱼采集互联网数据。下面是邮件的原话:

  我是接触可视化工具较多,但是你这个应该不复杂就有点主观了吧,没办法,让我对应就对应吧。

  首先登陆官网:http://www.bazhuayu.com/,下载客户端安装,傻瓜式安装下一步下一步就完成了。我不需要免费账号,公司买了一个。

  这是这个工具的界面,还是蛮简洁的,最主要的是任务栏和工具箱栏。任务栏首先可以建立任务组,在任务组下面建立具体的任务。下面我就具体的某一任务来一一说明。

  我采集的是中国土地市场网的结果公示,网址为http://www.landchina.com/default.aspx?tabid=263&ComName=default,页面如图:

  需要采集的信息是列表内容和点进去列表后的详情,当然我的例子是列表选一个,详情选一个。还有一点,这个列表需要翻页,一共200页,每页30条。

1,建立任务:点击新建,选择自定义采集,输入网址,点击保存。

出来的页面是这样:

2,现在我要把序号这一列采集下来,鼠标点击1.,然后选择选中全部:

再选择采集以下元素文本。至此,列表的信息可以采集了。

3,点击钻取到详情列的超链接,然后选择点击该链接:

下面会跳转到详情页,我再采集项目名称,单击对应文本,选择采集该元素的文本,至此详情的信息可以采集了。

4,我们的采集工作完成了,但是我们还差翻页循环,点击返回上个页面:

找到下页按钮,点击,然后选择循环单击单个链接:

然后点击左上角保存,全部步骤完成,我们可以看一下流程图:

这样一个采集任务就完成了,接下来就可以点击开始采集按钮测试了。

转载于:https://www.cnblogs.com/caozx/p/10121645.html

八爪鱼采集列表和详情信息相关推荐

  1. ios图文详情加载html_前端项目009 Vue 信息分享系统 商品列表、详情

    頔言頔语:进步,一定要进步,进步是跟收入持平的本钱. 01 商品列表 0101 路由配置和数据请求 0102 上拉加载更多 02 商品详情 0201 详情数据请求和展示 0202 轮播图组件提取 02 ...

  2. 大数据信息资料采集:公众号武志红文章评论爬取八爪鱼采集器规则

    大数据信息资料采集:公众号武志红文章评论爬取八爪鱼采集器规则 大数据信息资料采集 公众号历史文章采集 公众号评论爬取 微信公众号历史文章导出 抓取微信公众号所有文章. 公众号文章抓取工具 抓取公众号所 ...

  3. 大数据信息资料采集:视频信息采集及评论内容爬取八爪鱼采集规则

    大数据信息资料采集:视频信息采集及评论内容爬取八爪鱼采集规则 数据采集满足多种业务场景:适合产品.运营.销售.数据分析.政府机关.电商从业者.学术研究等多种身份职业. 舆情监控:全方位监测公开信息,抢 ...

  4. 大数据信息资料采集:校园二次元热门漫画动画信息八爪鱼采集规则

    大数据信息资料采集:校园二次元热门漫画动画信息八爪鱼采集规则 数据采集满足多种业务场景:适合产品.运营.销售.数据分析.政府机关.电商从业者.学术研究等多种身份职业. 舆情监控:全方位监测公开信息,抢 ...

  5. 八爪鱼采集器爬取京东手机信息

    1.下载八爪鱼采集器,运行 2.点击新建任务(高级模式) 3.在基本信息栏中输入任务名,点击下一步 4.流程栏里拖动打开网页到流程线上,并在右侧输入要打开的商品页面的url,点击保存 5.选中一个商品 ...

  6. 大数据信息资料采集:商品促营销活动海报设计模板八爪鱼采集规则

    大数据信息资料采集:商品促营销活动海报设计模板八爪鱼采集规则 数据采集满足多种业务场景:适合产品.运营.销售.数据分析.政府机关.电商从业者.学术研究等多种身份职业. 舆情监控:全方位监测公开信息,抢 ...

  7. 大数据信息资料采集:情感公号风茕子历史文章评论爬取八爪鱼采集

    大数据信息资料采集:情感公号风茕子历史文章评论爬取八爪鱼采集 大数据信息资料采集 公众号历史文章采集 公众号评论爬取 微信公众号历史文章导出 抓取微信公众号所有文章. 公众号文章抓取工具 抓取公众号所 ...

  8. 八爪鱼采集教程——房源信息采集

    介绍使用八爪鱼7.0采集安居客网页信息的方法(以深圳写字楼为例) 使用功能点: l 分页列表页信息采集     步骤1:创建采集任务 进入主界面选择,选择自定义模式 将上面网址的网址复制粘贴到网站输入 ...

  9. 天猫php采集列表,QueryList: QueryList是一个基于phpQuery的通用列表采集类,是一个简单、 灵活、强大的采集工具,采集任何复杂的页面 基本上就一句话就能搞定了。...

    #QueryList交流社区: http://querylist.cc/ #QueryList文档: http://doc.querylist.cc/ #QueryList交流QQ群:12326696 ...

最新文章

  1. protel DXP的类矢量图功能
  2. 《SAS编程与数据挖掘商业案例》学习笔记之七
  3. postman 无法正常返回结果 Could not get any response
  4. python模拟手机充值场景_appium+Python实例(二)模拟新建场景表(辅助测试执行)...
  5. 上传下载文件到Linux服务器
  6. getter与setter
  7. ubuntu20有道词典亲测安装记录
  8. java8 Stream2
  9. Android开发笔记(六十一)文件下载管理DownloadManager
  10. LeetCode(908)——最小差值 I(JavaScript)
  11. 作业6--第3、4、5天进度
  12. 第三届空间信息智能服务研讨会
  13. android 万能视频播放器源码,Android万能视频播放器05-音视频同步
  14. cad2018安装教程_安装CAD后,我首先干了这些事!
  15. 360浏览器设置语言国际化
  16. html自动验证邮件地址格式,JavaScript验证Email邮箱格式的三种方法
  17. 计算机组成原理课程笔记
  18. ESP32基于arduino和风天气获取代码
  19. vue+videojs视频播放、视频切换、视频断点分段上传
  20. DMP (Dynamic Movement Primitives) 动态运动基元

热门文章

  1. 企业宣传片如何做?上海宣传片公司拍摄与制作看这里
  2. 金蝶云php webapi,金蝶云星空(WebApi集成方式):免密码登录接口
  3. 云南省行政村谷歌图层_如何根据行政边界(省市区县乡镇)下载地图
  4. 算法经典“钓鱼”问题详解 基于贪心算法 C语言描述
  5. 理想、激情、生存———位技术管理人员的20年工作经历和感悟(2)
  6. 详谈企业级session、Token登入实现方式
  7. train_test_split参数解释
  8. scikit learn train_test_split的使用
  9. 朝阳群众盯上了望京A座,举报996造成交通严重堵塞。996将成历史?
  10. 学习了解通信-R16-5G QI VoNR