1.复杂数据对象的挖掘处理

答:这里的对象是指复杂但相对结构化的数据对象,这些数据对象不能简单的用数据关系来表示,大多数拥有这些数据的应用基本上是面向对象的。这个时候,对数据对象的挖掘就是对复杂结构化的数据对象进行处理。挖掘复杂数据对象的任务是建立复杂对象的多维数据仓库,做联机处理分析,针对多维数据仓库做有效、可伸缩的数据挖掘。结构化多维数据挖掘处理遵循通用的挖掘过程,可以采用一般的数据规约方法。

2.空间数据的挖掘处理

答:空间数据的特点是存在大量与空间相关的数据,包含拓扑或者距离信息,对地理、空间方面有帮助。空间数据挖掘是指提取空间数据库中非显式存储的知识、空间联系或其他有趣的模式。空间数据仓库是面向主题的、集成的、时变的、非易失性的空间数据和非空间数据的集合,用于支持空间数据挖掘和与空间数据相关的决策过程。

由于空间数据信息由空间信息和非空间信息两部分组成,,所以针对空间信息要采用专门的空间维度来保存,做空间信息的挖掘;针对非空间信息要在空间维度的基础上进行非空间信息的处理。空间信息的常用数据挖掘方法有空间数据立方体处理方法和空间聚类方法。

3.多媒体数据的挖掘处理

答:多媒体数据信息是多类信息的数据集合,这些信息数据集合的信息类型有视频、图像、图形、声音、文本、文档、超文本数据等。对多媒体数据的数据挖掘就是针对各种信息类型进行数据挖掘,可以是组合信息的索引,也可以是信息内容。多媒体信息的数据挖掘是一种复合型的数据挖掘,可能同时要使用多种数据挖掘的方法,分别处理图像、文本、声音、空间等。

4.文本数据的挖掘处理

答:文本信息是有各种数据文档组成的,与其他类型的数据不同,文本数据的数据挖掘任务重点关心文本的信息检索。一般检索方法分为两类:文档选择问题和文档秩评定问题。文档选择问题看作是对选择相关文档指定约束条件,类似于给定足够的选择项约束集合,然后根据约束集合中的条件对文档进行筛选,非集合内的条件不被接受。文档秩评定方法使用查询,按相关次序评定所有文档的秩,通过秩的评定来响应客户的查询。确定了这两种方法需要解决的主要问题,对文档选择问题来说:数据预处理、规约、设定标签、索引、约束条件集合是要重点考虑的因素;对于文档秩评定问题的来说:约束条件的权值设定、数据的预处理、规约、文档组成部分的信息挖掘等是要重点考察的因素。

5.Web信息的数据挖掘

答:Web信息网络作为现在一个巨大并告诉增长的信息库,是一个数据挖掘的重要场所。由于Web

本身的结构特点和信息内容重点集中于某些结构上,这有助于信息挖掘。但是这种结构是弹性很大的,有时甚至是动态的,在数据挖掘的过程中要考虑这些特点。常规的数据挖掘方法是仿照文本的数据挖掘方法中文档秩评定问题,对Web信息设定一些权重标准,如高引用的页面、时间、内容、搜素条件的词汇复合等,最后返回一组经过秩评定的Web信息页面。

6.数据挖掘的理论基础

答:数据规约、数据压缩、模式发现、概率论、微观经济学观点、归纳数据库等。

7.可以应用数据挖掘的前提条件

答:必须有足够的数据是最基础的前提,不论这些数据是孤立的还是有序一致的。有了数据也不一定要应用数据挖掘,如果要挖掘的信息是基础数据所不具备的信息,这也是枉然。当数据足够多,需要获取的信息可以从数据中获得支持,还要考虑获取数据的成本问题,就是构建数据仓库、数据挖掘、联机数据分析、数据展示所消耗的成本问题。如果这些前提条件都满足,就可以进行数据挖掘。因为整个挖掘过程是需要消耗时间成本的,对响应时间要求没有那么严格,所以数据挖掘最好是采用存量异步处理+增量异步处理结合的方式进行,还要考虑数据挖掘任务的紧急性和重要性排序。

挖掘对象、空间、多媒体、文本和Web数据相关推荐

  1. 利用查询条件对象,在Asp.net Web API中实现对业务数据的分页查询处理

    在Asp.net Web API中,对业务数据的分页查询处理是一个非常常见的接口,我们需要在查询条件对象中,定义好相应业务的查询参数,排序信息,请求记录数和每页大小信息等内容,根据这些查询信息,我们在 ...

  2. Web数据存储之localStorage和sessionStorage

    Web数据存储之localStorage和sessionStorage 学习前端以来,自己了解有localStorage和sessionStorage的相关存储的知识,也有实践过,但是之前只限于能用的 ...

  3. 在 Web 数据控件中显示二进制数据54

    简介 前面的教程中 , 我们介绍了将二进制数据与应用程序的基础数据模型相关联的两种方法 , 并使用FileUpload 控件从浏览器向 Web 服务器的文件系统上载.我们还将了解怎样将上载的二进制数据 ...

  4. slickgrid 中ajax,slickgrid.js 一种高性能web数据表格组件的探讨

    本文将探讨一种高性能web数据表格组件的实现,首先简单介绍slickgrid这个前人开发的组件,接着对该组件的设计和实现思路进行讨论,最后对该组件的思想进行提炼,实现基于原始思想的新组件. slick ...

  5. 可爱的 Python: 使用 mechanize 和 Beautiful Soup 轻松收集 Web 数据

    可爱的 Python: 使用 mechanize 和 Beautiful Soup 轻松收集 Web 数据 使用 Python 工具简化 Web 站点数据的提取和组织 David Mertz, Ph. ...

  6. 巧用ASP实现Web数据统计、报表和打印 (转)

    巧用ASP实现Web数据统计.报表和打印 (转)[@more@] 巧用ASP实现web数据统计.报表和打印XML:namespace prefix = o ns = "urn:schemas ...

  7. DM数据库管理模式对象空间、表、索引、触发器、视图、序列列、同义词等。

    一.管理模式对象的空间 模式对象的空间管理关系到空间的有效使用和数据的合理分布. 1.设置存储参数 对于普通表和索引,DM8提供了以下的存储参数: 初始簇数目INITIAL:指建立表时分配的簇个数,必 ...

  8. 目前最流行的Web 数据接口 API 设计规范:RESTful

    RESTful 是目前最流行的 API 设计规范,用于 Web 数据接口的设计. 它的大原则容易把握,但是细节不容易做对.本文总结 RESTful 的设计细节,介绍如何设计出易于理解和使用的 API. ...

  9. python与网页交互_可爱的 Python: 使用 mechanize 和 Beautiful Soup 轻松收集 Web 数据

    可爱的 Python 使用 mechanize 和 Beautiful Soup 轻松收集 Web 数据 使用 Python 工具简化 Web 站点数据的提取和组织 David Mertz 2010 ...

最新文章

  1. [置顶] 单例模式lua实现
  2. 压力传感器 ZNHM-I-5KG初步测试
  3. C++实现 找出10000以内的完数
  4. python基于百度接口的语音识别_Python基于百度接口的语音识别
  5. Win32 汇编要点总结
  6. test index.php,index.php
  7. 面向对象程序设计 第六次作业
  8. Android ----中文Api 百度地图
  9. Rancher 2.5 正式发布,多项重大更新来袭!
  10. nodejs Error: request entity too large解决方案
  11. ajax 表格删除,jQuery AJAX删除只捕获第一个表格
  12. linux-2.6.22.6 内核源代码包的文件目录介绍
  13. 推荐10个我在用的Chrome浏览器插件
  14. 物理化学第6版笔记和课后答案(天津大学)
  15. 波段划分相关资料总结
  16. 【复习必备】高中数学必修四公式汇总, 精华版赶快收藏
  17. Matlab如何调用外部函数/工具包,如何将新函数加到默认函数库中
  18. js 身份证 港澳通行证正则
  19. 银行数字化运维转型应对之道
  20. java 动态分区 链表_大二作业——操作系统实验——C语言用双向链表,模拟实现动态分区式存储管理...

热门文章

  1. 进程(程序)僵死问题解决方法
  2. mybatis:通过参数传表名、select字段
  3. html手机打不开是什么,手机打不开路由器网址_手机打不开路由器设置页面怎么办? - 192路由网...
  4. 美女老师酷似刘诗诗,“女神崇拜”挺伤人
  5. 高新区培育申报瞪羚企业
  6. Navicat还原.psc备份的数据库
  7. 英语学习——100个超级短句
  8. [51CTO学院三周年]+一个巴士阿叔和Linux不得不說的故事
  9. 2G内存只有1G可用是什么问题?
  10. Salesforce Admin篇(三) Delegated Administrator