目录

粗糙集理论和数据挖掘的关系

1.Rough集的基本概念

2.属性约简


粗糙集理论和数据挖掘的关系

Rough set理论和数据挖掘关系密切,它能为数据挖掘提供新的方法和工具,且具有以下特点:

首先,数据挖掘研究的对象多为关系型数据库。关系表可以看作为Rough Set理论中的决策表,这给Rough Set导出的方法的应用带来极大的方便。

第二,现实世界中的规则有确定性的,也有不确定性的。从数据库中发现不确定性的知识,为Rough Set导出的方法提供了用武之地。

第三,从数据中发现异常,排除知识发现过程中的噪声干扰,也是Rough Set导出的方法的特长。

第四,运用Rough Set导出的知识发现算法有利于并行执行,可以极大地提高发现效率。对于大规模数据库中的知识发现来说,正是求之不得的。

第五,数据挖掘中采用的其他技术,如神经网络的方法,不能自动地选择合适的属性集,而利用Rough Set导出的方法进行预处理,去掉多余属性,可提高发现效率,降低错误率。

第六,Rough Set方法比模糊集方法或神经网络方法在得到的决策规则和推理过程更易于被证实和检测。

1.Rough集的基本概念

粗糙集是一种可以定量分析处理不精确不一致不完整 信息与知识的数学工具

信息表是一个二维表格,其每一行是一个元组,对应现实世界的一个个体。其每一列代表信息空间的一维。如表1.1

实例是信息表中的一行,在表1.1中标记为e1,e2,e3,e4,e5,e6。

表1.1
个体编号 条件属性 决策
头疼 肌肉疼 体温
e1 正常
e2
e3 很高
e4 正常
e5
e6 很高

设M为信息表,则M的形式化描述为:

U = {x1, x2, ..., xn} : 有限对象集合,又称:论域

At = {头疼,肌肉疼,体温,流感}:有限非空的属性集合。

Va: 表示属性a ∈ A的属性值范围,即属性a的值域。

Ia: U → Va: 是一个信息函数;Ia(x)代表对象x在属性a的取值(属性值)。

不分明关系

在给定的论域U上,任意选择一个等价关系集R和R的子集,且,则P中所有等价关系的交际依然是论域U中的等价关系,称该等价关系为P的不可分辨关系,记作IND(P)。并且

如:考虑条件属性头疼和肌肉疼。对于e1,e2,e3这三个实例,其条件属性头疼的值都是“是”,条件属性肌肉疼的值也都是“是”,因此,从条件属性头疼和肌肉疼的角度来看,这三个实例是不可分辨的。

基本集

 表示非空子族集所产生的不分明关系IND(P)的所有等价类关系的集合,又称该知识为知识库中关于P-基本知识(P-基本集)

如:从条件属性头疼和肌肉疼的值来看,不分明集{e1,e2,e3}、{e4,e6}和{e5}被称为基本集。

可定义集

任意有限个基本集的并被称之为可定义集。

可定义

,当X能用属性子集B确切地描述(即是属性子集B所确定地U上的不分明集的并)时,称X是B可定义的,否则称X是B不可定义的。B可定义集也称作B精确集,B不可定义集也称为B非精确集或B Rough集。

上下近似

上近似包含了所有那些可能是属于X的元素,下近似包含了所有使用知识R可确切分类到X的元素。

给定知识库中,任意选择集合,可定义X关于知识R的上下近似

上近似:

下近似:

X的边界域、正域和负域

边界域:

正域:

负域:

2.属性约简

粗糙集理论相关基本概念及属性约简相关推荐

  1. 粗糙集理论中--属性约简部分相关概念

    下面的知识,只要掌握等价关系.等价类.商集就可以明白 定义(知识和概念(范畴或信息粒)) 设U是我们感兴趣的对象组成的非空有限集合,称为论域.论域U的任何一个子集X⊆U,称为论域U的一个概念或范畴.为 ...

  2. 【机器学习】粗糙集属性约简—Attribute Reduction

    介绍 RoughSets算法是一种比较新颖的算法,粗糙集理论对于数据的挖掘方面提供了一个新的概念和研究方法.本篇文章我不会去介绍令人厌烦的学术概念,就是简单的聊聊RoughSets算法的作用,直观上做 ...

  3. 【机器学习】粗糙集属性约简算法与mRMR算法的本质区别

    1. 粗糙集属性约简算法仅仅选出属性重要度大的条件加入约减中,没有考虑约简中条件属性相互之间的冗余性,得到的约简往往不是都必要的,即含有冗余属性. 2. mRMR算法则除了考虑特征与类别之间的相关性, ...

  4. 粗糙集理解之二:属性约简

    由上一节可以知道,粗糙集是处理模糊数据的有力工具,而要达到这样的目的需要有两个重要的步骤来进行处理-属性约简和值约简,属性约简是对粗糙集合(那些不能区分的集合)进行纵向的简化,把不必要的属性去掉,即去 ...

  5. 粗糙集 遗传matlab,一种基于遗传算法和粗糙集的属性约简方法及精神状态评估方法...

    一种基于遗传算法和粗糙集的属性约简方法及精神状态评估方法 [专利摘要]本发明公开了一种基于遗传算法和粗糙集的属性约简方法及精神状态评估方法,该基于遗传算法和粗糙集完成了粗糙集属性约简方法通过设定合适的 ...

  6. 粗糙集matlab程序,粗糙集属性约简matlab程序

    <粗糙集属性约简matlab程序>由会员分享,可在线阅读,更多相关<粗糙集属性约简matlab程序(4页珍藏版)>请在人人文库网上搜索. 1.粗糙集-属性约简-matlab程序 ...

  7. 粗糙集约简 程序 matlab,粗糙集属性约简matlab程序

    粗糙集-属性约简-matlab程序 Data2为条件属性, decision2为决策属性 %%%my_test函数实现 clc; %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%读取 ...

  8. 混合型数据的邻域条件互信息熵属性约简算法

    混合型数据的邻域条件互信息熵属性约简算法 兰海波 中国气象局公共气象服务中心 摘要:属性约简是粗糙集理论的重要研究内容之一,其主要目的是消除信息系统中不相关的属性,降低数据维度并提高数据知识发现性能. ...

  9. 粗糙集理论介绍(概念入门)

    面对日益增长的数据库,人们将如何从这些浩瀚的数据中找出有用的知识?我们如何将所学到的知识去粗取精?什么是对事物的粗线条描述什么是细线条描述? 粗糙集合论回答了上面的这些问题.要想了解粗糙集合论的思想, ...

最新文章

  1. tensorflow(4)踩过的一些坑
  2. 用MATLAB函数绘制系统的,用matlab绘制odes系统定义的函数
  3. 画瀑布图_常见的招财风水画之含义
  4. BZOJ3511: 土地划分
  5. 打开word2007总是出现配置进度_实战经验:Word 2007每次打开都弹出正在配置
  6. Python使用pip自动升级所有第三方库
  7. Atitit 判断判断一张图片是否包含另一张小图片
  8. python 稠密重建_使用openMVG+PMVS实现视觉三维重建
  9. 常见的会员积分系统都有什么样的功能?
  10. 大学生英语跨文化交际阅读课程 Unit6 Text A
  11. 在unik中,写一个Go HTTP服务器
  12. postgresql 表分区
  13. HTTP (RESTful) API 响应时间分析及SLA定义
  14. idea编译报错:Refer to the generated Javadoc files in ‘..\target\apidocs‘ dir. 解决
  15. 自做Google Chrome免安装绿色版
  16. Android 面试技巧分享~
  17. 日期 时间格式转换 时间过滤器 moment
  18. feed流和瀑布流_推荐系统之Feed流UI交互设计
  19. alphago zero和alpha go、alphago master的区别
  20. 【中危】启用了不安全的TLS1.0、TLS1.1协议

热门文章

  1. python zipfile_Python zipfile
  2. 中国废钢行业运营模式及投资方向建议报告2022-2028年
  3. 日本成本企划的现状及未来
  4. html5拖拽换位效果演示,H5 实现div拖放位置互换
  5. 本地yum源、httpd的共享yum源、vsftpd的共享yum源
  6. C#中控制键盘只输入数字,退格
  7. Double TAG
  8. 呵护你上上下下的享受:国内电梯保险概览
  9. 【转载】酷壳网陈皓:开发者实用学习资源汇总
  10. 面向对象,类,对象,GC垃圾回收器,private关键字