一、数据挖掘的目的

数据挖掘(Data Mining)阶段首先要确定挖掘的任务或目的。数据挖掘的目的就是得出隐藏在数据中的有价值的信息。数据挖掘是一门涉及面很广的交叉学科,包括器学习、数理统计、神经网络、数据库、模式识别、粗糙集、模糊数学等相关技术。它也常被称为“知识发现”。知识发现(KDD)被认为是从数据中发现有用知识的整个过程。数据挖掘被认为是KDD过程中的一个特定步骤,它用专门算法从数据中抽取模式(patter,如数据分类、聚类、关联规则发现或序列模式发现等。数据挖掘主要步骤是:数据准备、数据挖掘、结果的解释评估。二、数据挖掘算法说明

确定了挖掘任务后,就要决定使用什么样的挖掘算法。由于条件属性在各样本的分布特性和所反映的主观特性的不同, 每一个样本对应于真实情况的局部映射。建立了粗糙集理论中样本知识与信息之间的对应表示关系, 给出了由属性约简求约简决策表的方法。基于后离散化策略处理连续属性, 实现离散效率和信息损失之间的动态折衷。提出相对值条件互信息的概念衡量单一样本中各条件属性的相关性, 可以充分利用现有数据处理不完备信息系统。

本次数据挖掘的方法是两种,一是找到若干条特殊样本,而是找出若干条特殊条件属性。最后利用这些样本和属性找出关联规则。(第四部分详细讲解样本和属性的选择)

三数据预处理过程

数据预处理一般包括消除噪声、推导计算缺值数据、消除重复记录、完成数据类型转换(如把连续值数据转换为离散型数据,以便于符号归纳,或是把离散型数据转换为连续)。

本文使用的数据来源是名为“CardiologyCategorical”的excel文件中的“源数据”。该数据表共303行,14个属性。即共有303个样本。将该数据表的前200行设为训练样本,剩下后的103行作为测试样本,用基于粗糙集理论的属性约简的方法生成相应的规则,再利用测试样本对这些规则进行测试。

首先对源数据进行预处理,主要包括字符型数据的转化和数据的归一化。

数据预处理的第一步是整理源数据,为了便于matlab读取数据,把非数字数据转换为离散型数字数据。生成文件。这一部分直接在excel工作表中直接进行。

步骤如下:

将属性“sex”中的“Male”用“1”表示,“Female”用“2”表示;

将属性“chest pain type”中的“Asymptomatic”用“1”表示,“Abnormal Angina”用“2”表示,“Angina”用“3”表示,“NoTang”用“4”表示;

用matlab做数据挖掘,用MATLAB实现数据挖掘的一种算法相关推荐

  1. 用matlab做音乐仿真,Matlab课程设计报告--MATLAB GUI的音乐键盘仿真

    Matlab课程设计报告--MATLAB GUI的音乐键盘仿真 1 MATLAB MATLAB 实践实践 课程设计课程设计 目目 录录 1.1.设计目的设计目的3 3 2.2.题目分析题目分析3 3 ...

  2. 用matlab做app,2020-02-27 MATLAB App Designer——在用 App 设计工具创建的 App 内共享数据...

    1 访问和更新回调中的 UI 组件内的数据 app.Component.Property 2 获取并设置一个仪表的 Value 属性 x = app.PressureGauge.Value; % Ge ...

  3. MATLAB写的三维魔方解算GUI 两种算法(Thistlethwaite算法和Kociemba算法)

    大二的时候,没什么事情,打算用MATLAB做一个三阶魔方机器人,所以使用GUI做了个上位机,使用MATLAB编写的3阶魔方GUI,可以实现魔方状态设置(始末状态都可以设置),使用 patch 实现的魔 ...

  4. matlab做cdf图,matlab画CDF曲线

    CDF(cumulative distribution function)叫做累积分布函数 描述一个实数随机变量X的概率分布,是概率密度函数的积分. 我觉得它的最主要作用就是观测某些数值也就是随机变量 ...

  5. matlab做dft后绘图,Matlab实现DFT

    前言: 摘自: http://zhidao.baidu.com/link?url=lB3CS6qxlLIy7EuC8-X0MGNcFndC4ntrfXHdzdk5Wo_oJuRut8iHXoaOTEw ...

  6. matlab做TSP,基于matlab TSP问题遗传算法的实现

    %TSP问题(又名:旅行商问题,货郎担问题)遗传算法通用matlab程序 %D是距离矩阵,n为种群个数,建议取为城市个数的1~2倍, %C为停止代数,遗传到第 C代时程序停止,C的具体取值视问题的规模 ...

  7. 怎样用matlab做复数运算,MATLAB面向复数运算的设计.doc

    MATLAB面向复数运算的设计 MATLAB面向复数运算的设计 MATLAB的所有运算都是定义在复数域上的.这样设计的好处是:在进行运算时,不必像其他程序语言那样把实部和虚部分开来处理.为描述复数,虚 ...

  8. matlab做概率论题,Matlab 概率论与数理统计.doc

    <Matlab 概率论与数理统计.doc>由会员分享,可在线阅读,更多相关<Matlab 概率论与数理统计.doc(16页珍藏版)>请在装配图网上搜索. 1.Matlab 概率 ...

  9. matlab做拉普拉斯曲线,Matlab 拉普拉斯滤波 以及 imfilter 详解(多图)

    Matlab 拉普拉斯滤波 以及 imfilter 详解(多图) 08-08栏目:技术 TAG:imfilter imfilter 代码: jhua.orgclc clear all A=imread ...

  10. 用matlab做天线仿真,matlab中天线的建模与仿真

    各位大侠,老师让我用matlab把印刷偶极子天线建模并仿真其性能,但是我现在遇到了一个初级的问题,就是如何对这个偶极子天线进行matlab建模呢?(用矩量法进行分析),其中还会涉及到三角元的划分,这一 ...

最新文章

  1. linux shell 计算时间差
  2. 转载:js拖拽文本文档并读取内容到textarea
  3. [Elasticsearch] 全文搜索 (一) - 基础概念和match查询
  4. 洛谷——P1540 机器翻译
  5. 如何将 SAP UI5 应用托管到 Github 网站上并运行
  6. 在Java应用程序中使用密码学
  7. Linux Qt打包发布应用程序
  8. 出现ESXi系统无法连接FreeNAS的情况?90%以上的人都做错了!
  9. scala的map映射问题
  10. C#调用C++的DLL所有数据类型转换方式
  11. jxcell开发简单实例
  12. DbUtils框架(这是一个耗时耗力的差事)
  13. 【读书札记】《北大授课》中华文化四十七讲 余秋雨
  14. Epic宣布免费开放虚幻4引擎
  15. vscode安装和配置ESLint
  16. 基本放大器电路- (一)
  17. 面试高薪程序员之高频面试题(一),集合,JVM,高并发多线程等
  18. 大学生考计算机二级的好处,大学生考计算机二级到底有没有卵用?
  19. 如何编写本地shellcode
  20. 认证管理(锐捷路由篇)

热门文章

  1. 制作6D姿态数据集常用的BCH码背景图下载
  2. Vue3 Composition API如何替换Vue Mixins
  3. Hibernate学习总结
  4. 小程序+新零售,行业新玩法!
  5. 爱旅行就旅行,旅行又不是个麻烦事
  6. 音乐与计算机摘要,音乐教育论文摘要_论文摘要_论文摘要范例
  7. PTA 1069 微博转发抽奖(20points)
  8. Some App Tech Support
  9. 百度实时路况接口 根据道路名称获取路况
  10. 上古卷轴ol java_《诛仙3》七脉会武介绍