最近要写论文涉及到聚类集成,想先从EAC做起,集成方面做得还不是很好。如果有机会的话,希望也在研究集成聚类的大佬们和我联系,一起研究探讨集成聚类这方面的知识。感谢各位!

证据积累的想法是这样的:将每个聚类结果作为数据组织独立的证据,把多个聚类的结果合并到一个分区中。

方法为拆分合并:

(1)拆分:把大型的多维数据分成小型的球型簇。

使用K-Means算法执行此步骤,因为通过K的随机初始化,可以获得各种聚类结果。

(2)结合:为将不同数目的聚类分区并到一块,使用“投票法”合并聚类的结果。

那么肯定会有这么一种可能,“自然”产生的集群可能在不同集群下的统一集群(不同的划分,做出一个邻近度矩阵)

在同一个集群下模式对的同时出现做一个投票标记给关联上。做一个矩阵

N是聚类的数目,是ij对,被分配给N个聚类数中相同聚类的次数。

(3)合并:恢复自然簇,根据邻域关系,用MST算法(最小生成树),用t的阙值切断弱连接,这句话说的专业一点就是用阙值t在相似性矩阵上切割单连接(SL)生成的树状图,来合并拆分阶段生成的簇。

补充:

1.MST(最小生成树):学过数据结构的一定都会,包括解决方法两种,克鲁斯卡尔和普利姆算法,很简单,如果有忘记的朋友们可以自行复习一下。

2.那么什么是单连接(SL)呢?:单连接和全连接都是由(2)的邻近度矩阵所出现的。

单连接是作用于阙值图的

(阙值图是N个节点的无向图,每个节点都是一个对象,图中不存在环和多重边。用G(v)表示,v表示不相似的程度。给一个v,如果节点i和j之间的不相似度小于v,就在i和j之间插入一条边。)

例:邻近度矩阵:设定邻近度为5

(1)G(0):刚开始都是点,没有边,每个点都是一个簇,有n个点就是有n个簇。

(2)G(1):根据邻近度矩阵,找1,发现(2,3)满足条件

(3)G(2):找2,发现

(4)G(3):(2,5)

(5)G(4):设定不超过5,所以4是最后一个(4,5)

我们做聚类,最后把它拉成树状图:

总结

EAC步骤:

n ---维数    k---初始簇数   N---聚类数   t---阙值   邻近度矩阵设为空

(1)做N次:1.随机选择K聚类中心;2.初始化用K-Means,生成分区P;3.更新关联度矩阵,对P中同一集群中每对ij更新

(2)用SL找到一致性簇:1.投票法找到多数关联,对每对(i,j)合并到统一集群;2.没包含集群里剩下的做单个集群。

本人尚才疏学浅,如内容中有任何错误的地方,望告知,我会加以修改,之后会继续更新。

集成聚类之EAC算法(证据积累数据聚类)附:单连接(SL)易理解详谈相关推荐

  1. 使用证据积累进行聚类算法集成

    目录 摘要 2. 问题表述 参考论文:<Combining Multiple Clusterings Using Evidence Accumulation> 摘要 证据集成算法 evid ...

  2. ML:教你聚类并构建学习模型处理数据(附数据集)

    翻译: 王雨桐 校对: 顾佳妮 本文约1500字,建议阅读6分钟. 本文以Ames住房数据集为例,对数据进行聚类,并构建回归模型. 摘要 本文将根据41个描述性分类特征的维度,运用无监督主成分分析(P ...

  3. 聚类算法之K均值聚类

    K-Means聚类方法 1. 介绍 k均值聚类是基于样本集合划分的聚类算法.由于每个样本在划分的过程中只能属于一个类别,所以k-Means算法属于硬聚类. 2. 算法过程 k均值聚类算法是一个迭代的过 ...

  4. 集成聚类之EAC方法

    刚看完一篇集成聚类的文章: Combining Multiple Clusterings Using Evidence Accumulation(EAC) 做个简单的笔记,方便复习. 和一般的集成聚类 ...

  5. 【数据挖掘】数据挖掘总结 ( K-Means 聚类算法 | 二维数据的 K-Means 聚类 ) ★

    文章目录 一. K-Means 聚类算法流程 二. 二维数据的 K-Means 聚类 1. 第一次迭代 2. 第二次迭代 参考博客 : [数据挖掘]聚类算法 简介 ( 基于划分的聚类方法 | 基于层次 ...

  6. moead算法流程步骤_数据聚类(一)常见聚类算法的基本原理[图解]

    文章整理了五种常见聚类算法的基本原理,通过简易图解的形式对算法原理进行形象化的描述,同时给出了算法的实现流程和数学表达.全文约4192字. 相关名词的英文翻译 监督学习Supervised Learn ...

  7. python画罗小黑_python股票数据聚类算法:罗小黑战记的股票_XAC配资之家

    python股票数据聚类算法:罗小黑战记的股票 你好朋友,本文将为你分析python股票数据聚类算法怎么样以及罗小黑战记的股票的相关问题,如有任何疑问和留言咨询站长!有了尊严,我们的人生才会快乐.美好 ...

  8. MATLAB实现k-means算法(k-均值)对无标签数据进行聚类,并通过肘部法则确定聚类类别

    应一个小伙伴的要求介绍了一下K均值聚类算法.本人也不是很专业,这是之前自学的,如果有错,大家可以提出来,共同进步嘛. 文章目录 一.k-means算法(k-均值) 1.k-means算法介绍 2.k- ...

  9. 【数据聚类】第五章第一节:基于网格的聚类算法概述

    pdf下载(密码:7281) 基于网格的聚类算法:主要用于处理大规模多维数据的聚类问题.它利用一个网格结构,将数据分布的空间划分为有限数目的单元,然后在这些网格单元上执行聚类操作.基于网格的聚类算法主 ...

  10. K-means 算法实现二维数据聚类

    所谓聚类分析,就是给定一个元素集合D,其中每个元素具有n个观测属性,对这些属性使用某种算法将D划分成K个子集,要求每个子集内部的元素之间相似度尽可能高,而不同子集的元素相似度尽可能低.聚类分析是一种无 ...

最新文章

  1. SQL关键字转换大写核心算法实现
  2. 汇编:以字符形式给出数据
  3. 企业托管云模式 浪潮ERP签约山东医药
  4. 【内核驱动】 Linux内核源码查看方法(基于Vim)
  5. ArrayList方法源码
  6. 两分钟倒计时(Python)
  7. android 获取url中的参数,验证邮箱格式,截取字符串中键值对的值,String的字节长度,去空格,替换字符
  8. thymeleaf select_SpringBoot整合thymeleaf简单的CRUD
  9. C语言课后习题(36)
  10. 怎样成为一名高手观后感
  11. Linux设置封包报头的函数,GitHub - LinuxDigger/RTMP
  12. 中国水稻种子行业市场供需与战略研究报告
  13. 查漏补缺!java主要包括哪几种开发平台
  14. caffe 利用Python API 做数据输入层
  15. Laravel 2017 年度调查报告
  16. 使用 Python 进行人脸识别(第2部分)
  17. tim指定保存云服务器_腾讯 TIM 迎来重大版本更新 新增独立的云文件功能
  18. 谷歌,Google,Chrome,检查工具栏常用功能介绍
  19. 一般来说仿制一个网站大概需要多少钱呢
  20. [导入]美国得州5岁男童智商高达130(图)

热门文章

  1. 输入一些整数,编程计算并输出其中所有正数的和,输入负数或零时表示输入数据结束。输出正数的和以及正数的项目。
  2. 小程序FMP优化实录,实战篇
  3. Devexpress xtrareport 列单元格合并
  4. Windows10下安装mysql-8.0.19-winx64及修改初始密码
  5. 单进程+selenium模拟,爬取领导留言并整合成CSV文件
  6. 第11周阅读程序(5-1)
  7. 比UBUNTU还帅,还好用哦~~国内发行版Linux Deepin出新版啦!!!
  8. STM32CubeMX配置串口DMA传输实现不定长数据收发
  9. 审核员考试-认证通用基础-合格评定基础-1
  10. 职称计算机考试补考,山东省直考区2015年职称计算机考试补考通知