聚类分析-层次聚类(Hierarchical Clustering)解析

层次聚类
层次聚类(Hierarchical Clustering)是聚类算法的一种,通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树。层次聚类可以被分为两类:自上而下和自下而上,其中常用的自下而上算法(Bottom-up algorithms),也称为hierarchical agglomerative clustering 或HAC。层次聚类常用的合并算法是通过计算每一个类别的数据点与所有数据点之间的距离来确定它们之间的相似性,距离越小,相似度越高。并将距离(层次聚类使用欧式距离来计算不同类别数据点间的距离)最近的两个数据点或类别进行组合,生成聚类树。在聚类树中,不同类别的原始数据点是树的最底层,树的顶层是一个聚类的根节点。

层次聚类(Hierarchical Clustering)在生物信息学中的应用
层次聚类是一种比较实用的聚类方法,应用于不同领域的数据分析算法中。在生物医学信息学领域,层次聚类方法常常用于蛋白质序列数据聚类和基因表达数据的聚类。结构相似的蛋白质,功能也相似,通过聚类将相似功能的蛋白质聚为一类,为研究蛋白质的功能提供帮助。基因表达数据聚类就是将具有相似表达谱的基因聚为一类,称为共表达基因,根据基因的共表达现象推断这些基因的生物学功能,从而对新的基因功能进行注释,对基因的生物学功能研究具有重要意义。

Figure1. Agglomerative hierarchical clustering of blood and brain samples. (Kong S, et al. 2015)

  • 每一排代表不同的转录本或者基因,列代表不同的样本或者处理。
  • 底部颜色条表示准录本表达量,红色代表上调表达,蓝色代表下调表达。

参考文献

  1. Kong S, et al. Divergent dysregulation of gene expression in murine models of fragile X syndrome and tuberous sclerosis[J]. Molecular Autism, 2014, 5(1):16-16.

聚类分析-层次聚类(Hierarchical Clustering)在生物信息学中的应用相关推荐

  1. 聚类(2)——层次聚类 Hierarchical Clustering

    聚类系列: 聚类(序)----监督学习与无监督学习 聚类(1)----混合高斯模型 Gaussian Mixture Model 聚类(2)----层次聚类 Hierarchical Clusteri ...

  2. 层次聚类-Hierarchical Clustering

    一.概述 层次聚类(Hierarchical Clustering)是聚类算法的一种,通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树,距离越小,相似度越高.在聚类树中,不同类别的原始数据 ...

  3. 机器学习算法(十二):聚类(2)层次聚类 Hierarchical Clustering

    目录 1 层次聚类 1.1 层次聚类的原理 1.2 两个组合数据点间的距离: 2 自底向上的合并算法 2.1 AGNES算法 (AGglomerative NESting) 2.1.1 原理 2.1. ...

  4. 层次聚类(Hierarchical Clustering)——CURE算法详解及举例

    1 CURE聚类概述 绝大多数聚类算法或者擅长处理球形和相似大小的聚类.或者在存在孤立点时变得比较脆弱.CURE采用了一种新颖的层次聚类算法.该算法选择基于质心和基于代表对象方法之间的中间策略.它不同 ...

  5. 机器学习笔记(九)聚类算法Birch和层次聚类Hierarchical clustering

    本篇文章我们继续介绍另一种聚类算法--Birch模型,相对于K-means和DBSCAN,Birch的应用并没有那么广泛,不过它也有一些独特的优势,Birch算法比较适合于数据量大,类别数K也比较多的 ...

  6. 层次聚类(Hierarchical Clustering)——BIRCH算法详解及举例

    1 BIRCH概述 BIRCH(Balanced Iterative Reducing and Clustering Using Hierarchies)的主要动机是两个方面,一是处理大数据集,二是对 ...

  7. 机器学习(6): 层次聚类 hierarchical clustering

    假设有N个待聚类的样本,对于层次聚类来说,步骤: 1.(初始化)把每个样本归为一类,计算每两个类之间的距离,也就是样本与样本之间的相似度: 2.寻找各个类之间最近的两个类,把他们归为一类(这样类的总数 ...

  8. R语言ggplot2可视化:为层次聚类树状图dendrogram中的簇进行着色、在树状图dendrogram中为不同的层次聚类簇配置不同的色彩

    R语言ggplot2可视化:为层次聚类树状图dendrogram中的簇进行着色.在树状图dendrogram中为不同的层次聚类簇配置不同的色彩 #层次聚类树状图dendrogram labs = pa ...

  9. 多元统计分析——聚类分析——层次聚类

    聚类方法 适用场景 代表算法 优点 缺陷 延伸 层次聚类 小样本数据 - 可以形成类相似度层次图谱,便于直观的确定类之间的划分. 该方法可以得到较理想的分类 难以处理大量样本,计算复杂度高   基于划 ...

最新文章

  1. mac 命令行 解压7z文件_Mac 有哪些好用的压缩软件?
  2. JavaWeb--数据库添加
  3. wxWidgets:事件
  4. Palo Alto Networks漏洞防护扩展至云端
  5. 简易的遍历文件加密解密
  6. java 开发规范 下载_java后端开发规范 PDF 下载
  7. 【BZOJ 2595】2595: [Wc2008]游览计划 (状压DP+spfa,斯坦纳树?)
  8. 利用VB函数Dir()实现递归搜索目录
  9. Unity插件学习记录 -- SW Actions
  10. SQL SERVER 数据库概括
  11. 饥荒联机服务器配置文件翻译,饥荒设置界面翻译图解
  12. 尤雨溪:重头来过的 Vue 3 带来了什么?
  13. 软件工程基础知识复习宝典
  14. vs2013 error C1083: 无法打开包括文件: SDKDDKVer.h: No such file or direc
  15. Matlab R2020a + Yalmip + IBM ILOG CPLEX Optimization Studio V12.10
  16. 【现代密码学】仿射密码加密
  17. 新手学习微信小程序遇到的一些坑
  18. 算法设计与分析—— 绪论
  19. NOJ 机器狗组装费用 (优先权队列)
  20. JavaScript - java内部对象replace、slice、substring、substr、转换大小写

热门文章

  1. python模拟浏览器请求
  2. Unturned未转变者 Windows SteamCMD 2023最新开服教程-全网最全
  3. 教你怎么将手机转变成音箱
  4. 如何使电脑彻底崩溃!!!!(不要干坏事哦)
  5. Unity--升级Android api level 28踩坑记录
  6. 5G网络硬盘,100M文件大小,联想研究院发布联想社区化数据服务
  7. 瑞芯微RK3588开发板测评(全网最细+调试工具)
  8. 【电脑无法识别移动硬盘的五种可能】
  9. “无法定位程序输入点nextafterf于动态链接库MSVCR120_CLR0400.dll上“完美解决方案!
  10. 爬取豆瓣读书Top250,导入sqlist数据库(或excel表格)中