学习笔记,仅供参考,有错必究


面向高维数据的聚类算法研究

摘要

随着信息技术的发展,数据的维度在不断增加,传统的聚类算法将面临以下挑战和问题:

  • 高维数据包含大量冗余的、不相干的信息,数据之间的差异性可能是由部分特征子集导致的,直接对高维数据进行聚类,会降低算法的性能;
  • 高维数据通常存在于多个低维子空间中,传统的距离度量方式不再适用于高维数据;
  • 传统的聚类算法本身就存在稳定性较差的问题,对于高维数据,更是难以满足高稳定性的需求.

因此,研究面向高维数据的聚类算法是一项非常有意义并且有挑战的课题。近年来,学者们主要从特征选择、子空间聚类、聚类集成三个方面开展了高维数据聚类算法的研究,提出了许多有效的聚类算法,但仍存在以下问题:

  • 对特征之间的相关性利用不充分;
  • 忽略了噪声以及表达矩阵的结构特性对子空间聚类的影响;
  • 忽略了初始聚类结果所包含子类之间的结构信息和判别性信息.

针对上述问题,本文从四个方面开展了高维数据聚类算法的研究,主要的研究内容和贡献点如下:

  • 基于结构

文献记录(part15)--面向高维数据的聚类算法研究相关推荐

  1. 文献记录(part75)--基于最大平均熵率的大数据关联聚类算法

    学习笔记,仅供参考,有错必纠 基于最大平均熵率的大数据关联聚类算法 摘要 聚类是数据挖掘和机器学习中的基本任务之一 . 传统聚类方法由于其设计中对簇结构假设的限制 , 导致算法在不符合其假设的数据集上 ...

  2. 生物效应大数据评估聚类算法的并行优化

    生物效应大数据评估聚类算法的并行优化 彭绍亮1,2,杨顺云2,孙哲1,程敏霞1,崔英博2,王晓伟2,李非3,伯晓晨3,廖湘科2 1. 湖南大学信息科学与工程学院&国家超级计算长沙中心,湖南 长 ...

  3. 【论文翻译】聚类算法研究

    论文题目:聚类算法研究 论文来源:聚类算法研究 翻译人:BDML@CQUT实验室 聚类算法研究 孙吉贵 , 刘 杰 , 赵连宇 Clustering Algorithms Research SUN J ...

  4. Python 高维数据降维聚类显示

    先用 t-SNE 将数据进行降维,然后再依据聚类,做完聚类的结果在降维数据展示就可以了. from sklearn import manifold from sklearn.cluster impor ...

  5. 以nba球员数据学习聚类算法

    本内容所有代码都在我的github上,喜欢的朋友可以点个赞 https://github.com/zxhjames/NBA_DataAnalysis 由于一些小需求,需要学习下聚类算法,大二有段时间曾 ...

  6. 文献记录(part63)--跨模态社交图像聚类

    学习笔记,仅供参考,有错必纠 关键词 :跨模态学习:共轭词典学习: WordNet :图像聚类:社交图像:语义相似度度量 文章目录 跨模态社交图像聚类 摘要 引言 相关工作(略) 跨模态特征学习 优化 ...

  7. 聚类算法分类及如何选择某类方法

    聚类算法分类: (1)划分聚类算法:也称为基于距离的聚类算法,此类算法中,簇的数量是随机选择的或最初给定的.属于这一类的算法有K-Meansl,PAM,CLARANSI等. K-means聚类算法的不 ...

  8. 高维数据降维 国家自然科学基金项目 2009-2013 NSFC Dimensionality Reduction

    2013 基于数据降维和压缩感知的图像哈希理论与方法 唐振军 广西师范大学 多元时间序列数据挖掘中的特征表示和相似性度量方法研究 李海林 华侨大学       基于标签和多特征融合的图像语义空间学习技 ...

  9. 用Spark和DBSCAN对地理定位数据进行聚类

    机器学习,特别是聚类算法,可以用来确定哪些地理区域经常被一个用户访问和签到而哪些区域不是.这样的地理分析使多种服务成为可能,比如基于地理位置的推荐系统,先进的安全系统,或更通常来说,提供更个性化的用户 ...

最新文章

  1. POJ 2104 K-th Number 划分树
  2. avisynth_c.h:825:3: error: unknown type name ‘HMODULE’
  3. 什么是DHCP?—Vecloud微云
  4. android 判断是否有网络连接,判断网络连接类型
  5. linq Distinct
  6. 数据自治开放与治理模式创新
  7. 文青不适合看的电影《雪国列车》
  8. python自己写包_如何将自己的Python包发布到PyPI
  9. C# 类中的静态代码块
  10. Android开发Java版 —— 基础知识
  11. 【SVPWM】SVPWM算法推导及其Simulink仿真(二)
  12. VB显示透明FLASH效果
  13. ecmobile php开发文档,ecmobile PHP接口说明文档之购物车(cart/create|list|detele|update)
  14. 华为鸿蒙鲲鹏麒麟凌霄,华为麒麟、凌霄、鸿鹄三大芯片有什么区别?
  15. JVM(1)——字节码
  16. python计算1的平方减2的平方加3的平方减4的平方怎么算_计算1的平方减2的平方加3的平方减4的平方 – 手机爱问...
  17. MAC实用SSH连接远程服务器,并实现文件上传下载
  18. html音乐博客代码,【转载】HTML博客音乐播放器代码大全
  19. 学计算机常用到的英语,常用计算机英语词汇学习
  20. matlab实验报告李琼指数函数,基于MATLAB的多元非线性回归模型

热门文章

  1. Ubuntu下面对Chrome浏览器护眼插件的调研
  2. python调用stanfordNLP的NER接口
  3. Django死活不跳转的问题
  4. php getfooter,wordpress函数get_footer()用法示例
  5. ubuntu中解决无法调节屏幕亮度的问题
  6. 安全狗护航金砖厦门会晤 圆满完成任务
  7. [JZOJ5426]摘Galo
  8. L型代码结构案例:Link访问权限(上)
  9. Hibernate提高性能的几点建议
  10. [CF1036C]Classy Numbers