目的

在使用k-means算法聚类时,k值的选择十分重要,肘部法则和轮廓系数可以方面我们选择出最佳的k值。

数据说明

2019年各省份MFP等经济指标

均在Jupter notebook 实现

肘部法则的可视化

# 载入数据
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('D:/目录/2019年各省MFP等.csv') # 文件目录加文件名
df.head()
#定位数据
X = df.iloc[:,2:6]
X.head()
# 标准化数据
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
standX = scaler.fit_transform(X)
standX
# 肘部法则的可视化
from sklearn.cluster import KMeans
elbow=[]
for i in range(1,20): # 创建遍历,找到最合适的k值kmeans=KMeans(n_clusters=i,init='k-means++',random_state=101)kmeans.fit(X)elbow.append(kmeans.inertia_)
# 通过画图找出最合适的K值
import seaborn as sns
sns.lineplot(range(1,20),elbow,color='blue')
plt.rcParams.update({'figure.figsize':(16,10),'figure.dpi':100})
plt.title('Elbow Method')
plt.show()

肘部法则图片,根据图片中内容,k=2最合适

轮廓系数

from sklearn import metrics
# 创建遍历,找到最合适的k值
scores = []
for k in range(2,20):labels = KMeans(n_clusters=k).fit(X).labels_score = metrics.silhouette_score(X,labels)scores.append(score)
# 通过画图找出最合适的K值
plt.plot(list(range(2,20)),scores)
plt.xlabel('Number of Clusters Initialized')
plt.ylabel('Sihouette Score')
plt.show()

轮廓系数图,根据图片中也是k=2最佳

纯新手,如有错误,欢迎指出,共同学习。

python实现肘部法则和轮廓系数可视化相关推荐

  1. python K-means聚类分析聚类数的选择-肘部法则和轮廓系数

    如何选择kmeans中的k值--肘部法则–Elbow Method和轮廓系数–Silhouette Coefficient

  2. 聚类总结(二)聚类性能评估、肘部法则、轮廓系数

    文章目录 一.聚类K的选择规则 1.1 肘部法则–Elbow Method 1.2 轮廓系数–Silhouette Coefficient 二.聚类性能评估 2.1 外部评估(external eva ...

  3. Python——Kmeans聚类算法、轮廓系数(算法理论、代码)

    目录 1 Kmeans模型理论 1.1 K-均值算法(K-means)算法概述 1.2 距离度量 1.3 K-means算法流程 1.4 K值的选择 1.5 K-means的优点 1.6 K-mean ...

  4. 肘部法和轮廓系数法确定K-means中的k值

    目录 1. K-Means 算法 2. 肘部法 3. 轮廓系数法 1. K-Means 算法 k-means算法(详解k-means算法原理)是机器学习中常用的聚类算法,原理简单实现容易,内存占用量也 ...

  5. point 如何求elbow_如何选择kmeans中的k值——肘部法则–Elbow Method和轮廓系数–Silhouette...

    肘部法则–Elbow Method 我们知道k-means是以最小化样本与质点平方误差作为目标函数,将每个簇的质点与簇内样本点的平方距离误差和称为畸变程度(distortions),那么,对于一个簇, ...

  6. 如何选择kmeans中的k值——肘部法则–Elbow Method和轮廓系数–Silhouette Coefficient...

    肘部法则–Elbow Method 我们知道k-means是以最小化样本与质点平方误差作为目标函数,将每个簇的质点与簇内样本点的平方距离误差和称为畸变程度(distortions),那么,对于一个簇, ...

  7. matlab聚类轮廓系数,R数据挖掘 第三篇:聚类的评估(簇数确定和轮廓系数)和可视化...

    在实际的聚类应用中,通常使用k-均值和k-中心化算法来进行聚类分析,这两种算法都需要输入簇数,为了保证聚类的质量,应该首先确定最佳的簇数,并使用轮廓系数来评估聚类的结果. 一,k-均值法确定最佳的簇数 ...

  8. 机器学习(三)K-means聚类(手肘法、轮廓系数、可视化代码)

    K-means聚类 聚类是无监督学习当中非常重要的一部分,能够在没有标签的情况下将数据分类.说到聚类,最常用也是最重要的一个算法就是K-means算法. 算法介绍 K-means是一种非常简单快速高效 ...

  9. python计算3j系数_聚类算法评估——轮廓系数及python实现

    含义 轮廓系数(Silhouette Coefficient),是聚类效果好坏的一种评价方式. 可见轮廓系数的值是介于 [-1,1] ,越趋近于1代表内聚度和分离度都相对较优. 计算步骤 1)对于簇中 ...

最新文章

  1. ios关于用xib创建的cell 自动返回cell的高度问题!
  2. oracle中存在函数吗,Oracle中的函数
  3. trinitycore MySQL模块_Windows下编译TrinityCore服务端
  4. 面向对象程序设计的术语
  5. 项目中记录影响性能的缓慢数据库查询
  6. 新型监控告警工具prometheus(普罗米修斯)入门使用(附视频讲解)
  7. ccs是轮_CCS-船型标准.pdf
  8. Kent Beck 的《测试驱动开发》(TDD) Money示例Ruby版
  9. java实现梯度异步通知,BIO原理及代码实现
  10. Proteus ISIS仿真软件中英文元件名称对照
  11. 服务器显示断开网络驱动器,网络驱动器
  12. python 循环语句s =2+22+222+2222之和_python基础2
  13. youtube下载视屏和字幕办法
  14. 常用的薪酬管理系统有哪些,薪酬管理需要具备哪些功能?
  15. 【干货】微博短视频去水印下载使用介绍
  16. 微软云+Servlet实现图片上传接口
  17. 计算机网络什么是p2p,计算机网络-p2p(示例代码)
  18. 書劍恩仇錄 (無線電視翡翠台版本) - 劇本終回由誰人敲定? 就是李添勝.
  19. 12306 java程序_基于java httpclient的12306 买票软件
  20. Oracle修改SEQUENCE起始值

热门文章

  1. PHP构造函数的继承
  2. 惠普薄锐笔记本电脑HP ENVY x360-15-cn1001tx原装出厂Windows10系统恢复原厂OEM系统
  3. 用html贝塞尔曲线绘制海豚,echarts 用 bezier-js 绘制贝塞尔曲线
  4. 校园wifi网页认证登录入口
  5. twilio python_我用 Python 和 Twilio 实现自动化选课
  6. linux学成之路(四)中 linux用户与组管理
  7. java架构师和C语言架构师,C语言-Java架构师必看
  8. 孙子兵法:如何应用于软件
  9. 奇怪的朋友圈(并查集)
  10. 王小川新AI公司浮出水面:成立「五季智能」,召集搜狗旧部,水下估值接近独角兽...