第1关:美国国家教育统计中心数据——降维

# -*- coding: utf-8 -*-
import pandas as pd #用于生成满足绘图要求的数据格式
from sklearn.manifold import MDS #用于MDS降维
import matplotlib.pyplot as plt #用于绘制撒点图
from sklearn.cluster import KMeans #用于Kmeans聚类
from scipy.spatial import distance #用于计算获取距离矩阵
edu=pd.read_csv(r"MDS/csv/education.csv") #读取csv数据,返回值为二维标记数据结构 DataFrame
def plot():# ********* Begin *********#edu_x=edu.iloc[:,1:7] #选择edu中的第 1 列到第 6 列  DM_dist = distance.squareform(distance.pdist(edu_x, metric="euclidean")) #计算距离矩阵 clf2 = MDS(n_components=2,dissimilarity="precomputed") edu_t2 = clf2.fit_transform(DM_dist)  fig,ax=plt.subplots() ax.scatter(edu_t2[:,0],edu_t2[:,1]) names=list(edu.iloc[:,0]) for i in range(len(names)):  plt.annotate(names[i], xy = (edu_t2[:,0][i],edu_t2[:,1][i]), xytext=(-20, 5), textcoords='offset points') # ********* End *********#plt.savefig("MDS/studentanswer/level_1/education.png")plt.close()

第2关:美国国家教育统计中心数据——分别按特征和聚

# -*- coding: utf-8 -*-
import pandas as pd #用于生成满足绘图要求的数据格式
from sklearn.manifold import MDS #用于MDS降维
import matplotlib.pyplot as plt #用于绘制撒点图
from sklearn.cluster import KMeans #用于Kmeans聚类
from scipy.spatial import distance #用于计算获取距离矩阵
edu=pd.read_csv(r"MDS/csv/education.csv") #读取csv数据,返回值为二维标记数据结构 DataFrame
def plot():# ********* Begin *********#edu_x=edu.iloc[:,1:7] #选择edu中的第 1 列到第 6 列  DM_dist = distance.squareform(distance.pdist(edu_x, metric="euclidean")) #计算距离矩阵 clf2 = MDS(n_components=2,dissimilarity="precomputed") edu_t2 = clf2.fit_transform(DM_dist)  fig,ax=plt.subplots()   reading_colors_list=[] average=sum(edu_x["reading"])/len(edu_x["reading"]) #计算阅读平均值  for i in range(0,len(edu_x["reading"])):  if edu_x["reading"][i] < average:  reading_colors_list.append("#DB7093") #小于平均值的数据为粉红色,并添加到颜色列表else:  reading_colors_list.append("#5F9F9F") #大于平均值的数据为灰绿色,并添加到颜色列ax.scatter(edu_t2[:,0],edu_t2[:,1],color=reading_colors_list) names=list(edu.iloc[:,0]) #选择州名这一列数据  for i in range(len(names)):  plt.annotate(names[i], xy = (edu_t2[:,0][i],edu_t2[:,1][i]), xytext=(-20, 5), textcoords='offset points',color=reading_colors_list[i])plt.show()   # ********* End *********#plt.savefig("MDS/studentanswer/level_2/education.png")plt.close()

6.4 差异可视化-多维量法(MDS)相关推荐

  1. Nat. Biotechnol | PHATE:高维生物数据的可视化方法

    高维生物数据的可视化能帮助研究者以直观的方式了解数据.今天介绍2019年12月发表在Nature Biotechnology的可视化工作. 1 研究背景 高维数据需要可视化工具,以直观的方式显示数据结 ...

  2. 【ceph】ceph分布式存储MDS(各种状态、源码)

    目录 1. mds存储 2. mds冷备/热备 3. mds主备切换策略 4. 节点失效机制 5. 恢复过程 6. resolve阶段的事件 7. 重建分布式缓存和锁状态 Ceph MDS State ...

  3. Nature子刊:教你零基础开展微生物组数据分析和可视化

    使用MicrobiomeAnalyst进行微生物组数据的全面统计.功能和元分析 Using MicrobiomeAnalyst for comprehensive statistical, funct ...

  4. 可视化网络拓扑:两天之内从零到英雄

    Visualizing Network Topologies: Zero to Hero in Two Days / Habrhttps://habr.com/en/post/534716/ 翻译 原 ...

  5. R语言差异检验:单因素方差分析

    文章目录 @[toc] 方差分析介绍 适用条件 分类 R语言 单因素方差分析示例 数据集 示例 多重比较 评估检验的假设条件 t检验可以解决单样本.双样本时的均数比较.当要比较的组多于两个时,t检验方 ...

  6. 流形学习(manifold learning)综述(数据可视化)

    假设数据是均匀采样于一个高维欧氏空间中的低维流形,流形学习就是从高维采样数据中恢复低维流形结构,即找到高维空间中的低维流形,并求出相应的嵌入映射,以实现维数约简或者数据可视化.它是从观测到的现象中去寻 ...

  7. 反欺诈中所用到的机器学习模型有哪些?

    作者 | 微调(知乎ID微调,普华永道高级数据科学家) 反欺诈方向的实际应用很多,我有做过保险业反欺诈和零售快消业的欺诈检测,抛砖引玉的谈谈反欺诈项目的"道"和"术&qu ...

  8. 随机森林RandomForest挖掘生物标记预测分类

    随机森林简介 如果读者接触过决策树(Decision Tree)的话,那么会很容易理解什么是随机森林.随机森林就是通过集成学习的思想将多棵树集成的一种算法,它的基本单元是决策树,而它的本质属于机器学习 ...

  9. RandomForest:随机森林预测生物标记biomarker——分类

    随机森林简介 R randomForest包 安装与加载 分类Classification 分类结果主坐轴分析 随机选取2/3预测,1/3验证 无监督分类 分层抽样 Reference 猜你喜欢 写在 ...

最新文章

  1. C语言open和creat函数
  2. 三种方法实现CSS三栏布局
  3. python运行mcmc为何老出错_python中mcmc方法的实现
  4. Django项目工程配置工程日志
  5. oracle用户名密码过期引起的网站后台无法登录
  6. 初读CLR Via C# 之 IL、CTS、CLS
  7. devops 开源_没有开源就无法拥有DevOps
  8. 永州计算机职称考试网,永州2016年11月职称计算机考试时间
  9. 使用Mac App Store更新、下载软件时出现未知错误的解决方法
  10. 在eclipse中如何搭建ssh框架
  11. 在Java中使用Jedis的测试案例
  12. 第三章: 微信小程序底部导航栏的实现(详细)
  13. shell编程三大神器之sed
  14. (MATLAB/C)高斯拟合法求光斑中心
  15. 网页浏览flash时不停黑屏
  16. Win10系统开启黑暗主题
  17. Random Projection 随机投影法
  18. 32位计算机如何升级,32位改64位系统怎么安装 32位怎么升级64位系统
  19. 如何快速找出一个数组中最大数和第二大数
  20. C语言上机报告例文,c语言上机实验报告_大一c语言上机实验报告_c语言实验报告怎么写...

热门文章

  1. 100个不能错过的网站
  2. 一个可以在线生成条形码的网站
  3. 将PC网站转化为手机自适应网页或者自己制作手机自适应网页其实很简单,可以利用meta标签声明。
  4. LVS负载均衡群集——DR直接路由模式
  5. java北大青鸟视频_西安java se视频
  6. python绘图打码_「若快打码」python调用若快打码接口 - seo实验室
  7. 百度推广链接与百度排名
  8. Python绘制地图时的色带Colormaps
  9. 编写西门子300plc控制三菱伺服电机机
  10. python学习模拟电路_如何学习使用CircuitPython