数据描述:
id :国家对应id
国家:国家名称
2019年国际排名:2019 年国际足联的世界排名。
2018年世界杯:2018 年世界杯中,很多球队没有进入到决赛圈,所以只有进入到决赛圈的球队才有实际的排名。如果是亚洲区预选赛 12 强的球队,排名会设置为 40。如果没有进入亚洲区预选赛 12 强,球队排名会设置为 50。
2015年亚洲杯:真是排名。

1、获取数据:使用pandas读取数据

2、数据处理:归一化数据

3、模型训练:利用sklearn中的K-Means算法实现聚类,K=3

4、模型可视化:利用matplotlib包中的方法画出三维图,并按照预测类别的不同,使用不同的颜色表示。

代码如下:

import pandas as pd
data = pd.read_csv(r"D:/pyCharm/asina_football_data.csv")
print(data.head())
train_x = data[[‘2019年国际排名’, ‘2018年世界杯’, ‘2015年亚洲杯’]]
df = pd.DataFrame(train_x)

from sklearn import preprocessing
min_max_scaler=preprocessing.MinMaxScaler()
train_x=min_max_scaler.fit_transform(train_x)

from sklearn.cluster import KMeans
kmeans = KMeans(n_clusters=3)
kmeans.fit(train_x)
predict_y = kmeans.predict(train_x)
result = pd.concat((data,pd.DataFrame(predict_y)),axis=1)
result.rename({0:u’梯队编号’},axis=1,inplace=True)
#print(result.head())
print("----------------------------------------------------")
tx = result[[‘国家’,‘梯队编号’]]
print(tx.head())

from mpl_toolkits.mplot3d import Axes3D
import matplotlib.pyplot as plt
import matplotlib
font = {‘family’: ‘MicroSoft Yahei’,
‘weight’: ‘bold’,
‘size’: 10}
matplotlib.rc(“font”, **font)
xs = data.iloc[:,2]
ys = data.iloc[:,3]
zs = data.iloc[:,4]
fig = plt.figure()
ax=Axes3D(fig)
name = data.iloc[:,1]
for label,x,y,z in zip(name,xs,ys,zs):
ax.scatter(x,y,z)
ax.text(x, y, z, label)
cValue = [‘r’,‘y’,‘g’,‘b’,‘r’,‘y’,‘g’,‘b’,‘r’]
ax.set_xlabel(‘2019年国际排名’)
ax.set_ylabel(‘2018年世界杯’)
ax.set_zlabel(‘2015年亚洲杯’)
plt.show()

划分亚洲国家的三个足球梯队相关推荐

  1. python模拟足球_使用K-Means算法划分亚洲国家的三个足球梯队

    数据:asina_football_data.csv 数据描述: id :国家对应id 国家:国家名称 2019年国际排名:2019 年国际足联的世界排名. 2018年世界杯:2018 年世界杯中,很 ...

  2. 使用K-Means算法划分亚洲国家的三个足球梯队

    首先对对数据有一个初步的了解: **数据:asina_football_data.csv 数据描述:  id :国家对应id  国家:国家名称  2019年国际排名:2019 年国际足联的世界排 ...

  3. 1.5 训练/开发/测试集划分-深度学习第三课《结构化机器学习项目》-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 1.4 满足和优化指标 回到目录 1.6 开发集合测试集的大小 训练/开发/测试集划分 (Train/Dev/Test Distribution) 设立训练集,开发集和测试集 ...

  4. KMEANS均值聚类和层次聚类:亚洲国家地区生活幸福质量异同可视化分析和选择最佳聚类数...

    阅读全文:http://tecdat.cn/?p=24198 <世界幸福报告>是可持续发展解决方案网络的年度报告,该报告使用盖洛普世界民意调查的调查结果研究了150多个国家/地区的生活质量 ...

  5. 深度:远控木马Posion Ivy开始肆虐缅甸和其它亚洲国家

    臭名昭著的远程控制木马Poison Ivy(后面称作PIVY)最近开始重新露出水面.并且出现了一些新行为.过去一年,已经发现PIVY为了种种企图攻击了许多亚洲国家. Palo Alto Network ...

  6. 亚洲国家互联网渗透率_发展中亚洲国家如何回应covid 19

    亚洲国家互联网渗透率 The COVID-19 pandemic has severely hit various economies across the world, with global im ...

  7. 数据分析案例:亚洲国家人口数据计算

    数据截图: 数据下载地址:链接:https://pan.baidu.com/s/1dGHwAC5 密码:nfd2 该数据包含了2006年-2015年10年间亚洲地区人口数量数据,共10行50列数据.我 ...

  8. iso国家代码 三位字母_ISO 2字母语言代码

    iso国家代码 三位字母 The codes below, which are sorted alphabetically by language (not language code) are to ...

  9. 4 数据分析-案例:亚洲国家人口数据计算

    数据截图: 该数据包含了2006年-2015年10年间亚洲地区人口数量数据,共10行50列数据.我们需要使用Numpy完成如下数据任务: 计算2015年各个国家人口数据 计算朝鲜历史各个时期人口数据 ...

最新文章

  1. golang sync.Map 使用
  2. 1 分钟 Serverless 部署掌上游戏机,“一行命令”找回小时候的乐趣!
  3. 上海j计算机一级分值,计算机一级考试内容及分值
  4. 将给定数据源生成静态HTML页面持久化到项目之外的硬盘
  5. 开源最大的谎言是什么?
  6. 学生用计算机说明方法,15.文中多处运用了作比较的说明方法.请任选一例.说说运用这种方法的作用. 例子: 作用:...
  7. 使用JavaFX构建反应系统
  8. oracle自动创建分区存储过程,oracle 存储过程创建表分区
  9. 小程序页面启动过程分析
  10. 一机三屏台式计算机,三屏系统重现江湖:背后一台完整主机
  11. LPC1768的USB-相关结构体定义
  12. python中id 是什么意思_python中的id函数是什么意思?
  13. 安装virtualbox可能遇到的错误
  14. Angular真有React开发人员讲得那么差劲?
  15. 一声快门和三个时代:全球移动影像二十年
  16. 聚合资金托管+支付 联动优势推出房产行业线上产品“海金居”
  17. C++异常之栈解旋(unwinding)
  18. modbus测试软件
  19. linux系统下grub.cfg详解和实例操作
  20. matlab中Add什么意思,add detail是什么意思

热门文章

  1. 云计算的认识和看法_如何通俗的理解云计算和大数据?
  2. Golang搭建并行版爬虫信息采集框架
  3. !pdftex error (font expansion): auto expansion is only possible with scalable fonts
  4. sorted在python中是什么意思_python中sorted是什么
  5. Cpolar配合Everything快速搜索私有云资料
  6. 趣乐王正盛:如何认真地做一把智能吉他?
  7. 股市学习稳扎稳打(三)如何找出颈线,分辨压力位和支撑位
  8. kafka maven 依赖_SpringBoot入门建站全系列(二十八)整合Kafka做日志监控
  9. 性能优化08_电量优化:监控电量状态
  10. 联想微型计算机如何更改主题,联想vibe怎么更换主题 联想vibe主题更换方法【图文】...