计算MovieLens 100k数据集中男性女性用户评分的标准差并输出。

数据集下载http://files.grouplens.org/datasets/movielens/ml-100k.zip

其中u.data 表示100k条评分记录,每一列的数值含义是:

user id | item id | rating | timestamp

u.user表示用户的信息,每一列的数值含义是:

user id | age | gender | occupation | zip code

u.item文件表示电影的相关信息,每一列的数值含义是:

movie id | movie title | release date | video release date |IMDb URL |
unknown | Action | Adventure | Animation | Children’s | Comedy | Crime
| Documentary | Drama | Fantasy |Film-Noir | Horror | Musical |
Mystery | Romance | Sci-Fi |Thriller | War | Western |

可能会用到的相关函数:

pandas.read_table(filepath_or_buffer, sep=’\t’, names=None)

pandas.pivot_table(data, values=None, columns=None, aggfunc=‘mean’)

pandas.merge(left, right, how=‘inner’)

更详尽的API文档请参考http://pandas.pydata.org/pandas-docs/stable/。

输出结果:

Gender

M *

F *

结论:标准差高的评分差异大

注意:先分别计算每个人电影评分的平均分再按性别求标准差

请将男女评分(保留2位小数)组合后放到一个txt文件中通过网络提交,例如:如果两者评分的标准差分别是

男:0.32

女:0.35

则提交:

3235

import pandas as pdwith open(r'C:\Users\USER\Desktop\用Python玩转数据\4.1 Python基本数据统计\ml-100k\u.data', 'r') as f:data = pd.read_table(f, header=None)data.columns = ['user id','item id','rating','timestamp']with open(r'C:\Users\USER\Desktop\用Python玩转数据\4.1 Python基本数据统计\ml-100k\u.user', 'r') as f:user = pd.read_table(f, header=None)list = []for i in range(len(user.values)):names = user.values[i][0].split('|')list.append(names)user = pd.DataFrame(list)user.columns =['user id', 'age', 'gender', 'occupation', 'ip code']user['user id'] = pd.to_numeric(user['user id'], errors='coerce')avgrating = pd.pivot_table(data, values='rating', index = 'user id', aggfunc='mean')
new = pd.merge(avgrating, user, how='inner', on = 'user id')
std = pd.pivot_table(new, values='rating', index = 'gender', aggfunc='std')
print(std)

男女电影评分差异分析编程相关推荐

  1. python 计算男女电影标准差 coursera男女电影评分差异分析编程

    最近学习AI的强有力工具Python. 看到南京大学 的 用python玩转数据视频,有一个计算标准差的作业,现分享如下 import pandas as pd # 导入评分数据 ratingData ...

  2. 基于pandas的电影评分差异分析

    基于pandas的电影评分差异分析 实验内容 数据来源 详细步骤 import pandas as pd import numpy as npunames = ['user id','age','ge ...

  3. python数据挖掘电影评分分析_Pyhon数据分析项目——男女电影评分差异比较

    <用 Python 玩转数据>数据分析项目 一.程序功能 基于 MovieLens 100k 数据集中男性女性对电影的评分来判断男性还是女性电影 评分的差异性更大. 二.数据来源 数据集下 ...

  4. 基于pandas的男女电影评价差异分析

    看了南京大学的<用python玩转数据视频>,Python强大.代码做了些注释.慢慢逐渐深入. https://scipy.org/ import pandas as pd import ...

  5. 基于R语言构建的电影评分预测模型

    电影评分系统是一种常见的推荐系统.现在使用R语言基于协同过滤算法来构建一个电影评分预测模型. 一,前提准备         1.R语言包:ggplot2包(绘图),recommenderlab包,re ...

  6. 利用python进行数据分析_第二章_案例2_movielens_电影评分分析

    自己尝试了一下数据分析,和书里的方法不完全一样.标*的为比较好的方法. ================================================ MovieLens电影评分数据 ...

  7. 大数据Spark电影评分数据分析

    目录 1 数据 ETL 2 使用 SQL 分析 3 使用 DSL 分析 4 保存结果数据 5 案例完整代码 6 Shuffle 分区数目问题 1 数据 ETL 使用电影评分数据进行数据分析,分别使用D ...

  8. Python 电影评分分析

    关注微信号:小程在线 关注CSDN博客:程志伟的博客 import numpy as np import pandas as pd import matplotlib.pyplot as plt %m ...

  9. 电影评分数据集的分析

    目录 数据集的获得 使用工具 项目流程 数据集的获得 进入该网址:https://grouplens.org/datasets/movielens/ 找到如下part: 点击ml-100k.zip进行 ...

最新文章

  1. redis主从复制如何保证数据一致性_面试官:Redis 主从复制时网络开小差了怎么整?...
  2. trident State应用指南
  3. Meta AI 发布 data2vec!统一模态的新里程碑!
  4. js函数引用、函数调用与回调函数
  5. 小A点菜(洛谷P1164题题解,Java语言描述)
  6. 二、JAVA第一行代码
  7. Linux 系统设置图形界面启动和黑窗口启动
  8. Adobe Premiere常用快捷键_艾孜尔江摘录
  9. 推荐10款简单好用的免费内网穿透工具
  10. 如何修改文件最后一次修改时间?
  11. 点乘/内积/数量积;叉乘/向量积;矩阵乘法;哈达马积;克罗内克积;卷积
  12. WIN7中任务栏,菜单栏和工具栏的基本设置
  13. 浅谈产业界与学术界的合作研究(转)
  14. 人大金仓KingbaseES大小写敏感性专题
  15. 股票量化分析系统浅析之(三)归一化与标准化
  16. 每日 30 秒 ⏱ 复制内容到剪贴板
  17. 全球及中国氮化铝(AlN)模板行业运行态势及投资战略分析报告2021-2028年
  18. R语言函数定义快速查看
  19. 三分钟学会怎样识别手写文字
  20. VM:VMware 创建windows10 虚拟机

热门文章

  1. W12 - 999、O2O优惠券使用预测
  2. VMWare和Virtual PC虚拟机的比较
  3. 算法数据结构(三十八)----DC3算法
  4. 全境封锁:背水一战 - 概念艺术
  5. android 连接蓝牙音响,Android 扫描附近的蓝牙设备并连接蓝牙音响的示例
  6. BZOJ_1014_[JSOI2008]_火星人prefix_(Splay+LCP_Hash+二分)
  7. Python爬虫能当副业吗?到了那个层次才能接兼职?
  8. Hasee神舟战神Z7M-CT7NA笔记本电脑i7原装出厂Windows10系统恢复原厂OEM系统
  9. 启中教育:新手开网店怎么做好准备工作
  10. AWVS14 Docker Update