男女电影评分差异分析编程
计算MovieLens 100k数据集中男性女性用户评分的标准差并输出。
数据集下载http://files.grouplens.org/datasets/movielens/ml-100k.zip
其中u.data 表示100k条评分记录,每一列的数值含义是:
user id | item id | rating | timestamp
u.user表示用户的信息,每一列的数值含义是:
user id | age | gender | occupation | zip code
u.item文件表示电影的相关信息,每一列的数值含义是:
movie id | movie title | release date | video release date |IMDb URL |
unknown | Action | Adventure | Animation | Children’s | Comedy | Crime
| Documentary | Drama | Fantasy |Film-Noir | Horror | Musical |
Mystery | Romance | Sci-Fi |Thriller | War | Western |可能会用到的相关函数:
pandas.read_table(filepath_or_buffer, sep=’\t’, names=None)
pandas.pivot_table(data, values=None, columns=None, aggfunc=‘mean’)
pandas.merge(left, right, how=‘inner’)
更详尽的API文档请参考http://pandas.pydata.org/pandas-docs/stable/。
输出结果:
Gender
M *
F *
结论:标准差高的评分差异大
注意:先分别计算每个人电影评分的平均分再按性别求标准差
请将男女评分(保留2位小数)组合后放到一个txt文件中通过网络提交,例如:如果两者评分的标准差分别是
男:0.32
女:0.35
则提交:
3235
import pandas as pdwith open(r'C:\Users\USER\Desktop\用Python玩转数据\4.1 Python基本数据统计\ml-100k\u.data', 'r') as f:data = pd.read_table(f, header=None)data.columns = ['user id','item id','rating','timestamp']with open(r'C:\Users\USER\Desktop\用Python玩转数据\4.1 Python基本数据统计\ml-100k\u.user', 'r') as f:user = pd.read_table(f, header=None)list = []for i in range(len(user.values)):names = user.values[i][0].split('|')list.append(names)user = pd.DataFrame(list)user.columns =['user id', 'age', 'gender', 'occupation', 'ip code']user['user id'] = pd.to_numeric(user['user id'], errors='coerce')avgrating = pd.pivot_table(data, values='rating', index = 'user id', aggfunc='mean')
new = pd.merge(avgrating, user, how='inner', on = 'user id')
std = pd.pivot_table(new, values='rating', index = 'gender', aggfunc='std')
print(std)
男女电影评分差异分析编程相关推荐
- python 计算男女电影标准差 coursera男女电影评分差异分析编程
最近学习AI的强有力工具Python. 看到南京大学 的 用python玩转数据视频,有一个计算标准差的作业,现分享如下 import pandas as pd # 导入评分数据 ratingData ...
- 基于pandas的电影评分差异分析
基于pandas的电影评分差异分析 实验内容 数据来源 详细步骤 import pandas as pd import numpy as npunames = ['user id','age','ge ...
- python数据挖掘电影评分分析_Pyhon数据分析项目——男女电影评分差异比较
<用 Python 玩转数据>数据分析项目 一.程序功能 基于 MovieLens 100k 数据集中男性女性对电影的评分来判断男性还是女性电影 评分的差异性更大. 二.数据来源 数据集下 ...
- 基于pandas的男女电影评价差异分析
看了南京大学的<用python玩转数据视频>,Python强大.代码做了些注释.慢慢逐渐深入. https://scipy.org/ import pandas as pd import ...
- 基于R语言构建的电影评分预测模型
电影评分系统是一种常见的推荐系统.现在使用R语言基于协同过滤算法来构建一个电影评分预测模型. 一,前提准备 1.R语言包:ggplot2包(绘图),recommenderlab包,re ...
- 利用python进行数据分析_第二章_案例2_movielens_电影评分分析
自己尝试了一下数据分析,和书里的方法不完全一样.标*的为比较好的方法. ================================================ MovieLens电影评分数据 ...
- 大数据Spark电影评分数据分析
目录 1 数据 ETL 2 使用 SQL 分析 3 使用 DSL 分析 4 保存结果数据 5 案例完整代码 6 Shuffle 分区数目问题 1 数据 ETL 使用电影评分数据进行数据分析,分别使用D ...
- Python 电影评分分析
关注微信号:小程在线 关注CSDN博客:程志伟的博客 import numpy as np import pandas as pd import matplotlib.pyplot as plt %m ...
- 电影评分数据集的分析
目录 数据集的获得 使用工具 项目流程 数据集的获得 进入该网址:https://grouplens.org/datasets/movielens/ 找到如下part: 点击ml-100k.zip进行 ...
最新文章
- redis主从复制如何保证数据一致性_面试官:Redis 主从复制时网络开小差了怎么整?...
- trident State应用指南
- Meta AI 发布 data2vec!统一模态的新里程碑!
- js函数引用、函数调用与回调函数
- 小A点菜(洛谷P1164题题解,Java语言描述)
- 二、JAVA第一行代码
- Linux 系统设置图形界面启动和黑窗口启动
- Adobe Premiere常用快捷键_艾孜尔江摘录
- 推荐10款简单好用的免费内网穿透工具
- 如何修改文件最后一次修改时间?
- 点乘/内积/数量积;叉乘/向量积;矩阵乘法;哈达马积;克罗内克积;卷积
- WIN7中任务栏,菜单栏和工具栏的基本设置
- 浅谈产业界与学术界的合作研究(转)
- 人大金仓KingbaseES大小写敏感性专题
- 股票量化分析系统浅析之(三)归一化与标准化
- 每日 30 秒 ⏱ 复制内容到剪贴板
- 全球及中国氮化铝(AlN)模板行业运行态势及投资战略分析报告2021-2028年
- R语言函数定义快速查看
- 三分钟学会怎样识别手写文字
- VM:VMware 创建windows10 虚拟机
热门文章
- W12 - 999、O2O优惠券使用预测
- VMWare和Virtual PC虚拟机的比较
- 算法数据结构(三十八)----DC3算法
- 全境封锁:背水一战 - 概念艺术
- android 连接蓝牙音响,Android 扫描附近的蓝牙设备并连接蓝牙音响的示例
- BZOJ_1014_[JSOI2008]_火星人prefix_(Splay+LCP_Hash+二分)
- Python爬虫能当副业吗?到了那个层次才能接兼职?
- Hasee神舟战神Z7M-CT7NA笔记本电脑i7原装出厂Windows10系统恢复原厂OEM系统
- 启中教育:新手开网店怎么做好准备工作
- AWVS14 Docker Update