movielens处理代码
这一篇博客主要记录自己的代码是如何对movielens数据集进行处理的,想要达到的目的很简单,就是得到一个txt文件,形式如下:第一列为user,第二列为item,第三列为rating。
形如:
要达到这样的目的该怎么处理呢,很简单。
- 到达movielens的下载官网,https://grouplens.org/datasets/movielens/,选择你要下载的数据集大小类型。
- 其中,有csv的,有dat的。怎么处理呢?由于我只需要用户项目和评分信息我只对ratings进行处理。
- 如果是csv,把代码文件与csv文件放在同一个目录下,代码如下:
import math import random from numpy import * import numpy as np import sys import os from pandas import Series,DataFrame import pandas as pd from sklearn.model_selection import train_test_split import csvratings_list = csv.reader(open('ratings.csv','r'))rating_file = [] for item in ratings_list:rating_file.append(str(item[0])+' '+str(item[1])+' '+str(item[2])+'\n')filename = 'ratings.txt' with open(filename,'w') as f:for i in range(len(rating_file)):f.write(rating_file[i])
如果是dat,代码如下:
import math import random from numpy import * import numpy as np import sys import os from pandas import Series,DataFrame import pandas as pd from sklearn.model_selection import train_test_splitratings = pd.read_table('ratings.dat', sep='::', header=None, engine = 'python')data = ratings.filter(regex='user_id|movie_id|rating')ratings_array = np.array(ratings)ratings_list = ratings_array.tolist()rating_file = [] for item in ratings_list:rating_file.append(str(item[0])+' '+str(item[1])+' '+str(item[2])+'\n')filename = 'ratings.txt' with open(filename,'w') as f:for i in range(len(rating_file)):f.write(rating_file[i])
运行代码后,就可以得到我们需要的ratings数据集了~
movielens处理代码相关推荐
- 隐私合规:收集SDK部分介绍
com.meizu.cloud.pushsdk.SystemReceiver 魅族推送服务是由魅族公司为开发者提供的消息推送服务,开发者可以向集成了魅族 push SDK 的客户端实时地推送通知或者消 ...
- python 怎么取对数_概率矩阵分解(PMF)及MovieLens上的Python代码
首先对Probabilistic Matrix Factorization这篇论文的核心公式进行讲解和推导:然后用Python代码在Movielens数据集上进行测试实验. 一. 背景知识 文中作者提 ...
- movielens推荐系统_浅谈推荐系统+3个小时上手python实现(完整代码)
已经9012年了应该也不需要我解释什么是推荐系统,大致就像头图一样,挖掘用户的喜好,精准的推送给用户ta想要的东西!推荐系统可以说是无处不在了,电商的猜你喜欢,浏览器右侧的推送消息,包括搜索结果的排序 ...
- 1.AutoRec: Autoencoders Meet Collaborative Filtering论文解读以及AutoRec代码实现(pytorch)
一.论文原文 二.综述 协同过滤模型的目的是利用用户对商品的偏好信息来提供个性化的推荐.AutoRec是一个新型的基于自动编码器的协同过滤模型.论文作者认为AutoRec与现有的将玻尔兹曼机用于协同过 ...
- 推荐系统——开源代码
最近这两年推荐系统特别火,本文搜集整理了一些比较好的开源推荐系统,即有轻量级的适用于做研究的SVDFeature.LibMF.LibFM等,也有重量级的适用于工业系统的 Mahout.Oryx.Eas ...
- python协同过滤调用包_简单的python协同过滤程序实例代码
本文研究的主要是python协同过滤程序的相关内容,具体介绍如下. 关于协同过滤的一个最经典的例子就是看电影,有时候不知道哪一部电影是我们喜欢的或者评分比较高的,那么通常的做法就是问问周围的朋友,看看 ...
- DeepCTR-Torch 如何使用【案例(Criteo、Movielens)演示、特征(SparseFeat、DenseFeat、VarLenSparseFeat)参数含义】
文章目录 安装 DeepCTR-Torch 的 4 个步骤 step1:模型导入 step2:简单的预处理 step3:生成特征列 step4:生成训练样本并训练模型 分类:Criteo 回归:Mov ...
- 基于项目的协同过滤推荐算法单机版代码实现(包含输出电影-用户评分矩阵模型、项目相似度、推荐结果、平均绝对误差MAE)
基于项目的协同过滤推荐算法单机版代码实现(包含输出电影-用户评分矩阵模型.项目相似度.推荐结果.平均绝对误差MAE) 一.开发工具及使用技术 MyEclipse10.jdk1.7.movielens数 ...
- 基于hadoop的商品推荐系统_[零基础入门推荐系统(1)]基于用户和基于物品的协同过滤方法(python代码实现)...
1. 前言: 为什么会有该系列? 最近,打算写<零基础入门推荐系统>系列,为了系统地介绍推荐系统知识,以及加强基础的实践能力. 该系列将结合一些书籍,比如项亮的<推荐系统实践> ...
- 从IMDB上爬取MovieLens数据集中的详细电影信息
文章目录 基于协同过滤的电影推荐系统 数据集 HTML页面分析 爬虫代码 运行时间 百度网盘链接 基于协同过滤的电影推荐系统 用这个数据集实现了一个小型的电影推荐网站,GitHub代码 数据集 数据集 ...
最新文章
- 在linux 下配置firewalld
- 计算机组成原理DMA方式原理,计算机组成原理4(程序查询方式、程序中断方式、DMA方式及其I/O接口电路)...
- strcpy,strncpy,memcpy,memmove
- oracle忘记实例名,Oracle的安装和MS SQL Server实例名
- Python单元测试框架之pytest 3 -- fixtures
- 纯CSS打造可折叠树状菜单
- flink 5-窗口和时间
- nginx 防止恶意域名解析_配置nginx只允许域名访问,禁止ip访问【图文教程】
- 已饱和!未来程序员没活路了...
- 读取SqlServer表名及结构
- bzoj 4883 [Lydsy1705月赛]棋盘上的守卫——并查集(思路!)
- tail -f 命令卡住
- python的金融计算器_Python计算器
- pandas 空值填充
- FPGA实现cameralink高清相机解码
- lc滤波器是利用电感的感抗_由浅入深讲解滤波电路工作原理
- c语言字符串求n的阶乘,C语言求n的阶乘(n!)
- 谷歌日语输入法、中文输入法之间的切换
- 常州刘国钧计算机专业,2020常州刘国钧高等职业技术学校的录取分数线
- 1472_TC275的看门狗简介以及安全看门狗及CPU看门狗的区分
热门文章
- No.3PPT风格及搭配
- 淘宝天猫店铺装修问题与技巧性经验汇总
- 在线预览打印Word文档
- (ensp)华为USG6000v防火墙双机热备份的配置
- C/C++:构建你自己的插件框架(1)
- qq发送文件时显示服务器拒绝,qq给对方发文件为什么服务器拒绝接收 - 卡饭网...
- 医疗服务机器人市场复合年增长率将达15.7%
- matlab中遗传算法代沟,谢菲尔德大学的MATLAB遗传算法
- Vue html转word
- 【Proteus仿真】Arduino UNO步进电机驱动示例