推荐系统学术研究常用的数据集包括:

  1. MovieLens,MovieLens数据集中,用户对自己看过的电影进行评分,分值为1~5。MovieLens包括两个不同大小的库,适用于不同规模的算法。小规模的库是943个独立用户对1 682部电影作的10 000次评分的数据;大规模的库是6 040个独立用户对3 900部电影作的大约100万次评分。
  2. EachMovie,HP/Compaq的DEC研究中心曾经在网上架设EachMovie电影推荐系统对公众开放。之后,这个推荐系统关闭了一段时间,其数据作为研究用途对外公布,MovieLens的部分数据就是来自于这个数据集的。这个数据集有72 916个用户对1 628部电影进行的2 811 983次评分。早期大量的协同过滤的研究工作都是基于这个数据集的。2004年HP重新开放EachMovie,这个数据集就不提供公开下载了。
  3. BookCrossing,这个数据集是网上的Book-Crossing图书社区的278 858个用户对271 379本书进行的评分,包括显式和隐式的评分。这些用户的年龄等人口统计学属性(demographic feature)都以匿名的形式保存并供分析。这个数据集是由Cai-Nicolas Ziegler使用爬虫程序在2004年从Book-Crossing图书社区上采集的。
  4. Jester Joke,Jester Joke是一个网上推荐和分享笑话的网站。这个数据集有73 496个用户对100个笑话作的410万次评分。评分范围是−10~10的连续实数。这些数据是由加州大学伯克利分校的Ken Goldberg公布的。
  5. Netflix,这个数据集来自于电影租赁网址Netflix的数据库。Netflix于2005年底公布此数据集并设立百万美元的奖金(netflix prize[47]),征集能够使其推荐系统性能上升10%的推荐算法和架构。这个数据集包含了480 189个匿名用户对大约17 770部电影作的大约10亿次评分。
  6. Usenet Newsgroups,这个数据集包括20个新闻组的用户浏览数据。最新的应用是在KDD 2007上的论文[49]。新闻组的内容和讨论的话题包括计算机技术、摩托车、篮球、政治等。用户们对这些话题进行评价和反馈。
  7. UCI知识库,UCI知识库是Blake等人在1998年开放的一个用于机器学习和评测的数据库,其中存储大量用于模型训练的标注样本,被用于推荐系统的性能测试数据。
一个完整的推荐系统由3个部分组成:收集用户信息的行为记录模块,分析用户喜好的模型分析模块和推荐算法模块.行为记录模块负责记录用户的喜好行为,例如问答、评分、购买、下载、浏览等.问答和打分的信息相对好收集,然而有的用户不愿意向系统提供这些信息,那么就需要通过其他方式对用户的行为进行分析,例如购买、下载、浏览等行为.通过这些用户的行为记录分析用户的潜在喜好产品和喜欢程度.这就是模型分析模块要完成的工作.模型分析模块的功能能够对用户的行为记录进行分析,建立合适的模型来描述用户的喜好信息.最后是推荐算法模块,利用后台的推荐算
法,实时地从产品集合中筛选出用户感兴趣的产品进行推荐.其中,推荐算法模块是推荐系统中最为核心的部分.

推荐系统研究常用数据库相关推荐

  1. java计算机毕业设计个人阅读习惯个性化推荐系统研究源码+mysql数据库+系统+lw文档+部署

    java计算机毕业设计个人阅读习惯个性化推荐系统研究源码+mysql数据库+系统+lw文档+部署 java计算机毕业设计个人阅读习惯个性化推荐系统研究源码+mysql数据库+系统+lw文档+部署 本源 ...

  2. 计算机毕业设计Java个人阅读习惯个性化推荐系统研究(源码+系统+mysql数据库+Lw文档)

    计算机毕业设计Java个人阅读习惯个性化推荐系统研究(源码+系统+mysql数据库+Lw文档) 计算机毕业设计Java个人阅读习惯个性化推荐系统研究(源码+系统+mysql数据库+Lw文档) 本源码技 ...

  3. [推荐系统]基于个性化推荐系统研究与实现(1)

    目  录 一.搜索引擎与推荐系统 二.推荐系统原理与算法 2.1 Jaccard系数 2.2 余弦相似度 三.数据定向爬取及电影数据集 3.1 爬取近七日天气预报数据存入DB数据库,分为五步完成. 3 ...

  4. 推荐系统研究中的九大数据集

    推荐系统研究中的九大数据集 原文地址 ps:对原文有所删减 在这篇博客中,作者介绍了九个数据集,其中一些是推荐系统中常用到的标准数据集,也有一些是非传统意义上的数据集(non-traditional ...

  5. 论文阅读:基于用户上网数据的电影个性化推荐系统研究

    基于用户上网数据的电影个性化推荐系统研究 赵鹏程,黄韬* *(北京邮电大学信 工程学院,北京 100876) 摘要:本文讲述了如何构建出完整电影知识图谱的方法,同时提出了一套发掘电影系列的实现算法.基 ...

  6. 可解释推荐系统研究综述

    可解释推荐系统研究综述 文献来源 简介 解释的各种类型 基于用户和基于项目的解释 基于内容的解释 文本解释 可视化解释 社交解释 混合解释 可解释推荐模型 推荐模型概述 基于矩阵/张量分解的可解释推荐 ...

  7. 数据库中html数据类型,常用数据库的字段类型及大小

    Oracle/MSSQL/Mysql 常用数据库的字段类型及大小 ORACLE的数据类型 常用的数据库字段类型如下: 字段类型 中文说明 限制条件 其它说明 CHAR 固定长度字符串 最大长度2000 ...

  8. 基于深度学习的推荐系统研究

    基于深度学习的推荐系统研究 论文信息:北京邮电大学   陈达  14年硕毕论 目的:深度网络学习算法应用到推荐系统 . 为此工作: 1)研究分析基于内容的推荐系统和基于协同过滤的推荐系统,包括基于相似 ...

  9. Linux下推荐的常用应用程序列表

    Linux下推荐的常用应用程序列表 一,网页浏览 1,firefox firefox是现在最火的一个浏览器,支持好多扩展和插件,也有很多漂亮的主题.firefox就是mozilla-firefox,他 ...

最新文章

  1. 在一个解决方案中用C#测试调用C++ DLL
  2. windows7如何查看端口被占用
  3. 使用jquery在新窗口中打开外部链接
  4. Oracle拆分字符串函数与执行调用
  5. E1 PCM复用设备能当程控交换机用吗?
  6. 边缘检测robert原理_在操作机器视觉检测过程中,遇到检测精度的难题怎么办?_西旺科技...
  7. c#二维数据最大最小值_C#| 打印类型,各种数据类型的最大值和最小值
  8. 4-1k近邻算法(k-Nearest Neighbors)
  9. Notes on how to use Webots, especially how to make a robot fly in the air
  10. MySQL 5.6 dump/load buffer pool实验
  11. 进度条制作-GIF动画
  12. 免费下载qq音乐的音频资源的方法
  13. 这次跟大家聊聊技术,也聊聊人生
  14. Python爬取百思不得姐的视频+视频的切割+给视频添加水印
  15. Varscan2 Call snp_indel
  16. Linux系统中VCS、Dve Verdi的使用
  17. 华为云硬盘备份(VBS)服务
  18. iOS迅雷安装最新方法,免签稳定,看教程!
  19. xfs文件系统损坏修复
  20. 关于51号单片机开发所需软件keil5的安装教程

热门文章

  1. Android P 如何挂载system镜像到根目录
  2. USB 调试工具(python2.7 + Tkinter + pyusb/pywinusb)
  3. BAAI 2020 北京智源大会 | Yolanda Gil | Thoughtful Artificial Intelligence
  4. 简单的交换排序法(选择排序)。
  5. VSCode设置代码格式化
  6. Django使用旧有的数据库
  7. Spring Boot整合Shiro + JSP教程(用户认证,权限管理,图片验证码)
  8. 谈谈QUIC协议原理
  9. 第6章 关系数据理论—范式的介绍
  10. 蓝桥杯历年试题汇总 C/C++ B组