新闻推荐系统【DAY1】
赛题简介
赛题以新闻APP中的新闻推荐为背景,要求选手根据用户历史浏览点击新闻文章的数据信息预测用户未来点击行为,即用户的最后一次点击的新闻文章,测试集对最后一次点击行为进行了剔除。
赛题数据
赛题以预测用户未来点击新闻文章为任务,数据集报名后可见并可下载,该数据来自某新闻APP平台的用户交互数据,包括30万用户,近300万次点击,共36万多篇不同的新闻文章,同时每篇新闻文章有对应的embedding向量表示。为了保证比赛的公平性,将会从中抽取20万用户的点击日志数据作为训练集,5万用户的点击日志数据作为测试集A,5万用户的点击日志数据作为测试集B。
数据表
train_click_log.csv
:训练集用户点击日志
testA_click_log.csv
:测试集用户点击日志
articles.csv
:新闻文章信息数据表
articles_emb.csv
:新闻文章embedding向量表示
sample_submit.csv
:提交样例文件
字段表
Field | Description |
---|---|
user_id | 用户id |
click_article_id | 点击文章id |
click_timestamp | 点击时间戳 |
click_environment | 点击环境 |
click_deviceGroup | 点击设备组 |
click_os | 点击操作系统 |
click_country | 点击城市 |
click_region | 点击地区 |
click_referrer_type | 点击来源类型 |
article_id | 文章id,与click_article_id相对应 |
category_id | 文章类型id |
created_at_ts | 文章创建时间戳 |
words_count | 文章字数 |
emb_1,emb_2,…,emb_249 | 文章embedding向量表示 |
结果提交
提交前请确保预测结果的格式与sample_submit.csv
中的格式一致,以及提交文件后缀名为csv。其格式如下:
user_id,article_1,article_2,article_3,article_4,article_5
其中user_id
为用户id,article_1
,article_2
,article_3
,article_4
,article_5
为预测用户点击新闻文章Top5的article_id
依概率从高到低排序,例如:
user_id,article_1,article_2,article_3,article_4,article_5
200000,1,2,3,4,5
200001,1,2,3,4,5
200002,1,2,3,4,5
200003,1,2,3,4,5
评分方式
MRR(Mean Reciprocal Rank)
首先对选手提交的表格中的每个用户计算用户得分
其中, 如果选手对该user
的预测结果predict k
命中该user
的最后一条购买数据则s(user,k)=1
; 否则s(user,k)=0
。而选手得分为所有这些score(user)
的平均值。
推荐系统通用流程
赛题理解、数据分析、特征工程、召回模块、排序模块等。
新闻推荐系统【DAY1】相关推荐
- 【组队学习】【32期】推荐系统-新闻推荐系统实践
推荐系统-新闻推荐系统实践 航路开辟者:罗如意 领航员:肖桐 航海士:汪志鸿.吴忠强.赖敏材.王辰玥.毛伟.宋禹成.陈雨龙.管柯琴 基本信息 开源内容:https://github.com/dataw ...
- 今日 Paper | 新闻推荐系统;多路编码;知识增强型预训练模型等
2020-01-21 05:41:48 目录 用多尺度自监督表征提高小样本学习的表现 详细了解如何设计和使用一个基于深度学习的新闻推荐系统 几何GCN 提升鲁棒性的多路编码 常识故事生成的知识增强型预 ...
- bgb邻居关系建立模型_今日 Paper | 新闻推荐系统;多路编码;知识增强型预训练模型等...
目录 用多尺度自监督表征提高小样本学习的表现 详细了解如何设计和使用一个基于深度学习的新闻推荐系统 几何GCN 提升鲁棒性的多路编码 常识故事生成的知识增强型预训练模型 用多尺度自监督表征提高小样本学 ...
- 【翻译】Bing-CF-IDF+:语义驱动的新闻推荐系统
本文由 林鸿钊@funco 翻译,仅作为交流学习之用,诚向各方大佬请教. 翻译不易,感谢支持,转载也请注明出处,不胜感激. 翻译:Bing-CF-IDF+:语义驱动的新闻推荐系统 原文:Bing-CF ...
- 新闻推荐系统:深度知识感知网络DKN
DKN: Deep Knowledge-Aware Network for News Recommendation DKN: Deep Knowledge-Aware Network for News ...
- Task01:熟悉新闻推荐系统的基本流程(项目结构)
Task01:熟悉新闻推荐系统的基本流程(项目结构) 0.代码版本 1. 文件说明 2. 流程图示 3. 架构图示[^1] 0.代码版本 该专栏的博客当中涉及的所有代码,均为组队学习期间的版本,大概在 ...
- Task01:熟悉新闻推荐系统的基本流程(代码复现)
Task01:熟悉新闻推荐系统的基本流程 0.代码版本 1.系统信息 2.`python`环境 3.`MySQL`数据库 4.`MongoDB` 5.`Redis` 6.`Node.js` 7. 复现 ...
- 基于协同过滤推荐+余弦相似度算法实现新闻推荐系统
针对海量的新闻资讯数据,如何快速的根据用户的检索需要,完成符合用户阅读需求的新闻资讯推荐?本篇文章主要采用余弦相似度及基于用户协同过滤算法实现新闻推荐,通过余弦相似度算法完成针对不同新闻数据之间的相似 ...
- 新闻推荐系统:基于内容的推荐算法(Recommender System:Content-based Recommendation)
2018/10/04更新 这篇文章似乎被越来越多的小伙伴看到了,所以觉得有必要做一些进一步的详细说明. 首先按照本文所讲解的推荐思路进行新闻推荐的推荐系统,我已经实现并已经放在Github上了.欢迎小 ...
- 一、熟悉新闻推荐系统基本流程
一.悉新闻推荐系统基本流程 环境搭建: vmware + ubuntu20.04(虚拟机) 前端框架: Vue. 后端框架: Flask 数据库: MySQL.MongoDB.redis IDE:vs ...
最新文章
- 机器学习和计算机视觉的前20个图像数据集
- python编程lcd显示_Python api.lcd方法代码示例
- Maven 多模块项目,多个root解决方法
- MSM USB插入流程代码分析
- ubuntu 循环登录问题,
- css禁止双击dom节点被选中user-select:none
- leetcode 850. Rectangle Area II | 850. 矩形面积 II(递归分割未重叠矩形)
- 解决虚拟机能ping通宿主机,而宿主机不能ping通虚拟机
- 在CISCO ASA 防火墙上配置Web ×××
- ❤️六W字《计算机基础知识》(九)(建议收藏)❤️
- 2003 -服务器没有响应,PowerPoint2003
- python访问字符串中的部分字符的操作_小白学Python-13(字符串基础与简单操作)...
- 【2019最新最全版】Java基础入门视频
- 立体栅格地图_具有立体效果的地图制作
- ORA-01002 “fetch out of sequence”关于cursor的一个bug
- 瑞士轮赛制模拟器_【入门必读】VGC综合介绍(下篇)【翻译】
- 控制台报 [WDS] Disconnected!不影响代码运行。
- Codeforces 1077B Disturbed People(思维题)
- canvas绘制火柴人
- LeetCode/LintCode 题解丨一周爆刷双指针:神奇字符串
热门文章
- matlab取矩阵元素的模,matlab – 提取矩阵元素
- 全家桶大礼包Adobe Photoshop免费自取免费
- 汽车学堂 自 动 驾 驶 决 策 与 控 制 算 法——现 代 控 制 理 论学习(一)
- 试编写程序,利用前、中序序列或者后、中序序列唯一确定一棵二叉树。
- Parsec 移动宽带无法登录问题和设置代理方法
- 普罗米修斯?对!就是 Prometheus ,如何计算 P90 / P99 ? 准确评控服务耗时性能!
- Mac node切换版本,指定版本
- JavaScript【树】
- 关于笔记本WLAN被禁用解决方法
- 奔驰c260语言设置方法图解,奔驰glc260l​中控​按钮图解,glc260l车内按键功能说明...