1-前序,从wide&deep说起

wide&deep由wide侧与deep侧一起使用发挥了两者综合的优势,wide侧是由低级特征交叉(cross-product)而得到的人工特征,与LR无差别,这种特征可能需要较多时间来进行组合,而且泛化性很低,可以认为是一个记忆网络,但很好解释;而deep侧则将特征进行embedding后concat作为dnn网络的输入,这种特征的交叉的方式显得更为高级,毕竟神经元全连接加上relu这种非线性激活函数,不足的是,当user-item交互是稀疏的时候可能推出相关性较小的item。因而,wide&deep一起使用就会弥补两者的不足,同时也能兼顾两者的优点,这很奈斯!!

For Recommendation in Deep learning QQ Group 277356808

For deep learning QQ Second Group 629530787

I'm here waiting for you

2,wide&deep中的基本概念与deepFM的异同点

2.1两个概念:memorization,generalization

前者是记忆,根据以往item历史推出相关的item,这是很直观的,后者是泛化,根据相关特征转化,探索历史中从未出现或很少出现的特征,这就增加了item的多样性。

特征交叉是什么?共现特征对AND,这就是说,其他的情况只能是0,比如,买了啤酒和尿不湿就是共现特征对,此时为1,只买啤酒或只买尿不湿,都是0。cross-product不会生成训练集中没有的,除非你穷举所有的特征对(特征组合,这个除非是我说的)啥意思?人工构造的特征组合肯定比不上全连接的这种特征交叉组合,很少有人穷举这些特征组合,这很费劲,而且效果也不一定好。因而,wide这部分完全可以改成自动学习,自动交叉的方式,比如FM,DNN,wide&deep中有了DNN,因此没有必要两个DNN(双塔,也不是,四不像),因而只剩下FM了,

2.2FM是啥?为啥FM不需要特征工程

从数据上来说,FM可能有多个field的数据,比如cate类型及连续值类型,前者one-hot编码作为表达,后者直接就是数字表达(或离散化后one-hot编码),流程如图下:

field中的特征如上所述,可以是cate类型(one-hot编码后),也可以是数值类型(不需编码),这是sparse 特征层,将其中不为0的进行embedding作为embedding层,且不为0的部分(其实是xi)与wi(在训练中学习)进行相乘后经Norm 后相加,也即FM表达式的第一项(一阶项),embedding层两两进行inner product(这就潜在要求embedding size应当一致),得到2阶项,也就是FM的第2项,这个两两取内积就是我上面提到的(穷尽了两两特征对),因而FM效果肯定要比wide好。1阶项与2阶项之和相加得到最终的yFM。其中的weight -1 就是指直接相加,权值为1。

2.3细节问题,为何只对上述的非0项进行embedding?

这是因为,0项与隐向量V相乘后都是0,而唯独非0项才有值,因而embedding 其实就是V,如下图所示:0与1对应于2阶项中的xi

2.4 wide是如何计算的,cross-product 与 inner-product有啥区别?

这部分就是如下图的LR,对于binary或者其他特征,取cross-product相当于是取AND(上述已经提到),其实就是特征共现对,y=wx+b,sigmoid为激活函数,其中输入的x为原始数据(数值型或离散型)或者经cross-product处理后的特征(可以交叉,也可以不交叉),交叉则增加了非线性。最终将wide部分的y与deep部分的y相加后才经过sigmoid激活。inner-product则就是内积,很好理解。

参考deepFM paper​​​​​​

参考wide&deep paper

愿我们终有重逢之时,

而你还记得我们曾经讨论的话题。

deepFM排序模型与widedeep的差异相关推荐

  1. 推荐排序模型2—— wideDeep及python(DeepCTR)实现

    wide&Deep模型重点指出了Memorization和Generalization的概念,这个是从人类的认知学习过程中演化来的.人类的大脑很复杂,它可以记忆(memorize)下每天发生的 ...

  2. 深度排序模型在淘宝直播的演进与应用

    分享嘉宾:纪志辉 阿里巴巴 算法专家 编辑整理:李春雷 出品平台:DataFunTalk 导读:淘宝直播近两年在排序模型上进行了持续的迭代优化和演进落地,在多目标学习.跨场景迁移.召回匹配.大促GMV ...

  3. 排序模型(learning to rank)发展史(偏推荐系统

    前言 「排序」是一个非常业务化的任务,其实践场景也多为搜索.广告.推荐,被用于解决排序任务的模型也被人一统称作了「排序模型」,但其实「排序模型」也是「普通模型」,只不过或多或少在业务层面针对排序做了一 ...

  4. FM,FMM,deepFFM模型总结,深度排序模型

    微博团队张俊林 https://zhuanlan.zhihu.com/p/67795161 如果你是 liblinear.libfm.libffm 的用户,那么现在 xLearn 将会是你更好的选 h ...

  5. 互联网大厂面试官:推荐系统最经典的 排序模型 有哪些?你了解多少?

    互联网大厂面试官:推荐系统最经典的 排序模型 有哪些?你了解多少? 提示:最近系统性地学习推荐系统的课程.我们以小红书的场景为例,讲工业界的推荐系统. 我只讲工业界实际有用的技术.说实话,工业界的技术 ...

  6. 头条项目推荐的相关技术(十):排序模型进阶与总结

    1. 写在前面 这里是有关于一个头条推荐项目的学习笔记,主要是整理工业上的推荐系统用到的一些常用技术, 这是第八篇, 上一篇文章介绍了一些深度学习和TensorFlow框架相关的知识, 有了这些知识, ...

  7. CSCNN:新一代京东电商广告排序模型

    分享嘉宾:刘鹄 京东 算法工程师 编辑整理:李沛欣 出品平台:DataFunTalk 导读:随着电商平台对图像信息的大量引入,通过图像分析来进行广告点击率判断就成了新的趋势.本次分享的主题为CSCNN ...

  8. 分类模型与排序模型在推荐系统中的异同分析

    出品社区:DataFunTalk 前言 推荐系统是驱动内容分发的引擎,而个性化则是推荐系统的核心思想.分类模型和排序模型是业界常用的两种个性化建模方式.本文探讨两种方法的异同点,总结如下: 分类模型回 ...

  9. 长文剖析经典论文,揭晓 Facebook 广告排序模型!

    作者 | 梁唐 来源 | TechFlow(ID:techflow2019) 头图 |  CSDN 下载自东方IC 今天我们来剖析一篇经典的论文:Practial Lessons from Predi ...

最新文章

  1. 使用读写锁解决读者-写者问题
  2. 软件工程专业如何就业!
  3. apache服务器_Apache的简介与配置(上)
  4. anconda设置镜像源_三、DockerFile 定制属于自己的专属镜像
  5. 第三章:变量与字符串等基础知识
  6. 介绍Flex UI测试工具:FlexMonkey
  7. Eclipse小工具 TCP/IP Monitor
  8. C语言图形库函数easyx下载
  9. 软件开发过程与项目管理(8.软件项目质量计划)
  10. 详解ISA防火墙策略元素
  11. VG vs SS WE vs IM [20160815]
  12. 那些曾经被央视拿来跟韩寒作对比的三好学生们,十年之后,再看看(转)
  13. 小数取整 四舍五入
  14. verilog版的1602+ps2
  15. 天正当前比例怎么设置_天正模型空间怎么设置(天正7图纸空间中如何改变当前比例)...
  16. 【java毕业设计】基于java+swing+GUI的连连看游戏设计与实现(毕业论文+程序源码)——连连看游戏
  17. Redis监控和预警
  18. Linux系统中彻底隐藏你的进程(隐藏后如何恢复显示?)
  19. Qt中UI线程与子线程的交互
  20. 关于input文本框只能输入数字的几种实用方法!!!

热门文章

  1. python分析彩票数据,这波太炸了!Python脚本可视化居然可以这么玩
  2. 爱站导航网整站源码-全网首发
  3. vue前端代码风格指南
  4. 什么时候使用resulttype_什么情况下用resultType和 resultMap
  5. 怎样释放计算机网络宽带限制,解除电脑网速限制 释放电脑被限制的20%网速
  6. 电阻额定电压和额定功率的关系 降额计算时的电阻额定电压怎么计算
  7. 数据中台咋就从“小甜甜”变成了“牛夫人”?
  8. java http reffer_HTTP Referer与网站流量来路统计
  9. 数据结构之图论算法(四)—— 拓扑算法
  10. SQL 笔记 By 华仔