时装分类+检索之DeepFashion
论文:DeepFashion: Powering Robust Clothes Recognition and Retrieval with Rich Annotations
Github:https://github.com/liuziwei7/fashion-landmarks
CVPR2016,汤老师,王小刚老师组的。
- 增加额外的landmark定位,有助于提高类别分类的精度
- 更多的衣服属性,有助于训练产生更好的特征空间,从而更好优化识别
论文贡献:
- 提出大型时装数据集DeepFashion
- 提出了FashionNet 进行DeepFashion 数据集的衣服属性的预测和分类
- 定义了多种任务的评价标准
DeepFashion 数据集:
DeepFashion 包含80W张图片,具体包含50种类别,1000个属性,4-8个关键点,同一种衣服的配对属性。
图片主要来源于,
- 购物网站Forever212和Mogujie,一共收集了1320078 张
- Google网络图片,一共收集了1, 273, 150 张
- 先使用Alexnet的全连接层剔除了特征相差较大的,然后进行人工清洗,得到最终的80W张图片。
和其他时装数据集的对比:
FashionNet 网络:
网络的基础结构类似于VGG-16,将VGG-16的最后一个卷积层替换为上图的红,绿,蓝,三个网络子模块。
红色的模块负责提取基础模块的全图的特征。
绿色的模块输入为基础网络的最后特征层和蓝色网络的landmark,然后经过landmark pooling layer层得到局部的特征层。再将红色的全局特征和绿色的局部特征进行融合,最终特征进行预测时装类别,属性和triplet类内类间分类
蓝色的网络输入为基础网络的最后特征层,然后回归得到landmark的坐标位置,已经坐标的是否可见。
landmark pooling layer类似于roi pooing。通过landmark的坐标,取一个L的区域,进行pooling操作,然后将所有关键点提取的pooling区域concat起来,就形成了绿色模块的pool5_local层。
训练loss:
训练过程中,首先加大蓝色模块的权值,先把蓝色模块训练收敛,然后再减少权值,整体训练。
landmark回归loss为加权的L2 loss,其中Vj为其权值,代表landmark的可见性,对于不可见的就不进行梯度的回传。
衣服类别分类和landmark是否可见分类,采用传统的softmax crossentrop loss
衣服属性分类采用加权的sigmoid crossentrop loss,Xj代表第j个衣服,aj代表第j个衣服的属性,Wpos和Wneg代表正负样本的权值
类内类间度量学习的loss采用triplet loss。(x, x+, x-) 表示三元组,m表示margin,d表示距离函数。
References:
http://mmlab.ie.cuhk.edu.hk/projects/DeepFashion.html
https://liuziwei7.github.io/papers/deepfashion_slides.pdf
时装分类+检索之DeepFashion相关推荐
- Tensorflow实现神经网络及实现多层神经网络进行时装分类
Tensorflow实现神经网络及实现多层神经网络进行时装分类 1. tf.keras构建模型训练评估测试API介绍 import tensorflow as tf from tensorflow i ...
- AutoCAD快捷键大全(按字母分类检索)
以下是学无忧网收集的AutoCAD快捷键大全(按字母分类检索),分享一下. A B C D E F G H I L M N O P Q R S T U W X Z [命令] [作用] 3D 创建 ...
- 【实战1】FashionMNIST时装分类
FashionMNIST时装分类 10个类别 包含已经预先划分好的训练集和测试集,其中训练集共60,000张图像,测试集共10,000张图像.每张图像均为单通道黑白图像,大小为28*28,分属10个类 ...
- 3000+ NLP资源一网打尽,只需用这个分类检索网站 | 免费
NLP资源免费搜索神器来了~ 有了它,就能一键直达arXiv论文PDF.相关研究的关联网.GitHub存储库,以及Colab,再也不用逐项搜索! 这是一个NLP资源检索网站,在reddit上获得了46 ...
- JQuery Mobile(书籍分类检索)
1.什么时候使用JQuery mobile 呢? 所有功能性比较强的网站,比如订酒店(如:携程).租车.订票等这样需要有本地APP 界面的网站.就需要使用JQuery mobile 如图: ...
- 电商网站 首页三级分类的分类检索 vue前端关键代码
goSearch(event){//event.target:获取到的是发出事件的元素(div,h3,a,em,dt,dl)let node=event.target;//给 a 标签添加自定义属性d ...
- 服装检索-DeepFashion
DeepFashion: Powering Robust Clothes Recognition and Retrieval with Rich Annotations 该篇论文主要有两个任务,第一个 ...
- 推荐两个检索和分类小工具Carrot2 OSS
Carrot2 Carrot2是一个开源搜索结果分类引擎.它能够自动把搜索结果组织成一些专题分类.Carrot2提供的一个架构能够从各种搜索引擎(YahooAPI.GoogleAPI.MSN Sear ...
- 分类号检索不好用?那是因为你压根没用对分类
灵活检索专利文献,是知产.研发过程中必不可少的一项工作技能,在浩如烟海的文献中精准地搜索到目标内容并总结出具有参考价值点是困难的,而检索技能的培养并不能一蹴而就. 笔者看到太多这样行业新手都有这样的问 ...
最新文章
- 策略模式——Strategy
- 生物计算论文笔记1:The construction of next-generationmatrices for compartmentalepidemic models
- 三线城市PHP5000怎么样,一线城市五千退休金,二线四千,三线三千,是一样生活水平吗?...
- iOS-Runtime知识点整理
- 网易10万+课程迅速刷屏又迅速被封:“违规”背后的思考
- 详细关闭iiop方法_疏通暖气片堵塞的方法,看完你就知道了!
- The Use Case Definition in UML
- t检验的p值对照表_统计学|各类统计检验方法大汇总
- CCF201512-5 矩阵【矩阵快速幂】(募集解题代码)
- JavaScript 中URL编码方式
- messagedigest 图片加密_通过MessageDigest实现简单的MD5加密
- c#锁定Excel工作表和单元格
- php 创建临时id_使用PHP创建ID3标签阅读器
- echarts柱状图加上数量
- 如何进行小红书推广?小红书平台适合推广什么产品?
- windows自定义屏幕大小,分辨率大小,自定义电脑屏幕分辨率
- i7 11700k、i7 11700f和i7 11700KF选哪个
- SVG实例入门与动画实战
- 打败苹果!小米销量跻身全球第二
- 为什么说社区团购是美团必须要拿下的市场?