Transfiguring Portraits论文阅读笔记

图1:我们系统的目标是让人们想象和探索在不同的国家,时代,发型,头发的颜色,年龄以及可以在图片搜索引擎中查询的其他内容的样子。上面的示例显示了一张输入照片(左),并自动合成了输入人的“卷曲的头发”(上排),“印度”(第二排)和“ 1930”(第三排)的外观。

摘要:

  • 通过改变头发的颜色,发型,变老,处于不同的时代风格,或不同的国家或职业,人们看起来可能会发生巨大变化。其中一些可以改变外观,并激发创造性的改变,有些则不能,但是如果不进行实际尝试,我们怎么知道?我们提出了一个系统,该系统可以自动合成无数个外观。 用户输入一张或多张他或她的脸部照片(任意数量),文本查询感兴趣的外观(就像他们搜索图像搜索引擎一样),并以查询的外观将输入的人作为输出。我们的系统不是固定查询或数据集的数量,而是利用网上所有相关且可搜索的图像,估计输入的图像,并利用其生成复合图像。我们展示了大量在不受约束的成像条件下拍摄的示例照片。
  • 关键字:人脸,大数据,野外,外观预测,基于互联网的合成,人像,富有想象力。

引言

  • 在“美国人”节目中,苏联克格勃间谍只是通过改变发型,颜色和服装风格来改变身份。当我们去找发型师时,我们可以浏览一本杂志,上面有模特的照片,并指向想要尝试的那种风格的照片。有时我们会看到名人,想知道他们的风格是否适合我们。演员会更改外观以适合特定角色,例如凯特·布兰切特(Cate Blanchett)在“我不在那儿”中描绘了鲍勃·迪伦(Bob Dylan)的角色。但是,如何在不进行物理尝试的情况下如何预测外观变化是否合适?还是我们如何探索各种外表,例如针对失踪人员?本文是关于这种变化的自动综合。
  • 其思想是让人们从图像中变形其外观,而不进行任何物理变化(图1)。我们没有解决在任何输入照片中人工渲染逼真的头发颜色和发型(例如从预先捕获的发型3D模型中)的难题,而是我们的主要想法是,互联网上数十亿人的照片已经捕获了所有可能的发型,颜色,和更多。例如,搜索“卷曲的金发”将返回该发型的数千种变体。受[Hays and Efros2007]的启发,该技术利用Internet来完成场景,我们创建了一种工具,该工具可以利用网络使人们以新的样式和场景进行探索和想象。【输入图像,利用网上的各种人像照片,自动合成不同发型,年龄,风格】

图2:我们系统的插图。系统将输入照片和文本查询**【卷发】**作为输入。文本查询用于搜索Web图像引擎,对检索到的照片进行处理以计算各种面部特征以及皮肤和头发面具,并根据它们与输入照片的匹配程度进行排名。最后,将输入人脸融合到排名最高的候选者中。

  • 我们的系统将输入一张或多张人脸的照片作为输入,让用户搜索所需的任何描述,自动处理目标照片集,并将输入的脸孔呈现在查询的描述中。具体来说,它具有三个关键功能:

    • 1.自由格式查询。允许用户搜索任何内容,而不仅限于规定的样式集。这开启了探索它们在不同国家,时代甚至宇航员中的样子的可能性。【允许搜索任意内容的图像】
    • 2。Doppelganger sets。由于性别,种族和面部表情的差异,人们的面孔差异很大。由于脸部形状和轮廓不同,合成两个任意脸部可能会失败。但是,由于每个查询捕获了大量图像,这些图像捕获了许多不同的人和姿势,这使我们能够结合面部,年龄和性别识别算法,并找到面部与输入人的面部和头部形状最相似的人。我们称此类相似的人为“Doppelganger sets.”。然后我们可以将输入的头发替换为Doppelganger sets集合中的发型,并以新的样式想象输入对象。【结合性别、年龄检测,姿态估计,将最接近输入图像的人脸作为备选集合。】
    • 3。in the wild.,我们的目标是完全不受限制和未经校准的设置,允许您从输入中输入任何照片。个人照片集。自然地,互联网照片在成像条件(照明,姿势,照相机)中包含着很大的差异,我们在匹配和合成阶段充分利用了这些信息,从而可以最佳地选择候选人。【适用于输入任何个人的图像】
  • 我们系统的关键技术组件是人脸处理(人脸和基准点检测和对齐),属性识别(年龄和性别),皮肤和头发遮罩计算,通过人脸和属性识别的Doppelganger sets估计以及匹配成像条件,并使用皮肤和发膜进行融合。完整的系统(如图2所示)是完全自动化的,并且设计时考虑了简单性。
  • 此外,为了允许与年龄有关的查询,特别是那些需要预测孩子将来的样子的查询,我们使用面部年龄进程方法[Kemelmacher-Shlizerman et al.2014]修改脸部,然后将其作为我们的匹配系统的输入。通过这种方式,我们可以预测整个头部的老化,而不仅仅是面部。老化过程也是自动的。【关键方法是人人脸处理(人脸检测和对齐)、属性识别(性别、年龄)、皮肤和头发遮罩计算、生成匹配的备选人脸数据集、融合人脸和头发】
  • 我们系统的新颖性不在于特定的技术组件(各个组件均来自大量文献),而在于应用程序及其独特的组合。我们证明了该系统使人们能够通过单击按钮以无限数量的方式想象自己。【我们基本没有创新,只是把别人的方法组合起来】

2、相关工作

  • 修改外观可能涉及复杂的物理变化,例如戴假发,染发,化妆,戴帽子或留胡须。商业图像处理软件(例如AdobePhotoshop)提供了多种工具来替换,融合和调整图像部件。此类工具需要熟练处理每张照片。在本节中,我们将介绍自动合成人的外观和样式的相关工作。【修改外观很复杂,工具比如ps也需要很熟练,所以我们提出全自动的工具】
  • 十多年前,交互式照片蒙太奇论文[Agarwala等 [2004年]表明,可以使用图形切割和梯度域混合技术将照片序列结合起来,以创建逼真的单个合成物。尽管需要手动操作,并且需要使用类似的成像设置拍摄照片序列,他们的方法产生了令人兴奋的结果。我们的系统是全自动的(无需用户交互),因为它需要处理大量的照片。【2004年有人提出利用图形切割和梯度域混合技术创建合成照片】
  • [Bitouk等人。 2008。即Face Swapping那篇文章]。他们利用大型面部数据集进行图形应用程序创建了一个庞大的人脸数据集。为每个人脸计算了属性,并将数据用于去识别任务。任何人想要隐藏其身份的输入照片都将与数据库匹配,然后将使用排名最高的数据库人脸来替换输入人的脸。在本文中,我们考虑了相反的任务:创建许多不同的外观,但保留输入人的身份。这需要精确的面部和头发分割和识别,例如,在人脸去识别任务中允许更改人的下巴,但是在我们的方法中不不允许,因为会改变身份【本文和Face Swapping有点相似,但是目标是相反的,不同于face Swapping 的人脸去识别,本文的目标是自动化的创建同一人的不同风格图像(更换发型,年龄编辑,换背景等等)】
  • 人脸重现方法是相关的,因为它们将源人员的表情融合到目标中。 2014; Thies et al.2015]。他们专注于视频跟踪,旨在保护目标人员的身份,而我们有兴趣保留源身份。他们也不执行头发替换和样式探索。【本文与上文不同之处】
  • [Nguyen等。 2008年]显示,通过分析有胡子和没有胡子的人的照片,他们可以创建胡子和非胡子照片的PCA空间,并从新输入的照片中删除胡子。【去除胡子】
  • [Kemelmacher-Shlizerman等。2014]利用互联网预测孩子长大后的样子。他们只专注于面部区域。在本文中,我们将该方法与头部匹配和替换方法结合起来以显示完整的头部预测。【结合以前方法去预测完整的头部的样式】
  • 与我们的Doppelganger sets选择有关的是[Crowley等人的最新工作。 2015]。他们应用了[Parkhi等人的VGG人脸识别模型。 2015],以使人们与绘画相匹配。事实证明,该模型在各种绘画和摄影风格上均十分可靠。因此,我们在匹配过程中使用它。此外,我们扩展了[Kemelmacher-Shlizerman等人的面部相似度指标。 2011]和[Berthouzoz等,2012]。【参考2015的人脸与绘画匹配方法,在2011方法上扩展了面部相似度指标】
  • [HaCohen等,2011。 [2011年]探索了如何使用个人照片收藏来增强照片的色彩和质量。他们的想法是在照片集中找到相应的部分,并在相应的部分上转移颜色。更笼统地说,要实现跨照片的样式转移:[Shih等。 [2014年]将从一组照片中学到的照相风格转移到新的输入中[Liuet al。 [2014年]转移了网络搜索返回的照片集的样式,以及许多深度学习方法,例如[Gatyset al。 2015]了解特定艺术家的风格,例如梵高,并将其应用于新照片。这些项目的共同目标是调整照片的风格。本文是关于修改内容和样式的。最后,[Hu等。 2015]利用3D头发模型的大型数据集生成3D的新发型。我们的应用程序从大数据创建发型的角度来看是相似的,而数据本身也有所不同:我们以2D逼真的外观为目标,并允许从Internet上的图像中学习任何样式。【本文的方法类似于风格迁移】

3、方法

  • 我们系统的输入是1)一张或多张人脸的照片,用“源集合”表示; 2)文本查询。该查询用于搜索图片搜索引擎,让我们将搜索引擎检索到的照片集称为“目标集”。两组照片(源照片和目标照片)被并行处理,并进行匹配以计算每张源照片的备选照片集合。接下来,将每个源照片及其对应的备选照片集合进行合成,以从源集合中获取面部(人脸),并从每个目标中获取头部。对结果进行排名,并将最重要的输出返回给用户。下面我们详细描述这些步骤。

3.1 面部处理

  • 每张照片(目标或源)均被独立处理。首先,检测面部和面部标志。我们使用[Mathias等人的人脸检测算法。 2014年],因为它对于较大的平面外旋转具有鲁棒性。给定脸部周围的盒子,我们运行IntraFacelandmark检测器[Xiong and De la Torre 2013]来估计眼睛,鼻子和嘴角。我们遵循[Kemelmacher-Shlizerman et al。 2011]使用模板3D模型将每张照片对齐并弯曲成正面姿势。通过此过程,我们还可以估算每张照片的3D姿势(翻滚,俯仰和偏航角)。【使用别人论文中的方法来检测人脸,对齐人脸。并估算其3D姿势】
  • 接下来,我们估计每张照片的许多功能:年龄,性别,HOG【方向梯度直方图】和面部识别功能VGG。对于年龄和性别估计,我们遵循[Levi and Hassner2015]中报告的方法,该方法使用在Adience数据集上训练的深度网络模型。我们用[Kemelmacher-Shlizerman et al。 2014],并使用Caffe创建年龄和性别分类器[Jia等。 2014]。为了比较面部表情,我们计算每张照片的渐变直方图[Dalal and Triggs 2005],并在变形的照片上进行估算。最后,我们使用[Parkhi等人的领先人脸识别方法来计算人脸识别功能。 [2015]使用VGG 16层模型训练人脸识别模型。我们将其应用于检测到并对齐的照片。【使用2015方法估计年龄,性别;使用2005估算面部表情。此处为什么要使用人脸识别?在下文有解释:原来是用来计算备选集合中图像的相似度,最终排名需要用到】

备选集合估计

  • 给定每张照片的计算特征,我们将每张源照片与每张目标照片进行匹配。源集可以包括一个或多个照片,目标集通常包括大约1000张照片。这些照片是在以各种照明,姿势和捕捉不同的人而拍摄的。我们的最终目标是使用来源人员的脸部和目标头部来创建复合图像,以保持来源人员的身份。我们发现脸部形状非常相似的人的照片更适合有效的构图(图4,前额和脸部侧面轮廓非常相似)。因此,我们根据目标图片与输入者的相似度对目标图片进行排名,并估算出来源的备选集合。相似度被计算为VGG的面部识别功能之间的L2范数。这是针对每张源照片完成的,最后(源,目标)对根据其等级进行排序。【输入源图像,检测人脸,并对每一张图像进行以下操作:检测到人脸A,输入搜索词获得1000张对应属性的照片。然后用VGG的人脸识别功能对1000张不同光照、姿势、年龄、面部表情下的人脸做检测,然后估算相似度,最后排名选出备选人脸集合】
  • 尽管人脸识别功能发现非常相似的人脸,但它们在姿势,年龄和面部表情方面相对不变。混合具有不同姿势的两个面孔会产生伪影,尤其是当姿势差异很大且需要完整的3D模型(不可用)校正姿势时尤其如此。然后根据以下相似度函数对选定的已排序(源,目标)照片对进行重新排名:【不知道干嘛了】
  • 其中Pi是3个向量,包括横滚,偏航和俯仰角,Agei是目标和源的估计年龄,Hiare是HoG特征。

3、3 合成

  • 为了创建外观更改,我们将源的脸部组合到其目标doppelg̈anger集的头部。组成包括两个步骤:
  • 1。遮盖皮肤和头发以将源脸融合到目标头中。
  • 2。变换脸部以适合查询,例如,在搜索年龄较大的情况下,源脸部的年龄已升至目标年龄。【】
  • “野生”照片中的脸部变形和修改的先前工作假定使用固定的遮罩将脸部分开例如[Bitouk et al。 2008年; Kemelmacher-Shlizerman et al.2014]。最近,[刘等人。 2015]通过标记LFW数据集中的照片,训练了一个深层的皮肤和头发分割网络[Huang等。 2008]。我们修改了他们的方法以适合对齐的照片集合并估计源照片和目标照片的蒙版。我们对源对和目标对的最终过滤是基于蒙版的比较。我们从每个蒙版计算一个边缘贴图,并计算两个蒙版之间的L2范数。差异较小的对排名较高。图3示出了掩模。【使用并改进别人的方法进行蒙版估计】

3:对应对的示例边线图

  • 如果查询的年龄较大,我们将[Kemelmacher-Shlizerman等人的方法纳入本文。 [2014年]可以让您的脸焕然一新。具体来说,我们确定,如果单词中的一个是“年龄”或“岁”,则要求年龄编辑。我们估计了搜索的年龄和估计的输入年龄之间的差异,并且如果差异超过1年,我们就得出了年龄进展。该查询用于标识目标年龄空间,而输入的年龄用作对创建源空间的数据的查询。像[Kemelmacher-Shlizerman等人,2007年。 [2014年]。【人脸年龄差异超过1年时要进行年龄编辑】
  • 一旦脸部发生变化并估计了遮罩,我们将给定两个遮罩的两张照片混合在一起,类似于[Levin等。 2004]。在最终融合之前,使用基准点将源照片对准目标照片。为了确保同一性,将混合遮罩定义为源遮罩(图3)。图4显示了在该方法的每个步骤中混合可能会出错的示例,并将我们的结果与[Bitouk等。 2008]。【我们提出的方法的效果很显著】

图4:比较有和没有人脸识别匹配(Doppelganger与Non-Doppelganger),固定(例如Bitouket等人)或可变面罩(我们的方法)的比较。非Doppelganger照片不能很好地与输入融合,并且固定的遮罩可能会更改人的身份。两者都是我们应用程序中不希望的。

1:第3-4行:每个输入查询组合从网络检索并由算法过滤掉的图像数量。第5-7行:高质量输出的数量,带有伪影的结果的数量以及不可接受的复合材料的数量。第1-2行中的缩写:MM = Matthew McConaughey,KR = Keri Russell,IK = Ira Kemelmacher,GC = George Clooney,CB = Cate Blanchett,BD = Bob Dylan

结果

  • 我们的系统实现为Web界面(图6),并且易于实验。该系统在具有NVIDIA GeForce GTX750ti和24GB RAM的双六核Intel X5680(3.33GHz)linux计算机(Fedora 22)上运行。该代码是用MATLAB编写的,使用的是Caffe [Jia等。 2014]。目前,每次输入和文本查询返回结果需要1分钟,我们计划在将来提高效率,并使系统广泛可用。【该可以提升效率】
  • 图1在单个输入照片上显示了系统的典型输出(左)查询“卷曲的头发”,“ 1930”和“印度”。图5显示了将该方法应用于五张输入照片的结果。添加更多输入照片很容易,并且可以创建具有非正面的合成物。该方法将自动对任何提供的(源,目标)对进行排名。图7显示了Keri Russell转换为“ 1930”,“卷发”和“黑发”的照片。系统处理了100张Keri Russell的照片(在图像搜索引擎中检索到的最上面的照片),并将每张照片与“ curly”,“ 1930”和“ black hair”的目标集进行匹配。图中呈现的结果使用六个不同的输入(可以根据面部表情和妆容进行识别)。比较两个不同的人(图5和7)和他们的“弯曲”合成照片很有趣。尽管查询相同,但结果排名最高的输出却不同。这是由于输入人的面部形状不同所呈现的所有照片都是自动生成的,在每种情况下我们都显示排名最高的结果。图8展示了乔治·克鲁尼的发型变化。

5:在“印度女人”(上图),“黑发女人”(左下图)和“卷发女人”(右下图)中合成了同一个人。总共使用了五张输入照片。最下面一行中的合成物为所有结果使用单张照片。第一排使用四张不同的照片

6:我们的Web界面的屏幕截图。用户输入一张或多张照片,搜索文本查询,并以查询的外观获取输入人的各种渲染图。

  • 图9显示了5岁,10岁,15岁,15岁,30岁,40岁和60岁的1岁未来外观的完整头部预测(排名最高的结果)。通过搜索例如“ 5岁男孩”来检索目标集。随着年龄的增长,面部表情朝着自动生成照片迈出了一大步,对于诸如失踪儿童搜索之类的重要任务,创建全头模型是必不可少的,因为人类识别人的能力与发型高度相关[Kumar等。 2009]。保证这确实是老年人长发的样子超出了本文的范围。但是,我们的系统是第一个允许替换头部并结合年龄变化并自动搜索数百个查询(目前失踪的儿童基金会手动匹配数十个模板中的头部)的一种方法来限制空间,方法是合并父母的照片,这将在我们的系统中直接进行。此外,具有探索遗传上不可能的发型的能力仍然非常有用,例如,贩运儿童通常会给儿童染发。【输入1岁孩子的照片可以自动生成未来外观的完整预测,此举可以用于失踪儿童的寻找】
  • 图4将我们的结果与[Bitouk等。 2008]相比较。我们的方法之间的两个主要区别是:1)我们结合了面部识别,而他们的方法主要侧重于姿势和光照匹配,以及2)我们使用针对人的皮肤和头发的专用遮罩,而它们(以及其他先前的作品)则使用固定的遮罩。我们表明,使用固定的蒙版通常会更改人的身份(请注意两个结果的下巴如何变化),这对于取消身份识别任务是有积极作用的,但是不能用于样式转换。我们还表明,通过匹配相似的人,我们可以获得更高的准确性结果。【图4中的比较结果。是否结合面部识别,是否使用固定遮罩】
  • 图10显示了凯特·布兰切特(Cate Blanchett)扮演鲍勃·迪伦(Bob Dylan)的示例结果。 (a)-(h)是通过输入Cate Blanchett(在图像搜索中出现的前100个)的照片和查询“ Bob Dylan”自动生成的。 (i)显示实际转换为鲍勃·迪伦(Bob Dylan)的实际凯特·布兰切特(Cate Blanchett),在电影“我不在那儿”中扮演的角色。我们设想演员或导演可以使用我们的系统轻松地预测一个人看起来像在扮演别人,或者处于图7(下排)不同的时代和风格。【此技术应用于电影】

7:自动生成的Keri Russell的照片带有各种查询。呈现的照片是合成的。


8:自动生成“克鲁伊卷发”的乔治·克鲁尼的照片。在网站http:// grail.cs.washington.edu/ tportraits /上查看这些示例中使用的目标照片。
图10:演员经常改变外貌以适应新角色。我们的系统可以帮助预测它们的外观。我们介绍了凯特·布兰切特(Cate Blanchett)扮演鲍勃·迪伦(Bob Dylan)的情况,这些人物是我们的系统通过搜索“鲍勃·迪伦”创建的。

  • 在表1中,我们量化了结果的质量。我们介绍了该算法检索和过滤出的图像数量,以及本文中出现的用于查询/输入组合的合成复合图像的质量。我们还从许多不同的查询和输入中产生了许多其他结果,发现平均75%的质量与本文的结果相同,而25%的质量与图11相同。即,本文给出的结果是典型的。在下一节中,我们将讨论限制和可能的解决方案。

图11:我们系统的典型当前限制:
(a)在这种情况下,面具没有捕获胡须;
(b)由于使用了源面具,头巾被脸部覆盖,
(c)-(d)图像的对比度没有不合适,衣服部分也出错了。红色箭头指出了问题所在。
(e)使用与(d)相同的目标,但源照片不同,并且由于(e)中的源具有胡须,因此可以更好地融合(蓝色箭头)

5 讨论

  • 我们提出了一种用于从一张或多张照片中合成一个人的可能外貌的系统。我们称此过程为变容外观。我们的主要目标之一是建立一个使用起来非常直观的系统。用户唯一需要做的就是像在搜索引擎中一样输入文本查询。另一个目标不是将用户限制为一组特定的样式,而是鼓励创造力,让人们探索他们希望的任何查询并自动处理所有检索到的照片。
  • 虽然我们的一些结果看起来近乎完美,但有些显示了我们下面讨论的伪影。然而,对于风格探索的应用,我们专注于为用户提供非常广泛的良好结果,而不是范围狭窄的完美结果。我们认为,用户将从许多不同的照片中看到许多不同的风格(即使它们有轻微问题)。 例如,如果用户正在搜索“金发”,系统将显示卷曲的金发,直金发,不同外型的金发,等等。在未来的工作中,最好解决遗留的问题 ,下面我们将讨论可能的解决方案。
  • 局限性目前,在混合之前使用直方图均衡化调整了两个图像(源图像和选定目标图像),这可能会造成色彩泄漏和伪影。为了在混合阶段改进颜色,对比度和其他图像调整,我们可以在系统中潜在地组合最近的样式转移方法。具体而言,将[Gatys等人的基于深度学习的神经艺术方法纳入本文。 [Shih et al。2015]。 2014]和[Sunkavalli等。 2010]应用于我们的外观探索应用。
  • 目前,自动蒙版估计算法可提供头发和皮肤区域。典型的故障是背景(或衣服)被认为是头发的一部分。重新训练方法并为衣服,胡须和眼镜添加标签将很有趣。将扩展的掩码合并到我们的系统中将是很直接的。类似地,将脖子和手的分割也将是有用的,例如,使用[Zheng等人的语义分割。 2015]。【重新训练方法可以解决头发衣服被认为是头发部分的问题】
  • 目前对结果进行了可视化评估。虽然这对于某些应用程序来说是足够的,例如,参与者可能会判断他们是否喜欢该应用程序,但是对于其他应用程序,训练一个能够对结果的真实性进行排序的分类器将是令人兴奋的。我们已经用预先训练好的现实主义模型进行了实验。并得出结论认为,模型需要重新训练面部照片。由于我们的系统可以产生大量可能的外观,因此很容易创建大量的正面和负面示例,以满足深度网络培训的需要([Zhuet al。2015年]培训使用了22K张照片)。【对结果进行评估,训练一个分类器对结果的真实性进行排序。训练分类器需要用到的积极或者消极的图像我们可以提供】
  • 用于人员识别研究的内容创建。人员识别研究中的一个开放问题是,是否可以跨年龄识别人员。更具挑战性的是实现变相不变的识别,例如,如果该人更改了发型和颜色,他们是否仍被识别为不变?最大的问题之一是缺乏合适的数据来进行此类研究。我们的系统可用于轻松提供大量数据。【我们的系统可以提供大量的数据进行训练人脸识别】

Transfiguring Portraits论文阅读笔记相关推荐

  1. 全卷积(FCN)论文阅读笔记:Fully Convolutional Networks for Semantic Segmentation

    论文阅读笔记:Fully Convolutional Networks forSemantic Segmentation 这是CVPR 2015拿到best paper候选的论文. 论文下载地址:Fu ...

  2. DnCNN论文阅读笔记【MATLAB】

    DnCNN论文阅读笔记 论文信息: 论文代码:https://github.com/cszn/DnCNN Abstract 提出网络:DnCNNs 关键技术: Residual learning an ...

  3. Learning Multiview 3D point Cloud Registration论文阅读笔记

    Learning multiview 3D point cloud registration Abstract 提出了一种全新的,端到端的,可学习的多视角三维点云配准算法. 多视角配准往往需要两个阶段 ...

  4. FCGF论文阅读笔记

    FCGF论文阅读笔记 0. Abstract 从三维点云或者扫描帧中提取出几何特征是许多任务例如配准,场景重建等的第一步.现有的领先的方法都是将low-level的特征作为输入,或者在有限的感受野上提 ...

  5. PointConv论文阅读笔记

    PointConv论文阅读笔记 Abstract 本文发表于CVPR. 其主要内容正如标题,是提出了一个对点云进行卷积的Module,称为PointConv.由于点云的无序性和不规则性,因此应用卷积比 ...

  6. DCP(Deep Closest Point)论文阅读笔记以及详析

    DCP论文阅读笔记 前言 本文中图片仓库位于github,所以如果阅读的时候发现图片加载困难.建议挂个梯子. 作者博客:https://codefmeister.github.io/ 转载前请联系作者 ...

  7. 2019 sample-free(样本不平衡)目标检测论文阅读笔记

    点击我爱计算机视觉标星,更快获取CVML新技术 本文转载自知乎,已获作者同意转载,请勿二次转载 (原文地址:https://zhuanlan.zhihu.com/p/100052168) 背景 < ...

  8. keras cnn注意力机制_2019 SSA-CNN(自注意力机制)目标检测算法论文阅读笔记

    背景 <SSA-CNN Semantic Self-Attention CNN for Pedestrian Detection>是2019 的工作,其作者来自于南洋理工.这篇文章主要是做 ...

  9. ResNet 论文阅读笔记

    ResNet 论文阅读笔记 #机器学习/深度学习 文章介绍 论文地址:https://arxiv.org/pdf/1512.03385.pdf 原文题目:Deep Residual Learning ...

最新文章

  1. 黑科技,教你用Python打电话,控制手机技术,快来学一下
  2. 【粉丝福利】今天不谈技术,只送福利!
  3. AcWing 1234. 倍数问题
  4. python 创建空的numpy数组_数据分析-NumPy内置函数创建数组
  5. 02-第二章 基本类型
  6. 桥牌笔记L4D17:小心阻塞
  7. linux 共享内存为分配,Linux在x86_64上共享内存分配
  8. IP地址在数据库里面的存储方式
  9. css卷轴动画小程序,微信小程序登录页:CSS实现动画云层漂浮
  10. python图形库使用教程_PySide——Python图形化界面入门教程(四)
  11. 超简代码版设计模式系列六
  12. matlab可靠性优化,齿轮减速器可靠性优化的MATLAB实现
  13. GitHub / 码云 Pages 打造个人在线简历
  14. MODLE CODE
  15. 学生党高性价比蓝牙耳机有哪些?高性价比学生党蓝牙耳机推荐
  16. 分享30个独特的 404 错误页面设计模板
  17. 鸵鸟腿“半兽人”已学会跟踪避障,可自主移动到安全距离
  18. Bootstrap 框架使用
  19. 【BPF入门系列-4】如何在 BPF 程序中正确地按照 PID 过滤?
  20. Spring基础复习总结

热门文章

  1. 如何学习好游戏建模?游戏建模多要用到一些什么?
  2. Flask 报错:WARNING: This is a development server. Do not use it in a production deployment.
  3. 操作系统探秘之内存管理
  4. 【数据结构】——快排详解
  5. python Z检验
  6. 01 pyecharts 特性、版本、安装介绍
  7. yii2高级模板使用一个域名管理前后台(url重写)
  8. 梅宫主:全心创客联盟|社群空间站启动第二嫡系社群,赋能小白项目赚钱的秘诀是什么?
  9. HBuilderX 连接真机或者模拟器调试后不能运行ADB.exe的解决
  10. 微信小程序授权小知识