推荐 | 胡永波

翻译 | reason_W成龙

编辑 | 鸽子

Leila有两个身份,但她只在Facebook上公开了其中一个。

作为一名性工作者,她非常希望将自己作为普通人的生活,和作为性工作者的生活分隔开来,互不干扰,避免自己遭受羞辱、逮捕甚至专业的反击,以及避免那些可能的纠缠不休(或更糟)的客户。

她在Facebook上公开的”真实身份”为:Leila(本文使用名称均为化名),居住地加利福尼亚州,她经常发表一些关于政治的帖子。

为了保护自己性工作者的身份在社交网络上不被人知晓,她一直小心翼翼,坚持使用不同的电子邮件地址,不同的电话号码和不同的网络昵称。

今年早些时候,当她看到Facebook自动推荐的”你可能认识的人”的时候,Leila非常震惊地发现,居然可以在里面看到她作为性工作者曾经服务过的一些客户。

尽管她已经竭力保持不让自己性工作者的身份暴露到Facebook中,但没想到Facebook依然发现了她的秘密。

更令人恐惧的是,这些人也有可能在”你可能认识的人”中,知道她的日常身份。

但因为Facebook一直没有公开,其是如何将一个用户和另一个用户联系到一起,所采用的方法和数据,因此,Leila也无从知晓她的身份是如何在互联网上被辨别出来的,应该如何采取措施来防止这样的事件再次发生。

“不仅仅是性工作者要小心保护自己的身份,”Leila通过Skype对gizmodo的记者说到。

Leila继续说道,“那些与性工作者发生过关系的人,也对保护自己的身份信息十分在意,所以他们也常常使用替代的电子邮件和替代昵称。

在进行色情交易时,虽然他们也交换电话,但这只有在他们想和人发生性关系的时候,才会使用的电话号码。跟日常的电话号码完全不一样。总的来说,客户和性工作者双方对于安全性都比较在意,大家都不想透露身份。

可是万万没想到,掩盖那么好,竟然还是被Facebook发现了,还被悄悄地连接了起来,最恐怖的是,还都是各自的真实身份。真是要命啊!”

这些性工作者都有自己的秘密支援团队。

当Leila在秘密支援团队中咨询自己该怎么办时,团队中相当多的人也表示同感——他们有同样的遭遇。

“我们的预防措施那也是相当到位了,电话号码都是专用的,真是见鬼了,居然在Facebook上给联系上了,还他*&¥%#妈@#¥%的显示各自的真实姓名和工作?你%……¥大#¥%爷¥%&的,以后出事了叫我怎么有脸见人?”秘密支援团队的另一个人抱怨到。

Leila说:“性工作者,最恐怖的噩梦就是把你的真实姓名留在那里,Facebook这样把人连接起来,让这个噩梦成真了。”

那么,Facebook到底是如何做到的呢?

至今为止,Facebook并没有将“你可能认识的人”到底用的什么推荐算法,进行公开(这个算法在Facebook内部称为PYMK黑匣子)。Facebook一直强调,其推荐的建议“来自”共同好友,共享网络或群组,或用户上传的联系人。

然而,这样的说法,经不起考验。

Facebook发言人今年夏天曾告诉Gizmodo记者,PYMK参考的因素超过了100项。所有像Leila这样的人——即和客户没有任何共同好友,共享网络或群组,或者联系人关系,却被算法判定为可能认识的人——他们竟然能被推荐认识,其数据一定来自其他方面。

Leila怀疑Facebook收集了手机上其他应用的联系信息,或者使用了她位置信息,从而发现她和她的客户的智能手机同时出现在同一个地方。

但是Facebook的发言人通过电子邮件否认了这件事。

邮件写道:”我们不会使用第三方应用程序中的信息来作为”您可能认识的人”中的朋友建议的参考。 Facebook之前也已经说过,”你可能认识的人”的推荐算法并不会使用位置信息作为参考因素。

虽然Facebook的发言人对这一问题进行了坚决的否认,但我们在Quora上发现,南加利福尼亚大学信息科学研究所的研究人员Akhil Bhiwal的一篇的回答已经被Facebook前顾问悄悄点了赞。

这篇点赞量687,浏览量将近25万的回答表示,如果双方都对Facebook开放了位置权限(不管是在移动端还是在网页端),并且多次访问过相同的地方。那么Facebook的推荐系统便会使用你们在相同地点的共同事件和发生频率在提供好友建议。

比如,你访问了A、B、C、D、E、F,你的邻居访问了A、X、C、D、Z、W。在这种情况下,A、C、D就是你们共同访问的共同场所。那么你们两个就很有可能会互相认识,因为你们都访问过类似的地方(特别是在同一时间)。

现在让我们慢慢的增加访问次数

现在,因为你们两人都曾多次访问这些地点,这就增加了你们互相了解的可能性。在这里A因为访问频率超出其他,所以很可能被判定为你的家。

当然,除了单纯的位置因素,也有很多其他和位置有关的因素,比如位置语义信息,可以用来推荐。举个例子,例如,如果你和某个人Z同时访问了某个特定的地点,那么你们就很可能有相似的兴趣,并且可能会愿意成为朋友。

如果你对详细的技术算法感兴趣,还可以参考南加州大学的这篇论文:EPM-一种从时空数据推断社会关系的基于熵的模型

http://infolab.usc.edu/DocsDemos/sigra619.pdf

无独有偶,2016年8月,刊登在Gizmodo上的一篇文章,似乎也将矛头指向推荐系统中所透露的地理位置信息。

在这篇名为《Facebook recommended that this psychiatrist's patients friend each other-https://splinternews.com/facebook-recommended-that-this-psychiatrists-patients-f-1793861472》(Facebook 建议精神病医生与病人相互交往)的文章中,Lisa是一位精神病医生,他的病人,都是一些身心发育有严重问题的患者,这里面包括艾滋病患者,自杀倾向严重的抑郁症患者,有暴力倾向的狂躁症患者......

为了保护患者隐私,她在Facebook中从来没有将有关任何病人的任何资料,以及任何相关的内容放上去,可是,突然从某天开始,她所有患者的全名和个人资料开始出现在她的Facebook好友推荐里。

她无比惊讶,不知道Facebook是怎么做到的。

有分析称,正是因为Facebook通过智能手机定位发现了这些秘密。因为,她和她的病人都在同一个地方,同一个时间出现,并且反复出现。

看来,关于第三方应用的信息使用与否,看来Facebook发言人的回复也不是那么可信 。而在另一个234赞,22万浏览量的回答里,答主Prithvi Raj表示,其实早在2010年的时候,Facebook就收购了Octazen。而至于为什么要收购Octazen,其原因正是获取数据,并用于推荐系统。读者也可以参考这篇文章

Octazen: What The Heck Did Facebook Just Buy Exactly, And Why?

http://techcrunch.com/2010/02/19/octazen-what-the-heck-did-facebook-just-buy-exactly-and-why/

这些数据公司悄悄获取你的各种邮件和其他应用程序,以及联系人列表,并以此将你与其他人进行连接。

比如:

  1. 通过邮件列表匹配的方式:也许你邻居的账号只在你的新gmail账号联系人列表里保存着,但在你的旧gmail账号中,因为你的名字和你的新账号一样,因此你的邻居就有可能通过这样的方式和你的旧gmail邮箱匹配到一起。

  2. 通过应用程序匹配的方式,可以这样理解,在app启动后,Facebook会将手机当前位置和当前手机通讯录内容搜集起来,进行匹配。

  3. 而通过将上述几种方式匹配的结果结合起来,再进一步组成社会关系网,你们共同的朋友,朋友的朋友也就可以被计算出来

基于这些数据,他们就能够对谁可能是你可能认识的人做出有力的判断。

还有用户发现,同为Facebook旗下的whatsapp中的联系人信息也可能已经被Facebook在内部“共享”了。

当用户在whatsapp中同一些人交换过文件之后,facebook的好友推荐列表里就会出现这些人。

此外,Facebook很可能还会搜集用户的搜索数据。

那些在Facebook上搜索过你的人(哪怕他们删除了搜索记录,这依然可以作为活动日志被找到)、那些在朋友的照片或相册中标记过你的人、拥有大量共同好友的人、隶属于同一个社交网络(学校、工作、城市等)、参加过同样的活动或者链接到同一个媒体账号的朋友,甚至于那些被你拉黑的人的朋友都有可能被列入“你可能认识的人”列表中。

而且这些建议不仅仅是基于“搜索”,用户设备上的其他程序和应用中出现的任何地方的名字都可以被Facebook的算法所识别。

Facebook可以访问其正在使用的设备(PC,笔记本电脑,手机)上可能包含某人姓名的任何内容,然后将该人标记为“可能认识的人”。例如,当我将Google日历用于我的商务约会时,Facebook会向我建议的“你可能认识的人”中很多来自我最近在Google日历中约定的客户。

回到Leila的例子。

无论Facebook 所采用的PYMK算法究竟工作原理是什么,这样的机制,很有可能会对性工作者和色情行业的人造成严重后果。

在这个隐私权极其被看中的圈子,每一次精准推荐都会让当事人战栗。

Stabile是加利福尼亚的一个成人内容表演者,他说到一件令所有人最为尴尬的事件,那就是:当性工作者的账户被推荐给了他们在现实生活中认识的亲人、朋友时,那种丢人,让人恨不得找个地缝钻起来。

Darling在CAM4网站负责管理虚拟现实成人广播,他从事色情行业已经有八年之久,但她的家人不知道。

“我不希望因为我在Facebook上的帐户被推荐给亲人,让我15岁的表弟发现我竟然是一个色情明星。”Darling说道。

为了避免这种情况,她几乎每隔几周就会在Facebook上搜索一次家人和家族成员的姓名,看看她的亲戚是否已经加入了Facebook,或创建了一个新帐户。如果有的话,就赶紧拉黑他们。

Darling曾经用她的真实身份注册过第二个私人账号,用于和她在正常生活中认识的人进行联络,但是有些她在色情网站上的粉丝却在“可能认识的人”中推荐给了她的这个正常的私人号,从而让粉丝们知道了她真实身份。

她说,从那以后,这些人开始骚扰她,并试图跟踪她的家人。

“我们正生活在一个恐怖的时代,你都不知道个人信息是怎么泄露的,泄露后又是如何被别人当作武器来攻击你”,Darling说,她不知道Facebook是如何将她是色情工作者的身份与她公开的身份联系起来。于是,她不得不删除了她的私人账号。“我对于Facebook无时无刻不在收集着我的信息,简直不安。”

“对于性工作者来说,这是一个巨大的威胁,生死攸关的大事,”Leila说。

原文地址

https://gizmodo.com/how-facebook-outs-sex-workers-1818861596

你在Facebook上遇到过让你很惊恐的“你可能认识的人”吗?你怎么看待Facebook让人细思极恐的强大能力?欢迎在评论区留言。

精彩课程

一百天人工智能工程师学习计划——全程实战案例,从机器学习原理到推荐系统实现,从深度学习入门到图像语义分割及写诗机器人,再到专属GPU云平台上的四大工业级实战项目。100天内完美掌握人工智能工程师必备技能。

☞ 点击阅读原文,查看详细课程信息。

可怕!Facebook竟能识别出性工作者!你怎么看?相关推荐

  1. 可怕!Facebook 竟能识别出性工作者!你怎么看?

    作为一名性工作者,她非常希望将自己作为普通人的生活,和作为性工作者的生活分隔开来,互不干扰,避免自己遭受羞辱.逮捕甚至专业的反击,以及避免那些可能的纠缠不休(或更糟)的客户. 她在Facebook上公 ...

  2. Facebook 如何识别出性工作者?

    Leila有两个身份,但她只在Facebook上公开了其中一个.还有一个身份,她是一个性工作者. 她在Facebook上公开的"真实身份"为:Leila(本文使用名称均为化名),居 ...

  3. 删除10亿人脸数据,Meta关闭了Facebook的人脸识别系统

    来源:机器之心 本文约1700字,建议阅读5分钟 本文为你介绍了Meta在人脸识别系统上的最新动态. 选择一劳永逸,Meta 再不想为 Facebook 的人脸识别系统「买单」了. 在近期召开的 Fa ...

  4. Facebook推出人脸识别新功能,防止用户肖像遭滥用

    国内外各种社交媒体上,假冒明星的账户满天飞.顶着明星头像四处坑蒙拐骗的高仿号比比皆是.从明星到普通人,每个人都面临着个人肖像被滥用的风险. 全球最大的社交媒体Facebook曾在2010年推出人脸识别 ...

  5. 语音识别是如何识别出各地方言的?

    语音对于人机交互的重要性毋庸置疑,无论是国内外企业,都在 语音识别 的速度.准确度以及多语种方面持续创新,但是当机器面对那些有 口音 的人来说,似乎就没有那么灵敏了:不仅注意力会不集中,反应迟钝,甚至 ...

  6. 从零手写Resnet50实战——利用 torch 识别出了虎猫和萨摩耶

    大家好啊,我是董董灿. 自从前几天手写了一个慢速卷积之后(从零手写Resnet50实战-手写龟速卷积),我便一口气将 Resnet50 中剩下的算法都写完了. 然后,暴力的,按照 Resnet50 的 ...

  7. 如何掌握Facebook自动人脸识别技术?

    转自:http://toutiao.com/i6311228330276291073/ 1. 简介 你是否注意到 Facebook 已经开发出了一项能识别你朋友照片的神奇能力?过去,你能通过点击 Fa ...

  8. facebook 直播_什么时候是在Facebook Live上直播的最佳时间? 我分析了5,000个Facebook帖子以找出答案。...

    facebook 直播 by Ofir Chakon 由Ofir Chakon 什么时候是在Facebook Live上直播的最佳时间? 我分析了5,000个Facebook帖子以找出答案. (Whe ...

  9. python画三维立体图-Python 竟能绘制出如此酷炫的三维图

    原标题:Python 竟能绘制出如此酷炫的三维图 通常我们用 Python 绘制的都是二维平面图,但有时也需要绘制三维场景图,比如像下面这样的: 这些图怎么做出来呢?今天就来分享下如何一步步绘制出三维 ...

最新文章

  1. 【381天】我爱刷题系列140(2018.02.21)
  2. Ajax Toolkit日历控件CalendarExtender求教!
  3. ffmpeg结构体(二)
  4. pytorch自定义数据集DataLoder
  5. 嘉宾及议程速览,第四范式2021发布会进入一周倒计时
  6. 《美团点评编程题》整数加法
  7. 神雕侠侣2服务器维护,《神雕侠侣2》手游10月22日停服维护公告
  8. springboot 技术图谱_java后台(Springboot)开发知识图谱高频技术汇总-学习路线...
  9. 我端午节又来免费送书了!
  10. 喜马拉雅三年亏损超20亿 腾讯、小米为股东
  11. Vss2005局域网开发权限设置指南
  12. 使用join()方法 分隔拆分后的数组
  13. Python学习三|列表、字典、元组、集合的特点以及类的一些定义
  14. 数据持久化基础知识——属性列表
  15. 华为交换机debug icmp数据包
  16. 3000行代码之医院信息管理系统(内附MYSQL语句及背景图片)
  17. qq邮箱 html 屏蔽,QQ邮箱邮件被拦截该怎么办?邮件被拦截的三种解决办法
  18. 3.飞机机票的价格受季节旺季、淡季的影响,头等舱与经济舱的价格也不同机票的原价为5000,4~10月为旺季, 旺季:头等舱打9折,经济舱打8折;淡季:头等舱打5折,经济舱打4折。请编写根据出行的月份和
  19. db2 dec函数oracle,DB2常用函数与Oracle有什么区别?
  20. 使用MOSES搭建网页翻译系统

热门文章

  1. java中锁的介绍及运用
  2. mysql-5.5.25_Linux下安装Mysql-5.5.25
  3. std::bind介绍
  4. 网络流—Edmonds-Karp 最短增广路算法(最大流)
  5. 移动端rem屏幕设置
  6. Python爬虫案例-获取最新的中国行政区域划分
  7. Unity 单元测试(PLUnitTest工具)
  8. NSDictionary、NSMutableDictionary基本使用
  9. 区域设置 ID (LCID) 表, 及获取方法
  10. 处理问题的方法--抽象和特例化