东南教育网您的位置:首页 >早教 > 早教知识 >

Facebook如何通过与学者交流来改善隐私

导读 这一切都始于一个看似有趣的人格测验,名为thisisyourdigitallife,由剑桥大学的一位名叫Aleksandr Kogan的研究人员编写。在Kogan向政治咨

这一切都始于一个看似有趣的人格测验,名为“thisisyourdigitallife”,由剑桥大学的一位名叫Aleksandr Kogan的研究人员编写。在Kogan向政治咨询公司Cambridge Analytica传递了约8700万Facebook的个人信息后,它已经演变成Facebook历史上最突出的数据丑闻。

科甘星期天在60分钟的采访中道歉,说他不知道他的行为会带来什么影响。但是,许多其他学者表示,他们清楚地看到了这种滥用的可能性,如果Facebook花更多时间咨询隐私专家和学者,就可以避免这种情况。

其中一位学者是马里兰大学信息研究学院的教授詹妮弗·戈尔贝克,他多年来一直在讨论Facebook数据的隐私风险。在2013年的TED演讲中,她警告说,算法可以从少数Facebook“喜欢”中推断出一系列其他特征,并且需要对隐私政策和法律进行改革,以保护当今数字时代的用户。今天,她感觉像卡桑德拉,除了人们开始更仔细地听她说。

Golbeck对社交媒体巨头提出了很多建议,她希望公司能够更频繁地转向研究人员和隐私专家,就如何更好地保护用户提供建议。

EdSurge上周与Golbeck坐下来作为我们EdSurge Live视频讨论系列的一部分。她预测,在公司几年前改变其政策之前,数百个(如果不是数千个)教育应用可能会从Facebook用户那里获取大量数据。为了清晰起见,对话已经过编辑和浓缩。

您可以在下面收听完整版本,也可以收听您最喜爱的播客应用(如iTunes或Stitcher)。或者观看视频版本。

EdSurge:你是如何研究数据隐私和社交媒体的?

Golbeck:我做研究,我构建了这些算法来获取你的社交媒体数据并找出关于你的事情,这就是Cambridge Analytica正在做的事情。他们引用了我的研究论文,这些论文让我感到厌烦。

但是当我做这项工作时,可能是在2011年或2012年,我们发现的是我们想要了解的任何事情(我们可以)。

你的意思是只看到他们在Facebook上“喜欢”的东西,并从中猜出其他因素?

在你提到的TED演讲中,我引用了这项研究,这项研究实际上是在剑桥分析室空间重叠的一些人在剑桥完成的。使用Facebook“喜欢”,他们可以发现个性特征,政治偏好,人口统计,如种族,宗教,性别,性取向; 和行为的事情,比如你是喝酒,吸烟,还是吸毒。所有这一切都来自“喜欢”。

但它不仅仅是“喜欢”。我们可以通过分析你所写文本的结构来找到这些东西。所以不是内容,而是你使用的动词和副词,你的句子是什么样的?有一项很棒的研究,使用你的Instagram个人资料图片来诊断你是否有临床抑郁症。基本上我们发现的任何数据源都有足够的信号,我们可以识别这些属性。

这是超级强大的,因为你无法躲避他们。它不像这个逻辑连接。这是非常统计的。

你在TED演讲中提到你可以通过他们“喜欢”卷曲薯条来判断一个人的智力水平。这是如何运作的?

在我提到的那些他们在看“喜欢”的剑桥论文中,他们列出了四个“喜欢”,它们是最强大的智力预测者。他们“喜欢”科学,雷暴,科尔伯特报告和卷曲薯条的页面。是的,你会说,“为什么卷曲薯条?” 答案是我们不知道。但更重要的是,当我们喜欢Facebook上的内容时,不仅仅是关于我们这些固有的个人事物,它还是一个社交过程。

即使你喜欢卷曲的薯条,你也可能不会说,“哦,我们去找一个卷曲的薯条,这样我就可以'喜欢'它。” 你遇到它是因为朋友“喜欢”它,或者你偶然发现它,然后你就这样做了。而这些算法可以汲取这些社交互动的遗留物。他们实际上并没有看到你的网络互动,但是他们看到了你所做的事情,并且允许他们做出这些看起来完全不合逻辑的推论。但基本上他们正在拉起很少的社交互动痕迹。你无法掩饰这一点。

我敢肯定,有数百家公司,如果不是成千上万的应用程序,也做了同样的事情。

-Jennifer Golbeck

这让我非常担心。因为很明显我觉得有很好的方法可以使用这些算法,这就是我制作它们的原因,但显然我们终于看到人们也会以非常糟糕的方式使用它们。所以我在2013年10月做过TED演讲,我觉得我有点尖叫,不一定是因为很多人在过去的四年里听过我的话。但是上个月对我来说真的是卡桑德拉的时刻 - 我一直在说这将会发生,现在终于让人们相信我了。

是的,正如全世界正在观看马克·扎克伯格在国会前作证的那样,他们向他提出的问题是“Facebook应该采取什么措施来更好地保护用户?” 但听起来Facebook上的人知道这是可能的,因为他们可能会在此事件曝光之前阅读您的研究报告以及其他类似的研究报告。

哦,绝对。我正在构建Facebook应用程序的同时,这些东西正在进行中,剑桥Analytica正在抓取我们在新闻中看到的所有数据,这被称为数据泄露。我正在构建Facebook应用程序以执行相同的操作,但需要大学道德批准,以及关于如何使用数据的严格规则。Facebook有剑桥Analytica违反的规则。

所以他们说,如果你是学者,你收集这些数据,就不允许你把它交给其他人。我遵循这些规则。但他们不知道我是否遵循这些规则。我记得当时的想法,“抓住这么大量的数据会非常容易,Facebook永远不会知道我保留了它的副本,我可以随心所欲地做任何事情。”

所以,我们现在听说剑桥Analytica,他们肯定打破了一些规则,但我确信有数百家公司,如果不是数千个应用程序,也做了同样的事情。Facebook的聪明人显然已经考虑过这一点。每当有事情发生时,他们就会改变规则并修复规则,这对他们修正规则很有好处,但他们并没有像他们需要考虑人们可能滥用的方式那样积极主动我们要交给他们的数据。而且我认为这对他们来说是不负责任的。他们并不对人们违反规则承担全部责任,但如果你是所有这些个人信息的管家,你必须考虑到这一点。

但由于你是在研究使用Facebook数据,我猜你可能不会主张他们削减你和其他研究人员。Facebook如何保护用户,同时还允许真正的研究发生?

是的,这是一个非常重要的观点,因为我们现在处于真正的风险之中:他们可能会切断这种访问。你知道,研究人员不是问题所在。所以Cambridge Analytica的这个人违反了规则,但一般来说我们不是那些收集所有这些大量数据的人,而且我们也没有从他们那里赚钱。我们所要做的就是科学。Facebook,Twitter,他们在内部拥有自己的研究团队正在做这件事,但如果你只是在内部进行研究,那么你就不会对它进行批评。

因此,确保学者拥有这些数据存在一定的风险,但我们都受到大学内非常严格的道德规范的约束。我需要一个董事会来批准我对个人数据所做的每一个实验。它有一个我销毁它的时间表。它需要我说我将如何加密它,它将要使用什么计算机,谁将拥有它,办公室将被锁定在计算机所在的位置?我的意思是,它真的很详细地保护了这些数据。

我的意思是,有一个非常强大的基础设施,它来自像Tuskegee实验这样的非常糟糕的事情,对吗?未经同意的医学实验。这是我们道德规则的基础。

我们不会担心,而是随机公司正在构建您要提供数据的应用程序,然后可以将其出售并汇总并执行所有其他操作。因此,削减研究人员有点像最糟糕的一步,因为他们会找出可以使用的不良方法,以及可以使用的不仅仅是赚钱的好方法公司?

我们一直在努力弄清楚有多少教育应用可能已经完成了你和其他人用几年前Facebook允许的数据所做的事情,这也让Cambridge Analytica能够抓住数据。你认为那里有教育应用可能也在做一些吗?

我不知道有什么特别的,但我不会感到惊讶。关注的事情并非如此,如果您安装了我的应用程序,我可以获取您的数据。你知道那里发生了什么。但问题是,如果您安装了我的应用程序,我可以获取您的所有数据和所有朋友的数据。而且我曾向我的学生证明这一点,“嘿,你们,你们要小心这个。” 但它很容易做到。我的意思是,它实际上是一行代码,你可以抓住所有这些。

我不会惊讶地发现一些教育应用程序正在抓取那些朋友数据并使用它,可能不是以超级复杂的方式,而是用它来做一些事情来个性化他们已知用户的体验。

但是,当然,这意味着他们将从许多从未同意他们拥有它的人那里获取数据。因此,希望所有这些应用程序都将开始回溯他们的数据,并弄清楚他们是如何得到它并清理他们真正不应该拥有的一些东西。

在你理想的世界里,推荐Facebook做什么?

哦,我有很多Facebook的待办事项。让我给你一个首先想到的前三名:

一个是我认为帖子应该能够有一个到期日期。我实际上认为短暂,如果这是一个词,对于社交媒体来说是超级批判的。而且我们看到很多人转向使用像Snapchat这样的东西进行大量的互动,而这些东西就会消失。我实际上在我自己的社交媒体使用中这样做。在Facebook上我使用了一个名为Facebook时间线清洁工具。每运行两周,我删除超过两周的任何东西,所以那里的数据不多。这些算法都不适用于我。

如果你看看你六个月前写的社交媒体帖子,他们通常会感到羞愧,特别是在Facebook上。我想让人们看到Facebook有关他们的数据,并坚持将其删除,这是欧洲人将在GDPR中获得的东西。我认为这非常重要。

然后第三件事是,我真的希望看到[Facebook]在这些隐私问题上有一个受技术教育的顾问委员会。要真正推动他们,就像“这是一个坏主意,我不关心它如何影响你的底线,我关心它如何影响你的用户和他们的隐私,你需要在这里做得更好。”

因为他们一直在说他们真的没有考虑过怎么会被误用?这怎么会被人们看到?如果他们内部没有充分考虑到这一点,那么聚集一群像我一样的人 - 来自其他领域的人 - 进来并真正进行这些对话,并与他们的开发人员讨论它,以便他们不能再拥有声称喜欢,“天哪,我们不知道这会让人不安。”或者,“我们不知道这会不好。”

我很乐意自愿成为那个人。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。