来源:ATYUN AI平台

欧盟的通用数据保护条例(GDPR)将于2018年5月25日生效,它重新定义了组织如何处理欧盟公民个人数据的收集和使用。

关于GDPR的争论,主要是因为这个立法在全球的影响,它引入的严厉罚款,或者更严格的“知情同意”规则作为处理个人数据的条件。

然而,GDPR给企业带来的一个挑战被忽视:公民的解释权。

除了法律细节外,GDPR规定:公民有权获得关于用于处理其个人数据的自动化系统的足够信息,以便能够作出明智的决定,决定是否退出此类数据处理。

解释权一直被忽视。除了对权利本身的低认识之外,新引入的隐私保护会给处理公民数据的公司带来巨大的商业风险。

GDPR引入或扩大的其他公民权利,如反对分析的权利,获得收集的个人数据的权利,或者被忘记的权利–如果全部遵守,这些可能非常昂贵的。但是许多公司发现自己无法提供个人数据处理结果的解释。更糟糕的是,他们往往无法弄清楚如何遵守GDPR规定的义务。

我们的黑已经决定

问题在于处理公民个人数据的系统通常依赖机器学习。而且,与标准的“if – then”算法不同,机器学习模型是一种“黑箱”——没有人知道内部发生了什么,也不知道输出背后的精确推理。

这种情况在依赖神经网络的方法中尤为明显。基于决策树的机器学习方法理论上可以决定学习路径。但存在着严重的约束,使得任何说明都非常困难。

让我们来看一个极其简单的例子。假设一家银行有一个机器学习系统来决定申请贷款的人的信用度。基于之前贷款的数据——包括他们的收入,被贴上“好”或“坏”的标签——系统会自行学习预测新的贷款申请是“好”或“坏”。

这一预测的原因基于,由成千上万个模拟神经元组成的复杂网络如何处理数据,以此来确定申请人是否能够负担得起自己的房子。学习过程由数十亿的步骤组成,很难回溯。不仅由于技术上的限制,也因为基础数学理论的基本限制,没有人能确切地说出为什么任何特定的数据样本被贴上“坏”的标签。

处于两难境地

机器学习已经成为处理大型数据集和对样本进行分组的一种选择方法。出于这个原因,对所有处理欧洲公民个人数据的人来说,解释的权利构成了根本性的挑战,而且是不合规的风险。

除非处理公民个人资料的公司完全理解基于机器学习模式做出决策的原因,否则他们会发现自己处于两难境地。他们必须防止他们的客户自动处理他们的个人数据(为了节省成本和保持业务运行),同时保留公司尊重客户的标准解释权的错觉,以及对有争议的结果可以进行人力审查(以便公司可以避免未能遵守GDPR所带来的巨额罚款)。

必要的基础研究

为了能够解释他们的自动化决策过程背后的原因,并赋予他们对客户解释的权利,公司必须彻底的改进,才能理解机器学习如何在我们的理解中取得根本性的改进。简单地说,机器学习过程必须变得透明——如果不是真正的透明,那么对于那些处于GDPR之下的公司来说,要变得合规,至少要少许多的黑箱。

机器学习的透明度是很棘手的问题,它具有不可预测性——如果你能深入研究它所基于的基础数学理论,它是不透明的。因此,解释权问题的解决需要改进机器学习的理论基础。

机器学习的科学家们已经把注意力转移到这个方向上;然而,我们可能需要数年时间才能看到任何GDPR都适用的结果。

透明度:需要还是威胁?

与营销人员和其他处理个人数据并且必须遵守隐私法规的人不同不,网络安全公司喜欢这种机器学习研究的转变。

分配更多的资源来理解模型(即为了透明)意味着更少的资源用于使模型更加准确和有效。

对于我们来说,使机器学习模式准确有效的恶意软件猎手是至关重要的,而机器学习模式的透明度是我们需要做的最后一件事。毕竟,我们不希望看到网络犯罪分子成功地微调他们的恶意代码以通过我们的保护。

但是,我们必须更好地了解机器学习模型是如何工作的。

毫无疑问,改进我们的机器学习模型并使它们更精密是非常重要的。但是,这方面最重要的措施是要有更多的保护层。

取消机器学习模型的工具的出现清楚地表明,纯粹依靠这些模型的保护措施是多么的脆弱。在我看来,测试组织应该开发更复杂的方法来测试安全解决方案的抵御能力,目的在于绕过安全产品的检测机制,以了解这些机构是如何工作的。需要这些高级测试来区分可靠的解决方案,而不是那些只在理想条件下工作的解决方案。

本文转自ATYUN人工智能媒体平台,原文链接:机器学习算法的透明度是一把双刃剑,该如何应对?

更多推荐

MIT研究:为机器人提供更精细的触感,对流体和柔软物体塑型

BenevolentAI:人工智能识别出现有的药物可以减少黄斑变性导致的视力下降

图像猜谜游戏用于评估AI可解释性的实用性

给三类人的数据科学职业转换建议:完全零起步、软件工程师、CS/数学/物理学专业毕业生

欢迎关注ATYUN官方公众号,商务合作及内容投稿请联系邮箱:bd@atyun.com

机器学习算法的透明度是一把双刃剑,该如何应对?相关推荐

  1. 论文——多指标与机器学习算法相结合的中国县级玉米产量早期预测

    Combining multi-indicators with machine-learning algorithms for maize yield early prediction at the ...

  2. [LSTM]时间序列预测存在的问题--滑动窗口是一把双刃剑【持续更新】

    [想直接进入结果的请直接从右侧目录点击去看 解决方案 和 如何评估时序模型的泛化能力] 期待你提出宝贵的意见. 注1:本文仅仅展示思路和最基础的代码.欢迎提出您的宝贵意见. 注2:本文展示的可视化图形 ...

  3. 回归、分类与聚类:三大方向剖解机器学习算法的优缺点

    回归.分类与聚类:三大方向剖解机器学习算法的优缺点 2017-05-20 13:56:14    机器学习   数学    3 0 0 在本教程中,作者对现代机器学习算法进行一次简要的实战梳理.虽然类 ...

  4. Pymetrics开源公平性感知机器学习算法Audit AI

    Pymetrics是一件专注于向企业提供招聘服务的初创企业.最近,Pymetrics在Github上开源了企业使用的偏差检测(bias detection)算法,称为"Audio AI&qu ...

  5. 机器学习算法系列之K近邻算法

    本系列机器学习的文章打算从机器学习算法的一些理论知识.python实现该算法和调一些该算法的相应包来实现. 目录 K近邻算法 一.K近邻算法原理 k近邻算法 通俗解释 近邻距离的度量 k值的选择 KN ...

  6. 【机器学习】 主流机器学习算法简介与其优缺点分析

    来源:EliteDataScience   专知 机器学习算法的分类是棘手的,有几种合理的分类,他们可以分为生成/识别,参数/非参数,监督/无监督等. 例如,Scikit-Learn的文档页面通过学习 ...

  7. 刷脸支付人脸识别技术是一把双刃剑

    刷脸支付是一种以AI人脸识别为核心的新型支付方式.刷脸支付的过程非常的简单,消费者不需要带钱包.信用卡或手机,支付时只需要自己面对刷脸支付机屏幕上的摄像头,刷脸支付系统会自动将消费者面部信息与个人账户 ...

  8. 【机器学习算法】聚类分析-1 聚类是什么,我们如何确定类别间的相似性或者相异性

    目录 聚类分析 聚类的概念 如何衡量两笔数据的相似性 二元变量的相似性的衡量方法 混合类别型变量与数值型变量的的相似性衡量 距离的计算 明天我们在接下来解决剩下两个问题 我的主页:晴天qt01的博客_ ...

  9. 机器学习算法的优点和缺点总结

    机器学习算法的优点和缺点总结 1.正则化算法(Regularization Algorithms) 它是另一种方法(通常是回归方法)的拓展,这种方法会基于模型复杂性对其进行惩罚,它喜欢相对简单能够更好 ...

最新文章

  1. (0055)iOS开发之dealloc认识
  2. 一文吃透PHP和HTML的嵌套写法
  3. 分享21个丰富多彩的 HTML5 小游戏
  4. 百度SEO站群爱叶解析接口php网站源码
  5. 如何在Windows 10上安装MySQL数据库服务器8.0.19
  6. pytorch学习笔记(三十):RNN反向传播计算图公式推导
  7. erp代码matlab,ERP1 Protocol in Matlab - 源码下载|Windows编程|其他小程序|源代码 - 源码中国...
  8. 请问两个div之间的上下距离怎么设置
  9. 自定义UITabBarController以及UITabBar的分析
  10. Speex的安装使用
  11. 交换机与路由器的配置
  12. 计算机图形学入门(十五)-光线追踪(辐射度量学)
  13. 冲压模具中的回弹解决办法
  14. sql语法:详解DDL
  15. 初值对牛顿迭代法的影响
  16. 【Android】请求打开蓝牙和定位功能
  17. cadence SPB17.4 - allegro - 尺寸标注
  18. Urule Pro 普通决策表的应用,Excel导入决策表
  19. 阿里云购买学生机镜像多种选择
  20. 为机械臂安装自己的机械手

热门文章

  1. 华为鸿蒙安装酷喵,华为鸿蒙系统首次体验,3799元,4K屏!
  2. springboot实现邮箱简单内容发送(可以自己进行邮箱维护并发送多个人员)
  3. 杂谈java面向对象
  4. Mysql学习笔记3-数据类型+创建数据表+唯一性
  5. android怎么把数组清空,android-从ListPreference删除数组项
  6. 比起尴尬的“免签”政策,马来西亚的美食美景要靠谱多了
  7. openVino +windows+GPU/CPU 运行_2 ( FP16和FP32差距)
  8. 计算机应用办公室,办公室自动化与计算机应用的实践
  9. vue中如何返回历史路由_产品分析丨VUE如何在Vlog大潮中稳步发展
  10. 惠普微型计算机开机,惠普笔记本开机时为什么会有嘟嘟嘟的声音,很响,而且开不了机...