第 26 届 ACM SIGKDD 知识发现和数据挖掘会议(KDD 2020)于近日公布了最佳论文奖、最佳学生论文奖等多个奖项。此外,汤继良、盛胜利、唐杰等华人学者在本届 SIGKDD 大会上也荣获了包含新星奖、时间检验研究奖、时间检验应用科学奖在内的三项大奖。

更多内容可移步“KDD 2020 全部大奖出炉!杜克大学陈怡然组获最佳学生论文奖”一文。

其中最佳学生论文第一作者李昂是杜克大学电子和计算机工程系的一名在读博士,导师为陈怡然教授。李昂曾在2013 年获得北京大学软件工程硕士学位,2018 年获得阿肯色大学计算机科学博士学位。

获奖论文:《TIPRDC: Task-Independent Privacy-Respecting Data Crowdsourcing Framework for Deep Learning with Anonymized Intermediate Representations》

1

背景

大规模数据集是深度学习大获成功的重要原因之一。这些数据很多情况下都是通过众包的方式从用户那里收集的。

然而在收集的过程中,这些数据中不可避免地包含了用户的隐私信息,例如性别、年龄等。这些隐私信息有可能被数据收集者误用,甚至更严重的情况下被恶意滥用。近几年来,各种互联网公司信息泄露的事件让人们意识到了保护个人隐私的重要性。

因此如何在保护个人隐私的前提下,收集数据用于训练深度神经网络模型就成为了最近的重要研究课题。

过去的相关研究在效用和隐私之间进行权衡。一类常见的方法是从原始数据中提取任务所需要的特征,然后用户仅仅上传特征。然而提取出的特征容易恢复出用户的原始数据和隐私信息。

为了使得原始数据难以恢复,研究人员又进一步提出在提取出的特征中人为加入噪声,但这种方式使得学习任务的表现大大降低。更重要的是,这些方法都是针对某个特定任务提取相应特征的,然而在实际的数据收集过程中,学习任务可能是不知道的或者是会变化的。

针对这个问题,这篇论文的目标是设计一种方法,能够从用户的原始数据中抽取一种中间表示,在去除隐私信息的同时保留学习任务所需要的判别特征。

这篇论文提出的TIPRDC框架如图1所示。用户可以在本地运行特征抽取器,并且仅将那些中间表示提交给数据收集器,而无需提交原始数据。然后,数据收集器使用这些收集的中间表示来训练DNN模型,但是数据收集器和对手都无法准确地推断出任何受保护的私人信息。

这篇论文提出一个隐私对抗训练(PAT)算法来隐藏特征中的隐私信息,该算法可模拟试图从提取的特征中推断出私人属性的对手与旨在保护用户隐私的防御者之间的博弈。原始信息通过应用这篇论文提出的MaxMI算法得以保留,该算法旨在最大化原始数据的特征与私有信息与保留特征的并集之间的相互信息。这篇论文通过三个数据集上的对比实验,验证了TIPRDC在效用-隐私权衡方面的优越性。

2

模型和算法

TIPRDC是根据两个目标来设计的:

目标1:确保抽取的特征不传达任何隐私属性;

目标2:保留尽可能多的原始数据信息,以维护主要学习任务的效用。

记用户的隐私属性为,原始数据为,抽取出的特征为,TIPRDC的核心是设计一个特征抽取器,其中 θ为权重参数。TIPRDC的目标1可以表示为

,即最小化z和u之间的互信息,在图2中的绿色区域和橘色区域尽可能没有重叠。目标2可以表示为,即最大化x和z,u的联合分布之间的互信息,在图2中绿色区域和橘色区域加在一起要尽可能涵盖蓝色圆圈对应的区域。

由于任意两个分布的互信息的优化问题难以精确求解,这篇论文首先将目标1对应的优化问题转换为了一个博弈优化的问题:

其中交叉熵:

也就是说一个对手想要从特征z中推断出隐私属性u,而一个防御者则试图保护隐私属性。接着这篇论文利用Jensen-Shannon公式将目标2对应的优化问题转换为了如下问题:

其中是辨别器对应的参数。最后这篇论文通过引入一个权重系数来表示效用-隐私预算,将上面两个优化问题组合到了一起:

为了训练TIPRC中核心的特征抽取器,这篇论文设计了如图3所示的混合学习方法框架,一共包含了三个模块,即特征抽取器,对抗分类器和互信息估计器。

特征提取器抽取中用户数据对应的特征。对抗性分类器在PAT算法中模拟对手,旨在从窃听的特征中推断出私人属性u。MaxMI算法中采用了互信息估计器来测量原始数据与私人属性和提取特征的联合分布之间的互信息。整个混合学习方法的交互迭代的流程见算法1,其中损失函数为交叉熵损失函数。

道翰天琼认知智能未来机器人接口API简介介绍

  • 认知智能是计算机科学的一个分支科学,是智能科学发展的高级阶段,它以人类认知体系为基础,以模仿人类核心能力为目标,以信息的理解、存储、应用为研究方向,以感知信息的深度理解和自然语言信息的深度理解为突破口,以跨学科理论体系为指导,从而形成的新一代理论、技术及应用系统的技术科学。 认知智能的核心研究范畴包括:1.宇宙、信息、大脑三者关系;2.人类大脑结构、功能、机制;3.哲学体系、文科体系、理科体系;4.认知融通、智慧融通、双脑(人脑和电脑)融通等核心体系。 认知智能四步走:1.认知宇宙世界。支撑理论体系有三体(宇宙、信息、大脑)论、易道论、存在论、本体论、认知论、融智学、HNC 等理论体系;2.清楚人脑结构、功能、机制。支撑学科有脑科学、心理学、逻辑学、情感学、生物学、化学等学科。3.清楚信息内涵规律规则。支撑学科有符号学、语言学、认知语言学、形式语言学等学科。4.系统落地能力。支撑学科有计算机科学、数学等学科。
    认知智能CI机器人是杭州道翰天琼智能科技有限公司旗下产品。认知智能机器人是依托道翰天琼10年研发的认知智能CI体系为核心而打造的认知智能机器人大脑,是全球第一个认知智能机器人大脑。具有突破性,创新性,领航性。是新一代智能认知智能的最好的产品支撑。 认知智能机器人技术体系更加先进,更加智能,是新一代智能,认知智能领域世界范围内唯一的认知智能机器人。 认知智能机器人是新时代的产物,是新一代智能认知智能的产物。代表了新一代智能认知智能最核心的优势。和人工智能机器人大脑相比,优势非常明显。智能度高,客户粘性大,客户满意度高,易于推广和传播等核心特点。 依托认知智能机器人平台提供的机器人大脑服务,可以赋能各个行业,各个领域的智能设备,各类需要人机互动的领域等。认知智能机器人平台网址:www.weilaitec.com,www.citec.top。欢迎注册使用,走进更智能机器人世界。
    认知智能和人工智能的优劣势对比主要可以分为四大方面: 第一:时代发展不同。人工智能是智能时代发展的第二个阶段,认知智能是智能时代发展的第三个阶段。时代发展上决定了认知智能更显具有时代领先性。 第二:基础理论体系不同。人工智能的基础理论体系以数学为基础,以统计概率体系为基础。认知智能基础理论体系以交叉许可理论体系为基础。包含古今中外哲学体系,心理学体系,逻辑学体系,语言学体系,符号学体系,数学体系等学科。其基础理论体系更加具有创新性,突破性和领先性。且交叉学科理论体系的研究也是未来智能发展的大方向。其具体理论体系,还包含三体论(宇宙,信息,大脑三者关系),融智学,和HNC等。 第三:技术体系不同。人工智能的核心技术体系主要是算法,机器学习,深度学习,知识图谱等。其主要功用在感知智能。感知智能其核心主要是在模仿人类的感知能力。认知智能的核心技术体系是以交叉学科理论体系而衍生出来的。具体包含三大核心技术体系,认知维度,类脑模型和万维图谱。认知智能的技术体系核心以类脑的认知体系为基础。以全方位模仿类脑能力为目标。人工智能以感知智能为基础的体系,只能作为认知智能中的类脑模型技术体系中的感知层技术体系。类脑模型大致包含,感知层,记忆层,学习层,理解层,认知层,逻辑层,情感层,沟通层,意识层等9大核心技术层。因此人工智能的核心只是作为认知智能类脑模型中的感知层。因此在技术体系上,人工智能和认知智能基本上没有太多的可比性。 第四:智能度成本等方面的不同:人工智能产品的综合智能程度,普遍在2-3岁左右的智力水平。认知智能产品其智能程度大致在5-8岁左右。认知智能体系构建的机器人更加智能。且更省时间,更省人力和资金。优势非常多。具体请看下列的逐项对比。

道翰天琼CiGril机器人API

道翰天琼CiGril认知智能机器人API用户需要按步骤获取基本信息:

  1. 在平台注册账号
  2. 登录平台,进入后台管理页面,创建应用,然后查看应用,查看应用相关信息。
  3. 在应用信息页面,找到appid,appkey秘钥等信息,然后写接口代码接入机器人应用。

开始接入

请求地址:http://www.weilaitec.com/cigirlrobot.cgr

请求方式:post

请求参数:

参数

类型

默认值

描述

userid

String

平台注册账号

appid

String

平台创建的应用id

key

String

平台应用生成的秘钥

msg

String

""

用户端消息内容

ip

String

""

客户端ip要求唯一性,无ip等可以用QQ账号,微信账号,手机MAC地址等代替。

接口连接示例:http://www.weilaitec.com/cigirlrobot.cgr?key=UTNJK34THXK010T566ZI39VES50BLRBE8R66H5R3FOAO84J3BV&msg=你好&ip=119.25.36.48&userid=jackli&appid=52454214552

注意事项:参数名称都要小写,五个参数不能遗漏,参数名称都要写对,且各个参数的值不能为空字符串。否则无法请求成功。userid,appid,key三个参数要到平台注册登录创建应用之后,然后查看应用详情就可以看到。userid就是平台注册账号。

示例代码JAVA:

import java.io.ByteArrayOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.net.HttpURLConnection;
import java.net.URL;

public class apitest {

/**
     * Get请求,获得返回数据
     * @param urlStr
     * @return
     */
    private static String opUrl(String urlStr)
    {        
        URL url = null;
        HttpURLConnection conn = null;
        InputStream is = null;
        ByteArrayOutputStream baos = null;
        try
        {
            url = new URL(urlStr);
            conn = (HttpURLConnection) url.openConnection();
            conn.setReadTimeout(5 * 10000);
            conn.setConnectTimeout(5 * 10000);
            conn.setRequestMethod("POST");
            if (conn.getResponseCode() == 200)
            {
                is = conn.getInputStream();
                baos = new ByteArrayOutputStream();
                int len = -1;
                byte[] buf = new byte[128];

while ((len = is.read(buf)) != -1)
                {
                    baos.write(buf, 0, len);
                }
                baos.flush();
                String result = baos.toString();
                return result;
            } else
            {
                throw new Exception("服务器连接错误!");
            }

} catch (Exception e)
        {
            e.printStackTrace();
        } finally
        {
            try
            {
                if (is != null)
                    is.close();
            } catch (IOException e)
            {
                e.printStackTrace();
            }

try
            {
                if (baos != null)
                    baos.close();
            } catch (IOException e)
            {
                e.printStackTrace();
            }
            conn.disconnect();
        }
        return "";
    }
    
    
    public static void main(String args []){        
            //msg参数就是传输过去的对话内容。            
            System.out.println(opUrl("http://www.weilaitec.com/cigirlrobot.cgr?key=UTNJK34THXK010T566ZI39VES50BLRBE8R66H5R3FOAO84J3BV&msg=你好&ip=119.25.36.48&userid=jackli&appid=52454214552"));
            
    }
}

KDD 2020最佳学生论文奖解读!杜克大学陈怡然组获奖-23相关推荐

  1. 中国力量占领KDD:包揽“大数据领域世界杯”全部冠亚军,北航拿下最佳学生论文奖...

    萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 数据挖掘.知识发现领域的最高学术会议--KDD 2020的所有奖项已全部公布. KDD,全称Knowledge Discovery and ...

  2. 25岁同济硕士生斩获CVPR 2022 最佳学生论文奖

    来源:量子位 从汽车动力学"转行"智能视觉感知,3年斩获2篇CVPR论文. 其中一篇,还是今年CVPR论文的最佳学生论文奖. 奖项颁了二十多届,今年第一次颁给来自中国高校的学生一作 ...

  3. 姚班本科生摘最佳学生论文奖,计算机理论顶会STOC2022奖项公布

    来源:机器之心 日前,STOC 2022 官网公布了论文接收列表,其中共有 2 篇最佳论文和 2 篇最佳学生论文. 作为计算机理论领域的全球顶级学术会议,ACM 计算理论年会(ACM Symposiu ...

  4. ACM MM 2020大奖项出炉!南开获最佳论文奖,西安交大获最佳学生论文奖

    本文转载自AI科技评论. 作者 | 陈大鑫 刚刚!第28届ACM国际多媒体会议(ACM MM)最佳论文奖.最佳学生论文奖.最佳demo奖. 最佳开源软件奖在内的所有多媒体领域大奖都已出炉. 其中最佳论 ...

  5. 同济、阿里的CVPR 2022最佳学生论文奖研究了什么?这是一作的解读

    视学算法发布 作者:陈涵晟(同济大学研究生.阿里达摩院研究型实习生) 距离 CVPR 2022 各大奖项公布没多久,来自同济大学研究生.阿里达摩院研究型实习生陈涵晟为我们解读最佳学生论文奖. 本文解读 ...

  6. 亚洲首获奖!清华大学团队获ACM SIGCOMM 2021唯一最佳学生论文奖

    来源:清华大学 编辑:Priscilla 好困 [导读]近日,全球网络通信顶会ACM SIGCOMM 2021公布了获奖名单,清华大学信息学院刘云浩.李振华团队研究影响蜂窝网络可靠性的软硬件及人类行为 ...

  7. CVPR 2020最佳学生论文分享回顾:通过二叉空间分割(BSP)生成紧凑3D网格

    机器之心发布 机器之心编辑部 在近日举行的 CVPR 2020 大会上,最佳论文.最佳学生论文等奖项悉数公布.加拿大西蒙弗雷泽大学陈之钦(Zhiqin Chen )等人的「BSP-Net」相关研究获得 ...

  8. 清华姚班“斩获”AAAI 2020最佳学生论文:首届弟子贝小辉携手本科在读李子豪,攻坚算法博弈研究...

    本文经AI新媒体量子位(公众号ID:qbitai)授权转载,转载请联系出处 本文约1700字,建议阅读5分钟 江湖英雄辈出,又是姚班少年郎. 江湖英雄辈出,又是姚班少年郎. 第34届美国人工智能协会年 ...

  9. 姚期智施尧耘获FOCS 2021时间检验奖,MIT华人摘最佳学生论文奖

    转自:量子位 计算机理论顶会FOCS 2021各项论文奖项已公布. 最佳学生论文奖被MIT华人学霸毛啸收入囊中. 而姚期智院士和达摩院量子实验室负责人施尧耘则凭借2001年发表的论文<Infor ...

最新文章

  1. 面向对象——单例设计模式
  2. Bag of Tricks for Image Classification
  3. linux的无密码登录,linux 无密码登录
  4. 静态工厂配置bean
  5. JAVA:说说你对序列化的理解
  6. Opserver开源的服务器监控系统(ASP.NET)
  7. Ubuntu中用gedit保存文件失败的解决办法
  8. leetcode259. 较小的三数之和
  9. 2008-10-13 XEIM 2.0 beta 准时发布
  10. aws s3 cli_了解AWS CLI –使用AWS CLI与AWS S3存储桶进行交互
  11. Junit4中的新断言assertThat的使用方法
  12. [译]GLUT教程 - 重整子窗体
  13. SVN文件夹对号图标(更新、冲突等)不显示
  14. 【Kaggle-House Price Prediction】代码参考
  15. 【贪玩巴斯】数字信号处理Digital Signal Processing(DSP)——第三节「离散时间 系统 详解」2021-09-29
  16. vue中使用$refs获取不到DOM元素
  17. VC6/VS6定制应用程序按键与贴图错位问题的排查及解决
  18. Inno Setup 系列之卸载删除文件
  19. 2022年1024程序员节随笔
  20. kafak集群部署配置,开启SASL_PLAINTEXT认证以及acl权限控制

热门文章

  1. 重复最多字符次数java_利用Java实现求字符串中出现次数最多的字符及次数
  2. 从产品设计角度,解读物联网四层架构
  3. 即时聊天表情功能的实现
  4. 在multisim14上完成数码管的显示(0-9)
  5. Codis和Redis-cluster对比
  6. 由ChatGPT反思大语言模型(LLM)的技术精要
  7. 全代码编写的iPhone界面源码1 UIView UILabel UIButton
  8. VLC播放gstreamer pipeline rtp流
  9. 【RabbitMQ】消息应答--ack机制
  10. abc D - Polynomial division