北大AI讲座公开课-精华

最近在观看北大AI讲座公开课，觉得受益良多，稍做笔记。

观看地址如下：

https://c.m.163.com/news/s/S1521443845851.html

小技巧：上面链接是移动端观看方式。如果电脑端观看网址模式为http://live.163.com/room/xxx.html。点击合集网站获取每个视频的标签码，然后将根据标签进入相关网址，如http://live.163.com/room/173117.html 中的173117即为标签。

附清华AI公开课的链接：https://c.m.163.com/news/s/S1521539942968.html

北大第一课：人工智能前沿产业趋势

第一课是由雷鸣老师主讲。

开篇就提到了AI需要“做一个有用的东西”，所谓“有用”，就是要比人类现有的处理方式产生优势。比如：如果自动驾驶每百万公里的事故率低于人类驾驶，那么这项技术就因此而有用。随着深度学习算法、计算能力以及数据量三方面的发展，机器在图像识别（人脸识别、医学影像）、语音识别（翻译盒子）等方面已经超过人类，未来可以预期有更多的领域将会成为AI发展的土壤。

劳动可以按照需要的脑力水平分为体力劳动（如：耕作）、技能劳动（如：驾驶、机械制造、售货服务）和创新劳动（如：芯片设计、算法设计）。回顾人类历史，劳动者在单位时间内的生产力水平在工业革命之前并没有显著提升，而在工业革命之后的二百年时间里成指数上升。这是因为工业革命后，机器取代了人类的体力劳动，农业社会转变为工业社会。展望未来，随着智能时代的推进，更多的技能劳动将被机器取代，由工业社会转向智能社会。

目前来讲，智能化还集中在低技能、高数据、高经济效益的领域；从趋势上看，在向高技能、低数据、普通行业发展。

北大第二课：AI在金融领域的应用及趋势
本课由蚂蚁金服的漆远主讲，漆远博士毕业于MIT，是普渡大学的终身教师。开篇说了句幽默而反应当下社会的话：“如果现在还有人工智能解决不了的，那就上区块链吧！”

漆远给大家带来了人工智能在蚂蚁金服中的应用，主要是金融智能大脑（主要用于风控和借贷）。其开发的智能包括云端智能和agent端智能。在智能安全方面，有系统安全检测（弱监督学习）、反洗钱模型（无监督、基于网络）、垃圾账户识别（根据人与社会的关联形成网络、涉及表示学习范畴的struc2vec模型）；在智能营销方面，有多次触达序列强化学习营销（深度强化学习）、information fusion和multi-view learning（发现了 skinny jeans->手机碎屏服务的关联规则）、保险应用（定损宝：部件识别、去反光）；在智能助理方面，有客服机器人（当年自助比94%）、Antone（迭代成长的对话机器人）。

金融智能平台需要非常快地处理海量数据，重要的是安全、实时和大规模，从底层的GPU、FPGA、CPU、ASIC，到中间层的金融级超大规模异构计算，再到上层的强化学习、深度学习、无监督学习和图推理。金融智能平台在“芝麻分”中应用，可以将建模效率从1月提升至1周，将部署从2周提升至1小时，信用KS值提升10%。将科学决策机制AB测试用在金融服务中，用测试流量来分析因果关系（发现小红点作为提示符更好，去掉腰封之后的网页点击率更高，这是与设计者初衷相悖的），体现用户反馈在系统中的重要性。

北大第三课：视觉计算的变革和挑战

本课由Face++的孙剑主讲，主要内容为计算机视觉方面的基本概念及发展脉络，以知识普及为主。

计算机视觉按照任务种类可以分为分类（猫狗）、检测（框出）和分割（像素级）。神经网络的方法在上世纪50年代就有人研究，但由于神经网络模型难以训练，而SVM等传统方法效果和理论基础都比较好，神经网络的方法没有获得足够的发展空间。2012年，hinton等人BP算法应用到CNN模型中，使得神经网络的训练和优化变得简单。随后的几年中，在imagenet测评的推动下，VGG、GoogleNet、ResNet等模型被提出，模型层数越来越深。

在这场科技变革中，Face++引领人脸识别领域的发展，做了很多优秀的应用。着力于解决深度学习在计算机视觉中的优化问题，增强其解释性、可训练性和普适性。孙剑团队凭着深厚的学术积累，与2013年的R-CNN直到2017年的Mask R-CNN中都有着直接或间接的关系。Face++目前在嵌入式智能设备（ShuffleNet 低计算复杂度计算）、人工智能平台取得了优秀成果。

北大第四课：人工智能如何释放数据原力
本课由来自Intel公司的宋继强老师主讲，重点讲解芯片技术对于智能时代的推动。

在过去的一段时间里，AI主要由大公司在B端（企业端）进行革新，更重视系统能力；而将来会更多地接近C端（消费者），更重视个人以及系统成本。从2005年至今的13年时间里，我们处于CT（计算机技术）时代，而在不远的将来，我们将进入RT（机器人技术）时代。机器人并不是长得像人的机器，而是代替人工作的机器，比如：扫地机器人就是一个小圆盘、个人助理就是一个音箱、炒菜机器人就是一口锅……当机器人像手机一样变成刚性需求的时候，就是RT时代的降临。

Intel在人工智能时代的最大贡献莫过于在其主导下摩尔定律保持了53年之久（1965年至2018年），使得AI的浪潮成为可能。CPU、GPU、FPGA、众核处理器、ASIC（如：Google的TPU）等多种芯片的发展使得计算能力提高、成本降低。根据应用场景，选择能效比和适应性符合要求的芯片，是各公司考虑的问题。Intel近期推出了LOIHI类脑计算芯片，正在开发配套软件和应用场景。

北大第五课：陈云霁——深度学习处理器

本次课程由寒武纪创始人之一的陈云霁主讲，他跟弟弟陈天石均是科大少年班出身，共同创建了寒武纪公司，目前也都是中科院计算所的研究员。

课程开始回顾了人工智能的发展脉络，阐述了由符号主义到行为主义，再到连接主义的进程。将人工神经网络的兴起归结为连接主义中的成果，同时也将人工神经网络与生物神经网络的关系比喻为老鼠与米老鼠的关系，表明了当前人工神经网络的一些不足和固有困境。课程指出，增强学习+深度学习的框架是当前人工智能领域的一大革新。Google使用10亿英镑收购当时初露头角的DeepMind，体现出其智慧与对未来的感知。

陈云霁的研究生方向为芯片设计，而陈天石研究深度学习算法，他俩联合起来就进行了专用神经网络处理器的研究。从2008年开始研究相关技术以来，在国际上的很多会议上获得最佳论文（12-16年间成果颇丰），目前寒武纪的芯片已经在华为手机中加速，提升手机中的神经网络运算速度。其主要解决的三个科学问题包括：①有限规模的硬件VS无限规模的算法（基本运算元时分复用、各种方法降低数据搬运成本）；②结构固定的硬件VS千变万化的算法（创造智能指令集，搜索几百种算法并从中归纳出几算法共性）；③能耗受限的硬件（手机<=1w，服务器<=300w）VS精度优先的算法（采用稀疏化算法，将权重较小的神经元稀疏掉）。

陈自豪地说，相关领域高引论文前十位有一半来自其团队，“一直被跟随，从未被超越”，2018年的science报道表明了其先驱地位。但愿中国能够产生更多地领先世界的团队、公司和领域。

北大第六课：自动驾驶与人工智能

本次课程由百度的陈竞凯讲解自动驾驶方面的知识，从自动驾驶的历史、分级、目标和系统组成部分展开。自动驾驶早在1925年就开始被研究，1939年的未来城市计划更是明确表示了自动驾驶的愿望，因此很多历史悠久的公司对于自动驾驶有着深厚的积累。根据智能化程度，自动驾驶可以分为L0-L5六个等级：L0，警报；L1，自动控制油门或者刹车；L2控制方向盘，但需要人时刻注意；L3，人可以部分时间脱离注意力，目前奥迪A8等车型宣称具备L3；L4，在限定场景自动驾驶，比如F1赛场中；L5，在不限定的场景下自动驾驶，是无限逼近的终极目标。

北大第八课：自然语言对话：现状和未来

本次课程由李航老师主讲，题为“Natural Language Dialogue: Present and Future”。课程由智能机器的定义展开，认为智能计算机有4种可能的定义：Thinking humanly, Acting humanly, Thinking rationally, Acting rationally。从功能角度来看，理解包括两个层面：表示和行动。

对于自然语言，理解的层面包括：Lexion、Syntax、Semantic（即词法、句法和语义）。在脑科学领域，科学家发现人脑的布洛卡区对应句法、韦尼克区对应词汇。对于语义的理解，在概念的形成过程中，每个人有共性也有个性。如“flying pig”，人们对于pig的具象化理解大致相似，但对于flying的具体方式（是否使用翅膀？）会有区别。另一个很大的挑战是“ambiguity and variablility”，人是有world knowledge和语言习惯作为背景知识的，而计算机会被多义性困扰。

本课主题为自然语言对话，具体分为单轮对话和多轮对话。单轮对话的形式包括基于分析、基于检索和基于生成。多轮对话要基于有限状态机和知识库。

最后，李航老师给出了几个比较重要的课题：semantic grounding、neural symbolic processing、deep reinforcement learning、 modular and hierarchical processing、meta learning (learning to learn, few-shot learning)。

北大第九课：人工智能在视频中的应用

本节课由奇虎360公司副总裁颜水成老师为大家带来人工智能在现实生活和安全领域的应用。

AI工程化：场景、算法、算力、数据

做AI工程需要考虑的问题：高频刚需、技术成熟、贸易壁垒、变现途经（讲座非常之精彩，其中意蕴需要细细领会）

北大第十一课：语言智能的进展
    本节课由来自微软亚研院的周明老师为大家带来关于自然语言处理（NLP）的讲座，对自然语言现阶段的状况和进展作出了一些阐述。
    人工智能的三要素包括：数据、算法与框架、计算能力。如果做出的应用有落地场景，能够接收用户反馈，那么就有机会作出更好的产品或应用。
    智能可以分为下面几个层次，有底层到高层分别是：运算智能（计算）、感知智能（听、视觉）、认知智能（语言和推理）、创造智能（想法、理论）。运算智能指的是计算机的运算和存储能力；感知智能指的是计算机能够接收外界传入的信号，能有辨别能力；认知智能与语言智能紧密相连，要求对问题有理解和推理的能力；创造智能要求计算机产生新的事物、想法或意识（对联、作曲、唱歌等）。
    微软亚研院在神经机器翻译、聊天机器人、机器阅读理解、创作机器人等方面都有很强的科研实力。其中有很多理论和实践方面的创新，如：对偶学习（机器利用自己产生的数据来加强训练，中英翻译中->英->中两个中文句子间差距越小表示性能越好）。

周明副院长表示，自然语言理解在未来5-10年内将发挥巨大作用。例如，智能客服能够解决30%-50%的问题，google assistance已经能够帮助人类处理简单的日常事务。

北大第十四课：AI工程实践与人才成长路径

本节课程由创新工场的王咏刚老师主讲，主要是概念上的指导，包含少量技术上的内容。他指出，从学校里培养出来的科学型人才与AI市场需要的工程型人才有一定的鸿沟，需要通过工程项目的实践才能成长起来。下面将其讲解的具体内容做一些整合。

目前市场上的很多独角兽公司采取B2B、B2G模式，发展很好。阿里提出的新零售概念也已经渐渐步入生活（比如：原麦山丘面包店里的自动识别付费系统）。从学科教学到工程实践有很多需要弥补的空缺，科学中的算法只是工程中的一小部分。比如说，面包识别系统的灯光会随着适用场合、使用年限产生不稳定的波动，而且面包重叠情况下的提示和识别也是必须要考虑的问题。能力建设有三个视角：个人发展、学术环境、产业环境。工业界与学术界在关注重心上有所差别。

接下来是一些技术上的探讨。作为一个AI工程师，需要知道深度学习不同场景下应该使用的芯片技术（GPU？TPU？云服务器？），模型应该写成多大（模型压缩），是否使用边缘计算（每个节点有一些计算能力，将初步处理得到的数据与控制节点进行交换），编程语言的使用（C、C++、Java、Python甚至是LISP），编程代码的规范（Google Style Guide），深度学习框架的选择（tensorflow、pytorch、keras、DL4J、caffe）。

清华演讲人工智能：未来已来，隐约可见

商汤科技CEO徐立幽默风趣地向同学们展示了他对于科技和未来的思考。通过展现商汤科技在图像理解方面的成就，阐释了人工智能在当下的应用。

目前人工智能是作为生产力的工具，在不同的领域中的发展有这样的阶段共性：第一阶段，技不如人，只能作为artificial label；第二阶段，超越大众，可以作为人工的辅助；第三阶段，超越专家，实现技术的突破，形成人对机器的依赖。商汤科技使用自主研发的深度学习平台，采用超深的网络、超大的数据学习、复杂的关联应用，作为其核心技术。在应用层级上，视觉计算不仅可以进行low level成像和感知，还可以进行high level的识别和理解，机器已经可以创作、可以将模糊的图像还原精细，在这些限定领域，机器超越人类指日可待。

清华第四课：人工智能与量子计算

本课由施尧耘和段路明主讲。

施尧耘是阿里云量子技术首席科学家，他的讲演深入浅出，为我们概况性地阐述了量子计算及其在人工智能中的应用。量子计算方面的概念包括：量子比特（带有复数权重的线性组合），量子操作（保持长度的线性变换，在不同场景下被称作酉变换或正交变换），读取（投影测量，平方和为1）。由于量子比特的权重可以为负，量子算法中的错误不会线性累加（positive&negative weights may cancel out）。量子计算的驱动力：物理模拟、破解密码、AI/大数据。在AI中，量子计算可以加速AI常用算法：解线性方程、解常微分方程、SVM、Data Fitting。量子模型：Quantum PAC Learning。量子处理器-> 量子软件-> 量子算法-> 应用，最后喊出了口号：量子计算终将实现。

段路明是清华大学姚期智讲座教授，是清华大学量子信息中心的教授。其口音较重，但说话很准确。他更多地从物理角度解释量子计算。他表示量子计算机提供自动并行，量子计算硬件与量子学习算法结合提供指数加速。作为资深科学家，他将近期量子计算机的实现分为几个发展阶段——阶段一（目前阶段）：2-20个量子比特，逻辑门保真度95%-99%；阶段二（Logic qubit/ Quantum supremacy, 下5年）：30-100个量子比特，在特定问题上超过最强经典计算机；阶段三（量子革命，大约15年）：广泛影响各个领域。

清华第六课：落地的人工智能

本课开始时，雷鸣老师给我们列举了几个人工智能落地比较有前景的行业：智能助理、游戏及娱乐、智能制造、智能农业。

杨强是香港科技大学教授、IJCAI理事会主席、华为诺亚方舟实验室主任。他讲述了人工智能的层级和实例。从层级来说，包括感知、机器学习、推理和抽象迁移。目前感知已经做得很好，而机器学习技术也在大规模应用，推理技术还不成熟，抽象迁移更加困难。一个AI，两种模式：专用VS通用、辅助VS自动、交互VS核心；不同的学者给AI的角色和定位有所区别，目前来说专用和辅助是更加普遍的观点。测试方法（evaluation）很重要，它决定了是否可以采用AI，使用AI的效果会怎么样。AI落地，需要：目标明确、数据切合要解决的问题、跨界人才（需要领域内知识）。AI in all是不合适的，更准确的是AI in some。例如：Watson希望在癌症医疗领域有所作为，但是无法获得足够量的需要的数据，因此这种尝试没有成功。

【本博客随课程更新中...】

北大AI讲座公开课-精华相关推荐

3D Vision公开课精华 | 深度三维感知：数据、学习架构与应用
文稿整理者 | 何常鑫审稿&修改 | 弋力博士本文总结于弋力博士2021年5月19日在深蓝学院关于深度三维感知的公开课--<深度三维感知:数据.学习架构与应用>. 本次公开课 ...
AI学习-公开课汇总
目录 OpenAILab公开课北大AI公开课智东西公开课计算机视觉应用系列课嵌入式AI合辑现收集若干公开课的相关链接 OpenAILab公开课评价:基于ARM嵌入式或者边缘设备,全链条讲解 ...
有奖评选 | 2020年的AI技术公开课，你想听到哪些干货？
CSDN技术公开课有奖评选开始啦~~听过课的小伙伴们,哪位讲师的分享让你获益匪浅?记得给TA投票哦!投票后获取入群方式,参与抽奖,奖品很丰厚哦~~ 进入付费时代,如今我们看似只要招招手,一切知识随手可 ...
公开课精华 | 移动机器人视觉三维感知的现在与将来
文稿整理者 | 何常鑫审稿&修改 | 王凯旋本文总结于香港科技大学王凯旋博士关于移动机器人视觉三维感知的现在与将来的公开课,其中主要介绍了基于视觉的三维环境感知方案,包括传统方法和基于深度 ...
推荐一波知名学府的计算机/编程/AI免费公开课
导读:50+公开课分别来自哈佛.MIT.UCB.普林斯顿.CMU.斯坦福以及国内清华.北大.中科大.浙大.上交大.东南大学.南邮等知名学府,伴随公开课一并奉上的不仅有课程视频.课程笔记,还有中文版教材 ...
公开课精华 | 无人驾驶中感知的挑战与尝试
本文总结于深圳元戎启行公司点云感知方向技术负责人邹晓艺,在深蓝学院的关于无人驾驶中感知的挑战与尝试的公开课演讲内容. 全文约3500字主讲人邹晓艺来自深圳元戎启行公司,曾在百度IDL和ADU部门工作 ...
2019张小龙微信公开课精华整理（未完待续....）
看起来微信有很多跟别的不一样的地方,就像有一个朋友说,有一次在朋友圈里说,微信是互联网界的异类,所谓异类就是跟其他所有产品不一样. 我看到这句话觉得很惊讶,同时也觉得挺自豪的.自豪的是你是一个异类,表 ...
公开课精华|机器人的带约束轨迹规划
本文章总结于大疆前技术总监,目前在卡内基梅隆大学读博的杨硕博士在深蓝学院的关于机器人的带约束轨迹规划的公开课演讲内容. --------全文约5000字-------- 笔者不是机器人领域的,因此特地 ...
AIIA开发者大会——百度·产业AI技术公开课
物流架构成本效率体验飞桨的实践名字的各种清洗,奇怪名字智慧园区 POC解决方案园区CV 预警系统技术服务行业赋能飞机制造业复合材料质检技术方案背景流程数据收集方法比较图像技术 ...
免费学习AI公开课：打卡、冲击排行榜，还有福利领取
CSDN 技术公开课 Plus--AI公开课再度升级内容全新策划:贴近开发者,更多样.更落地形式多样升级:线上线下.打卡学习,资料福利,共同交流成长, 扫描下方小助手二维码,回复:公开课,加入课程 ...

北大AI讲座公开课-精华

北大AI讲座公开课-精华相关推荐

最新文章

热门文章