分布式系统领域有着最令人费解的理论,全链路的不确定性堪比物理中的量子力学。同时,分布式系统领域又有着当代最宏伟的计算机系统,Google、Facebook、亚马逊遍布全球的系统支撑着我们的信息生活。显然,能够征服分布式系统的,都是理论和实践两手抓两手都要硬的强者。然而,分布式系统领域还有着最高的上手门槛,没有大规模的基础设施、没有潮水般的流量,分布式领域幽灵般的问题并不会浮出水面。那么,我们应该如何开启征服分布式系统的征程呢?

好在这条路上我们并不孤独。学术大牛们在五十年前就开始探索各方面理论上的问题,全球规模的互联网公司也有着丰富的实践和经验。而这些分布式领域人类的智慧,最终都沉淀为了一篇篇的经典论文。和普通的技术文章相比,论文的发表有着极为严格的要求,随之而来的也是极高的质量。

通过阅读分布式领域的经典问题,我们可以快速吸收前人的智慧,领略大型系统的风采,并收获最为宝贵的实战经验。现在,就让我们从一篇篇经典论文开始,踏上征战分布式系统的征程吧!按照从理论到实践的顺序,将经典的分布式系统论文分成了分布式理论基础、分布式一致性算法、分布式数据结构和分布式系统实战四类,帮助你快速找到自己需要的论文。这些论文我都给到了标题,你可以直接去 Google 学术里搜索。

分布式理论基础

分布式理论基础部分的论文,主要从宏观的角度介绍分布式系统中最为基本的问题,从理论上证明分布式系统的不确定、不完美,以及相互间的制约条件。研读这部分论文,你可以了解经典的 CAP 定理、BASE 理论、拜占庭将军问题的由来及其底层原理。有了这些理论基础,你就可以明白分布式系统复杂的根源。当再碰到一些疑难杂症,其他人不得其解时,你可以从理论高度上指明方向。

以下就是分布式理论基础部分的论文:

Time, Clocks, and the Ordering of Events in a Distributed System

The Byzantine Generals Problem

Brewer’s Conjecture and the Feasibility of Consistent, Available, Partition-Tolerant Web Services

CAP Twelve Years Later: How the “Rules” Have Changed

BASE: An Acid Alternative

A Simple Totally Ordered Broadcast Protocol

Virtual Time and Global States of Distributed Systems

分布式一致性算法

只要脱离了单机系统,就会存在多机之间不一致的问题。因此,分布式一致性算法,就成了分布式系统的基石。在分布式一致性算法这一部分,我将与你推荐 2PC、Paxos、Raft 和 ZAB 等最知名的一致性算法。分布式算法的复杂度比普通算法要高出几个数量级,所以这部分论文是最为烧脑的一部分。搞明白这部分论文,你的空间想象力和统筹规划能力都会得到质的提升。

A Brief History of Consensus, 2PC and Transaction Commit

Paxos Made SimplePaxos Made Practical

Paxos Made Live: An Engineering Perspective

Raft: In Search of an Understandable Consensus Algorithm

ZooKeeper: Wait-Free Coordination for Internet-Scale Systems

Using Paxos to Build a Scalable, Consistent, and Highly Available Datastore

Impossibility of Distributed Consensus With One Faulty Process

Consensus in the Presence of Partial Synchrony

分布式数据结构

分布式数据结构部分的论文,将与你介绍管理分布式存储问题的知名数据结构原理。通过它们,你可以构建自己的分布式系统应用。

这部分论文的涵盖范围大致包括两部分:一是,分布式哈希的四个著名算法 Chord、Pastry、CAN 和 Kademlia;二是,Ceph 中使用的 CRUSH、LSM-Tree 和 Tango 算法。和分布式一致性算法类似,分布式数据结构也极其考验空间想象力和统筹规划能力。不过,在经过分布式一致性算法的锻炼后,相信这些对你来说已经不再是问题了。

Chord: A Scalable Peer-to-Peer Lookup Service for Internet Applications

Pastry: Scalable, Distributed Object Location, and Routing for Large-Scale Peer-to-Peer Systems

Kademlia: A Peer-to-Peer Information System Based on the XOR Metric

A Scalable Content-Addressable Network

Ceph: A Scalable, High-Performance Distributed File System

The Log-Structured-Merge-Tree

HBase: A NoSQL Database

Tango: Distributed Data Structure over a Shared Log

分布式系统实战

分布式系统实战部分的论文,将介绍大量互联网公司在分布式领域的实践、系统的架构,以及经验教训。Google 的新老三驾马车,Facebook、Twitter、LinkedIn、微软、亚马逊等大公司的知名系统都会在这一部分登场。你将会领会到这些全球最大规模的分布式系统是如何设计、如何实现的,以及它们在工程上又碰到了哪些挑战。

The Google File System

BigTable: A Distributed Storage System for Structured Data

The Chubby Lock Service for Loosely-Coupled Distributed Systems

Finding a Needle in Haystack: Facebook’s Photo Storage

Windows Azure Storage: A Highly Available Cloud Storage Service with Strong Consistency

Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory Cluster Computing

Scaling Distributed Machine Learning with the Parameter Server

Dremel: Interactive Analysis of Web-Scale Datasets

Pregel: A System for Large-Scale Graph Processing

Spanner: Google’s Globally-Distributed Database

Dynamo: Amazon’s Highly Available Key-value Store

S4: Distributed Stream Computing Platform

Storm @TwitterLarge-scale Cluster Management at Google with Borg

F1 - The Fault-Tolerant Distributed RDBMS Supporting Google’s Ad Business

Cassandra: A Decentralized Structured Storage System

MegaStore: Providing Scalable, Highly Available Storage for Interactive Services

Dapper, a Large-Scale Distributed Systems Tracing Infrast

Dapper, a Large-Scale Distributed Systems Tracing Infrastructure

Kafka: A distributed Messaging System for Log Processing

Amazon Aurora: Design Considerations for High Throughput Cloud-Native Relational Databases

以上就是我为你准备的分布式系统经典论文清单了。这个清单里的每一篇论文,都是经典中的经典。很多论文对之后的工业界及学术界产生了翻天覆地的影响,开创了一个又一个火热的产业。希望你没有被这个清单吓到,当你翻开这些论文后,就会发现它们的内容并不是高高在上,包含了很多很实际、很具体的问题。认真读下去,你甚至会有掌握了屠龙之技的快感,一发而不可收拾。为了帮助你高效阅读这些论文,并汲取其中的精华,我再和你说说我阅读论文的一些心法吧。

如何高效地阅读论文?

一般来说,单篇论文大概会有 15 到 20 页的内容,如果你是第一次读论文可以把重点放在前面的背景介绍、相关工作和概要设计上。好的论文通常会很仔细地介绍背景知识,帮助你从宏观上先对整个问题有一个初步认识,了解当前现状。

接下来,你可以再根据自己的兴趣,选择是否仔细阅读论文涉及的详细原理和设计。这一部分,通常是论文中最精华的部分,包含了最具创新的理念和做法,内容通常也会比较长,需要花费较多的时间和精力去研究。这时,你可以根据自己的情况,选择一批论文重点突破。

论文最后通常是评测和数据展示部分。这部分内容对我们最大的参考价值在于,学习作者的评测方法、用到的测试工具和测试样例,以便将其运用到工作中。

阅读完一篇论文后,如果你觉得内容还不错的话,可以通过 Google 学术去搜索相关的文章,找到所有引用这篇论文的新作品。这样一来,你就可以通过一篇经典论文不断深入,全面掌握一个领域。

论文down下来了,上不了Google学术的同学可自取

链接: https://pan.baidu.com/s/1LN9ZaIuSMCRKN_3LAlq4Iw 提取码: 1hp5

分布式系统经典论文汇总相关推荐

  1. DNN:DL讨论与DNN经典论文汇总

    引言: 达尔文的进化哲学:适者生存!其原因不是因为适者生存,而是因为不适者都会死去: 没有免费的午餐定理:没有普适性的优越算法,如果一个算法对一个或一些应用相对其他算法表现极大的优越性,那么在特定领域 ...

  2. 深度学习经典论文汇总

    CV-CNN AlexNet(2012):深度学习热潮的奠基作 VGG(2014):使用 3x3 卷积构造更深的网络 GoogleNet(2014):使用并行架构构造更深的网络 ResNet(2015 ...

  3. 图像识别经典论文汇总(按年份排,并附论文和模型链接)

    1998年:LeNet <Gradient-based Learning Applied to Document Recognition> 论文:http://lushuangning.o ...

  4. 数字图像处理经典论文汇总

    Colorization and Color Transfer(图像上色和颜色迁移) Semantic Colorization with Internet Images, Chia et al. S ...

  5. 主动领域自适应(Active Domain Adaptation)部分经典论文汇总

    只简单找了一小部分 CVPR [link] [code] [TQS] [21] Transferable Query Selection for Active Domain Adaptation [l ...

  6. 类增量学习(Class-Incremental Learning)领域部分经典论文汇总

    2022.03.08 正在逐步完善补充中 只简单找了一小部分 CVPR [link] [code] [iCaRL] [17] iCaRL: Incremental Classifier and Rep ...

  7. 主动学习(Active Learning)领域部分经典论文汇总

    只简单找了一小部分 CVPR [link] Active Image Segmentation Propagation CVPR 16 segmentation [link] The Power of ...

  8. 伪装目标检测(Camouflage Object Detection)部分经典论文汇总

    本文不保证时效性覆盖性 CVPR [link] [code] [ZoomNet] [22] Zoom in and Out: A Mixed-Scale Triplet Network for Cam ...

  9. 【NLP相关】NLP领域经典论文汇总(附代码实现)

    ❤️觉得内容不错的话,欢迎点赞收藏加关注

最新文章

  1. python itertools模块位置_Python高效编程之itertools模块详解
  2. 使用PHP实现用户登录和注册的功能
  3. linux命令界面下载kettle,kettle在linux环境中打开图形界面-Go语言中文社区
  4. 前端学习(2386):远程仓库的issue
  5. 多系统引导工具支持Linux,多系统引导工具(BootThink)
  6. 安卓3d游戏开发引擎_鲁大师安卓3D引擎更新,跑分测试精准度再升级
  7. 人脸检测(三)--Haar特征原理及实现
  8. VirtualBox (VBoxManage clonehd )复制vdi文件实现复制
  9. android手机怎么root,安卓手机如何Root 安卓手机Root权限获取图为教程
  10. 身神话继续遭受DDOS进攻,也遭受了雷同的陵犯
  11. 闲聊:Android 平台网络游戏加速器(二)
  12. 搜狗站长工具:索引量与收录量的解释,它等同于site的收录吗?
  13. 三角警示牌emark认证详解
  14. 2022年国家高新技术企业认定评审最新标准及补贴政策重点,补贴10-50万
  15. Daemon函数的用法
  16. 【C51定时计数器讲解】
  17. 2020-12-16 今日学习 arraycopy
  18. 开题报告里的基本内容写什么,预期效果又怎么写?
  19. TCP 的三次握手(简述)
  20. 【JS逆向系列】某乎x96参数与jsvmp初体验

热门文章

  1. Python实现用户名字母大小写数字特殊符号
  2. 湿法后道清洗药液及设备的研究
  3. 【2019暑假集训】07.10比赛总结
  4. KindEditor解决浏览器兼容性的问题
  5. 大数据联合实验室落户青羊区
  6. LeetCode 面试题 08.11. 硬币 多种解法 完全背包问题
  7. IT界郎朗上口的名言
  8. 聚焦2021云栖大会,边缘云专场畅谈技术应用创新
  9. 安卓刷机遇到的一些问题
  10. CDH集群使用spark作为hive查询引擎(实时查询)