初步了解分布式原理:

分布式文件系统(Distributed File Systemm)是指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点相连。简单来说,就是把一些分散的(分布在局域网内各个计算机上)共享文件夹,集合到一个文件夹内(虚拟共享文件夹)。对于用户来说,要访问这些共享文件夹时,只要打开这个虚拟共享文件夹,就可以看到所有链接到虚拟共享文件夹内的共享文件夹,用户感觉不到这些共享文件是分散在各个计算机上的。分布式文件系统的好处是集中访问、简化操作、数据容灾,以及提高文件的存取性能。

MFS原理:

MFS是一个具有容错性的网络分布式文件系统,它把数据分散存放在多个物理服务器上,而呈现给用户的则是一个统一的资源。

MFS文件系统的组成:

#元数据服务器(Master):在整个体系中负责管理文件系统,维护元数据。
#元数据日志服务器(MetaLogger):备份Master服务器的变化日志文件,文件类型为changelog_ml.*.mfs。当Master服务器数据丢失或者损坏时,可以从日志服务器中取得文件,进行修复。
#数据存储服务器(Chunk Server):真正存储数据的服务器。存储文件时,会把文件分块保存,在数据服务器之间进行复制。数据服务器越多,能使用的“容量”就越大,可靠性就越高,性能也就越好。
#客户端(Client):可以像挂载NFS一样挂载MFS文件系统,其操作是相同的。

MFS读取数据的处理过程:

#客户端向元数据服务器发出读请求
#元数据服务器把所需数据存放的位置(Chunk Server的IP地址和Chunk编号)告知客户端
#客户端向已知的Chunk Server请求发送数据
#Chunk Server向客户端发送数据

MFS写入数据的处理过程:

#客户端向元数据服务器发送写入请求
#元数据服务器与Chunk Server进行交互(只有当所需的分块Chunks存在的时候才进行交互),但元数据服务器只在某些服务器创建新的分块Chunks,创建成功后由Chunk Server告知元数据服务器操作成功。
#元数据服务器告知客户端,可以在哪个Chunk Server的哪些Chunks写入数据。
#客户端向指定的Chunk Server写入数据
#该Chunk Server与其他Chunk Server进行数据同步,同步成功后Chunk Server告知客户端数据写入成功
#客户端告知元数据服务器本次写入完毕

下面为MFS文件系统的基本组成架构:

下面我通过实验进行说明:
实验环境:

mfs软件包链接:https://pan.baidu.com/s/1QDIMfqZGjlqUfRRwZfDFqQ
提取码:d3mi
一、搭建Master Server
下载编译环境

yum install gcc gcc-c++ zlib-devel -y

关闭防火墙

systemctl stop firewalld.service
setenforce 0

建立管理用户

useradd -s /sbin/nologin mfs

解压源码包

tar zxvf mfs-1.6.27-5.tar.gz -C /opt

对本台服务器进行配置,因为在进行源码包编译时,它是默认安装了所有模块的,而这台是Master所以需要禁用chunkserver和mount两个模块

cd /opt/mfs-1.6.27/
./configure \
--prefix=/usr/local/mfs \
--with-default-user=mfs \
--with-default-group=mfs \
--disable-mfschunkserver \
--disable-mfsmount

编译安装

make && make install

复制文件

cd /usr/local/mfs/etc/mfs/
cp mfsexports.cfg.dist mfsexports.cfg
cp mfsmaster.cfg.dist mfsmaster.cfg
cp mfsmetalogger.cfg.dist mfsmetalogger.cfg
cd /usr/local/mfs/var/mfs/
cp metadata.mfs.empty metadata.mfs

将该文件的属组和属主改为mfs

chown -R mfs.mfs /usr/local/mfs

本台服务器需要用到的配置文件有两个:mfsmaster.cfg(主配置文件)和mfsexports.cfg(被挂载目录及权限配置文件)。这两个文件不需要做任何修改就可以开始工作
mfsmaster.cfg文件常用参数如下:

#WORKING_USER = mfs #运行masterserver的用户
#WORKING_GROUP = mfs #运行masterserver的组
#SYSLOG_IDENT = mfsmaster #在syslog中表示是mfsmaster产生的日志
#LOCK_MEMORY = 0 #是否执行mlockall(),以避免mfsmaster进程溢出(默认为0)
#NICE_LEVEL = -19 #运行的优先级(如果可以,默认是-19;注意:进程必须用root启动)

#EXPORTS_FILENAME = /usr/local/mfs/etc/mfs/mfsexports.cfg #被挂载目录及其权限控制文件的存放位置

#TOPOLOGY_FILENAME = /usr/local/mfs/etc/mfs/mfstopology.cfg

#DATA_PATH = /usr/local/mfs/var/mfs #数据存放路径

#BACK_LOGS = 50 #metadata改变的log文件数目(默认是50)
#BACK_META_KEEP_PREVIOUS = 1

#REPLICATIONS_DELAY_INIT = 300
#REPLICATIONS_DELAY_DISCONNECT = 3600

#MATOML_LISTEN_HOST = #metalogger监听的IP地址(默认是,代表任何IP)
#MATOML_LISTEN_PORT = 9419 #metalogger监听的端口地址(默认是9419)
#MATOML_LOG_PRESERVE_SECONDS = 600

#MATOCS_LISTEN_HOST = #用于chunkserver连接的IP地址(默认是,代表任何IP)
#MATOCS_LISTEN_PORT = 9420 #用于chunkserver连接的端口地址(默认是9420)

#MATOCL_LISTEN_HOST = #用于客户端挂接连接的IP地址(默认是,代表任何IP)
#MATOCL_LISTEN_PORT = 9421 #用于客户端挂接连接的端口地址(默认是4921)

#CHUNKS_LOOP_MAX_CPS = 100000
#CHUNKS_LOOP_MIN_TIME = 300 #chunk的回环频率(默认是300秒)

#CHUNKS_SOFT_DEL_LIMIT = 10
#CHUNKS_HARD_DEL_LIMIT = 25
#CHUNKS_WRITE_REP_LIMIT = 2 #在一个循环里复制到一个chunkserver的最大chunk数
#CHUNKS_READ_REP_LIMIT = 10 #在一个循环里从一个chunkserver复制的最大chunk数
#ACCEPTABLE_DIFFERENCE = 0.1

#SESSION_SUSTAIN_TIME = 86400
#REJECT_OLD_CLIENTS = 0

#deprecated:
#CHUNKS_DEL_LIMIT - use CHUNKS_SOFT_DEL_LIMIT instead
#LOCK_FILE - lock system has been changed, and this option is used only to search for old lockfile

mfsexports.cfg文件参数格式如下:

#Allow everything but "meta".

  • / rw,alldirs,maproot=0

#Allow "meta".

  • . rw

该文件每一个条目分为三部分
第一部分:客户端的IP地址
第二部分:被挂接的目录
第三部分:客户端拥有的权限

地址可以指定的几种表现形式:

#*——所有的IP地址
#n.n.n.n——单个IP地址
#n.n.n.n/b——IP网络地址/子网掩码
#f.f.f.f-t.t.t.t——IP段

目录部分的标识如下:

#/标识MFS根
#.表示MFSMETA文件系统

权限部分的标识如下

#ro——只读模式共享
#rw——读写的方式共享
#alldirs——允许挂载任何指定的子目录
#admin——管理员权限
#maproot——映射为root,还是指定的用户
#Password——指定客户端密码

启动Master Server

/usr/local/mfs/sbin/mfsmaster start

查看进程,如果有MFS的进程表示服务成功开启

ps -ef | grep mfs

这是关闭Master Server命令

/usr/local/mfs/sbin/mfsmaster -s

二、搭建Metalogger Server
安装编译环境

yum install gcc gcc-c++ zlib-devel -y

关闭防火墙

systemctl stop firewalld.service
setenforce 0

创建管理用户

useradd -s /sbin/nologin mfs

解压安装包

tar zxvf mfs-1.6.27-5.tar.gz -C /opt

配置模块,因为本台服务器是Log服务器,所以需要禁用掉mfschunkserver和mfsmount两个模块

cd /opt/mfs-1.6.27/
./configure \
--prefix=/usr/local/mfs \
--with-default-user=mfs \
--with-default-group=mfs \
--disable-mfschunkserver \
--disable-mfsmount

编译安装

make && make install

复制文件,本台服务器只需要开启日志文件即可

cd /usr/local/mfs/etc/mfs/
cp mfsmetalogger.cfg.dist mfsmetalogger.cfg

在文件中将地址指向Master Server的地址

vim mfsmetalogger.cfg
MASTER_HOST = 192.168.199.129

将文件的属组和属主都改为mfs

chown -R mfs.mfs /usr/local/mfs/

开启MetaLog Server服务

/usr/local/mfs/sbin/mfsmetalogger start

查看进程,如果有MFS进程表示服务成功开启

ps -ef | grep mfs

关闭服务用如下命令

/usr/local/mfs/sbin/mfsmetalogger -s

三、搭建两台Chunk Server,两台的操作步骤完全一样
安装编译环境

yum install gcc gcc-c++ zlib-devel -y

创建管理用户

useradd -s /sbin/nologin mfs

关闭防火墙

systemctl stop firewalld.service
setenforce 0

解压安装包

tar zxvf mfs-1.6.27-5.tar.gz -C /opt

配置模块,本台服务器是Chunk Server,所以需要禁用掉mfsmaster和mfsmount两个模块

cd /opt/mfs-1.6.27/
./configure \
--prefix=/usr/local/mfs \
--with-default-user=mfs \
--with-default-group=mfs \
--disable-mfsmaster \
--disable-mfsmount

编译安装

make && make install

开启mfschunkserver和mfshdd两个文件

cd /usr/local/mfs/etc/mfs/
cp mfschunkserver.cfg.dist mfschunkserver.cfg
cp mfshdd.cfg.dist mfshdd.cfg

在chunk文件下将地址指向 Master Server

vim mfschunkserver.cfg
MASTER_HOST = 192.168.199.129

在mfshdd文件下添加一行/data,在这里/data是一个给MFS的分区,生存环境最好使用独立的分区或磁盘挂载到此目录

vim mfshdd.cfg
#mount points of HDD drives

#/mnt/hd1
#/mnt/hd2
#etc.
/data

创建挂载目录

mkdir /data
chown -R mfs.mfs /data

开启服务

/usr/local/mfs/sbin/mfschunkserver start

想要关闭可以使用如下命令

/usr/local/mfs/sbin/mfschunkserver -s

查看进程,可以检测服务是否开启

ps -ef | grep mfs

四、客户端配置
安装编译环境,MFS客户端依赖于FUSE,所以需要安装fuse的安装包和开发包

yum install gcc gcc-c++ zlib-devel fuse fuse-devel -y

关闭防火墙

systemctl stop firewalld.service
setenforce 0

添加环境变量PKG_CONFIG_PATH,环境变量PKG_CONFIG_PATH是用来设置.pc文件的搜索路径的,pkg-config按照设置路径的先后顺序进行搜索,直到找到指定的.pc 文件为止

vim /etc/profile
export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig:$PKG_CONFIG_PATH
source /etc/profile

创建进程管理用户

useradd -s /sbin/nologin mfs

解压安装包

tar zxvf mfs-1.6.27-5.tar.gz -C /opt

配置模块,本台服务器是Client,所以需要禁用掉mfsmaster和mfschunkserver两个模块,同时开启mfsmount模块

cd /opt/mfs-1.6.27/
./configure \
--prefix=/usr/local/mfs \
--with-default-user=mfs \
--with-default-group=mfs \
--disable-mfsmaster \
--disable-mfschunkserver \
--enable-mfsmount

编译安装

make && make install

创建挂载点

mkdir /opt/mfs

加载fuse模块到内核

modprobe fuse

挂载MFS

/usr/local/mfs/bin/mfsmount /opt/mfs -H 192.168.199.129

查看挂载情况

df -hT
192.168.199.129:9421 fuse.mfs 13G 0 13G 0% /opt/mfs

优化客户端
MFS在客户端安装完毕后,会生成/usr/local/mfs/bin目录,在这个目录下有很多命令文件,为了方便使用这些命令,可以将该路径添加到环境变量中

vim /etc/profile
export PATH=/usr/local/mfs/bin:$PATH
source /etc/profile

Mfsgetgoal命令用来查询文件被复制的份数,利用-r命令可以对整个目录进行递归,goal是指文件被复制的份数

mfsgetgoal -r /opt/mfs
/opt/mfs:
directories with goal 1 : 1

Mfsaetgoal命令用来设置文件被复制的份数,生产环境Chunk Server节点数量应至少大于2,文件副本数小于等于Chunk Server服务器的数量

mfssetgoal -r 2 /opt/mfs
/opt/mfs:
inodes with goal changed: 1
inodes with goal not changed: 0
inodes with permission denied: 0

创建测试文件

cd /opt/mfs
touch test
mfsgetgoal test
test: 2

MFS监控 (在Master Server上执行)
Mfsgiserv是用python编写的一个WEB服务器,其监听端口是9425,可以在Master Server上通过命令/usr/local/mfs/sbin/mfscgiserv 来启动

/usr/local/mfs/sbin/mfscgiserv #在客户端上执行
http://192.168.199.129:9425 #通过浏览器访问该地址

下图为登录访问的页面:

转载于:https://blog.51cto.com/13706760/2287867

详细讲解MFS分布式文件系统搭建(内含源码包)相关推荐

  1. RedHat6.4系统下LAMP环境的搭建---(源码包编译安装)---v1.0

    一:配置本地yum源 :--目录 作者:李文轩 座右铭:一个愿意为理想奋斗终生的人! 联系QQ:838997384 网站地址:www.74cto.com 说明:本篇安装的系统版本RedHat6.4(6 ...

  2. CentOS下MFS分布式文件系统搭建

    MFS : 网络分布式文件系统中的一种 Project web site: http://www.moosefs.com/ Installation and using MooseFS: http:/ ...

  3. MFS分布式文件系统搭建

    MFS分布式文件系统介绍 m ooseFS(moose 驼鹿)是一款网络分布式文件系统.它把数据分散在多台服务器上,但对于用户来讲,看到的只是一个源.MFS也像其他类unix文件系统一样,包含了层级结 ...

  4. mfs文件服务器,MFS分布式文件系统搭建

    MFS概述 MooseFS是一个具有容错性的网络分布式文件系统.它把数据分散存放在多个物理服务器上,而呈现给用户的则是一个统一的资源. 优势 1.高可靠(数据的多个拷贝被存储在不同的计算机上) 2.通 ...

  5. spring boot分布式文件系统 毕业设计-附源码182251

    摘  要 随着科学技术的飞速发展,各行各业都在努力与现代先进技术接轨,通过科技手段提高自身的优势:对于分布式文件系统当然也不能排除在外,随着网络技术的不断成熟,带动了分布式文件系统,它彻底改变了过去传 ...

  6. 详细讲解Android中的Message的源码

    相信大家对于Android中的Handler是在为熟悉不过了,但是要知道,Handler就其本身而言只是一个壳子,真正在内部起到作用的是Message这个类,对于Message这个类,相信大家也不会陌 ...

  7. LNMP架构搭建(源码编译)

    1. LNMP架构介绍 LNMP代表的就是:Linux系统下Nginx+MySQL+PHP这种网站服务器架构. Linux是一类Unix计算机操作系统的统称,是目前最流行的免费操作系统.代表版本有:d ...

  8. MFS分布式文件系统的搭建

    MFS分布式文件系统的搭建 一:介绍MFS ​ MFS(MooseFS)是一个具有容错性的网络分布式文件系统.它把数据分散存放在多个物理服务器上,而呈现给用户的则是一个统一的资源. MFS也像其他类的 ...

  9. MFS分布式文件系统的部署

    目录 一.MFS分布式文件系统详述 分布式简介 MFS分布式文件系统的原理 MFS文件系统的组成 MFS文件系统的工作过程 二.MFS分布式文件系统的部署 实验环境 配置Master Server 配 ...

最新文章

  1. VTK:PolyData之GradientFilter
  2. 一个有趣的python排序模块:bisect
  3. 存储管理之页式、段式、段页式存储
  4. ES6-12 array/数值拓展、ArrayOf、ArrayFrom
  5. Json Schema的使用
  6. RabbitMQ/pika模块
  7. 小米崔宝秋:一家互联网公司没有信息安全团队,就像在“裸奔”!
  8. Go 编码建议——功能篇
  9. Java 面向对象编程 tricks
  10. kafka session.timeout.ms 是指消费一条数据的时间?_干货 | Kafka 内核知识梳理,附思维导图...
  11. C++-Qt【1】-退出程序静态调试
  12. 机器学习 Machine Learning- 吴恩达Andrew Ng Week2-Octave
  13. c语言从入门到精通真垃圾,从入门到精通的C语言(吐血量)
  14. vue横向树结构_vue组件横向树实现代码
  15. crontab 问号_轻松搞定crontab和quartz表达式
  16. Xcelsius 2008 在win10 64位系统下 基于OFFICE2010-x64 的安装
  17. PNG的介绍以及PNG文件解析
  18. python报错ImportError: cannot import name ‘Image‘ from ‘PIL‘ 的时候大多数情况下是由于PIL版本和当前python的版本出现了不兼容
  19. 黑马JAVA P121 时间日期:Date、SimpleDateformat、Calendar
  20. 复习C++期末考试题目

热门文章

  1. 华为4G路由器成软银快速部署宽带业务新利器
  2. Windows Server下DB2自动备份、复原和前滚的脚本编程
  3. ASP.NET MVC 第三章 异步提交数据
  4. tags cloud
  5. 【JNI】JNI中java类型的简写
  6. windows server 2008 R2 初试Hyper-V(一)
  7. Hibernate中sessoin的flush学习笔记
  8. 使用Hyperledger Ursa简化区块链安全性
  9. ubuntu bless 16字节每行
  10. “一次性”小家电之死:互联网必是杀手