使用fastDFS搭建分布式文件存储系统

什么是fastDFS

FastDFS是用c语言编写的一款开源的分布式文件系统,它是由淘宝资深架构师余庆编写并开源。FastDFS专为互联 网量身定制,充分考虑了冗余备份、负载均衡、线性扩容等机制,并注重高可用、高性能等指标,使用FastDFS很 容易搭建一套高性能的文件服务器集群提供文件上传、下载等服务。 为什么要使用fastDFS呢? 上边介绍的NFS、GFS都是通用的分布式文件系统,通用的分布式文件系统的优点的是开发体验好,但是系统复杂 性高、性能一般,而专用的分布式文件系统虽然开发体验性差,但是系统复杂性低并且性能高。fastDFS非常适合 存储图片等那些小文件,fastDFS不对文件进行分块,所以它就没有分块合并的开销,fastDFS网络通信采用 socket,通信速度很快。

fastDSF工作原理

FastDFS架构包括 Tracker server和Storageserver。客户端请求Tracker server进行文件上传、下载,通过Tracker server调度最终由Storage server完成文件上传和下载。


fastDSF工作原理
  • Tracker
    Tracker Server作用是负载均衡和调度,通过Tracker server在文件上传时可以根据一些策略找到Storage server提 供文件上传服务。可以将tracker称为追踪服务器或调度服务器。
    FastDFS集群中的Tracker server可以有多台,Tracker server之间是相互平等关系同时提供服务,Tracker server 不存在单点故障。客户端请求Tracker server采用轮询方式,如果请求的tracker无法提供服务则换另一个tracker。
  • Storage
    Storage Server作用是文件存储,客户端上传的文件最终存储在Storage服务器上,Storage server没有实现自己 的文件系统而是使用操作系统的文件系统来管理文件。可以将storage称为存储服务器。
    Storage集群采用了分组存储方式。storage集群由一个或多个组构成,集群存储总容量为集群中所有组的存储容 量之和。一个组由一台或多台存储服务器组成,组内的Storage server之间是平等关系,不同组的Storage server 之间不会相互通信,同组内的Storage server之间会相互连接进行文件同步,从而保证同组内每个storage上的文件 完全一致的。
    一个组的存储容量为该组内的存储服务器容量最小的那个,由此可见组内存储服务器的软硬件配置最 好是一致的。 采用分组存储方式的好处是灵活、可控性较强。比如上传文件时,可以由客户端直接指定上传到的组也可以由 tracker进行调度选择。一个分组的存储服务器访问压力较大时,可以在该组增加存储服务器来扩充服务能力(纵向 扩容)。当系统容量不足时,可以增加组来扩充存储容量(横向扩容)。
  • Storage状态收集
    Storage server会连接集群中所有的Tracker server,定时向他们报告自己的状态,包括磁盘剩余空间、文件同步 状况、文件上传下载次数等统计信息。
文件上传流程
文件上传流程

客户端上传文件后存储服务器将文件ID返回给客户端,此文件ID用于以后访问该文件的索引信息。文件索引信息 包括:组名,虚拟磁盘路径,数据两级目录,文件名。
/group1/M00/00/00/wKgFiF3DfWuANNz4AAAlzCrdDj8028.png

  • 组名
    文件上传后所在的storage组名称,在文件上传成功后有storage服务器返回,需要客户端自行保存。
  • 虚拟磁盘路径
    storage配置的虚拟路径,与磁盘选项store_path*对应。如果配置了store_path0则是M00, 如果配置了store_path1则是M01,以此类推。
  • 数据两级目录
    storage服务器在每个虚拟磁盘路径下创建的两级目录,用于存储数据文件。
  • 文件名
    与文件上传时不同。是由存储服务器根据特定信息生成,文件名包含:源存储服务器IP地址、文件创 建时间戳、文件大小、随机数和文件拓展名等信息。
文件下载流程
文件下载流程

tracker根据请求的文件路径即文件ID 来快速定义文件。
1.通过组名tracker能够很快的定位到客户端需要访问的存储服务器组是group1,并选择合适的存储服务器提供客 户端访问。
2.存储服务器根据“文件存储虚拟磁盘路径”和“数据文件两级目录”可以很快定位到文件所在目录,并根据文件名找到 客户端需要访问的文件。

安装Tracker端
  • 安装依赖
yum install gcc-c++  libevent
  • 安装libfastcommon
    libfastcommon 是 FastDFS 官方提供的,libfastcommon 包含了 FastDFS 运行所需要的一些基础库。
# 安装成功后会自动将库文件拷贝到/usr/lib64下
tar -zxvf libfastcommonV1.0.7.tar.gz -C /usr/local
cd libfastcommon-1.0.7
make.sh
make.sh install

# 由于 FastDFS 程序引用 usr/lib 目录所以需要将/usr/lib64 下的库文件拷贝至/usr/lib 下
cp /usr/lib64/libfastcommon.so /usr/lib
  • 安装tracker
#安装tracker
tar -zxvf FastDFS_v5.05.tar.gz -C /usr/local
cd FastDFS
make.sh
make.sh install
# 安装成功后将安装目录下的文件拷贝到/etc/fdfs
http.conf
mime.types
  • 配置tracker.conf
cp /etc/fdfs/tracker.conf.sample tracker.conf
vi tracker.conf
base_path=/home/fastdfs
http.server_port=80
  • 启动
/usr/bin/fdfs_trackerd /etc/fdfs/tracker.conf restart
安装Storage端
  • 安装依赖
  • 安装libfastcommon
  • 安装tracker
    以上三步同tracker一致
  • 配置storage.conf
cp /etc/fdfs/storage.conf.sample storage.conf
# 修改配置
group_name=group1
base_path=/home/fastdfs
# 如果多个挂载磁盘则定义多个store_path
store_path0=/home/fastdfs/fdfs_storage
store_path2=...
# 配置tracker服务器ip,如果多个则配置多个tracker
tracker_server=192.168.5.134:22122
tracker_server=192.168.5.135:22122
# http端口
http.server_port=80
  • 启动
/usr/bin/fdfs_storaged /etc/fdfs/storage.conf restart
和nginx整合

在 storage server 上安装 nginx 的目的是对外通过 http 访问 storage server 上的文件。使用 nginx 的模块 FastDFS-nginx-module 的作用是通过 http 方式访问 storage 中的文件,当 storage 本机没有要找的文件时向源 storage 主机代理请求文件。

  • fastdfs-nginx-module
tar -zxvf fastdfs-nginx-module_v1.16.tar.gz
cd fastdfs-nginx-module/src
# 修改配置文件 /usr/local改为/usr
ngx_addon_name=ngx_http_fastdfs_module
HTTP_MODULES="$HTTP_MODULES ngx_http_fastdfs_module"
NGX_ADDON_SRCS="$NGX_ADDON_SRCS $ngx_addon_dir/ngx_http_fastdfs_module.c"
CORE_INCS="$CORE_INCS /usr/include/fastdfs /usr/include/fastcommon/"
CORE_LIBS="$CORE_LIBS -L/usr/lib -lfastcommon -lfdfsclient"
CFLAGS="$CFLAGS -D_FILE_OFFSET_BITS=64 -DFDFS_OUTPUT_CHUNK_SIZE='256*1024' -DFDFS_MOD_CONF_FILENAME='\"/etc/fdfs/mod_fastdfs.conf\"'"

# 将fastdfs-nginx-module/src下的mod_fastdfs.conf拷贝到/etc/fdfs/
cp mod_fastdfs.conf /etc/fdfs
# 修改mod_fastdfs.conf 
base_path=/home/fastdfs #保存日志目录
tracker_server=192.168.5.135:22122 #tracker服务器的IP地址以及端口号
storage_server_port=23000 #storage服务器的端口号
url_have_group_name=true #文件 url 中是否有 group 名
store_path0=/home/fastdfs/fdfs_storage  #存储路径
[group1]
group_name=group1
storage_server_port=23000
store_path_count=1
store_path0=/home/fastdfs/fdfs_storage

# 创建nginx/client目录
mkdir -p /var/temp/nginx/client
  • 安装nginx所需依赖
yum -y install pcre pcre-devel  
yum -y install zlib zlib-devel  
yum -y install openssl openssl-devel
  • 安装nginx
tar -zxvf nginx-1.8.1.tar.gz -C /usr/local
cd /usr/local/nginx-1.8.1
# 编译
./configure \
--prefix=/usr/local/nginx \
--pid-path=/var/run/nginx/nginx.pid \
--lock-path=/var/lock/nginx.lock \
--error-log-path=/var/log/nginx/error.log \
--http-log-path=/var/log/nginx/access.log \
--with-http_gzip_static_module \
--http-client-body-temp-path=/var/temp/nginx/client \
--http-proxy-temp-path=/var/temp/nginx/proxy \
--http-fastcgi-temp-path=/var/temp/nginx/fastcgi \
--http-uwsgi-temp-path=/var/temp/nginx/uwsgi \
--http-scgi-temp-path=/var/temp/nginx/scgi \
--add-module=/usr/local/fastdfs-nginx-module/src
# make
make
make install
vi //usr/local/nginx/conf/nginx.conf

server {
        listen       80;
        server_name  localhost;

        location / {
            root   html;
            index  index.html index.htm;
        }

        location /group1/M00 {
        root /home/fastdfs/fdfs_storage/data;
        ngx_fastdfs_module;
    }
}
  • 启动nginx
/usr/local/nginx/sbin/nginx
  • 测试图片上传
[root@fds-client conf]# /usr/bin/fdfs_test /etc/fdfs/client.conf upload /home/test/test.png 
This is FastDFS client test program v5.05

Copyright (C) 2008, Happy Fish / YuQing

FastDFS may be copied only under the terms of the GNU General
Public License V3, which may be found in the FastDFS source kit.
Please visit the FastDFS Home Page http://www.csource.org/ 
for more detail.

[2019-11-07 10:11:55] DEBUG - base_path=/home/fastdfs, connect_timeout=30, network_timeout=60, tracker_server_count=1, anti_steal_token=0, anti_steal_secret_key length=0, use_connection_pool=0, g_connection_pool_max_idle_time=3600s, use_storage_id=0, storage server id count: 0

tracker_query_storage_store_list_without_group: 
    server 1. group_name=, ip_addr=192.168.5.136, port=23000

group_name=group1, ip_addr=192.168.5.136, port=23000
storage_upload_by_filename
group_name=group1, remote_filename=M00/00/00/wKgFiF3DfWuANNz4AAAlzCrdDj8028.png
source ip address: 192.168.5.136
file timestamp=2019-11-07 10:11:55
file size=9676
file crc32=719130175
example file url: http://192.168.5.136/group1/M00/00/00/wKgFiF3DfWuANNz4AAAlzCrdDj8028.png
storage_upload_slave_by_filename
group_name=group1, remote_filename=M00/00/00/wKgFiF3DfWuANNz4AAAlzCrdDj8028_big.png
source ip address: 192.168.5.136
file timestamp=2019-11-07 10:11:55
file size=9676
file crc32=719130175
example file url: http://192.168.5.136/group1/M00/00/00/wKgFiF3DfWuANNz4AAAlzCrdDj8028_big.png
使用Java程序对文件上传下载
  • 依赖
<dependency>
    <groupId>net.oschina.zcx7878</groupId>
    <artifactId>fastdfs-client-java</artifactId>
    <version>1.27.0.0</version>
</dependency>
  • 配置文件
# resoureces/config/fastdfs-client.properties

fastdfs.connect_timeout_in_seconds = 5 #http连接超时时间 
fastdfs.network_timeout_in_seconds = 30 #tracker与storage网络通信超时时间 
fastdfs.charset = UTF‐8 #字符编码 
fastdfs.tracker_servers = 192.168.5.135:22122 #tracker服务器地址,多个地址中间用英文逗号分隔
  • 文件上传
@Test
void testUpload() throws  Exception{
    ClientGlobal.initByProperties("config/fastdfs-client.properties");
    System.out.println("network_timeout: "+ ClientGlobal.g_network_timeout);
    System.out.println("charset: "+ ClientGlobal.g_charset);

    //创建tracker客户端
    TrackerClient tc = new TrackerClient();
    //连接tracker server
    TrackerServer ts = tc.getConnection();
    if(ts == null){
        System.out.println("connect null");
        return;
    }

    //获取一个storage server
    StorageServer ss = tc.getStoreStorage(ts);
    if(ss == null){
        System.out.println("ss null");
        return;
    }

    //创建一个storage 客户端
    StorageClient1 storageClient1 = new StorageClient1(ts, ss);
    NameValuePair[] meta_list = null;
    String item = "E:\\logo.png";
    String fileid = storageClient1.upload_file1(item, "png", meta_list);
    System.out.println("Upload local file " + item + " ok, fileid=" + fileid);
}
输出:
network_timeout: 30000
charset: utf-8
Upload local file E:\logo.png ok, fileid=group1/M00/00/00/wKgFiF3Dj9GAMryVAAAexdAvMYY862.png
  • 文件查询
@Test
public void testFind() throws Exception{
    ClientGlobal.initByProperties("config/fastdfs-client.properties");
    TrackerClient trackerClient = new TrackerClient();
    TrackerServer trackerServer = trackerClient.getConnection();
    StorageServer storageServer = null;
    StorageClient storageClient = new StorageClient(trackerServer, storageServer);
    FileInfo fileInfo = storageClient.query_file_info("group1", "M00/00/00/wKgFiF3Dj9GAMryVAAAexdAvMYY862.png");
    System.out.println(fileInfo);
}
输出:
source_ip_addr = 192.168.5.136, file_size = 7877, create_timestamp = 2019-11-07 11:30:25, crc32 = -802213498
  • 文件下载
@Test
public void testDownload() throws Exception{
    ClientGlobal.initByProperties("config/fastdfs-client.properties");
    TrackerClient trackerClient = new TrackerClient();
    TrackerServer trackerServer = trackerClient.getConnection();
    StorageServer storageServer = null;

    StorageClient1 storageClient1 = new StorageClient1(trackerServer, storageServer);
    byte[] bytes = storageClient1.download_file1("group1/M00/00/00/wKgFiF3Dj9GAMryVAAAexdAvMYY862.png");
    File file = new File("e:/1.png");
    FileOutputStream fileOutputStream = new FileOutputStream(file);
    fileOutputStream.write(bytes);
    fileOutputStream.close();
}

本文所需软件包百度网盘地址
链接:https://pan.baidu.com/s/1Rp7av-rLbXmM6vojvbkmrg
提取码:1maj

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,928评论 6 509
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,748评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,282评论 0 357
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,065评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,101评论 6 395
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,855评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,521评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,414评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,931评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,053评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,191评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,873评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,529评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,074评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,188评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,491评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,173评论 2 357

推荐阅读更多精彩内容