移动互联网、人工智能、5G、IoT等技术的发展,海量的终端催生了越来越高的业务性能需求,越来越多的文件业务场景要求被“加速”,以提供快速响应和高带宽访问。HDD存储设备已无法满足高IOPS、低延迟的业务需求,越来越多的企业数据中心开始选择全闪存的解决方案。据Gartner预计,到2020年数据中心50%的机械硬盘存储将被全闪存存储取代,应用于新数据时代的诸多业务场景。

01 方案背景

海量小文件难题

大数据、人工智能、物联网、智慧金融、电子商务、新媒体等应用产生了大量数据,其中小文件数量可以可轻松达到千万甚至十亿级别。如淘宝、京东等购物网站的海量产品图片;微博微信里用户上传的表情、图片;人工智能领域的人脸识别、安防监控的卡口图片、金融的影像数据等,这些文件在几KB至几百KB不等,数量可达上亿级,属于典型的海量小文件。

海量小文件简称LOSF(lots of small file),业内将大小在1MB以内的文件称为小文件,百万级数量及以上称为海量。LOSF读写性能低下一直是困扰存储界的难题,无论是传统磁盘阵列,还在风头正劲的分布式存储,都无法有效应对海量小文件的I/O压力。

海量小文件的文件尺寸小,因此多个文件在硬盘上的分布不连续,物理位置跨度较大;而文件系统的每次文件访问都会伴随一定的元数据操作,文件数量越多,元数据访问压力越大。因此海量小文件读写是并发随机访问,资源开销大,对存储系统的随机读写性能有极高的要求。而目前的文件系统包括本地文件系统、分布式文件系统等主要面向传统场景设计,在元数据管理、数据布局、缓存策略等方面都侧重于大文件,在海量小文件压力下性能极差,业务访问时常常出现目录无法打开、检索缓慢、响应迟钝、甚至发热宕机等情况。

大文件带宽压力

一方面,小文件的数量在疯狂增长,另一方面,大文件的尺寸在快速增加。如像素越来越高的手机照片、动辄几百GB甚至TB级的4K/8K视频、精密科研仪器产生的大尺寸素材数据。这些数据不仅仅需要海量的存储空间,更需要充足的带宽性能,满足大量数据在快速查看、编辑、处理、共享等多方面的需求。

高清非编为例,它通过多个工作站对于高清视频素材的编辑与渲染,最终处理生成符合播放要求的视频文件。无损4K视频码率可超过300MB/s,压缩后仍有500Mb/s的码率,某些特殊场景因有更高的帧率,码率更可达到惊人的1.5GB/s。

在10个工作站规模、无损4K素材视频编辑时,假设每工作站平均编辑5层4K素材,需要的带宽性能为300MB/s×5×10=15000MB/s。这对于存储系统是一个巨大的性能挑战,SAN文件系统方案架构复杂,且需要很多套光纤阵列支撑;而传统分布式存储需要众多存储节点,且网络延时带来的抖动也很难满足视频渲染的稳定性要求。类似的大文件应用场景,需要更高带宽、更低延时、简单经济的解决方案。

02 FASS文件网关解决方案说明

为满足海量小文件高效管理和大文件的高带宽性能需求,TaoCloud基于FASS分布式全闪存储系统,推出了FASS文件网关解决方案。该方案主要采用分布式全闪存储架构,通过在资源调度、元数据管理、数据组织、I/O 流程优化等多方面优化,可以有效释放全闪存介质的性能,实现海量小文件访问的快速响应;文件网关可以支持多种文件存储协议,实现便捷的数据共享和强大的带宽性能。

△FASS文件网关方案拓扑图

为保障文件网关的高性能表现,方案采用配备全闪存介质的FASS分布式全闪存储集群作为存储底座,FASS使用本地SSD资源创建多个LUN卷,并映射到不同的网关节点。FASS是面向IO密集型应用的高性能块存储系统。它采用高性能的全闪存硬件平台,针对NVMe闪存介质设计了高效的分布式存储软件栈,FASS可将多个节点的SSD资源通过高速以太网或Infiniband网络组成高性能、高可用、易扩展的块存储资源池,并通过iSCSI、iSER、NVMeoF存储接口对外提供超高性能的存储服务。随着业务性能需求的增长,FASS可以通过横向扩展,轻松提升容量与性能。

文件网关相当于IO节点,它们通过高速IP SAN网络访问FASS存储服务,使用iSER协议挂载其LUN资源。每个网关节点以多路径的形式挂载所有LUN卷,并使用其中某个卷作为自己的存储介质资源。各网关节点使用的LUN卷各不相同,可以单独导出文件服务,或将所有LUN创建存储资源池,并以CIFS/NFS/S3等协议对外导出,通过10/25/100Gb以太网为应用提供高性能、易共享、弹性扩展的存储服务。

网关节点本身即一套高可用集群,通过LUN多路径映射以及SAN高可用设计,任何一个网关节点故障后,它的LUN卷会由其他网关节点自动接管,最大允许N-1节点故障,而不影响文件存储服务的正常使用。

FASS文件网关包含IO链路、集群内部、业务访问几层,不同网络可单独配置,也可以复用简化。为保证方案整体性能,推荐配置10Gbps以上网络配置。

FASS文件网关可以提供远高于传统NAS的文件访问性能,满足新兴文件应用场景对于高IOPS和带宽的苛刻要求,参考性能:

03 FASS方案优势

·优秀的性能表现

FASS网关方案采用share-nothing分布式集群架构,可以消除独立元数据性能瓶颈,支持百亿级别文件总数目和千万级单目录文件数目。FASS元数据服务基于内存K/V数据库实现,文件数据与元数据分别存储和管理,具备优秀的性能扩展能力。通过NVMe盘提供极致I/O性能,结合软件层的XPE引擎设计、微控制器技术、轻量元数据索引等机制,块存储端可达到三节点千万级IOPS、微秒级延迟文件存储性能可达到数十万OPS、10GB/S级带宽

·统一存储、便捷共享

FASS文件网关方案同时提供高性能块、文件、对象访问,如CIFS、NFS、FTP、S3、iSCSI、iSER,可以满足用户各类应用的存储访问需求。数据库可以使用iSER高性能块服务,满足关键业务的性能需求;海量小文件或大文件编辑,可以使用NAS协议或POSIX共享访问。方案采用透明共享机制,可以让文件协议和对象协议实现零拷贝数据共享,异构应用可以轻松共享彼此写入的数据,而无需任何拷贝或转换。。

·高可用、灵活扩展

FASS分布式全闪存储系统采用全活高可用架构,可以允许任意节点故障而不中断块存储服务;存储网关通过多路径映射加SAN高可用机制,可以允许N-1个网关节点故障。两者结合,具有极高的业务可用性。

随着业务的增长,方案可以按需配置相应的集群规模,以最小的投入满足业务性能需求。方案前后端相对独立,用户可以根据业务对块存储和文件/对象存储的不性能要求,对FASS存储底座与文件网关可以配置不同的网络、集群规模、硬件规格,以经济灵活的配置,满足业务的实际资源需求。随着集群规模的扩展,文件网关的整体性能呈线性增长。

04 典型业务场景

FASS文件网关解决方案主要面向海量小文件和高业务带宽需求场景,可以通过标准的NAS或CIFS协议,可以便捷的文件共享和高吞吐带宽性能。可广泛应用于AI海量小文件、4K/8K非编、HPC、基因测序、高速数据采集 (雷达、卫星等)等业务场景。

海量小文件

AI人脸识别、大型电商、交通卡口等场景,每天都会产生高级TB量级的小图片文件,这些数据要求保存一定的周期,到期后需要批量删除,集中操作往往给存储系统带来巨大的压力。大量的元数据操作导致传统存储系统对小文件的删除、检索效率极低,读写放大明显,HDD存储系统难以应对如此庞大的文件数据和随机访问压力,成为类似应用的最大性能瓶颈。

FASS网关方案采用分布式轻量级元数据设计,可以支持百亿级别文件总数目和千万级单目录文件数目。结合软件层的的多种优化,可以充分发挥NVMe盘的随机读写性能,应对海量小文件的同时删除或并发随机访问压力。

△FASS文件网关交通卡口海量图片管理

高清非编

4K/8K不仅给播放设备、网络带宽带来的新的挑战,给后端的存储设备更是带来了性能和容量上的巨大压力。视频后期制作通常需要同时编辑多层素材,导致存储带宽需求数倍增长;除了极高的带宽,还要求存储的访问延迟较低,不能存在明显的性能抖动,否则会导致画面卡顿、丢帧等情况,极大影响编辑人员的工作体验。随着业务的增长,视频素材的累积,工作站所需要的存储空间也越来越大,存储设备需要具备强大的扩展能力,以弹性满足业务发展的需要。

FASS文件网关解决方案可以较低的成本提供非编所需的容量、带宽与共享特性,解决4K/8K视频编辑处理面临的性能难题。

△FASS文件网关4K/8K非编应用

高性能计算

随着HPC逐渐往大数据、AI等方向融合和演进,对存储容量、I/O性能、弹性扩展能力提出了更多的要求。多个HPC高工作需要便捷的数据共享,通过文件协议实现高带宽业务访问。也对数据提供出了全场景交叉共享,跨业务自由流动的要求。

FASS文件网关支持多种文件存储协议,高吞吐、可扩展的带宽表现,可以满足多个高性能计算节点的并行数据处理要求,并提供原生的数据共享;内置的冷数据归档功能,可以将重要的结果数据归档至蓝光或云端保存;软件定义方案,支持主流的服务器硬件平台,降低用户建设成本。

△FASS文件网关基因测序HPC应用

(TaoCloud团队原创)

FASS全闪高性能文件网关解决方案相关推荐

  1. 行业典型案例解读 | FASS全闪高性能文件网关解决方案

    伴随移动互联网.人工智能.5G.IoT等技术的发展,海量的终端催生了越来越高的业务性能需求,越来越多的文件业务场景要求被"加速",以提供快速响应和高带宽访问.HDD存储设备已无法满 ...

  2. 为 GPU 而来,焱融科技推出新一代全闪分布式文件存储产品

    随着"东数西算"工程全面开启,打造全国算力一张网按下了"快进键",国家.企业都开始关注算力布局中的机遇和挑战.数据中心作为算力的物理承载,是数字化发展的关键基础 ...

  3. FASS-K8S云原生全闪存储解决方案

    分布式存储|北京大道云行科技有限公司 1 FASS-CSI背景 随着Kubernetes容器编排系统的持续发展,应用程序的开发与部署方式经历了巨大的变革.微服务结构体系的兴起,促使基础架构与应用程序逻 ...

  4. 剑指核心-TaoCloud全闪SDS助力构建高性能云服务

    FASS&裸金属云 相对于虚拟化模式,裸金属服务器为用户提供物理服务器的租赁服务,延续了物理机无损性能这一得天独厚的优势,能够同时满足核心应用场景对高性能及稳定性的严格要求.使用裸金属服务器客 ...

  5. 焱融全闪 X NVIDIA InfiniBand:打造 AI 时代 GPU 计算的高性能存储技术

    InfiniBand 技术正在不断创造更高的数据吞吐量记录,目前 200Gbps 网络已经普及,400Gbps 紧随其后.同时,通过 multi-path 技术将多网卡带宽性能聚合.原生支持 RDMA ...

  6. Memblaze携全闪存VSAN解决方案亮相VMworld2015

    2015年10月13日--Memblaze携最新全闪存Virtual SAN解决方案及新一代PBlaze4 PCIe SSD亮相巴塞罗那举行的VMworld2015(欧洲)大会.作为一种高级的Serv ...

  7. 焱融全闪存储轻松构建百亿私募量化投研平台

    量化业务背景 量化金融指依托金融大数据.金融科技和智能金融的技术进展,通过数量化方式及计算机程序发出交易指令,以获取稳定收益为目的的金融投资方式,在海外的发展已有几十年的历史,其投资业绩稳定,市场规模 ...

  8. 华为庞鑫:闪存3.0时代,四大变化激发全闪存数据中心潜能释放

    从2005年到2019年间,中国数字经济总体规模由2.6万亿元增加至35.8万亿元,数字经济在GDP的占比也由14.2%提升至36.2%.随着数字经济蓬勃发展,数据也成为当之无愧的关键生产要素,是基础 ...

  9. 构筑数字底座,同济医院用全闪存提速智慧医疗

    智慧医疗从未如此受到重视. 今年一场突如其来的新冠疫情,不仅充分证明了数字化技术在科技抗疫中的重要作用,也加速驱动着医院等医疗机构从数字化医疗走向智慧医疗. 事实上,从国务院<关于积极推进&qu ...

最新文章

  1. UvaUva11059 最大乘积
  2. MicroPython支持图形化编辑了:Python Editor带你轻松玩转MicroPython
  3. 人工机器:jetbot小车密码
  4. html布局(盒子)
  5. P5021-赛道修建【平衡树,贪心,二分答案】
  6. 树莓派4b怎么使用usb摄像头_【动手实践】树莓派通过EC20模组访问互联网 by xinlong...
  7. 答网友问:一个abs函数引发的问题
  8. 站在我个人的角度上来说。。。。。
  9. Win11如何提高游戏性能?Win11提升游戏性能的方法
  10. centos7安装zabbix时的一些注意事项
  11. MySpace:.Net架构网站的王者
  12. LoadRunner9 5新特性
  13. springmvc中的session:不比对数据库自动登陆
  14. fragment--总结
  15. git删除远程库文件
  16. 只需 1 分钟,这个网站用 AI 分离歌曲的人声、伴奏和乐器声
  17. [Android实例] 【eoeAndroid社区索引】android开发基础之定位篇
  18. jpg格式怎么转换成plt格式的_JPEG格式图片转PLT格式雕刻输出
  19. java支付宝第三方支付前置流程
  20. 小白的倔强-NPN和PNP三极管的使用区别以及简单检测

热门文章

  1. c语言中0x12是什么进制,C语言中进制知识汇总
  2. 【vsftpd】配置
  3. 【前端大屏实战1】Vue+Echarts -- 大屏简介初体验 => 大屏自适应缩放解决方案 => 使用transform:scale => 组件化抽离ScaleBox=>【两分钟实现大屏宽高等比例】
  4. Docker容器入门及网易最佳实践
  5. 如何获取二维数组的长和宽
  6. 微信小程序点击发送短信验证(60秒倒计时)
  7. 小程序毕设作品之微信电子书阅读小程序毕业设计(1)开发概要
  8. HNOI2016D1T3 树 题解
  9. 51单片机运用数组和if条件语句完成流水灯和蜂鸣器同步
  10. 了解前端工程化之组件化——Vue组件