Fail-in-place高容错技术探讨

发布时间：2021-04-19 16:40:55 所属栏目：传媒来源：互联网

导读：大规模分布式存储被列为明确的发展重点。所谓分布式存储，是相对于传统集中式共享存储的一种新技术概念。在过去30年里，中国企业普遍采用IBM、EMC、NetApp等国外知名厂商的磁盘阵列，其架构体系主要是以RAID控制器为技术核心的集中式共享存储架构。分布式存

“大规模分布式存储”被列为明确的发展重点。所谓分布式存储，是相对于传统集中式共享存储的一种新技术概念。在过去30年里，中国企业普遍采用IBM、EMC、NetApp等国外知名厂商的磁盘阵列，其架构体系主要是以RAID控制器为技术核心的集中式共享存储架构。分布式存储是通过软件定义存储技术，把多台x86服务器的CPU、内存、固态硬盘(SSD)、机械硬盘(HDD)等存储资源，进行统一资源管理，通过高速网络将数据分散存储在各台服务器中。

自云计算诞生以来，企业井喷式的数据处理业务量对IT的系统计算与存储能力都提出了非常高的要求。传统集中式存储面临数据孤岛、扩展困难、成本高昂等挑战，与此同时，分布式存储由于其易于扩展和管理、成本低、硬件灵活度高、可快速集成等明显优势，逐渐成为全球的技术发展趋势，也将作为中国企业数字化转型的重要基石。

分布式存储是一个技术难度被显著低估的技术领域。随着HDFS、Lustre、GlusterFS、Ceph等开源分布式软件项目的兴起，一个中等程度的软件工程师可以在一天或一周时间内搭建一个分布式存储系统。包括华为、新华三、BAT、以及一些初创公司，在这些开源项目基础上通过魔改，推出分布式存储相关产品和服务，给行业带来严重假象，似乎存储没有什么技术门槛。然而，无论是互联网公司，还是在企事业单位，由于使用分布式存储导致的业务中断、甚至数据丢失的报导屡见不鲜。

为什么(分布式)存储是一个技术壁垒很高的行业?这是由于存储最基本的核心诉求是数据不丢失、业务不中断。一个典型的存储系统包含上百万个电子元器件、上亿行软件代码，里面任何一个元器件老化失效、电子信号干扰、软件Bug、系统意外掉电，都有可能导致数据丢失。由此可见，要打造一个高可靠、高性能的分布式存储系统绝非易事。

一个合格的存储系统须具备高度容错能力，是能够在线更换故障或老旧部件的软硬件系统，需要同时满足几个方面的要求：高可靠性的数据存储基础、对数据错误具有自愈能力、正常运行和自愈过程均对前端应用无性能影响、以及较高的存储效率。存储系统的数据安全性就好比飞机的安全性，业务中断就好比重大飞行事故，数据丢失对于一个存储系统而言，就好比飞机失事，带来灾难性的破坏和难以估量的重大影响。

飞机是一个典型的具有高度冗余、高容错性的机电系统，其安全性依赖于Fail-in-place(FIP)高容错技术，即在飞行过程中，飞机任何零部件发生故障或失效故障时，飞机仍然可以安全返回机场并平安着陆，然后才进行必要的维修。FIP容错的一个重要特征是，允许故障延迟修复，而不是必须立即解决或以最快的速度修复故障，否则可能会发生灾难性事故。要实现FIP容错，飞机采用了高度冗余设计，具备极强的故障告警、自动诊断、故障隔离，甚至自我修护的能力。

基于三副本架构的分布式存储是否具备FIP容错能力呢?答案是否定的。

三副本分布式存储通过将数据的三个副本分散保存在三个不同节点上。这种纯粹的网络副本保护机制虽然实现简单，但其数据可靠性严重依赖数据修复的速度和系统规模。随着硬盘数量增加，系统可靠性随之降低，尤其是当磁盘老化、硬件故障率上升，再加上网络可能出现的不稳定状况，以及磁盘可能出现的隐形数据失真等，三副本架构容易出现不稳定，甚至数据丢失的情况。当出现硬盘或节点故障时，三副本架构需

（编辑：我爱制作网_潮州站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!