ver 2.0 2026 年 2 月 6 日
矩阵存储架构前言
矩阵存储架构是空耀对服务器数据安全做出的规范和限制,任何符合此存储规范要求的计算机设备均可通过向空耀官方申请的方式获得该认证的合法使用权力。
目的
矩阵存储架构不仅仅是为了满足存储资源合理利用也是为各大业余服务搭建者提供一份完备、完整、安全同时高速的存储规范。
正文
数据是信息服务的心脏,而存储器就是数据存储的灵魂这篇规范旨在服务业余信息服务器搭建者 (如网站搭建、游戏服务器搭建、信息平台搭建) 。
1 存储器硬件选型规范
存储器在目前和将来的一段时间内都只有两种:基于芯片的固态存储器和基于磁碟存储的机械存储器。
现代存储器优缺点分析:
机械存储的优点是安全稳定和高数据可恢复性,但缺点是随机读取速度非常慢对于网站服务者来说够用,但对于游戏服务或其他对读写密集度要求高的环境来说羸弱的随机读写速度可能会带来很多麻烦譬如突发性卡顿加载速度影响体验等一系列情况。
固态存储器的优点是快速小体积和非常可观的接口丰富度,但缺点是由芯片提供的存储本质上是电子迁移构成的数据读写,因此长时间的不通电冷存储,或介质储存不当会造成主控或芯片故障导致数据恢复性极低所以安全性堪忧。
固态和机械的大类中也有各种不同结构的机械和固态硬盘。
常见的机械盘又分为叠瓦式和垂直式硬盘,叠瓦式由于其磁记录原理导致更容易损坏,因此文后所有提到的机械硬盘均为垂直机械硬盘,以后便不再陈述。
固态硬盘则根据 3d 堆叠层数分为 「SLC MLC TLC QLC 」四种,依次是一二三四层堆叠,堆叠层数越多寿命越低,因此寿命最好的显然是 SLC 但因为多层堆叠技术逐渐成熟 SLC 渐渐被市场所抛弃,转而其余三种登上了存储历史的舞台,为了追求快速稳定我们规定服务使用的固态硬盘必须为 QLC 以上
因此市面上绝对不会有一款既安全又快速的十全十美的存储器,所以我们的要求总结下来即是
1. 机械硬盘提供服务必须使用 cmr(垂直磁记录方式)
2. 固态硬盘提供服务必须使用除 QLC 以外的一二三线厂商出品的硬盘,最好使用 TLC 模拟 SLC 的硬盘以达到安全最大化。
2 磁盘阵列
2.1 磁盘阵列的基本原理
常言道 「孤木难立,孤掌难鸣」 磁盘阵列作用就是用以弥补单盘的各种缺陷,总结来无非就三种 「扩展 (RAID0) 」、 「镜像 (RAID1) 」、 「奇偶校验 (RAID5) 」这三种基本形式,至于三种结合衍生的 RAID50 RAID10 等由于本团队未尝试故此暂不在本版本讨论范围。
磁盘阵列的三种基础形式:
扩展是将多块磁盘虚拟链接起来每个参与链接的磁盘容量叠加形成更大容量的单块虚拟磁盘由于是将文件拆散放在多块物理盘上,因此,读取和写入速度都会大幅增加,但其中一块盘损坏所有数据全部丢失,这也是无论什么时候都不会推荐的阵列。
镜像是将两块硬盘相链接两块硬盘数据产生同步,一边删除另一边同时删除,一边写入另一同时写入,但操作系统会将两块构建成镜像的磁盘识别成一块,因此写入速度取决于木桶最短的那块板 (也就是最慢的那块盘) 而读取速度则是两者相加,这也是最适合服务提供者使用的阵列方式。
相比以上的两种,奇偶校验是更为复杂也是比镜像存储更加节约磁盘空间的存储方案,对于空间使用来说,您可以理解为核心是将整体硬盘当中的 2/3 空间作为数据盘,存储数据,而将 1/3 的硬盘空间作为校验盘存储校验信息,校验一般采用奇偶校验,通过将多块硬盘当中的存储的文件不同部分的二进制相加得到奇偶性,存储在校验盘中,其中任意几个硬盘产生损坏时将校验盘数据与未坏硬盘数据分析还原出坏盘数据达到冗余效果,因此实际容量是组成硬盘阵列的 2/3,也是安全性和空间利用最具性价比的存在,但写入速度由于其需要在写入的过程中对文件进行奇偶校验因此无论是性能还是速度都并不可观,在 windows 下,三块顺序读写 200mb 速度的硬盘组成阵列时,速度也只有仅仅 70mb/s;读取速度则好看些约有 600mb/s 但随机读写依旧拉跨;因此这个方案是不推荐即时性服务提供者使用的。
观察以上的规则我们发现对于业余个人服务提供者使用一块机械盘一块固态盘组成镜像卷既能保障数据安全又能增强数据读取速度,因此
结合以上两大点我们就能得出规则:
3. 必须使用镜像 (RAID1) 或奇偶校验 (RAID5) 组建服务磁盘
4. 镜像需至少 1 块固态硬盘 (可使用 2ssd 或 1ssd+1hdd) 奇偶校验根据实际需求至少包含 1 块固态硬盘。
【关于 Raid5 的使用构建提示】 推荐 4t 以下硬盘 3 块构成单 raid5 软阵列,硬件阵列自行决策,但需要注意恢复与构建速度,避免数据丢失或构建时的时间漫长!
2.2 存储虚拟化 (Storage Virtualization)
存储虚拟化是对传统 RAID 思路的延伸与发展,它们根植于操作系统的底层存储管理框架,通过将多块物理硬盘资源池化,提供条带化、镜像、奇偶校验等多种冗余与扩展机制。与传统硬件 RAID 不同,SV 技术在软件层面实现了灵活的卷管理和文件系统整合。
当今小规模存储简单容易地实现磁盘阵列大多使用此技术,而不同操作系统间也使用了不同技术,接下来为大家解析两种不同且主流的存储虚拟化技术路线
Windows 存储池化技术 Windows 采用的是存储池化技术,俗称 Windows Storage Spaces 。该技术根植于操作系统的底层存储管理框架,通过将多块物理磁盘资源池化,用户可以在其上创建虚拟磁盘,并选择镜像、条带化或奇偶校验等冗余方式,从而实现类似 RAID 的数据保护与扩展能力。与传统硬件 RAID 不同,Storage Spaces 属于 软件定义存储 (SDS) 的范畴,提供更灵活的扩容、管理,并与 ReFS/NTFS 文件系统深度整合。由于其为微软开发的闭源系统,数据恢复难度相对较高。
Linux 存储虚拟化技术 相比之下,Linux 提供了更为多元化的选择。得益于其开源特性,目前主流的存储虚拟化技术包括:
- ZFS 集成了卷管理和文件系统,具备强大的快照、校验和自愈能力,在企业和高可靠性场景中广受欢迎。
- LVM (Logical Volume Manager) 更传统的存储虚拟化方式,广泛应用于 Linux 服务器,提供灵活的卷扩展、缩减和快照功能。
- Btrfs Linux 原生的现代文件系统,支持存储池化、快照和校验和。在部分发行版 (如 openSUSE 、 Fedora) 中已成为默认选择。
总结
总体而言,ZFS 是目前最常用且主流的方案,无论是个人还是企业用户采用率都较高。
Windows 的存储池 (Storage Spaces) 在设计上确实存在一些天然短板。它的层次结构复杂,底层实现闭源,导致外部无法完全掌握奇偶校验布局、偏移管理和元数据机制。再加上微软在不同版本中引入了多种文件系统 (NTFS 、 ReFS),使得存储池在实际应用中呈现出分化状态:同样的阵列结构,不同文件系统的表现差异很大。
这种闭源特性带来的直接后果是:一旦出现故障,恢复难度极高,往往需要依赖第三方工具或专业服务。而在性能层面,Storage Spaces 的阵列实现也普遍不如 Linux 下的开源方案。无论是 RAID5/6 的奇偶校验效率,还是元数据管理的健壮性,Windows 的表现都逊色于 Linux 。
重要提示若需要使用磁盘阵列务必理清文件系统区别,勿贪一时性能择新技术弃成熟技术!
欲知后事如何请见下小章节
2.3 文件系统
对于 Windows 来说,存储池仅仅只是提供一个池化环境,将多块硬盘聚合在一起,但并未对文件系统进行统一。因此在文件系统层面,Windows 提供了两种主要解决方案:
NTFS (New Technology File System)
历史悠久,兼容性极佳,是 Windows 的默认文件系统。
支持访问控制列表 (ACL) 、文件压缩、加密、日志记录等功能。
在稳定性和通用性方面表现突出,但在数据完整性保护上相对有限。
ReFS (Resilient File System)
面向高可靠性和大规模存储场景设计。
具备自动校验和修复能力,能有效防止数据腐败。
与存储池 (Storage Spaces) 深度整合,支持镜像和奇偶校验卷的自愈。
为什么要特别开出此章节?
一开始本团队是极为信任微软公司及其操作系统并自以为文件系统并不重要,一时的贪图性能导致发生了如下灾难性后果:
在一次突发断电事件中,我们团队所依赖的 Windows Storage Spaces 存储池(RAID5/Parity + ReFS) 发生了严重故障。系统首先提示存储池处于 离线状态,无法正常访问。
在尝试恢复过程中,我们进行了 “刷新存储池状态” 等操作,然而这些动作并未真正修复底层的条带与元数据,反而触发了更严重的后果:ReFS 文件系统的目录结构在这种情况下极为脆弱,在元数据损坏后无法承受进一步的操作,最终导致整个文件目录体系彻底崩溃。
由于 Windows Storage Spaces 是闭源实现,其奇偶校验布局、偏移管理和元数据处理方式外界无法完全掌握,这使得我们在故障后无法依靠透明的机制来精确重建或修复。结果是:虽然底层物理数据块仍在磁盘上,但文件系统的目录和索引被破坏,导致数据访问和恢复难度大幅增加,以至于近乎无法恢复。
某种方面来看这种技术完全就是一种不成熟且极为拉跨的技术,微软及其不负责任!
尝试恢复出的文件由于条带混乱产生了无法读取几近报废,因此我们自此彻底放弃微软提供的存储方案,转战 Linux,如若您必须需要使用 Windows 下的存储方案,则必须使用 NTFS 增加断电存活的可能性!
4 补充
以上的内容当然存在一些难以弥补的缺陷和问题,在这块会给予您处理方案和加强规约,如若有不妥之处欢迎指出以丰富完善我们的存储规范。
关于 「TRIM 」功能的使用
TRIM 功能是固态硬盘特有的一套算法机制,该算法机制是为了提升固态硬盘的性能以及寿命,该功能的核心原理是定期擦除不使用的数据块,于此同时使用的一个 「垃圾回收」 机制导致开启功能则文件丢失注定无法找回,即,删除文件标记文件已删除,计算机和主控自动无视删除的数据块并等待这一区域数据块全标记删除时才确定清空抹除数据,在这期间无视的数据块会被系统和硬盘自动隐藏因此无法被任何软件或硬件恢复,这也造成了原本机械盘上数据恢复鲁棒性大大降低 (原本机械盘误删数据可能全都可以恢复,固态一旦开启 TRIM 你就没机会恢复了哦)
提升镜像的写入效率
镜像的读取速度虽快,但对写入速度有一定要求的业余服务提供者来说,如何提升写入速度就成为了最大的问题,但该问题解决方法其实也很简单:使用加速盘即可,最简单的就是傲腾,使用一块价值几元的 16G 傲腾加速盘加速 raid1 目录使用 「write back 」模式,硬盘写入的时候就会把由于写入速度限制暂时无法写入的文件存至傲腾加速盘,与此同时加速盘的文件也会依序慢慢写回硬盘中,相当于给硬盘增加了一个缓存区,就能简单地提升文件写入速度(由于驱动问题已弃用)
因此有最后的补充规约:
5. 如您使用两块固态硬盘构建镜像阵列,您必须关闭其中一块硬盘的 TRIM 功能,以增强阵列安全性
6. 【非必要加分项】 建议使用写入缓存加速镜像写入速度实现完美的服务磁盘搭建
7. 冷热数据分区,对于不同需求度的数据比如备份、 AI 训练集等冷数据必须与实际日常服务提供盘进行隔离两者互为独立物理硬盘以保障数据安全
8. 格式化删除 「三确认」 原则 1. 确认实际文件、硬盘名 2. 确定文件、硬盘大小 3. 确定硬盘序列号
9. 使用专业工具处理硬盘,不使用 windows 自带格式化工具和无法看到目标硬盘序列号的工具处理服务盘