过去,服务器在直连联硬盘驱动器中存储数据的方式是假定硬盘不会变化(即容量固定),以此来创建操作系统和应用,这是遗留至今的一大技术难题。尽管过去十年来,大多数服务器及应用都将文件存储于容量可变、支持逻辑单元 (LU) 的阵列子系统,但这些逻辑单元仍被当作固定尺寸单元或物理单元处理。
操作系统及应用的处理方式短期内很难改变。这就给需要支持大量服务器的公司 IT 部门带来了极大的隐形成本负担。而自动精简配置技术 (thin provisioning) 能减轻传统存储配置方案的成本压力。
本文介绍了自动精简配置技术的工作原理、优点及成功实施需要注意哪些问题。
什么是自动精简配置技术?
自动精简配置技术是一种存储管理功能,可为操作系统提供超大容量的虚拟驱动器,虽然实际容量要小得多。举例来说,存储系统实际只分配了几个 GB 的空间,却能为操作系统提供 2TB 的 LU。应用“认为”LU 非常大,然而实际上大多数空间都是虚拟的。随着应用写入的数据越来越多,实际存储空间也可以即时扩展。
若应用读取此前从未写入数据的区域(无实际存储数据),那么自动精简配置卷会返回以零填充的缓冲区。
在本图中,服务器占用的是自动精简配置卷的虚拟容量。而实际容量则要小得多,仅分配给服务器很少的空间以写入数据。所有虚拟空间都以零填充。随着写入数据的增加,实际存储容量可以即时扩展,而且对服务器不会造成任何影响。
该技术的一大明显优势在于可自动扩展分配卷,无需手动扩展。它的另一大不太容易发现的优势在于能使用户实现近乎 100% 的存储空间利用率,因为所有实际分配的空间都与应用写入的实际数据相对应。
当自动精简配置技术与远程镜像技术结合使用时,又会体现出另一大优势。在此情况下,除了能节约构建镜像所需的大量带宽外,它还能节约镜像两侧的磁盘空间。在基于Block级模块的远程镜像的初创过程中,整个卷都通过 WAN 传输。自动精简配置卷允许只传输实际使用空间,而无需传输整个卷。这就大大缩短了构建镜像所需的时间,同样也能使远程镜像采用低成本通信线路。
采用自动精简配置技术能节约多少资金?
提高存储容量利用率
计算自动精简配置技术可节约多少资金最直接办法是测定存储容量利用率的提升幅度。我们只需查看特定应用当前占用容量,再将该应用载入自动精简配置卷并计算实际占用容量。然后将每年节约的资金加起来,即可得出总共节约的资金。通常情况下,自动精简配置技术可将存储容量利用率由 60% 提高到 80%,这样每年就能节约 20% 的存储成本。
扩展逻辑单元所需的 IT 成本与努力
对大多数应用而言,不管预分配多少存储空间,到一定时候空间肯定会不够用。通常来说,每两到三年就需扩大卷的容量。根据应用、操作系统及存储阵列的功能,扩大卷容量通常需 IT 操作人员花费好几个小时的艰苦努力才能完成。每三年就要扩展每个存储卷,对超过 150 个卷的系统而言,这就意味着平均每周就要进行一次扩展工作。
自动精简配置技术可有效避免上述繁重的劳作。
因扩展卷而停机所造成的相关成本
通常来说,扩展卷都要求停机。虽然 Exchange 等某些应用能支持即时卷扩展,但只有 Exchange 重启后才能使用新的存储容量。根据应用的不同,重启要求不尽相同,但通常都会涉及到成本因素,比如停机造成的生产量减少,周末加班或临时加班的加班费等。在包含数百个卷的系统中,可能每周都要为此而劳作。
自动精简配置技术可避免因此而造成的停机问题。
用电、制冷的相关成本
存储阵列是用电大户且要求大量制冷资源。如果自动精简配置技术能将存储容量利用率提高 20% 到 30%,那么消耗同样多的电量可存储更多的数据。在计算投资回报率时,显然应当考虑到这个问题。
需特殊考虑的问题
与任何新技术一样,自动精简配置技术也有多种不同的实施方案。在实施过程中会遇到新的挑战和问题,我们必须慎重考虑。
最迫切的问题就是存储容量达到最大限度了怎么办。应用认为可用空间大得多,而实际上可用的物理存储空间非常小。一种可能的情况是,实际存储容量达到了极限,要是不增加容量,就不能再访问该卷。
这就把“容量极限”的概念从应用服务器转移到了存储系统本身。令人欣慰的是,应用服务器不用担心容量极限问题,但麻烦的是,存储管理员必须跟踪存储空间扩展情况,并确保提供足够的物理存储空间。
好的系统应当提供足够的信息,使存储管理员能轻松确定何时需扩展新的存储空间,并能预测存储容量的扩展情况。
另一个新的挑战则在于,不是所有文件系统和数据库都能恢复删除的空间。一些文件系统和数据库总是分配占用新的空间,而不是重复使用文件删除后释放的空间。如果应用不断创建并删除文件,自动精简配置系统就会不断扩展并要求更多物理存储空间,而实际上删除文件后释放的空间并没有被重新利用,这样会造成严重的问题。为了成功实施自动精简配置技术,我们建议对自动精简配置卷上的应用进行测试,看看实际存储容量利用率到底如何。
我们还建议咨询厂商,看看有没有工具能测量实际存储容量利用率,或者有什么办法能阶段性地恢复浪费的空间。
根据实施方案的不同,自动精简配置系统对性能会有不同的影响,这是因为其必须管理庞大的表格,而且还要处理潜在的文件碎片问题。我们建议向厂商咨询,以了解能否提供全配置卷与自动精简配置卷的性能对比基准。
自动精简配置技术的未来
自动精简配置技术将成为所有现代存储系统的标准技术。随着该技术日益普及,操作系统与应用不仅要考虑到在精简配置卷上的使用问题,而且还将优化存储分配机制以及所提供的信息,以避免导致此前部分提及的各种问题。
其他相关技术会促进自动精简配置技术的快速推广,如服务器虚拟化技术,特别是 VMware。在服务器虚拟化环境中,每个虚拟机都应有自己的启动卷和数据卷。启动卷的大小由操作系统和启动软件的大小决定,类似于存储器的大小,这是为了在应用发生故障时支持存储器的转储文件 (dump file)。通常说来,用户会为启动分配最小 4 ~ 8 GB,而实际数据还不足 1G。在有数百个虚拟机的系统中,会浪费数 TB 的宝贵存储空间。自动精简配置技术就是解决此类问题的解决方案,能为操作系统分配 8 GB 的卷,而实际上只分配 1 GB 的物理空间。如果应用发生故障,在创建存储器文件时会分配剩余的存储空间。
还有一项肯定会促进自动精简配置方案加速推广的技术就是目前快速流行的固态闪存磁盘 (Flash based Solid State disk)。就此而言,由于这种磁盘比旋转型磁盘 (spinning disk) 价格高,因此我们希望将其存储空间利用率提高到 80% 或 90%。由于固态磁盘不会遇到碎片影响性能的问题,因此在这方面比自动精简配置技术应用于旋转磁盘上要简单一些。
自动精简配置技术使我们能将存储资源管理 (Storage Resource Management) 从应用与文件层 (file level) 分离出来,移交给存储系统和模块Block级层 (block level) 来完成。SRM 软件没有被成功推广的原因之一在于,我们需要测量应用服务器与文件系统层的空间占用情况。在采用不同操作系统和文件系统的成百上千的服务器中,安装并维护这些 SRM 软件简直就是一场噩梦。此外,这种软件也不能提供模块层的可视化信息,因此,如果阵列中的文件系统要用1 TB 空间,但实际是相同的数据要复制三次,SRM 软件根本不能反映出占用空间是 3 TB。
如果采用自动精简配置卷,那么我们就能测量出模块层Block级的空间分配情况,而不是只停留在文件层面上。其优势在于,我们能统一测量空间占用,而不管应用服务器有多少,是何种类型。此外,自动精简配置技术还能了解到模块层Block级上发生的其他其它复制情况。随着自动精简配置技术的推广,新一代 SRM 软件将崭露头角,真正发挥高效作用。
结论
自动精简配置技术因其具备显著节约成本与时间资源的优异特性而日益获得用户的广泛青睐。此外,该技术还有望进一步降低当前存储基础架构的复杂性。本文同时也指出,并非所有应用都适合采用自动精简配置技术,而且随着技术不断向前发展,我们还将遇到更多新的问题。不过,随着该技术日益推广普及,新的相关技术也在不断涌现,在新的技术挑战面前,精简配置卷技术有望成为一统天下的存储空间分配技术。
[ 本帖最后由 武家麟 于 2007-11-30 19:07 编辑 ]

1.png
