更全的杂志信息网

信息网络分布式数据容灾应用研究

更新时间:2016-07-05

随着大型存储系统的广泛应用,对存储虚拟化(Storage Vir⁃tualization)的需求也日益强烈[1,2]。存储虚拟化是为了对不同体系结构存储子系统、以及异构存储设备实现统一的管理,从而为上层应用提供单一视图的存储资源。正是由于具备统一管理的特性,存储虚拟化技术成为各容灾厂商和研究机构争相研究开发的重点,因为统一管理就意味着能够取得存储资源,包括物理和逻辑的控制权,而控制权正是容灾应用的关键所在。文章主要基于存储虚拟化研究,通过构造智能虚拟化模型来实现满足某信息网存储容灾需求的多级和分布式数据容灾机制。

全省已建的山洪灾害防治县级非工程措施在防御2012年汛期的强降雨过程中,发挥了重要的防灾减灾作用,有效避免了群死群伤事件的发生。

1 存储虚拟化技术概述

SNIA(Storage Network Industry Association,全球网络存储工业协会)对存储虚拟化[2]的定义是:1)从应用程序、计算机服务器或者普通网络资源中提取、隐藏或者分离存储系统或者服务的内部功能的行为,其目的是使应用程序和网络与存储或者数据的管理相互独立。2)存储服务或者设备的虚拟化应用,其目的是集中、隐藏复杂性或者为低级存储资源添加新功能。

依据SNIA的观点,从实现的对象来看,可以创建于数据块级、磁盘、磁带、磁带驱动器和磁带库级、文件系统级、以及文件/记录级等虚拟化;从实现的层次来看,可以位于主机/服务器端、网络架构中以及存储设备/子系统里;从技术实现的方法来看,包括带内虚拟化和带外虚拟化两种。

根据存储虚拟化在存储系统体系结构中实现的层次,如图1所示,存储虚拟化可以划分为三类:基于主机层的虚拟化、基于存储层的虚拟化和基于网络层的虚拟化[3~5]

由于各二级容灾备份中心之间进行容灾数据的完整复制,对于数据量大而且机密性高的分布式容灾应用来说,既增加了存储空间占用率,又带来了数据安全性隐患。针对这个问题,文章重点研究(n,m)数据分散算法,通过构造数据分散模型进行容灾数据的片段拆分容灾和片段整合恢复,片段数据将有效减少存储空间占用率,同时片段数据的不可用也增强了数据的安全性,从而实现分布式数据容灾机制的优化。文章采用高效的前向纠错码RS编码技术来实现(n,m)数据分散算法。

表1 三种虚拟化技术特点比较

虚拟化技术 实现方式 优点 缺点

图1 存储虚拟化实现层次

基于主机层一般通过逻辑卷管理来实现对硬件要求较低,成本较低且容易实现消耗资源;其性能、通用性等难满足大型存储环境基于存储层在存储设备的适配器或控制器上实现虚拟化降低了实施虚拟化部署的复杂性缺乏统一标准;无法实现存储产品异构环境整合基于网络层通过交换机、或其他应用设备来实现独立于主机和存储系统;可灵活实施虚拟化服务;便于高层容灾备份的实施需对主机和存储设备有很好的兼容性

如图2所示,假设对一块容量为100MB的物理数据卷PDL(Physical Data LUN)进行虚拟化管理,其中用于索引物理数据块PDB(Physical Data Block)的物理块索引 PBI(Physical Block Index)为1MB,虚拟化管理通过创建一个虚拟头文件VH(Virtu⁃al Header)与PBI建立映射关系,实现虚拟数据卷VDL(Virtual Data LUN)与实际物理数据卷PDL的对应,其中虚拟头文件VH 2MB大小的存储容量取自原有100MB的物理数据卷PDL,剩余98MB用来供上层文件系统存储业务数据。另外,通过存储虚拟化的管理,虚拟头文件VH取得了物理数据块PDB的控制权,能够实现多路控制:一方面可分配给上层文件系统用来数据存储;另一方面也可附加镜像、复制等模块用来实现数据容灾。

基于智能虚拟化的分布式数据容灾实现原理如图4所示,首先由源站点根据目标站点数量n采用循环再分配方式为数据卷VDLS创建多重虚拟头文件VVHS1~VVHSn,存储容量均取自专用的虚拟头文件存储池VHSPS;然后由各目标站点将容灾卷VDLD1~VDLDn分配给源站点,在源站点通过智能虚拟化从专用虚拟头文件存储池VHSPS中创建虚拟头文件VVHS1~VVHSn后,分别与本地数据卷采用复制技术建立容灾关系,从而实现了源站点内100MB数据卷VDLS至各目标站点内100MB容灾卷VDLD1~VDLDn的分布式容灾保护。

2 网络层带内存储虚拟化

在网络层带内存储虚拟化方式下,由于数据和控制信息共用一条通道传输,相对带外方式而言实现较容易。

2.1 工作机制

网络层带内存储虚拟化从技术实现上可以划分为两个层面[6,7]:一个是对物理存储空间的管理,它描述了底层物理数据块在虚拟存储空间中的组织;另一个是对虚拟存储空间的管理,它描述了虚拟数据卷中数据块的组织。抽象数据结构[8]可以清晰地描述物理存储空间和虚拟存储空间之间的关系。下面以例子的形式说明网络层带内存储虚拟化的工作机制。

称为随机过程{X(t),t∈T}在参变量为t时的过程元.其中Oa为动词,c1,c2,…,cn表示Oa的特征,u1(t),u2(t),…,un(t)表示特征在参变量为t时所取的量值,且可以是参变量基元.

文章重点对基于网络层的虚拟化技术进行研究分析。

图2 简化的存储虚拟化模型

2.2 分布式数据容灾应用分析

基于存储虚拟化的分布式数据容灾实现原理如图3所示,首先由源站点根据目标站点数量采用循环再分配的方式创建多重虚拟头文件VVHS1~VVHSn;然后由目标站点将容灾卷VDLD1~VDLDn分配给源站点,在源站点创建虚拟头文件VVHS1~VVHSn后,分别与本地数据卷采用复制技术建立容灾关系,从而实现了源站点内小于等于98MB数据卷VDLS至各目标站点内100MB容灾卷VDLD1~VDLDn的分布式容灾保护。

图3 基于存储虚拟化的分布式数据容灾

由图3可知,该实现方式首先带来与多级数据容灾相同的问题,即当源站点发生灾难后,各目标站点无法直接从本地存储空间中将容灾的业务数据读取出来,而是需要重新开设源站点并进行虚拟化操作来获取容灾数据,从而大大增加了系统的复杂度和恢复风险;其次,为了与各站点建立复制关系,源站点数据卷需要进行多次虚拟化操作来创建相应的虚拟头文件,这就需要数据卷在初始化时就创建好多重虚拟头文件,从而大大降低了系统的灵活度,因此基于存储虚拟化的分布式数据容灾存在一定的局限性,实用性和可用性不强。

3 分布式数据容灾机制设计与实现

3.4 微小RNA 微小 RNA(MicroRNA,miRNA)是高度保守的非编码RNA,它是细胞增殖、生长、分化、迁移和凋亡过程中重要的调节因子。研究表明,miR-21过表达通过调节PTEN基因在卵巢透明细胞癌的发生发展中起重要作用。另一项研究证实miR-191可通过调控组织抑制金属蛋白酶(TIMP)表达在子宫内膜异位症恶变过程中发挥重要作用。TIMP是一种凋亡蛋白,它的表达与细胞生长及侵袭呈负相关。由于miRNA在血液循环中稳定存在,易于检测,因此许多研究者认为miRNA可以作为肿瘤筛查、诊断和预后评估的新指标。

图4 基于智能虚拟化的分布式数据容灾

具体基于智能虚拟化的分布式数据容灾在某信息网存储容灾系统建立中的应用模式如图5所示,各站点部署网络层带内存储虚拟化管理系统,通过对容灾卷的智能虚拟化管理,采用异步复制技术构建分布式数据容灾机制,有效解决现有容灾技术分布式应用的各种问题:

本次研究的病死猪无害化处理系统主要采用BS结构开发,开发环境基于SqlServer 2005数据库、微软Visual Studio 2008、AJAX技术、Silvrelight技术、Css+Div控制技术、PS设计[2]。整个系统采用可视化操作平台和多种应用相互兼容,能实现二次开发,整个结构体系体现了模块化功能,容易推广应用,拓展性更强。

(1)对于管理复杂问题,通过部署虚拟化管理系统来统一实现本地、点对点、多级和分布式等容灾需求,简化了系统的复杂度,使得维护人员仅需掌握单一的操作规程,因此不存在管理复杂问题;

(2)对于应用局限问题,通过虚拟化管理的多路控制,源二级容灾备份中心可以根据容灾需要循环创建虚拟头文件,数量不受任何限制,可以任意增加或者删减,因此也不存在应用局限问题。

图5 信息网分布式数据容灾应用模式

4 分布式数据容灾优化

这三种虚拟化方式各有特点,其中以基于主机层的虚拟化实现最为简单,但应用范围较窄;基于存储层的虚拟化则缺乏统一的业界标准;基于网络层的虚拟化是目前拥有了基于通用标准[6]即FAIS,Fabric Application Interface Standard,光纤架构应用界面标准)的API倡议或API项目的虚拟化技术。三种技术详细对比如表1所示。

4.1 算法实现

基于RS编码技术的(n,m)数据分散算法实现原理如图6所示,将需要分布式容灾的数据卷D以数据块为单位等分为容量大小为m的片断数据(假设数据卷容量大小N为|D|,则片断数据份数N’为N/m),与IDA编码不同,RS编码通过(n-m)×m阶线性独立的范德蒙德矩阵计算每份片断数据的校验数据,然后与原始数据按照类似于RAID 6校验数据左对齐方式共同构成n份片断数据,其容量大小为N’。

程序执行完后,在与该源程序相同路径下找到生成的tree.dot文件。然后用graphviz软件打开该文件,可以看到渲染得到的二叉树图像。代码如图14所示。

首先,与IDA编码类似,设数据卷D=b1,b2,…,bN由一串数据块组成,其中数据块bi可以看作一个整数,且bi∈[0,…,B],取最小的大于B的素数p作为该数据卷中字符运算的模,则D可以看作是经过模p运算的数组成的集合,也就是有限域Ζp中的数组成的集合。

“外师造化,中得心源”这个理论不仅适用于中国的绘画艺术理论,还与西方的绘画艺术理论有共通性。如果向更深层面进行分析,这个理论不仅仅适用于绘画艺术创作,几乎适用于所有的艺术创作活动,像文学、音乐等领域,都要通过“师造化”来表达内心的情感。由此证明,中国的艺术创作理论值得我们去探析、去继承与发展,这对人们的创作活动会起到指导性作用。

基于RS编码的(n,m)数据分散算法描述如下:

图6 基于RS编码的(n,m)数据分散算法

其次,选择合适的整数m,使得n=m+k满足n/m≤1+ε,ε>0。再构建(n-m)×m阶线性独立的范德蒙德矩阵A,其中aij=ji-1

接下来,计算校验数据,通过与原始数据的组合将数据卷D拆分为n个片断数据Di(i=1,…,n):

与氯化铁一样,硫酸铜溶液制版过程对人体几乎没有伤害,是一种“绿色”的制版方法。而因溶液中的二价铜离子(Cu2+)有杀菌作用,硫酸铜有着广泛的用途。如水族业用于清洗水箱,抑制藻类生长;农业中很早用于预防葡萄等果树病害,是著名无机农药波尔多液的主要成分,因此,硫酸铜也被命名为“波尔多蚀刻剂”②。

将数据卷D等分为长度为m的序列,即

深孔水泥灌浆完成后,再进行系统的浅孔水泥化学复合灌浆,复合灌浆以进一步填充前期水泥灌浆可能遗留的较大孔隙裂隙,以进一步提高岩体质量,化学浆液再浸润渗透填充水泥灌浆难以达到的部位,进一步增强围岩的整体性、强度和抗渗性。通过二者作用,首先发挥了水泥灌浆材料的高强、耐久、经济和环保等特点,又利用了真溶液类化学浆材易灌入围岩细微裂隙与孔隙的优点[11]。

最后,将任意m个片断数据Dj(j=1,…,m)整合为数据卷D:

构建一个n×m阶矩阵A,其中aij=(i-1)j-1∈Zm p。矩阵A前m行是一个单位矩阵,删除任意(n-m)行后的矩阵A’为一个可逆矩阵,容易看出:

用(ai1,ai2,…,aim)来表示 A-1的第i行,则对于1≤k≤N/m,

这里i=j模m(即取j/m的余数)(即取大于或等于j/m的最小整数)。

4.2 仿真对比

本文使用Matlab语言编写程序来进行(n,m)数据分散算法的软件仿真,并通过将RS编码与IDA编码比较,为算法的编码方式选择提供科学依据。

4.2.1 数据拆分

基于两种编码技术的(n,m)数据分散算法仿真程序分别对同一个容量大小为1MB的文件进行数据拆分,固定m为3,n从5依次增加到15,该实验重复10次取平均值(以下实验类同),获得两种编码技术数据拆分的时间开销如图7所示。分析可知,随着n的增加,IDA和RS编码时间开销均线性增加,说明两种编码方式的计算复杂度都是线性的,在n相同的情况下,RS编码比IDA编码多耗时5ms左右,说明RS编码效率高于IDA编码。

图7 基于两种编码数据拆分的时间开销(m=3)

4.2.2 数据整合

对上述第二种数据拆分实验进行对应的数据整合实验,随机丢弃2份片段数据后对剩余m份片段数据进行整合,通过测试获得两种编码技术数据整合的时间开销如图8所示。分析可知,在n、m和故障片段数据相同的情况下,两种编码的译码时间开销基本相同,但是随着n和m的增加,RS编码的译码效率略高于IDA编码。

图8 基于两种编码数据整合的时间开销(n=m+2)

5 结束语

存储虚拟化作为存储容灾系统建立的基础,是当前各容灾厂商和研究机构争相研究开发的热点,其通过对存储资源统一管理实现多路控制的技术原理,可以用来构建多级和分布式数据容灾机制。文章提出基于存储虚拟化关键技术实现分布式数据容灾的设计思路,重点研究网络层带内存储虚拟化技术的工作机制和应用模式,分析出该模式在实际应用中存在的局限性,在此基础上,利用网络层带内存储虚拟化技术,通过改进虚拟化管理的数据组织关系来构建智能虚拟化模型,并通过智能虚拟化管理构建实现了分布式数据容灾机制。

通过上述分析,吉奇对弗雷格判断杠的不当使用就很清楚了。弗雷格的判断杠是加在被他称为“语句”的单独词项之前的。因为这样的“语句”本身不具备判断力,而无法被用来做判断,所以当我们想做判断时,就需要通过判断杠将它改造成具有判断力的表达式。弗雷格引入判断杠“|”是必要的,他需要这样一个符号来将已被他剥夺了判断力的语句再恢复判断力。吉奇在没有明确弗雷格本意的前提下就直接借用判断杠“|”,并加在自然语句之前,是错误的。因为自然语句不是单独词项,它本身就携带判断力,没有必要再为它加上判断杠。

参考文献:

[1] 韩德志.云环境下的数据存储安全问题探析[J].通信学报,2011,32(9A):153-157.

[2] Chen Jincui,Jiang Liqun.Role-based access control model of cloud computing[C].2011 International Conference on Ener⁃gy Systems and Electrical Power,ESEP 2011.Singapore:Else⁃vier Ltd,Langford Lane,2011:1056-1061.

[3] 全球网络存储工业协会.网络存储双语词典[M].北京:中国科学技术出版社,2004(15):207,217,223.

[4] Dally W J,Towles B P.Principles and Practices of Intercon⁃nection Networks[J].Macromolecular Materials&Engineering,2014,299(6):707-721.

[5] 胡国忠,刘雪芹,王国成.分布式HSS容灾组网分析[J].通信电源技术,2016,33(02):138-139.

[6] 付江,程永新.基于天基信息基础设施的数据容灾设想[J].通信技术,2016,49(11):1503-1508.

[7] 冀鸣,朱江,曹雄,等.基于云计算的存储虚拟化技术研究[J].网络安全技术与应用,2017(03):84-86.

[8] 朱康林.分布式虚拟化存储在公安专科类学校中的应用[J].计算机科学,2016,43(6A):571-576.

夏红燕
《电脑知识与技术》 2018年第12期
《电脑知识与技术》2018年第12期文献

服务严谨可靠 7×14小时在线支持 支持宝特邀商家 不满意退款

本站非杂志社官网,上千家国家级期刊、省级期刊、北大核心、南大核心、专业的职称论文发表网站。
职称论文发表、杂志论文发表、期刊征稿、期刊投稿,论文发表指导正规机构。是您首选最可靠,最快速的期刊论文发表网站。
免责声明:本网站部分资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有
如有不愿意被转载的情况,请通知我们删除已转载的信息 粤ICP备2023046998号