快捷分类

一种改进的变预处理SOR-BICR算法

更新时间：2016-07-05

0 引言

最近几年，随着软件和硬件技术的发展，高性能并行计算机不断被研究出来. 因此,使用并行计算机来解决大型稀疏线性方程组问题就成了势在必行的选择. 但是,直接将Krylov子空间方法在并行计算机上运行,求解问题的效率往往非常低,所以研究适合于并行计算环境的Krylov子空间方法的并行算法就显得特别重要. 在主流的分布式共享存储内存并行计算环境中,Krylov子空间方法中的内积计算引起的全局通信制约着并行算法的高效运行. 设计并且实现Krylov 子空间方法并行算法的重要因素,就是限制内积计算对全局通信影响,使其影响降到最低. 文献[1]详细地介绍了这类问题和当前的研究现状.

（3）选定敏捷主管。既可以由团队负责人兼任，也可以由专业人士担任。负责培训敏捷方式，确保敏捷方式得到正确运用，帮助团队消除一切障碍。

在临床工作中，有些疾病的确难以明确诊断；而有些疾病其实并不难诊断。临床上经常会发现一种现象，一位患者到处寻医，长期得不到明确诊断，结果到某个医生手里，一次就医就解决了问题。本文从客观因素和主观因素两个方面来阐述疾病误诊和漏诊的原因，从而提高医务人员对疾病诊断和鉴别诊断的能力。

汪祥等[2]提出了变预处理SOR-双共轭残量算法(简称SOR-BICR),论文通过重构变预处理SOR-BICR算法的计算次序,减少了内积计算,提出了一种改进的变预处理SOR-双共轭残量算法(简称SOR-IBICR),对比变预处理SOR-BICR 算法,变预处理SOR-IBICR算法有着和变预处理SOR-BICR算法相同的数值稳定性,计算量也没加增多少,并且新算法的同步开销降低为变预处理SOR-BICR算法的二分之一.

结论:总而言之,对肠造口患者而言,其可能一生都无法像健康人一样进行排便,因此,掌握造口自我护理技能对改善生活状况、提高生活质量具有极为重要的意义。但由于造口护理具有繁琐性与专业性,护理人员应主动对患者进行指导,帮助其尽快熟悉造口护理。与此同时,医院应主动组织护理人员进行培养,提高其专业技能与知识素养,从而使得其在工作中能游刃有余地对患者进行系统而规范的指导。除此之外,护理人员还应主动为患者介绍相关社会支持机构,便于他们及时有效地获取帮助,从而不断提高肠造口患者的整体生活质量。

1 变预处理SOR-IBICR算法的设计

1.2.1 对照组给予常规治疗与护理方案，即入院后给予常规健康教育，帮助患者及家属尽快熟悉医院情况，遵医嘱服药及接受相关治疗。

其中A∈ R N ×N ,x,b∈RN ,设x0为任意的初始值,为对应的残差向量. 变预处理SOR-BICR 算法表示如下：

注：“静态的学习行为”主要指接收型语言技能(即听和读)的使用;“动态学习行为”主要指口头表达技能（说）的使用。“主动式学习行为”主要指学习者自愿进行的学习活动;“被动式学习行为”则指在他人要求下进行的学习活动。[10]伪静态学习”，即在题海中练习听力和阅读，长时间接触篇幅短小、题材有限、甚至是失真的英语听、读材料。

而变预处SOR-IBICR每次迭代并行计算所需要的时间为：

13）End do.

这座工厂从2019年夏天起，将成为该品牌首款混合动力轿跑车Polestar 1的全球生产基地。Polestar 1能够输出600马力的最大功率，和1000牛·米的峰值扭矩，它在纯电动模式下可以行驶150公里。作为旗舰车型，它的售价预计在15．5万欧元左右（约合125万元人民币，此处为未计算补贴价格，下同）。而将紧随其后推出的Polestar 2，是一款完全由电力驱动的车型，预计定价从4万欧元起（约合32万元人民币）。销售思路有所创新，以定制租赁为主，包括按月付款的全包式购车模式。

在上述变预处理SOR-BICR算法中,第(7)和(12)步要进行内积计算,而内积计算对其余向量的迭代更新密切相关,因此该算法需要两次全局通信. 随着处理机的数量增加,全局通信时间随之不断增长,同时算法的可扩展性受到限制. 为了解决这一问题,通过消除算法1中内积数据相关性来减少全局同信次数,同时保证通信与向量校正、矩阵向量积和内积能够有效的重叠.

定义：

由此第（7）步变成

在分布式存储并行机上的计算,一次通信的开销远远大于一次计算的开销,因此要尽可能使全局通信次数减少.对分布式并行计算机上进行并行算法设计时, 一个很重要的原则就是设法加大计算时间相对通信时间的比重,减少通信次数甚至以增加少量的计算时间来减少通信次数[3].

通信、同步和空闲等需要的运行时间Tcost公式为：

算法2（变预处理SOR-IBICR算法）

与算法1相比,上述算法中,内积计算量有所增加, 然而增加的内积计算也只是在算法的11)步中出现, 并且使用能够并行运行的连续内积替代离散的内积,而且,计算出来的内积运算可以有效地消除了各个内积计算间的数据关联性；同时,把算法1中单次迭代需要两次的全局通信降低为一次.

2 算法的性能分析

本节分析变预处理SOR-BICR算法和变预处理SOR-IBICR算法. 只讨论两个算法中,一个迭代步所需要的并行计算和通信的时间复杂性,两个算法在数学理论上是等价的,只是计算的次序不同, 因此在每一个迭代步中,两个算法有相同的计算量和相同的精度. 表1给出了两种算法每个迭代的计算量和全局通信次数对比.其中T是预处理计算的迭代次数.

表1 算法1和算法2一个迭代步中的计算操作数和全局通信次数对比

方法向量校正矩阵向量乘内积全局通信次数算法1（变预处理SOR-BICR） 6+2T 2+8T 2 2算法2（变预处理 SOR-IBICR） 7+2T 2+8T 3 1

从表1 可以看出,相对于变预处理SORBICR 算法,变预处理SOR-IBICR算法的全局通信次数减少了1次,矩阵向量乘是相同的,虽然多了向量校正. 但影响并行效率高低的限制因素为全局通信, 计算量的少量增加能降低全局通信的次数,进而使并行效率得以提高.我们针对分布式共享存储并行计算机,对算法1和算法2进行性能分析.

目前表达并行算法性能的有如下一些基本指标[4]：

论文在计算中,使用程序级的浮点操作（flops）,设处理机数为P,稀疏矩阵A的维数为N,矩阵A单行非零元素的平均个数为Nz,单浮点数操作的时间为tf,启动消息的时间设为ts,2个处理器之间传递单个字所耗费的时间为tw[4].

在21世纪的第2个10年，自由主义开始声名狼藉。关于自由民主服务中产阶级的能力的问题逐渐凸显；政治变得越来越种族化；在越来越多的国家中，领导人都开始表现出对群众煽动和专制的偏好。这种政治转变的原因是复杂的，但它们似乎与当前的技术发展交织在一起。支持民主的技术正在发生变化，随着人工智能的发展，民主可能会发生进一步的变化。

在这里假设并行计算矩阵是以按行划分为例讨论,其中矩阵阶数N能被P整除,通信是以二叉树进行的且不存在负载不平衡的问题[4].下面讨论Krylov子空间方法并行算法设计中矩阵向量乘、内积计算及向量校正三种运算的并行计算时间[5].

扶贫济困，赈灾救难，是基督教的传统，也是中国传统文化所倡导的。12年来，北辰教堂在服务群众、公益慈善等方面做了许多实事。

（1）矩阵向量乘需要的并行计算时间：

其中Ts,为在单处理机上最佳串行算法运行时间,Tp为在P台处理机上并行运行时间.当S（P）=P时,称这样的并行算法有完全的加速比.

（5）性能改进比率

假设原算法单次迭代并行计算时间是T1,并行化改进的算法单次迭代并行计算用时是T2,新算法相对于原算法计算时间的差量与原算法时间的比称为算法的性能改进比率,记为η：

（6）可扩展性

S为并行算法的加速比,定义为串行时间Tse与并行时间的Tpar之比,即S=Tse/Tpar, 这里,Tcost为通信、同步和空闲等额外开销时间.

由（3.2）,（3.3）和（3.4）知道 ,当 P=1时 ,为串行计算,没有通信时间,因此Krylov子空间方法每个迭代步的串行计算时间为:

在分布式共享内存并行计算机中,关系式ts ＞t w ＞t f ,nm可以忽略不计.则由SSB和SSIB的计算公式有变预处理SOR-IBICR 算法相对于变预处理SOR-BICR算法的加速比C 为：

根据以上内积计算公式改变变预处理SOR-BICR算法的一些计算顺序,得到变预处理SOR-IBICR算法:

并行算法的效率E定义为加速比与处理机台数之比,所以

通常情况下,设问题规模N恒定,额外开销时间Tcost是处理机台数P的增函数,效率E是处理机台数P的减函数,也就是说当P增多,Tcost增大,E却降低, 为了使效率E稳定,就必须满足的值稳定,故处理机数P应该随问题规模N的数值同比增减,才能保持效率稳定,由此定义出的问题规模随处理机台数变化的函数称为恒等效率函数[6]可得：

从表1中看出，第一道气环的闭口间隙较小，第二道及第三道密封环闭口间隙较大，其原理利用第二、三道密封环较大的闭口间隙将其上部的压力泄去，增大第一道环的上下压差，以便活塞顶上的高压气体可以轻易地将缸壁上的机油吹下，减少机油的消耗。所以第二、三道环是不会出现闭口间隙过小的问题，下面通过计算来确认第一道环的闭口间隙允许的最小值。

由上述中Krylov子空间方法计算过程中三种计算的时间公式(3.1), (3.2) 和(3.3) 结合表1中数据有：

很遗憾，Husqvarna品牌仍旧属于摩托车世界中的小众，更多人对于这个品牌的认知还处在最为基本的阶段，甚至能准确拼写这个品牌的名字就已算是相当难得了。不过，如果能亲身体验悬挂Husqvarna标识的摩托车，尤其是VITPLINE家族的车型，那么就能明白这个瑞典摩托车品牌的独到之处了。

变预处理SOR-BICR每个迭代步并行计算所需要的时间为：

当P=1时,为串行计算,无通信,变预处理SOR-BICR算法每次迭代串行计算的时间为：

算法1（变预处理SOR-BICR算法）[2]

考虑如下稀疏线性方程组的求解

变预处理SOR-IBICR算法进行串行计算每次迭代步所需要的时间为：

其中c是一个常数.

由C的计算公式知道,当P增大的时候,变预处理SOR-IBICR算法的加速比可以达到变预处理SOR-BICR算法的2倍.同时比较TS O R −IBICR 和TS O R −BICR ,当P满足：

变预处理SOR-IBICR算法具有比变预处理SOR-BICR算法方法更短的的计算时间. 由式TS O R −IBICR 和TS O R −BICR 分别关于处和则能够得到理论上两种算法具有最小并行时间的处理机台数分为:

因此,可见变预处理SOR-IBICR 算法方法比变预处理SOR-BICR 算法方法具有更好的可扩展性当N为固定值,P为充分大时,变预处理SOR-IBICR算法方法相对于变预处理SOR-BICR算法性能改进比率为：

这说明对比变预处理SOR-BICR算法,变预处理SOR-IBICR算法的性能改进比率理论上可达到50%.

4 两种算法可扩展性分析

变预处理SOR-BICR算法与变预处理SORIBICR算法方法的可扩展性. 从表1每个迭代步变预处理SOR-BICR算法所需要的通信时间为：

使用(3.8)恒等效率公式进行分析比较

2.审计委员会社会独立性研究。中国是一个重视人情的国家，费孝通教授（2007）指出中国特色的人情世故，使得企业内部的组织活动和外部的经营活动，都存在独特的社会关系。那么能否将这种特色的社会关系引入审计委员会？这种社会关系又会怎样影响审计委员会成员的独立性？为此，我们进一步梳理有关社会关系的文献。

变预处理SOR-BICR算法每个迭代步所需要的额外开销时间有下面的表达式：

将方程(3.9),(4.1)代入(3.8),得到处理机台数和并行算法的效率两者的关联公式：

从表1可以得到每个迭代步变预处理SOR-IBICR算法所需要的通信时间为：

系统数据从内容上分为机井地理位置信息基础数据与相关属性数据两部分，从数据的类型上分为空间数据和属性数据两大类。

每个迭代步变预处理SOR-IBICR算法所需要的通信开销时间为：

将方程(3.11),(4.2)代入(3.8)可得到处理机台数和并行算法的效率两者的关联公式：

而和分别是它们的通信时间和额外开销时间,分别是变预处理SOR-IBICR和变预处理SOR-BICR算法方法的串行计算时间. 对比方程N S OR −BICR ，N S OR −IBICR ,在并行计算效率相等条件下,当处理机台数P增多时,N S OR −BICR 中问题的规模增加约是N S OR−IBICR 的2倍, 这说明变预处理SOR-IBICR算法比变预处理SOR-BICR算法方法的可扩展性更好.

参考文献：

[1] 李晓爱, 陈玉花,张耕,王新苹.求解大型稀疏线性方程组的～Krylov 子空间方法的发展[J].科技导报,2013,31(11):68-73.

[2] 汪祥,聂永明,李乐波.变预处理子SOR-双共轭残量法[J].南昌大学学报（工科版）,2011, 33(3):281-284.

[3] 王细薇.利用优化的ORTHOMIN(m)算法求解油藏数值模拟问题[J]. 河南科技, 2012(11):76-76.

[4] 陈国良.并行计算——结构·算法·编程(修订版)[M].北京:高等教育出版社,2003: 77-89.

[5] Zuo Xian-yu, GuTong-xiang, Mo Ze-yao. An improved GPBi-CG algorithm suitable distributed parallel computing[J]. Applied Mathematics and Computation,2010, 215(12): 4101-4109.

[6] Kumar V, Rao V N.Parallel depth first search. Part II.Analysis[J].Int J of parallel programming, 1987, 16(6):501-509.

作者

刘广西，张衡

出处

《福建师大福清分校学报》 2018年第02期

上一篇：没有了

下一篇：PBD闭集H1(6)的有限生成集

《福建师大福清分校学报》2018年第02期文献

壳聚糖对镉污染土壤中油菜生长及镉含量的影响作者：金美芳，陈剑伟，林茂兹，林晨，姚虹

水源涵养型国家重点生态功能区的生态环境评价——以福建省为例作者：林云杉

中国省域环境效率差异及影响因素动态分析作者：孙泗泉，李军军

国内外体力活动研究综述作者：林政梅，王炎丽，许文鑫

福建省高职高专院校啦啦操发展现状与对策作者：黄艳治

一种改进的变预处理SOR-BICR算法作者：刘广西，张衡

PBD闭集H1(6)的有限生成集作者：吴章贵

基于ZigBee与Internet技术的植物培养监控系统作者：吴瑞坤，夏亚军，仇国华，李志煌，黄颖

基于现场数据的多模式智能管理闭环系统研究作者：仇国华，周晨晖，刘应红，曹智

基于FPGA的便携式视频显示系统的设计作者：廖延初

适用于数字信号的多路复用器辅助并行乘法器作者：王锦毅

Hadoop平台下基于快速搜索与密度峰值查找的聚类算法作者：郭友雄，黄添强，林玲鹏，黄维

基于可匿名性的信访信息系统之研究作者：刘政连，许介文，陶春源，陈广普

基于SVG矢量图的高校地图导航应用——以福建师范大学福清分校为例作者：谢超凡，苏彬彬

物联网工程创新性综合实训方案的设计作者：徐世武，苏国栋，钟伟雄

mPE/POE对HDPE的增韧改性研究作者：余立，林爱琴，林渊智，陈国明

谷物蛋白糖基化改性对其功能特性影响研究进展作者：王海林，施源德，陈盛，项雷文

响应面法优化即食鱼肉脯的研制作者：施源德，欧阳锐，陈细婷

杂志信息网

一种改进的变预处理SOR-BICR算法

0 引言

1 变预处理SOR-IBICR算法的设计

2 算法的性能分析

4 两种算法可扩展性分析