图形处理器加速算法在复杂高层结构非线性响应分析中的应用

李红豫1,2,滕 军3,李祚华3,张 璐4

(1.桂林理工大学土木与建筑工程学院,桂林 541004;2.桂林理工大学广西有色金属隐伏矿床勘查及材料开发协同创新中心,桂林 541004;3.哈尔滨工业大学深圳研究生院深圳市城市与土木工程防灾减灾重点实验室,深圳 518055;4.伊利诺伊大学芝加哥分校土木与材料工程系,美国芝加哥60607)

摘 要:目前有限元分析软件多基于中央处理器的平台方式构建,在处理复杂高层结构非线性响应分析时暴露出计算耗时多、计算效率低以及对计算硬件要求高等问题。图形处理器由于其硬件构造的先天优势,可以提供十倍乃至上百倍于中央处理器的浮点运算和并行计算性能,因而为高层结构非线性计算所面临的瓶颈问题提供了一个切实可行的解决方法。该文在构建异构并行计算平台的基础上,提出一种适用于图形处理器加速的有限元并行数值计算方法。该方法利用精细化结构分析模型的自由度数据和图形处理器中的线程建立一一对应映射关系,对动力响应的隐式积分算法进行图形处理器线程级的并行化处理,并且结合 EBE单元级的优化存储空间机制,降低系统方程组求解时对内存空间的需求。通过对比振动台试验结果对该方法进行验证,并对实际高层钢筋混凝土框筒结构工程进行弹塑性地震响应分析,结果显示该文所提方法在保证模型精度前提下能有效提高大型复杂高层结构非线性响应分析效率。

关键词:非线性响应分析;图形处理器;高层结构;并行计算;EBE

随着精细化建模的发展,复杂高层结构分析模型自由度数量巨大,计算耗时长制约着有限元进一步在复杂高层结构分析中应用推广。现有的有限元软件平台多基于单一中央处理器(CPU)串行方式构建,在弹塑性地震响应分析中尤其是针对大震作用下的结构响应分析,其计算耗时多已然成为高层结构抗震设计的瓶颈[1]。如何实现高效的有限元分析,成为迫切需要解决的问题。近年来图形处理器(GPU)已远超“摩尔定律”的速度飞速发展,不仅有效提高了图形处理的速度,而且很大程度地提高了与计算机图形相关应用领域的发展。由于图形处理器具有强大的浮点运算能力,基于图形处理器的并行计算已经成为国内外研究的热点。

图形处理器的并行计算主要应用于求解工程领域形成的系统方程组,分别在直接法和迭代法的并行算法开发与实施上的研究成果较多。He等[2]实现了LU分解方法;Yang等[3]和Naumov等[4]分别采用Cholesky分解和不完全Cholesky分解;Li等[5]采用不完全 LU 分解;高家全和王志超[6]采用SSOR预条件;陈曦等[7]和 Serban等[8]采用预处理Krylov子空间迭代法。上述研究成果与中央处理器的串行方式求解比较,图形处理器的并行计算都获得了至少10倍的加速。

图形处理器在非线性有限元方面获得了一些应用[9-11]。文献[12-14]采用图形处理器求解有限元系统方程,用于加速求解非线性问题,但这些应用暂且局限于平面问题。

目前,大型通用有限元软件ABAQUS的6.12版本提供GPU加速功能,它是基于现有CPU串行平台进行的改进,只在求解过程中某一环节利用GPU并行技术,软件主体框架仍然是基于CPU串行平台的。ABAQUS软件的GPU加速功能只限于ABAQUS/Standard模块中的对称直接稀疏(sparse)方程组求解器,而 ABAQUS/Explicit模块中暂不支持[15]

本文在结构非线性有限元分析高效计算平台HSNAS(GPU)(high-rise structure nonlinear analysis software based on GPU,软件著作权编号:2014SR086353)[16]基础上,提出一种适用于图形处理器加速的有限元并行数值计算方法。该方法利用精细化结构分析模型的自由度数据和图形处理器中的线程建立一一对应映射关系,对动力响应的隐式积分算法进行图形处理器线程级的并行化处理,并且结合EBE单元级的优化存储空间机制,以此降低系统方程组求解时对内存空间的需求,提高结构有限元分析的求解规模和计算效率。HSNAS(GPU)从平台搭建、软件整体框架设计到有限元并行算法开发,始终贯穿 GPU并行技术,从本质上突破目前国内外分析软件多基于单一平台的构建方式及大型复杂结构在单一 CPU串行有限元软件平台上计算耗时多的瓶颈,为复杂高层结构提供高效实用的数值分析平台。

1 图形处理器并行计算原理及有关算法

1.1 图形处理器并行计算原理

从硬件上来说,图形处理器执行资源组织成多核流处理器,也就是所谓的流处理核心,如图1所示。而目前的中央处理器多为8核、16核或者32核心。相比之下,目前英伟达(Nvidia)设计生产的图形处理器多达 5760个流处理核心。中央处理器的核心通常同一个时刻只能运行一个线程(thread)的指令。而图形处理器从硬件的设计目标来说就是以大量线程实现面向吞吐量的数据并行计算,非常适合大规模数据并行计算。

随着图形处理器硬件技术飞快发展,并行计算正在从单一的中央处理器多核向中央处理器协同图形处理器众核处理的方向发展。为了实现这种新型计算模式,英伟达发明了CUDA(compute unified device architecture)并行计算架构[17]。在CUDA编程模型中,中央处理器被视为主机(Host),图形图利器被视为设备(device)。开发人员可利用C、C++、Fortran等语言来为CUDA架构编写内核(kernel)程序。为了利用图形处理器的众多线程核心计算单元去实现数据密集计算的目的,并行算法开发的总体思路为:采用CUDA编程模型对原适合于中央处理器串行计算的程序进行开发,有效组织线程层次结构并对内核函数进行设计。

图1 图形处理器多线程执行模式
Fig.1 Multithread execution mode of GPU

从有限元离散化角度出发,结构经过有限元离散处理之后,最小的计算数据是单元节点的自由度对应的物理量。因此将各自由度对应的计算数据与图形处理器的线程一一对应是一种有效可行的并行策略。换言之,在全局坐标下的矩阵/向量(刚度矩阵、荷载向量、位移向量等)的元素映射到图形处理器的线程上,以图2中给出的位移向量中各自由度对应的位移未知量与线程的映射关系为例,利用众多线程拥有相同的指令地址,从而实现计算数据的并行执行。

图2 自由度与线程对应的并行策略
Fig.2 Schematic of parallelism of threads to DOFs

1.2 单元级的方程组求解算法

图形处理器能够加速密集的数值运算,但只能加速并行运算性能好的数值运算。有限元法的运算主要在求解方程组与形成刚度矩阵,而用串行的算法集成有限元刚度矩阵是相对较好的,所以大多数基于图形处理器的有限元计算是从加速有限元线性方程组这方面着手的。当问题规模变大,刚度矩阵大,矩阵半带宽大,存储这些刚度需要更大的空间,因此在这里,提出采用迭代方法求解线性方程组,结合单元级的EBE(element-by-element)并行策略用图形处理器实现算法加速。这个算法最终引入到求解结构动力方程的时间积分法当中去,进而实现高效的结构非线性响应分析。

本文对结构非线性响应分析的计算流程包含两个阶段:一是每个时间步的动力方程时间积分求解;二是时间步内的非线性方程组迭代求解。第一阶段采用 Newmark时间积分法,第二阶段采用 Newton-Raphson迭代法[18]。其中第二阶段的Newton-Raphson迭代法第k荷载步下第j次迭代方程为:

其中:

式中:D为单元刚度矩阵;B为应变矩阵。

式(1)写成有限元方程组的基本形式Ax=b,可采用预处理共轭梯度法(PCG)进行求解,图形处理器上进行的PCG并行算法流程图如图3所示。

在采用 PCG迭代法求解方程组的过程中,结合EBE并行策略,将结构的“整体”计算分解到“单元”上,进而实现扩大求解规模的同时使得并行效果进一步提升。EBE算法可描述为:

其中,为单元对应的位移向量,由第i号单元各结点编号决定。

图3 基于图形处理器的PCG并行算法
Fig.3 Flow chart of GPU-based PCG algorithms

EBE的计算步骤如图4所示,在方程组迭代过程中采用“提取→计算→散布”的步骤实现相对单独的单元级上计算。具体步骤如下:1)由()定位提取出第i号单元在整体位移向量中的单元级对应的向量;2)接着进行矩阵与向量乘法计算,其中为单元刚度矩阵;3)最后根据单元在整体结构中的定位,将获得的单元级上的计算结果散布到整体向量中去。从整个计算过程看出,EBE算法避开了总体系数矩阵的合成,不需要开辟系数矩阵的存储空间,因此从计算量还是存储空间而言,都非常小。

图4 方程组迭代过程中的EBE技术
Fig.4 EBE technique of in the equations iterative process

2 高效计算平台HSNAS(GPU)

基于CUDA编程模式,构建的混合编程异构平台HSNAS(GPU),平台配置了Intel Xeon E5-2680V3的中央处理器和Nvidia 生产的型号为Tesla K40C的图形处理器,该图形处理器能提供 2880个流处理核心。基于该计算平台研制的程序软件包括主程序及8个模块,其中cudafor为使用CUDA Fortran编程必须使用的模块,cublas为基本矩阵与向量的函数库,其余模块为内核函数模块(kernel)、几何模块(geometry)、刚度模块(stiffness)、质量模块(mass)、荷载模块(load)以及求解模块(solve)。

前期研究已在平台上建立了基于空间纤维梁柱单元[19]及分层壳单元[20]的复杂高层建筑结构的精细化模型,并且实现了塑性-损伤混凝土滞回本构模型的应用[21]

基于平台预留的子程序接口,本文对平台的求解器进行二次开发,利用图形处理器的高效并行计算能力,开发单元级并行求解线性方程组的 PCG算法求解器,最终该求解器引入到求解结构动力方程的时间积分法当中去,进而实现高效的结构非线性响应分析。

3 验证及应用

3.1 振动台试验验证

文献[21]在HSNAS(GPU)平台上对同济大学12层钢筋混凝土框架结构振动台试验模型进行模拟,验证了计算模型的有效性及平台的计算精度,先前研究表明 HSNAS(GPU)平台能适用于钢筋混凝土结构在“大震”(罕遇地震,50年超越概率2%~3%)作用下的非线性动力响应分析,且相较于 CPU串行计算,GPU的加速算法获得了至少12倍的计算加速比。考虑到规范的大震作用下结构有可能并未进入强非线性阶段,为了验证HSNAS(GPU)在强非线性下的算法收敛和加速优势,采用同样的计算模型(如图 5所示),通过划分不同单元尺寸,获得不同自由度的计算模型,对各计算模型输入峰值为500 gal的地面运动加速度,进而对比强非线性下的加速比。图6给出HSNAS(GPU)相对于ABAQUS的加速比,从图中看出,随着模型网格增密,自由度数增大,HSNAS(GPU)加速比呈基本线性增长,加速比超过一定数值(本例为自由度数11000)之后,对于强非线性下的加速比达到16。由于计算效率受到弹塑性计算迭代的影响,加速比的增长趋势逐渐变缓。

图5 振动台试验模型和有限元模型
Fig.5 Profile of shaking table test model and corresponding FEA model

图6 HSNAS(GPU)相对于ABAQUS的加速比
Fig.6 Comparison of speedup of HSNAS(GPU)and ABAQUS

3.2 实例应用

3.2.1 工程概况

深圳达实大厦位于深圳市南山区高新科技园南区,毗邻科技南一路,与地铁一号线深大站无缝衔接。该建筑结构为框架-核心筒体系的办公大楼,结构主屋面高度188.85 m,建筑总高度为199.85 m,建筑平面为一矩形平面,尺寸长宽为 40.9 m×46.7 m,核心筒外围尺寸14.0 m×29.8 m,核心筒高宽比约13.5。主塔楼地上41层,地下4层,办公楼标准层高4.35 m,塔楼首层和典型开洞楼层存在穿层柱,2层到 7层有一根斜柱,在第 7层设有12.0 m通高绿色架空花园。裙楼采用框架结构,地上3层,地下4层,建筑立面效果图和剖面图如图7所示。ABAQUS模型的单元划分保持一致,结点总数均为13 409,单元数为21 657,其中梁单元8 903个,壳单元12 754个,模型总自由度数为79 650。

图7 建筑效果图和剖面图
Fig.7 Architecture and elevation drawings of Shenzhen Dashi building

图8 框架-核心筒结构有限元模型
Fig.8 FEA model of frame tube

采用传统集成总体刚度方法与 EBE处理方法的存储量对比如表1所示。从表中看出,若采用传统方法,需要存储总刚度、总质量、总阻尼这类大型矩阵,需要至少11.57 GB的存储总量,而采用了EBE技术之后,占内存非常小,能够有效解决复杂结构模型求解过程中存储需求量大的瓶颈问题。

表1 各集成总刚方法与EBE处理方法的存储量对比
Table 1 Comparison of storage space between assembly and EBE

3.2.3 动力特性分析

ABAQUS模型与 HSNAS(GPU)模型采用完全相同的梁单元和壳单元,ABAQUS空间梁单元的混凝土应力-应变关系采用的是对用户自定义开发平台VUMAT上进行材料本构模型的二次开发[22],以此保证ABAQUS与HSNAS(GPU)采用相同的混凝土塑性损伤模型。表2给出 ABAQUS模型与HSNAS(GPU)模型前5阶的自振周期对比,最大误差出现在第三阶扭转振型,误差为5.13%,从对比分析可知本文算法能较好反映结构的动力特性。

表2 模型振动特性对比
Table 2 Comparison of dynamic characteristics

3.2.4 大震弹塑性响应分析结果

地震波输入采用一条人工波和两条天然波,地震波加速度时程曲线如图9所示,编号分别为DZ1、DZ2、DZ3,加速度峰值调整为 220 gal,相当于7度罕遇地震,地震作用方向为xy双向(加速度峰值xy=1∶0.85)。在动力弹塑性分析之前,进行了重力作用下的受力分析,以变形后的结构状态作为动力弹塑性分析的初始状态。表3和表4对比了顶层最大位移和基底剪力最大值,本文算法与ABAQUS计算结果最大误差分别为5.82%和7.30%。

图9 地震波加速度时程曲线
Fig.9 Acceleration time history curves of earthquake waves

表3 顶层最大位移计算结果对比 /m
Table 3 Comparison of top floor displacement

表4 基底剪力计算结果对比 /(×104kN)
Table 4 Comparison of base shear

3.2.5 计算效率

采用ABAQUS软件和本文基于HSNAS(GPU)平台研制的算法程序对同一模型在相同计算机硬件上完成20s时长的罕遇地震作用下弹塑性时程分析,两者的计算耗时列于表5。需要指出的是,ABAQUS采用的是动态显式算法,不用直接求解切线刚度,时间步长只要取得足够小即可收敛。为满足显式算法的有条件收敛,本例稳定时间步长取值为Δt=7×10-6,计算耗时约3 d时间(71 h 10 min)。虽然采用显式方法不需要进行平衡迭代,但其算法的计算时间成本大致与最小单元的尺寸成反比,由于本实例模型中存在一些小尺寸单元,导致稳定时间步长大幅度降低,整个计算耗时较多。而本文采用的是隐式动力分析算法,每次迭代步都要求解大型线性方程组,这个过程占用大部分计算时间针对最为耗时的这个步骤本文采用了图形处理器加速计算,计算耗时不到0.5 d时间(10 h 20 min),相对于ABAQUS的加速比为6.9倍。表6列出了未采用GPU加速(串行算法)耗时与采用GPU加速(并行算法)耗时,针对算法本身而言,若是CPU串行求解,计算耗时非常大,采用GPU加速后获得13.7倍加速比,加速效果理想。上述分析表明 GPU在弹塑性时程分析过程中加速迭代求解具有较大的优势。

表5 ABAQUS和HSNAS(GPU)总计算耗时和加速比
Table 5 Total computational time and speedup of HSNAS(GPU)and ABAQUS

表6 未采用和采用GPU加速算法的总计算耗时和加速比
Table 6 Total computational time and speedup of CPU and GPU based algorithms

4 结论

本文在构建的异构并行计算平台基础上,采用图形处理器加速有限元并行数值计算,提出自由度与线程映射模式的并行化策略,开发EBE单元级的方程组求解器,并且引入到求解结构动力方程的时间积分法中,进一步扩大图形处理器在复杂结构非线性响应分析的应用。通过与振动台试验结果进行对比对本文算法进行了验证,并对高层钢筋混凝土框筒结构实例进行弹塑性地震响应分析,研究结论如下:

(1)建立图形处理器中的线程与自由度对应计算数据的映射关系,可以实现大规模计算数据的并行计算,采用CUDA编程模型在异构平台上开发了线性方程组并行求解器,进而提高结构动力方程的时间积分算法求解过程。

(2)在实例应用中,图形处理器加速复杂高层建筑结构的非线性响应分析效果显著,并且采用了EBE优化存储空间机制,扩大求解规模的同时使得并行效果得到进一步提升。

(3)HSNAS(GPU)异构平台和分析程序不基于任何现有软件,从平台搭建、软件整体框架设计到算法开发,始终贯穿 GPU并行技术,是一种新型实用的分析平台,为复杂高层结构弹塑性地震响应分析提供了新思路。

参考文献:

[1]李云贵.工程结构设计中的高性能计算[J].建筑结构学报,2010,31(6): 89―95.Li Yungui.High-performance computing in structural design [J].Journal of Building Structures,2010,31(6):89―95.(in Chinese)

[2]He Kai,Tan Sheldon X–D,Wang Hai,et al.GPU-Accelerated parallel sparse LU factorization method for fast circuit analysis [J].IEEE Transactions on Very Large Scale Integration(VLSI)Systems,2016,24(3): 1140―1150.

[3]Yang D,Peterson G D,Li H.Compressed sensing and Cholesky decomposition on FPGAs and GPUs [J].Parallel Computing,2012,38(8): 421―437.

[4]Naumov M.Parallel solution of sparse triangular linear systems in the preconditioned iterative methods on the GPU [R]// NVIDIA Corporation,Westford,MA,USA,Technology Report NVR-2011-001,2011.

[5]Li R,Saad Y.GPU-accelerated preconditioned iterative linear solvers [J].The Journal of Supercomputing,2013,63(2): 443―466.

[6]高家全,王志超.基于GPU的SSOR稀疏近似逆预条件研究[J].浙江工业大学学报,2016,44(2): 140―145.Gao Jiaquan,Wang Zhichao.Research of the SSOR sparse approximate inverse preconditioner on GPUs [J].Journal of Zhejiang University of Technology,2016,44(2): 140―145.(in Chinese)

[7]陈曦,王冬勇,任俊,等.CPU-GPU 混合计算构架在岩土工程有限元分析中的应用[J].土木工程学报,2016,49(6): 105-112.Chen Xi,Wang Dongyong,Ren Jun,et al.Application of hybrid CPU-GPU computing platform in large-scale geotechnical finite element analysis [J].China Civil Engineering Journal,2016,49(6): 105―112.(in Chinese)

[8]Serban R,Melanz D,Li A,et al.A GPU-based preconditioned Newton-Krylov solver for flexible multibody dynamics [J].International Journal for Numerical Methods in Engineering,2015,102(9):1585―1604.

[9]Fazanaro F I,Soriano D C,Suyama R,et al.Numerical characterization of nonlinear dynamical systems using parallel computing: The role of GPUs approach [J].Communications in Nonlinear Science and Numerical Simulation,2016,37: 143―162.

[10]Mafi R,Sirouspour S.GPU-based acceleration of computations in nonlinear finite element deformation analysis [J].International Journal for Numerical Methods in Biomedical Engineering,2014,30(3): 365―381.

[11]Yang Y,Yang C,Hsieh T.GPU parallelization of an object-oriented nonlinear dynamic structural analysis platform [J].Simulation Modelling Practice and Theory,2014,40(1): 112―121.

[12]Cai Y,Li G,Wang H,et al.Development of parallel explicit finite element sheet forming simulation system based on GPU architecture [J].Advances in Engineering Software,2012,45(1): 370―379.

[13]刘小虎,胡耀国,符伟.大规模有限元系统的 GPU加速计算研究[J].计算力学学报,2012,29(1): 146―152.Liu Xiaohu,Hu Yaoguo,Fu Wei.Solving large finite element system by GPU computation [J].Chinese Journal of Computational Mechanics,2012,29(1): 146―152.(in Chinese)

[14]蔡勇,李光耀,王琥.基于多重网格法和 GPU并行计算的大规模壳结构快速计算方法[J].工程力学,2014,31(5): 20―26.Cai Yong,Li Guangyao,Wang Hu.A fast calculation method for large-scale shell structure based on multigrid method and GPU parallel computing [J].Engineering Mechanics,2014,31(5): 20―26.(in Chinese)

[15]DS Simulia Corporation.Abaqus 6.12 analysis user’s manual [Z].2012.

[16]李红豫,滕军,李祚华.钢筋混凝土框架结构非线性静、动力分析的高效计算平台HSNAS(GPU)——I程序开发[J].振动与冲击,2016,35(14): 47―53.Li Hongyu,Teng Jun,Li Zuohua.An efficient platform HSNAS(GPU)for nonlinear static and dynamic analysis of reinforced concrete frames—I.Program development[J].Journal of Vibration and Shock,2016,35(14): 47―53.(in Chinese)

[17]Sanders J,Kandrot E.CUDA by example: an introduction to general-purpose GPU programming [M].Addison-Wesley Professional,2010.

[18]孙宝印,古泉,张沛洲,等.钢筋混凝土框架结构弹塑性数值子结构分析方法[J].工程力学,2016,33(5):44―49.Sun Baoyin,Gu Quan,Zhang Peizhou,et al.Elastoplastic numerical substructure method of reinforced concrete frame structures [J].Engineering Mechanics,2016,33(5): 44―49.(in Chinese)

[19]陶慕轩,聂建国.组合构件纤维模型的建模策略-单元划分和截面离散[J].工程力学,2016,33(2): 96―103.Tao Muxuan,Nie Jianguo.Modeling strategies of fiber models for composite structural members: Element mesh and section discretization [J].Engineering Mechanics,2016,33(2): 96―103.(in Chinese)

[20]吕伟荣,罗雯,蒋 庆,等.基于分层壳单元的现浇混凝土空心楼板数值模拟[J].工程力学,2015,32(S1):172―183.Lv Weirong,Luo Wen,Jiang Qing,et al.Numerical simulation of cast-in-situ concrete hollow slabs based on layered shell elements [J].Engineering Mechanics,2015,32(S1): 172―183.(in Chinese)

[21]李红豫,滕军,李祚华.钢筋混凝土框架结构非线性静、动力分析的高效计算平台 HSNAS(GPU)——II验证分析[J].振动与冲击,2016,35(14): 54―60.Li Hongyu,Teng Jun,Li Zuohua.An efficient platform HSNAS(GPU)for nonlinear static and dynamic analysis of reinforced concrete frames—II.Program verification and analysis [J].Journal of Vibration and Shock,2016,35(14): 54―60.(in Chinese)

[22]Teng Jun,Li Zuohua,Ou Jinping,et al.Fiber damage analysis model for RC beam-column based on EEP super-convergent computation [J].Science China Technological Sciences,2011,54(10): 2542―2548.

APPLICATION OF GRAPHICS PROCESSING UNIT BASED ALGORITHM IN NONLINEAR RESPONSE ANALYSIS TO COMPLEX HIGH-RISE BUILDING STRUCTURES

LI Hong-yu1,2,TENG Jun3,LI Zuo-hua3,ZHANG Lu4
(1.College of Civil Engineering and Architecture,Guilin University of Technology,Guilin 541004,China;2.Collaborative Innovation Center for Exploration of Hidden Nonferrous Metal Deposits and Development of New Materials in Guangxi,Guilin University of Technology,Guilin 541004,China;3.Shenzhen Key Laboratory of Urban & Civil Engineering Disaster Prevention & Reduction,Shenzhen Graduate School,Harbin Institute of Technology,Shenzhen 518055,China;4.Department of Civil and Materials Engineering,University of Illinois at Chicago,Chicago,IL 60607,USA)

Abstract:Currently,most of the commercial finite element(FE)softwares are based on the CPU architectures,which causes massively time consuming,low efficiency,and rigor of requirements of hardware during analyzing the nonlinear response of high-rise structures.Meanwhile,the emergence of GPU based algorithms presents significantly superior performance in floating-point operation and parallel computation due to its special configuration.Therefore,GPU based algorithms can provide a feasible solution for the perplexing issues of nonlinear computation of high-rise structures.Our work is to develop a parallel FE algorithm by introducing GPU and to construct a corresponding heterogeneous platform,ultimately leading to speed up the computation.Firstly,the mapping between the degrees of freedom(DOFs)of a refined model and the threads of GPU is formed.Then,the implicit integration algorithm for solving the dynamic response will be parallelized in threads; meanwhile,the strategies of storage are optimized in terms of element-by-element scale and the demand of memory was reduced while solving the equations.All of the GPU based algorithms have been validated by comparing with the experimental results of a shaking table.Moreover,the validated algorithms are extended to apply to the analysis of the elastic-plastic seismic response of a practical high-rise reinforced concrete frame tube structure.The results show that the proposed algorithm can not only guarantee the accuracy but also improve efficiency dramatically in the procedure of structural nonlinear response analyses.

Key words:nonlinear response analysis; graphics processing unit(GPU); high-rise building structures; parallel computing; EBE

张 璐(1983―),男,吉林人,博士后,主要从事结构非线性分析和结构无损检测研究(E-mail: zhang889@uic.edu).

李祚华(1978―),男,吉林人,副教授,博士,主要从事高层建筑结构抗震和结构无损检测研究(E-mail: lizuohua@hitsz.edu.cn);

滕 军(1962―),男,辽宁人,教授,博士,博导,主要从事结构抗震抗风和结构振动控制方面研究(E-mail: tengj@hit.edu.cn);

作者简介:

通讯作者:李红豫(1985―),女,广西人,讲师,博士,主要从事高层建筑结构抗震和并行工程计算研究(E-mail: lihongyu@glut.edu.cn).

基金项目:国家自然科学基金青年科学基金项目(51708147);国家自然科学基金重大国际(中美)合作研究项目(51261120374);广西自然科学基金青年科学基金项目(2017GXNSFBA198184);桂林理工大学科研启动基金项目(GLUTQD2016046);广西高等学校高水平创新团队及卓越学者计划项目(桂教人[2017]38号)

收稿日期:2017-01-11;修改日期:2017-08-30

文章编号:1000-4750(2018)11-0079-07

doi:10.6052/j.issn.1000-4750.2017.08.0656

文献标志码:A

中图分类号:TU973+.2