稀疏偏最小二乘回归-多项式混沌展开代理模型方法

赵 威 1,2,3 ,卜令泽 1 ,王 伟 1,2,3

(1.哈尔滨工业大学土木工程学院,哈尔滨 150090;2.结构工程灾变与控制教育部重点实验室,哈尔滨 150090;3.土木工程智能防灾减灾工业与信息化部重点实验室,哈尔滨 150090)

摘 要: 为解决传统多项式混沌展开方法在高维全局灵敏度和结构可靠度分析当中存在的维数灾难与多重共线性问题,该文提出一种稀疏偏最小二乘回归-多项式混沌展开代理模型方法。该方法首先采用偏最小二乘回归技术得到多项式混沌展开系数的初步估计,然后根据回归误差阈值允许下的最大稀疏度原则,采用带有惩罚的矩阵分解技术自适应地保留与结构响应相关性强的多项式,并采用偏最小二乘回归得到多项式混沌展开系数的更新估计。通过对展开系数进行简单后处理即可得到Sobol灵敏度指数。在此基础上保留重要输入变量并按新方法重新进行回归可实现对代理模型的精简,从而在不增加计算代价的情况下实现高精度结构可靠度分析。算例结果表明在保证精度的情况下,采用新方法进行全局灵敏度和结构可靠度分析比传统方法在计算效率方面有显著优势。

关键词: 高维模型;稀疏偏最小二乘回归;多项式混沌展开;全局灵敏度;结构可靠度

结构可靠度和全局灵敏度分析是工程结构设计中的两大关键问题。结构可靠度分析从概率角度评价结构安全性,主要分为近似解析法 [1―2] 、基于抽样的方法和代理模型方法。近似解析法的核心是设计点的求解,然而很多情况下难以进行。基于抽样的方法当中,Monte Carlo模拟(Monte Carlo Simulation, MCS)最为直接,然而对于小失效概率问题收敛速度很慢。因此先后提出了重要抽样 [3―4] 、子集模拟 [5―6] 、线抽样 [7―8] 等方法。对于高维小失效概率问题,这些方法的计算量仍然过于繁重,所以近年来发展出了代理模型方法,本质上是对模型输出的再建模。代理模型方法主要分为三大步骤:

1)通过某种高效抽样方法在变量空间中进行少量预抽样,并对每个样本运行高精度模拟,获得结构响应;

2)基于已知样本,采用某种插值或回归方法训练一个新模型;

3)用新模型代替原始模型来进行结构可靠度分析。

代理模型方法已经从最初的二次响应面,发展到了现在的高维模型表达法 [9―10] 、Kriging方法 [11―12] 以及以人工神经网络和支持向量机为代表的机器学习方法等。其中,多项式混沌展开(Polynomial Chaos Expansion, PCE)方法是近年来国内外研究的主流方法之一。

多项式混沌展开由数学家Wiener [13] 开创,基本思想是将随机响应投影在由关于相互独立的标准Gauss随机变量的Hermite多项式所张成的Hilbert空间中。该方法以现代概率论为基础因而有严格的数学背景,可用于表达任意有限方差随机响应因而有广泛的适用性,对于光滑的输入-输出关系收敛迅速。投影系数记载着随机响应概率分布的全部信息,因此展开系数的求解是该方法的核心。该方法最初用于研究 Brown运动,直到20世纪90年代Ghanem等 [14] 将其与有限元结合,创立了谱随机有限元方法之后才逐渐引起力学与土木工程界的重视。该方法的应用方式分为侵入式和非侵入式两大类,其中非侵入式方法将结构分析模型看作一个黑箱,可以方便地采用现有的确定性的分析程序,因此对于大型复杂结构,目前该方法还是首选。在非侵入式方法当中,回归法将展开系数的求解当作一个统计回归问题,在实验设计上较为灵活,因而近年来受到一些学者的推崇,比如Choi等 [15―16] 研究了基于拉丁超立方体抽样(Latin Hypercube Sampling, LHS)的PCE代理模型方法,李典庆团队将 PCE应用于岩土工程可靠度分析问题 [17―19] 。当输入变量较多时,Blatman等 [20] 提出的自适应逐步回归和最小角回归 [21] 可以在一定程度上缓解维数灾难问题。

灵敏度分析的目的在于定量描述模型输入的不确定性对模型输出的不确定性的影响程度,主要分为局部灵敏度分析和全局灵敏度分析两大类方法 [22] 。局部灵敏度分析方法旨在反映某个自变量在局部范围内变化时对模型输出的影响,然而该方法不能反映某个变量对模型输出的全局影响,而且无法考察变量间的联合作用对模型输出的影响。全局灵敏度分析能够克服上述缺点,因而成为近年来研究的热点,其中基于方差的方法是近年来国内外关注最多的方法。该方法通过主Sobol指数和总Sobol指数来定量描述输入变量对输出变量方差的影响。计算Sobol指数最早的方法是Monte Carlo方法 [23―24] ,然而巨大的计算代价在实际问题中往往无法承受,因此代理模型方法被提出。目前已经提出的代理模型方法主要有高维模型表达法 [25] 、Kriging方法 [26] 以及PCE方法等,其中PCE方法近年来受到较多关注。在方法研究方面,Sudret最早将PCE方法用于计算Sobol指数 [27] 。该方法可以通过引入自适应逐步回归 [28] 和最小角回归技术 [21] 以及压缩感知技术 [29] 进行改进以应对高维问题。在方法应用方面,邬晓敬等 [30] 研究了翼型跨声速气动特性的不确定性及全局灵敏度分析。宋彦 [31] 将 PCE用于钢筋混凝土框架结构的全局灵敏度分析。陈光宋等 [32] 将最小角回归方法用于身管固有频率的全局灵敏度分析。

综上所述,PCE是一种强大的数学工具,然而目前多数文献采用普通最小二乘回归(Ordinary Least Squares Regression, OLSR)研究低维问题(自变量个数为几个或十几个)。对于高维问题(自变量个数为几十个或更多),普通最小二乘回归将不可避免地遇到维数灾难与多重共线性问题。解决问题的突破口在于寻求更高级的统计回归方法来实现小样本下展开式系数的稳健求解。

本文提出一种稀疏偏最小二乘回归技术代替普通最小二乘回归建立多项式混沌展开代理模型,来进行全局灵敏度与结构可靠度分析。与现有的逐步回归和最小角回归方法不同,新方法可以实现群选择,即将对结构随机响应贡献较大的多项式同时选中,增强模型的整体性。另外,自适应的变量选择方法可以有效剔除不重要的多项式,提高算法的自动化程度和鲁棒性。第1节将回顾传统多项式混沌展开方法并阐明其在高维问题中的局限性,第 2节将提出一种基于稀疏偏最小二乘回归的多项式混沌展开代理模型方法,第3节将通过两个不同结构形式的算例来对比新方法与传统方法的计算精度和效率。

1 传统多项式混沌展开代理模型方法及其局限性

假设结构的随机源可以用M个相互独立的标准 Gauss随机变量 来描述,则结构的随机响应 Y (ω)可以表示成以下的级数展开形式:

式中: 是由阶数为 n , n,…,n 的一维

12M Hermite多项式经过张量积运算形成的阶数为p的多维Hermite多项式; 是确定性的系数。可以证明式(1)是均方收敛的。实际当中通常取最高次数不超过p的多项式作为近似,写成紧凑形式如下:

式中:

展开系数 的求解是PCE方法的核心。传统的求解方法首先采用拟Monte Carlo或其他高效抽样方法生成标准正态空间中的样本点N个,然后在每个样本点处运行模拟,得到结构随机响应矩阵 Y ,同时计算多项式矩阵 Ψ ;然后做 Y Ψ 的普通最小二乘回归:

式中, + Ψ Ψ 的 Moore-Penrose广义逆。传统方法的核心是采用OLSR来求解展开式系数,然而当模型输入的数量M增加时,由式(3),展开式中多项式个数会迅速增长,而且样本数量必须要大于多项式个数才能保证精度,这将会带来维数灾难问题。若样本数不充足,则多项式的样本之间又会出现很强的多重共线性,导致OLSR对回归系数的求解精度严重下降,进而使全局灵敏度指数和失效概率的求解精度无法保证。所以解决问题的突破口在于寻求更高级的统计回归方法来实现小样本下展开系数的稳健求解。

2 稀疏偏最小二乘回归-多项式混沌展开代理模型方法

近年来兴起了一种新一代统计回归方法-偏最小二乘回归 [33] (Partial Least Squares Regression,PLSR),已经被用于处理化学计量学和生物信息学等领域的高维数据多重共线性问题。因此本文拟将PLSR融入PCE方法当中,以在保证精度的情况下提高结构全局灵敏度和可靠度分析的计算效率。

2.1 实验设计

采用拟Monte Carlo或其他高效抽样方法进行实验设计。拟Monte Carlo方法被目前很多文献所采用,而且已经有标准程序,所以本文采用这种方法进行抽样。然后对每个样本点进行高精度模拟获得结构响应矩阵并进行中心化,记作 F ,同时根据先验的知识选择多项式的最高阶数p max ,计算多项式矩阵并进行中心化,记作 E

2.2 多项式混沌展开系数的初步估计

采用PLSR建立 F E 之间的回归模型。PLSR的基本假设是回归模型只由少数几个典型成分所控制。通过分别在结构响应和多项式中提取典型成分(潜变量),并直接建立典型成分之间的回归模型来间接反映结构响应与多项式之间的关系,提取的典型成分一方面要尽可能多地携带结构响应与多项式各自的变异性信息,另一方面要尽可能反映结构响应与多项式之间的相关性。潜变量分别以结构响应与多项式线性组合的形式来表示,组合系数向量是以下最优化问题的解:

式中: E F 是中心化的多项式矩阵和结构响应矩阵; w c 是多项式和结构响应的组合系数向量,则 t = Ew u = Fc 就是所求的典型成分。假设二者之间为线性关系,即令:

显然有

=b t ,采用OLSR分别从 E F 中去掉 t 的贡献:

经过h次迭代后,分别令 T =( t 1 , t 2 ,… , t h ), U = ( u 1 , u 2 ,…, u h ), W = ( w 1 , w 2 ,… , w h ), P =( p 1 , p 2 ,…, p h ),则可以证明 T E 之间存在如下关系:

进一步可以得到回归系数矩阵为:

目前多数 PLSR的文献采用式(12)所示的预测残差平方和来进行模型选择(即控制迭代次数):

式中, (⋅)是把全体样本去掉第i个样本之后当作训练样本所得到的代理模型。然而对于多项式混沌展开来说,直接根据定义计算不仅代价会很大,而且难以控制拟合精度,容易造成过度拟合 [34] 。事实上,对于OLSR,当样本数不少于多项式个数时,可以证明:

式中: 是以全体样本为训练样本所得到的代理模型;h i 是矩阵 Ψ ( Ψ T Ψ ) -1 Ψ T 的对角线的第i个元素。类似地,对于PLSR,令 h = T ( T T T ) -1 T T ,也

i可以得到伪交叉验证误差 E rr L O O(P) ,然而这只是一种近似表达,因为每去掉一个样本,各 w 向量会变化,导致 T 在其他样本处的值发生变化。进一步可以除以样本方差进行归一化,记作 ε L O O(P) 。这样定义的误差在小样本下可能会偏于不保守 [21] ,因此可以做如下修正:

当伪交叉验证误差 取极小值时停止迭代,此时得到回归系数的初步估计量

2.3 多项式混沌展开系数的更新估计

直接采用PLSR得到的回归系数向量的各个分量一般均不为零,即所有多项式都参与回归,然而多项式混沌展开式中交叉项占了大多数,而且它们中的大部分与结构响应的相关性很弱,给回归模型的精度带来不利影响。若能将这些不重要的多项式去掉,对于保留下来的多项式而言,样本数将会更加充裕,回归模型的精度和稳定性将会得到明显提高。因此,下一步将采用正则化方法对回归系数进行变量选择,自适应地保留重要的多项式。

正则化,简单地说就是有约束优化。记 ,众所周知,矩阵 β 在F-范数最小化意义下的最佳秩-1近似是它的1阶奇异值分解,然而一般情况下它的左右奇异向量的各个分量均不为零,这给数据的特征提取和解释带来困难。为此可以采用带有惩罚的矩阵分解(Penalized Matrix Decomposition, PMD)方法 [35]

其中 u v 可以通过以下算法求解:

(i)随机生成 v 并令‖ v 2 = 1;

(ii)令 , 若‖ u ‖≤c , 则

Δ 1 = 0 ,否则寻找Δ 1 使得‖ u 1 = c 1

(iii)令 , 若 ‖ v ‖≤c , 则

Δ 2 = 0 ,否则寻找Δ 2 使得‖ v 1 = c 2

(iv)重复步骤(ii)和步骤(iii)直到收敛。

其中,S ( a, c) = sign(a)max(|a | - c , 0)表示软门限函数(Soft-thresholding Operator), Δ 1 , Δ 2 ≥0 ,这两个数越大表示对应的惩罚越强。因为rank( )=1,所以不需要对 u 进行变量选择,即Δ 1 = 0 。在求解过程中,本文并不直接寻找Δ 2 使得‖ v 1 = c 2 ,而是首先根据初步得到的回归系数向量)构建一个备选的Δ 2 值的集合,Δ 2 的选取首先应该满足0≤ Δ 2 ≤ m ax| β |以保证迭代能够进行。然后为了使不同阈值对应的稀疏度分布较为均匀,本文提出一种自适应的方式:在| β |中随机选取k个值,并按从大到小的顺序进行排序,它们的集合记作 。接下来将Δ 的第i个候选值(i = 1 ,2,… ,k)

2 依次代入上述算法中得到保留的多项式组,并作结构响应对该多项式组的 PLSR,记录伪交叉验证误差 ,在此过程中,多项式组的稀疏度依次降低。当伪交叉验证误差小于预定的阈值 时,为避免过度拟合,停止迭代。此时多项式组达到伪交叉验证误差允许下的最小个数,即最大稀疏度。若所有备选阈值对应的稀疏度均不满足伪交叉验证误差的约束条件,则保留原回归系数向量。最终得到的回归系数向量记作 。以上算法将PLSR与变量选择技术同时融入PCE方法当中,所以名为稀疏偏最小二乘回归-多项式混沌展开(Sparse Partial Least Squares Regression- Polynomial Chaos Expansion, SPLSR-PCE)代理模型方法。

2.4 全局灵敏度分析

求得回归系数向量之后,可以按照式(16)和式(17)计算全局灵敏度的Sobol指数S i 和S Ti

其中:

2.5 结构可靠度分析

保留S Ti 值大于某一阈值的自变量,其集合记作 ξ R ,采用原来的样本,按照上述步骤构建新的代理模型,然后按照式(21)计算失效概率。

式中, g P CE ( )是结构极限状态函数的 PCE代理模型。因为 g P CE ( )单次模拟的计算代价很小,所以失效概率可以采用MCS估计。

3 算例分析

3.1 简支梁受均布荷载

如图1所示的简支梁承受均布荷载,其中弹性模量用一个随机场来描述:

图1 简支梁受均布荷载
Fig.1 A simply supported beam subjected to a uniformly distributed load

其中,N( x,)ω是一个平稳Gauss随机场,其Pearson积矩相关系数函数设为:

其中,相关长度l=0.5m。N( x,ω)采用Karhunen-Loeve展开来离散,取前40阶主成分,各主成分相互独立且都服从标准Gauss分布。弹性模量场的均值 μ E = 210 GPa ,变异系数δ E =0.2。梁的长度L=3 m,惯性矩 I = 8 × 10 - 6 m 4 ,分布荷载集度 q = 13 kN/m。感兴趣的变量是跨中竖向位移u。用 MATLAB有限元工具箱来建立有限元模型,其中梁沿长度方向被分为100个等长度单元。

3.1.1 全局灵敏度分析

按照第2节介绍的步骤,本文首先选取了多项式的最高阶数p max =3,则多项式个数为 -1 = 12340。然后从Sobol拟随机数序列中选取了样本点,定义抽样比 γ = N /P ,分别取γ等于2.00、1.20、0.60、0.20、0.10和0.05,即分别取样本数N 等于24680、14808、7404、2468、1234和617。基于这5组样本,分别采用OLSR-PCE和SPLSR-PCE进行了全局灵敏度分析,并以MCS ( N = 4 .2× 10 7 )的解作为参考。取 = 0 .05,k=20。总灵敏度指数S Ti 及其相对误差的计算结果如图2~图3所示。

由图 2可见,本算例中S Ti 值较为显著的变量是第1和第3阶主成分,其他主成分的S Ti 值都接近于零,即它们的随机性对结构响应随机性的影响可以忽略。对于OLSR-PCE,当抽样比在0.20以下时,其计算结果与 MCS参考值吻合得很差,大量不重要的主成分被误判为重要变量,甚至主成分的重要性排序都出现误判,当抽样比增至0.6时,其精度虽然有所提高,重要性排序误判有所减轻,但仍然显著地高估了主成分间的联合作用,而且第 1主成分的S Ti 值仍然与参考值有较大差距,直到抽样比增至1.2以上时其结果才与MCS参考值有很好的吻合。相比之下,SPLSR-PCE的计算结果从抽样比等于0.05开始都可以与MCS参考值有很好的吻合,而且抽样比越大吻合得越好。虽然当抽样比较小时对于除第1和第3阶以外的主成分,相对误差已经达到10 0 ~10 5 数量级,但是这些主成分的S Ti 值本来就很小,对结构响应的影响也很小,而且相对误差仍然比普通最小二乘回归在抽样比为0.6时要低一个数量级,计算精度有显著提高。不同抽样比下代理模型中的多项式个数P R 如表1所示。

图2 不同抽样比下的总灵敏度指数对比
Fig.2 Comparison of total Sobol indices under different sample ratios

图3 不同抽样比下的总灵敏度指数相对误差数量级分布
Fig.3 Distribution of order of magnitudes of relative error of total Sobol indices computed with different sample ratios

表1 不同抽样比下保留的多项式个数
Table1 Number of remained polynomials under different sample ratios

由于实验的随机性,当γ增加时P R 的变化没有一定的规律可循,但总体来看,经过稀疏化过程之后,保留下来的多项式数量只占原数量P的约1%~10%,由此可见,稀疏化过程可以在保证精度的情况下大幅度简化回归模型。下面考察 ε L *

OO(P),th和k的取值对第1和第3阶主成分的S Ti 值的影响,如图4所示。

由图4可见,当抽样比在0.2以上时,各种参数取值均能使第1和第3阶主成分的S Ti 值以很高的精度接近参考值,相对误差均在 5%以内,参数的不同取值带来的影响主要体现在抽样比取 0.05和0.1的情况下。对于第1阶主成分,当γ=0.05,k= 20时, = 0 .05带来的精度相对最高,相对误差接近于零,而 取0.01和0.001所得的计算结果则有较大的相对误差,当γ=0.10时,这两种 的取值所得的计算结果开始收敛于参考值。对于变量3,在γ取0.05和0.10的情况下, = 0 .05所得计算结果的精度仍然高于另外OO(P),th两种取值。这是因为在抽样比一定时, 的减小会导致保留下来的多项式数量增加,进而使多项式之间的多重共线性增强,从而使PLSR的精度下降。当 取值一定,且γ=0.05时,k值越大,S Ti 值在小抽样比下的精度越高,这是因为k值的增加使稀疏化参数的备选阈值增多,分布更均匀,从而使稀疏度的控制更加精确,但当γ取0.10以上时k的取值对计算精度基本没有影响。综上所述,对于全局灵敏度分析,当 ε L * O O(P),th = 0 .05,k=20~50时,SPLSR-PCE在小样本下有较好的鲁棒性,在保证精度的情况下,其计算效率约为传统方法计算效率的24倍。

图4 参数的不同取值对重要变量总灵敏度指数的影响
Fig.4 Impact of different values of parameters on total Sobol indices

3.1.2 结构可靠度分析

基于全局灵敏度分析的结果进行结构可靠度分析,失效事件定义为 u > 0 .012 m ,失效概率的MCS参考值为0.0024。取S Ti 的阈值为0.018。两种方法的相对误差对比如图5所示。

图5 不同抽样比下的失效概率相对误差对比
Fig.5 Comparison between relative error of failure probability computed with different sample ratios

由图5可见,对于OLSR-PCE,当抽样比很小时,失效概率的计算精度很差,而且随抽样比的增加提升缓慢,当抽样比达到0.60以上时,失效概率的计算精度才有较快提升,当抽样比达到1.20以上时所求得的失效概率才与参考值有很好的吻合。总体来看,SPLSR-PCE方法在5组不同参数取值下均比OLSR-PCE有更好的鲁棒性。其中,当k一定时, = 0 .05所得计算结果从γ=0.05开始一直OO(P),th保持 10%以内的相对误差,稳定性相对最好, 取 0.01和 0.001时的计算结果虽然在OO(P),th γ= 0 .05时有较大误差,但是当γ=0.10以上时迅速收敛于参考值。当 一定时,除k=10时收敛速度略慢之外,k取20和50对收敛速度基本没有影响。综上所述,对于结构可靠度分析,当 = 0 .05,k=20~50时,SPLSR-PCE在小样OO(P),th本下有较好的鲁棒性,在保证精度的情况下,其计算效率约为传统方法计算效率的24倍。

3.2 平面框架受水平荷载

如图6所示的平面框架受到水平荷载作用,每层柱子的弹性模量为 E i , v (i = 1 ,2,… , 8 ),截面为正方形,边长为b i,v 。每层梁的弹性模量为E i,h ,截面为矩形,宽度为b i,h ,高度为2b i,h 。每层顶部受到水平集中力 P i 的作用。所有变量为相互独立的随机变量,分布参数如表2所示,顶点水平位移u(设向右为正)为感兴趣的模型输出。

3.2.1 全局灵敏度分析

按照第2节介绍的步骤,本文首先选取了多项式的最高阶数p max =3,则多项式个数为 -1 = 12340,然后从Sobol拟随机数序列中选取了样本点,抽样比γ分别取 2.00、1.20、0.60、0.20、0.10和0.05,即样本数分别取24680、14808、7404、2468和 617。基于这五组样本,分别采用OLSR-PCE和SPLSR-PCE进行了全局灵敏度分析,并以MCS( N = 4 .2× 10 7 )的解作为参考。根据算例1的计算结果,取 = 0 .05,k=20。总灵敏度指数S Ti 及其相对误差的计算结果如图7所示。

图6 平面框架受水平荷载
Fig.6 A plane frame subjected to horizontal loads

表2 输入变量的分布参数
Table2 Distribution parameters of input variables

图7 不同抽样比下的总灵敏度指数
Fig.7 Total Sobol indices computed with different sample ratios

由图 7可见,本算例中S Ti 值较为显著的变量有变量2、4、8、12、16、20、24、34~40,对应的物理量分别是1层柱宽、1层梁宽、2层梁宽、3层梁宽、4层梁宽、5层梁宽、6层梁宽、2层水平力和3层~8层水平力。对于OLSR-PCE,当抽样比在0.20以下时,其计算精度很差,而且随抽样比的增加提升缓慢。当抽样比增至0.60时精度有所提升,但各变量的S Ti 值仍与参考值有较大差距。直到抽样比增至1.20以上时各变量的S Ti 值才与参考值有很好的吻合。相比之下,SPLSR-PCE的计算结果从γ = 0.10开始就一直保持较高的精度和稳定性。当γ= 0 .05时由于多项式和结构响应矩阵的噪音增大,正则化进行变量选择的过程受到较强干扰,导致回归模型精度显著下降,从而使全局灵敏度指数的计算精度下降。因此,在保证精度的情况下,新方法在全局灵敏度分析中的计算效率约为传统方法计算效率的12倍。

3.2.2 结构可靠度分析

基于全局灵敏度分析的结果进行结构可靠度分析,失效事件定义为 u > 0 .250m,失效概率的MCS参考值为0.0064。取S Ti 的阈值为0.01。两种方法的相对误差对比如图8所示。

图8 不同抽样比下的失效概率相对误差对比
Fig.8 Comparison between relative error of failure probability computed with different sample ratios

由图8可见,对于OLSR-PCE,当抽样比在0.60以下时,其失效概率的计算精度很低,而且随抽样比的增加提升缓慢,当抽样比继续增加时,失效概率的计算精度有较快提升,当抽样比增至1.20以上时其失效概率的相对误差才达到10%以内。相比之下,SPLSR-PCE在小样本下的鲁棒性要好很多,其计算结果从γ=0.10开始就一直保持较高的精度和稳定性。在保证精度的情况下,新方法在结构可靠度分析中的计算效率约为传统方法计算效率的12倍。

4 结论

本文提出了一种新型多项式混沌展开代理模型方法用于解决高维全局灵敏度和结构可靠度分析问题。该方法引入了偏最小二乘回归技术来提取结构响应的多项式中的典型成分,并采用变量选择策略自适应地去掉不重要的多项式以提高鲁棒性。通过对两种不同结构形式的有限元模型进行验证,本文得出以下结论:

(1)与传统方法相比,新方法在提升高维全局灵敏度和结构可靠度分析的计算效率方面具有很大潜力。根据文中的估计,这种提升均可达到 12倍以上。

(2)伪交叉验证误差阈值的取值建议在0.01~0.05,过小的取值会导致保留下来的多项式数量增加,从而导致过度拟合,降低代理模型的精度。同时为了使稀疏度的控制更加精确,同时又不增加太多计算负担,正则化备选阈值的个数建议在20~50。

本文侧重于研究高维问题,所选算例的非线性程度并不很强。本文还假定只有少数几个输入变量的随机性占主导地位。另外,本文只研究了单元可靠度分析。因此,强非线性问题、输入变量贡献相近问题 [36] 以及体系可靠度 [37―38] 问题有都有待今后进一步研究。

参考文献:

[1]Hasofer A M, Lind N C.Exact and invariant second-moment code format [J].Journal of the Engineering Mechanics Division, 1974, 100(1): 111―121.

[2]Breitung K.40 years FORM: Some new aspects?[J].Probabilistic Engineering Mechanics, 2015, 42: 71―77.

[3]Au S K, Beck J L.A new adaptive importance sampling scheme for reliability calculations [J].Structural Safety,1999, 21(2): 135―158.

[4]Wang Z, Song J.Cross-entropy-based adaptive importance sampling using von Mises-Fisher mixture for high dimensional reliability analysis [J].Structural Safety, 2016, 59: 42―52.

[5]Au S, Beck J L.Estimation of small failure probabilities in high dimensions by subset simulation [J].Probabilistic Engineering Mechanics, 2001, 16(4): 263―277.

[6]Au S.On MCMC algorithm for subset simulation [J].Probabilistic Engineering Mechanics, 2016, 43: 117―120.

[7]Koutsourelakis P S.Reliability of structures in high dimensions.Part II.Theoretical validation [J].Probabilistic Engineering Mechanics, 2004, 19(4): 419―423.

[8]Koutsourelakis P S, Pradlwarter H J, Schueller G I.Reliability of structures in high dimensions, part I:algorithms and applications [J].Probabilistic Engineering Mechanics, 2004, 19(4): 409―417.

[9]Chowdhury R, Rao B N, Prasad A M.High dimensional model representation for structural reliability analysis [J].Communications in Numerical Methods in Engineering,2009, 25(4): 301―337.

[10]Chakraborty S, Chowdhury R.Assessment of polynomial correlated function expansion for high-fidelity structural reliability analysis [J].Structural Safety, 2016, 59: 9―19.

[11]Bichon B J, Eldred M S, Swiler L P, et al.Efficient global reliability analysis for nonlinear implicit performance functions [J].AIAA journal, 2008, 46(10):2459―2468.

[12]Hu Z, Mahadevan S.Global sensitivity analysisenhanced surrogate (GSAS)modeling for reliability analysis [J]. Structural and Multidisciplinary Optimization, 2015, 3(53): 1―21.

[13]Wiener N.The homogeneous chaos [J].American Journal of Mathematics, 1938, 60(4): 897―936.

[14]Ghanem R, Spanos P D.Polynomial chaos in stochastic finite elements [J].Journal of Applied Mechanics, 1990,57(1): 197―202.

[15]Choi S K, Grandhi R V, Canfield R A, et al.Polynomial Chaos Expansion with Latin Hypercube Sampling for Estimating Response Variability [J].Aiaa Journal, 2004,42(6): 1191―1198.

[16]Choi S, Canfield R A, Grandhi R V.Estimation ofstructural reliability for Gaussian random fields [J].Structures and Infrastructure Engineering, 2006, 2(3/4):161―173.

[17]李典庆, 蒋水华, 周创兵.基于非侵入式随机有限元法的地下洞室可靠度分析[J].岩土工程学报, 2012,34(1): 123―129.Li Dianqing, Jiang Shuihua, Zhou Chuangbing.Reliability analysis of underground rock caverns using non-intrusive stochastic finite element method [J].Chinese Journal of Geotechnical Engineering, 2012,34(1): 123―129.(in Chinese)

[18]蒋水华, 李典庆, 周创兵.基于拉丁超立方抽样的边坡可靠度分析非侵入式随机有限元法[J].岩土工程学报, 2013, 35(增刊2): 70―76.Jiang Shuihua, Li Dianqing, Zhou Chuangbing.Non-intrusive stochastic finite element method for slope reliability analysis based on Latin hypercube sampling[J].Chinese Journal of Geotechnical Engineering, 2013,35(Suppl 2): 70―76.(in Chinese)

[19]蒋水华, 冯晓波, 李典庆, 等.边坡可靠度分析的非侵入式随机有限元法[J].岩土力学, 2013, 34(8): 2347―2354.Jiang Shuihua, Feng Xiaobo, Li Dianqing et al.Reliability analysis of slope using non-intrusive stochastic finite element method [J].Rock and Soil Mechanics, 2013, 34(8): 2347―2354.(in Chinese)

[20]Blatman G, Sudret B.An adaptive algorithm to build up sparse polynomial chaos expansions for stochastic finite element analysis [J]. Probabilistic Engineering Mechanics, 2010, 25(2): 183―197.

[21]Blatman G, Sudret B.Adaptive sparse polynomial chaos expansion based on least angle regression [J].Journal of Computational Physics, 2011, 230(6): 2345―2367.

[22]吕震宙, 李璐祎, 宋述芳, 等.不确定性结构系统的重要性分析理论与求解方法[M].北京: 科学出版社,2015.Lü Zhenzhou, Li Luyi, Song Shufang, et al.Analysis theory and computational methods for uncertain structural systems [M].Beijing: Science Press, 2015.(in Chinese)

[23]Sobol’, Il’ya Meerovich.On sensitivity estimation for nonlinear mathematical models [J].Matematicheskoe Modelirovanie, 1990, 2(1): 112―118.

[24]Homma T, Saltelli A.Importance measures in global sensitivity analysis of nonlinear models [J].Reliability Engineering & System Safety, 1996, 52(1): 1―17.

[25]Stanfill B, Mielenz H, Clifford D, et al.Simple approach to emulating complex computer models for global sensitivity analysis [J].Environmental Modelling &Software, 2015, 74(C): 140―155.

[26]Oakley J E, O'Hagan A.Probabilistic sensitivity analysis of complex models: a Bayesian approach [J].Journal of the Royal Statistical Society: Series B (Statistical Methodology), 2004, 66(3): 751―769.

[27]Sudret B.Global sensitivity analysis using polynomial chaos expansions [J].Reliability Engineering & System Safety, 2008, 93(7): 964―979.

[28]Blatman G, Sudret B.Efficient computation of global sensitivity indices using sparse polynomial chaos expansions [J].Reliability Engineering & System Safety,2010, 95(11): 1216―1229.

[29]胡军, 张树道.基于多项式混沌的全局敏感度分析[J].计算物理, 2016(1): 1―14.Hu Jun, Zhang Shudao.Global sensitivity analysis based on polynomial chaos [J].Chinese Journal of Computational Physics, 2016(1): 1―14.(in Chinese)

[30]邬晓敬, 张伟伟, 宋述芳, 等.翼型跨声速气动特性的不确定性及全局灵敏度分析[J].力学学报, 2015,47(4): 587―595.Wu Xiaojing, Zhang Weiwei, Song Shufang et al.Uncertainty quantification and global sensitivity analysis of transonic aerodynamics about airfoil.Chinese Journal of Theoretical and Applied Mechanics, 2015, 47(4):587―595.(in Chinese)

[31]宋彦.基于随机响应面法的结构整体可靠度与全局灵敏度分析[D].哈尔滨: 哈尔滨工业大学, 2016.Song Yan.Global reliability and sensitivity analysis of structures based on stochastic response surface methods[D].Harbin: Harbin Institute of Technology, 2016.(in Chinese)

[32]陈光宋, 钱林方, 吉磊.身管固有频率高效全局灵敏度分析[J].振动与冲击, 2015, 34(21): 31―36.

Chen Guangsong, Qian Linfang, Ji Lei.An effective global sensitivity analysis method for natural frequencies of a barrel [J].Journal of Vibration and Shock, 2015,34(21): 31―36.(in Chinese)

[33]王惠文, 吴载斌, 孟洁.偏最小二乘回归的线性与非线性方法[M].北京: 国防工业出版社, 2006.Wang Huiwen, Wu Zaibin, Meng Jie.Linear and nonlinear methods of partial least squares regression [M].Beijing: National Defend Industry Press, 2006.(in Chinese)

[34]Deng B, Yun Y, Liang Y, et al.A new strategy to prevent over-fitting in partial least squares models based on model population analysis [J].Analytica Chimica Acta,2015, 880: 32―41.

[35]Witten D M, Hastie R T T.A penalized matrix decomposition, with applications to sparse principal components and canonical correlation analysis [J].Biostatistics, 2009, 10(3): 515―534.

[36]Pan Q, Dias D.Sliced inverse regression-based sparse polynomial chaos expansions for reliability analysis in high dimensions [J].Reliability Engineering & System Safety, 2017, 167: 484―493.

[37]刘娇, 刘敬敏, 余波, 等.工程结构体系可靠度分析的最新研究进展[J].工程力学, 2017, 34(增刊1): 31―37.Liu Jiao, Liu Jingmin, Yu Bo, et al.Recent research progress on structural system reliability analysis [J].Engineering Mechanics, 2017, 34(Suppl 1): 31―37.(in Chinese)

[38]孙威, 黄炎生, 杨惠贤.改进响应面法计算钢筋混凝土框架体系可靠度[J].工程力学, 2016, 33(6): 194―201, 208.Sun Wei, Huang Yansheng, Yang Huixian.System reliability calculation of RC frame structures by improved response surface method [J].Engineering Mechanics, 2016, 33(6): 194―201, 208.(in Chinese)

SPARSE PARTIAL LEAST SQUARES REGRESSION-POLYNOMIAL CHAOS EXPANSION METAMODELING METHOD

ZHAO Wei 1,2,3 , BU Ling-ze 1 , WANG Wei 1,2,3
(1.School of Civil Engineering, Harbin Institute of Technology, Harbin, 150090, China;
2.Key Lab of Structures Dynamic Behaviour and Control of the Ministry of Education, Harbin Institute of Technology, Harbin, 150090, China;3.Key Lab of Smart Prevention and Mitigation of Civil Engineering Disasters of the Ministry of Industry and Information Technology,Harbin Institute of Technology, Harbin, 150090, China)

Abstract: To circumvent the curse of dimensionality and multicollinearity problems of traditional polynomial chaos expansion approach when analyzing global sensitivity and structural reliability of high-dimensional models,this paper proposes a sparse partial least squares regression-polynomial chaos expansion metamodeling method.Firstly, an initial estimation of polynomial chaos expansion coefficients is obtained with the partial least squares regression.Secondly, according to the principle of maximum sparsity under the allowance of regression error threshold, polynomials which have strong correlation with the structural response are adaptively retained with the penalized matrix decomposition scheme.Next, an updated estimation of the polynomial chaos expansion coefficients is obtained with the partial least squares regression.Sobol sensitivity indices are obtained with a simple post-processing of the expansion coefficients.Finally, the metamodel is greatly simplified by regressingwith important inputs, leading to accurate estimations of the failure probability without additional computational cost.The results show that with acceptable accuracies, the new method overperforms the traditional counterpart in terms of computational efficiency when solving high-dimensional global sensitivity and structural reliability analysis problems.

Key words: high-dimensional models; sparse partial least squares regression; polynomial chaos expansion;global sensitivity; structural reliability

王 伟(1957―),男,黑龙江人,教授,博士,博导,主要从事结构可靠度方法研究(E-mail: wwang@hit.edu.cn).

作者简介:

赵 威(1982―),男,黑龙江人,讲师,博士,主要从事结构可靠度方法研究(E-mail: spritewei@163.com);

基金项目: 国家自然科学基金面上项目(11572106)

通讯作者: 卜令泽(1993―),男,黑龙江人,博士生,主要从事结构可靠度与全局灵敏度方法的研究(E-mail: 17b933010@stu.hit.edu.cn).

文章编号: 1000-4750(2018)09-0044-10

收稿日期: 2017-08-23;修改日期:2017-12-22

文献标志码: A

doi: 10.6052/j.issn.1000-4750.2017.08.0644

中图分类号: TU311