非高斯随机过程的短期极值估计:复合Hermite模型

高 山1,郑向远2,黄 一1

(1.大连理工大学船舶工程学院,大连 116024;2.清华大学深圳研究生院海洋科学与技术学部,深圳 518055)

摘 要:Hermite模型自20世纪80年代后期开始被广泛应用于非高斯随机过程的短期极值估计。当随机过程的非高斯性很强时,尤其是偏度很大时,常用的3阶Hermite模型不足以表征出极值分布的尾端特征。工程中,样本统计矩的不确定性使得更高阶的Hermite模型不宜使用。基于此,该文提出了同时基于中心矩与线性矩的复合Hermite模型,有效地将Hermite模型由3阶拓展到4阶。该文以对数正态模型作为非线性系统的研究对象,对比分析了在解析条件下和在使用蒙特卡洛模拟获得样本数据条件下,各类Hermite模型与传统的Gumbel法以及平均条件穿越率(ACER)法用于极值分析的表现。结果表明,对于大偏度强非高斯随机过程的极值预测,复合Hermite模型具有更好的精确度和鲁棒性。

关键词:复合Hermite模型;短期极值估计;中心矩;线性矩;强非高斯过程

海洋结构物在服役期间会遭受到风、浪、流等复杂的环境载荷。载荷的多样性、非线性以及多种载荷间的相互耦合导致了外激励呈现出复杂的非高斯统计特征[1-2]。在这种情况下,即便是将结构物简化成一个线性系统,其动力响应也多为非高斯的随机过程。使用高斯假设对载荷和响应进行分析会大大低估对于极值的判断[1],导致结构强度设计不足。因此,如何在实际的工程应用中,使用有限的样本数据构造出合理的数学统计模型,表征出非高斯随机过程的统计特征,例如穿越率,极值等,是亟待科研工作者们解决的问题。

近几十年来,多种极值分析方法被提出并应用,有使用特定的概率密度分布,如:Weibull分布[3]、Gumbel 分布[4]、广义极值(GEV)分布[5-6]等去拟合极值分布的做法,也有近些年来在风工程和土木工程中较为热门的峰值过阈值(POT)法[7-8]和平均条件穿越率(ACER)法[9-12]。在诸多方法中,Hermite变换法[1,3,1-18]由于其简单、精确以及普适性得到了广大科研工作者们的青睐。Hermite模型于1985年由Winterstein[14]提出,通过建立Hermite多项式级数形式的变换关系式将非高斯随机变量与窄带高斯随机变量联系在一起,达到分析非高斯随机过程的目的。其中,变换关系式中的模型系数需要通过平衡表达式两端的统计矩来确定。

中心矩是最为常用的统计量,它们能较好地描述出概率密度函数(PDF)的形状特征,高阶中心矩对于尾部特征有很强的敏感性。因此,基于中心矩的Hermite模型(C-Hermite模型)继承了中心矩对于极值的敏感性。实际工程中,实验数据和实地测量数据较为有限,因而高阶的样本中心矩存在着较大的不确定性[19]。对于非线性很强的极端情况,这种不确定性更加明显。因此,Hermite模型发展至今都停留在对于3阶模型的应用。但事实上,越是非线性强的情况,越需要使用高阶模型去获得精确地近似,因此,如何有效地将Hermite模型从3阶拓展到4阶并应用到实际工程中是本文研究的重点。

线性矩的概念最早于1912年由Gini[20]提出,直到1987年才由Kaigh和Driscoll[21]完善概念,给出完整的理论。线性矩是一种基于有序数据的统计矩理论,相对于中心矩,其拥有对样本长度和异常值更强的鲁棒性[22-24],但也有两面性:一方面,基于线性矩确立的Hermite模型(L-Hermite模型)受样本长度变化的影响很小;另一方面,线性特征使得线性矩更侧重于反映分布的主体部分,对于尾端分布的表征不够完全,因此,L-Hermite模型在极值分析上精度较差[13]

抱着同时利用中心矩的极值敏感性和线性矩的鲁棒性的目的,本文提出了一种同时使用中心矩与线性矩的复合模型,将Hermite模型的应用从3阶拓展到4阶。选取非线性很强的对数正态模型作为研究对象,把基于不同矩组合的复合模型和Gumbel法以及近十年新提出的ACER法进行对比。对比中,本文先后考虑了解析情况和两种蒙特卡洛模拟生成的不同长度的样本情况,以验证新模型的精确度与鲁棒性。

1 中心矩与线性矩

1.1 中心矩(Central moments)

对于一个概率密度函数为fx(x)的随机变量X,其中心矩定义如下:

式中,m1m2为均值μ和方差σ2。标准化后的3阶、4阶中心矩,α3=m3/σ3α4=m4/σ4,分别称为偏度(Skewness)和峰度(Kurtosis)。标准化后的第 5阶中心距α5=m5/σ5在过往的文献中鲜有提及,本文中称其为超偏度(Super skewness)。一个标准高斯随机过程的偏度和峰度分别为0和3。峰度小于 3的随机过程,称为亚高斯(Hardening non-Gaussian)随机过程;峰度大于3的随机过程,称为超高斯(Softening non-Gaussian)随机过程。

1.2 线性矩(Linear moments)

讨论一个随机变量X,累积概率密度函数(CDF)为F(X),线性矩的表达式如下:

式中,x(F)和分别表示分位点函数和(n-1)阶的移位勒让德(Shifted Legendre)级数。如果g(X)是关于X的函数,则g(X)的线性矩为:

g(X)是单调函数时,式(4)简化为:

样本线性矩的计算需要先对样本数据排序:而后将得到的有序数据点代入下式:

注意到,式(6)是式(3)的离散形式,代指样本线性矩,=i/Nxi的累积概率密度。标准化后的线性矩的定义如下:

其中,τ3τ4τ5称作“L-偏度”、“L-峰度”和“L-超偏度”。

2 超高斯随机过程的3阶Hermite变换理论

针对峰度大于 3的超高斯随机过程,Winterstein[13]提出了如下的3阶Hermite变换表达式:

式中,表示标准化后的非高斯随机变量,XμσX分别为X的均值和标准差。模型系数kc3c4通过平衡表达式两边的前4阶统计矩得到,这是一种基于统计矩的非线性变换模型。Winterstein在1985年给出了使用中心矩建立3阶Hermite模型的方法[14],并经历了多次完善[1,13-14,25];接着在2013年给出了使用线性矩建立三阶Hermite模型的方法[13]。为方便讨论,前者称为 3阶C-Hermite模型,后者称为3阶L-Hermite模型。当系数满足[13]

3阶Hermite模型是一个单调递增模型,满足XU之间的一一对应关系。

3 超高斯随机过程的4阶Hermite变换理论

3.1 4阶C-Hermite模型

工程中,3阶Hermite模型足以应对大多数情形。但是,当随机过程的非高斯性很强时,尤其是第5阶中心矩很大时,需要采用如下4阶Hermite模型:

将式(10)的两端代入式(2),即可得到 4阶Hermite模型的前2阶~5阶中心矩与系数kc3c4c5的关系式,由于篇幅所限,在此省略。

3.2 4阶L-Hermite模型

不同于3阶Hermite模型,4阶Hermite模型并不是一个单调模型,严格来说,难以通过式(5)来计算线性矩,进而求解模型系数。然而,线性矩对于尾端分布并不敏感,这就意味着当模型的非单调区域处于分布的尾端时,非单调区域对于线性矩的影响是微乎其微的,那么可以使用式(5)来近似地计算线性矩,得到:

求解k时,应当使用由中心矩推导得到的下式:

下面以两个算例来讨论式(11)~式(13)的精确性。

算例1:对数正态模型

对数正态模型常用于风工程中[12―13,15,26],现选取参数VX=0.3、VX=0.5、VX=0.7、VX=0.9,采取以下的步骤进行分析:① 由式(5)得到X的各阶线性矩。② 通过式(11)~式(13)求解出L-Hermite模型的系数c3c4c5。③ 使用第②步中建立的L-Hermite模型生成X的样本,计算样本线性矩,与第①步中得到的解析值作比较,评判计算得到的模型系数是否准确。

图1中可以看到,式(11)~式(13)建立的L-Hermite模型和对数正态模型的线性矩几乎完全吻合。

算例2:多项式模型

讨论一个非单调的多项式模型:

式(17)实际上是 4阶 Hermite模型取c3=0.4,c4=0,c5=0.05,k=0.858的情况。

表1 多项式模型与4阶L-Hermite模型的线性矩
Table 1 L-moments of quartic polynomial function and quartic L-Hermite model

注:括号内表示相对误差。

?

图1 4阶L-Hermite模型与对数正态模型的线性矩
Fig.1 L-moments of quartic L-Hermite model and lognormal model

此算例中,式(17)的线性矩同样由蒙特卡洛模拟生成样本得到,表1给出了对比的结果。注意到,即便是针对于式(17)这种非单调区间很大的模型,式(11)~式(13)的误差也不超过8%。

3.3 复合Hermite模型

鉴于高阶的 C-Hermite模型在小样本条件时会具有很强的不确定性,而相对稳定的L-Hermite模型不适用于极值预报,因此本文提出不单一地使用某一种统计矩系统,而是通过使用中心矩和线性矩的组合,建立起新的 Hermite模型:复合(Hybrid)Hermite模型,下文中简称为Hybrid模型。表2给出了本文中涉及到的Hermite模型,须注意到,4阶组合一共有 8种(C-Hermite+L-Hermite+6种 Hybrid Hermite)。在求解Hybrid模型的系数时,需要联立分别对应于中心矩与线性矩的非线性方程。

表2 各模型使用的中心矩与线性矩
Table 2 C-moments and L-moments used in various models

模型 偏度α3峰度α4超偏度α5L-偏度τ3L=峰度τ4L-超偏度τ53阶C-Hermite × ×3阶L-Hermite × ×3阶Hybrid1 × ×3阶Hybrid2 × ×4阶C-Hermite × × ×4阶L-Hermite × × ×4阶Hybrid 1 × × ×4阶Hybrid 2 × × ×4阶Hybrid 3 × × ×4阶Hybrid 4 × × ×4阶Hybrid 5 × × ×4阶Hybrid 6 × × ×

3.4 4阶Hermite模型的单调区间

在使用Hermite模型进行极值预报时,需要确保关注的极值处于模型的单调递增区间内(即:dX/dU>0),这样才能保证在U达到最大值时,X同样达到最大值。因此,明确4阶Hermite模型的单调区间至关重要。对式(10)求偏导,得到:

式(18)是一个3次方程,有3个根,可用以确定单调递增区间,具体的求解在此不再赘述。此外,还可以利用图像法绘制出X关于U的趋势图来定出单调区间,更为简单直观。

4 极值预报

4.1 极值估计:非线性变换法

对于一个标准高斯窄带随机过程U(t),其峰值服从瑞利分布[27],在这一前提条件下,其极值为:

其中:下标e、m表示极值的均值;N表示分析时长内的峰值个数。通过非线性变换,可得到非高斯随机过程X(t)的极值[3]

本文中,式中的函数g即为建立的Hermite模型。

4.2 解析结果分析

针对大偏度非高斯随机过程的极值分析问题,本文选取对数正态模型VX=0.7的情形作为研究对象。解析的中心矩和线性矩由式(2)和式(5)得到,结果可见4.3节的表4和表5。

海洋工程中,短期极值预报一般是指12-hr以内的极值预报,其中,1-hr和3-hr的风暴时长最为常见。假定随机过程的峰值周期Tp为8 s(过零周期Tz=6.48 s),表4给出了此情形下1-hr、3-hr、12-hr的极值计算结果,对应的响应循环次数N=555、N=1665、N=6660。

从表3可以看出:1) 对应于1-hr、3-hr和12-hr极值的U分别为3.7174、4.0015和4.3337,都落在了各模型的单调增区间中;2) 3阶的C-Hermite模型在4种3阶模型中表现最好,但是其精度依然让人难以满意,3-hr的偏差为-4.60%,12-hr的偏差为-8.20%。事实上,该3阶C-Hermite模型的超偏度为107.678,而对数正态模型的超偏度为127.333;3) 4阶的C-Hermite模型与Hybrid2-6模型均表现出了很好的精确度,其中,四阶C-Hermite模型尤其精准,这是由于高阶中心矩(α4α5)对概率密度函数的尾端分布有极强的敏感性,由它们得到的Hermite模型能够很好地反映极值。相对的,线性矩对于尾端分布不敏感,3阶和4阶的L-Hermite模型均不适合于极值预报。

表3 解析情况下各模型的极值估计结果
Table 3 Analytical extrema of various models

模型 1-hr极值 1-hr偏差/(%) 3-hr极值 3-hr偏差/(%) 12-hr极值 12-hr偏差/(%)X关于U的单调增区间对数正态方程 10.4590 — 12.5146 — 15.4357 — (-∞,+∞)3阶C-Hermite 10.2476 -2.02 11.9395 -4.60 14.1698 -8.20 (-∞,+∞)3阶L-Hermite 9.0495 -13.48 10.3549 -17.26 12.0481 -21.95 (-∞,+∞)3阶Hybrid1 10.2328 -2.16 11.9100 -4.83 14.1183 -8.54 (-∞,+∞)3阶Hybrid2 9.4422 -9.72 10.8160 -13.57 12.5939 -18.41 (-∞,+∞)4 阶C-Hermite 10.5231 0.61 12.5913 0.61 15.4780 0.27 (-1.4815,+∞)4 阶L-Hermite 9.9686 -4.69 11.6804 -6.67 13.9888 -9.37 (-2.7518,+∞)4阶 Hybrid1 13.7213 31.19 17.7010 41.44 23.5452 52.54 (-2.1841,+∞)4 阶 Hybrid2 10.3875 -0.68 12.2281 -2.29 14.7143 -4.67 (-4.0007,+∞)4 阶 Hybrid3 10.5772 1.13 12.5606 0.37 15.2809 -1.00 (-2.2231,+∞)4阶 Hybrid4 10.4703 0.11 12.3997 -0.92 15.0327 -2.61 (-2.8607,+∞)4 阶 Hybrid5 10.5824 1.18 12.5966 0.66 15.3685 -0.44 (-2.3071,+∞)4阶 Hybrid6 10.5601 0.97 12.6261 0.89 15.4976 0.40 (-1.7950,+∞)

4.3 蒙特卡洛模拟

4.3.1 基于多组样本数据的Hermite变换法

通过快速傅里叶变换法(FFT method)生成高斯随机波面U(t)[28],再代入对数正态模型(式(15))可以有效地生成用于分析的非高斯随机过程X(t)[29―30]。本研究中用于生成高斯波面U(t)的随机种子选取较SNAME规范[31]更为严苛,峰值范围:0.96Ue,m到1.075Ue,m;偏度范围:-0.01~0.01;峰度范围:-2.95~3.05。选取 Jonswap海浪谱[26]作为功率谱,其中:Tp=8 s (Tz=6.48 s);Hs=4 m;为保证窄带假设,谱峰参数取为γ=5.0。

在拥有多组样本数据时,使用Hermite变换法进行极值计算有3种方式:

A:认为样本的统计矩是独立的随机变量,计算出样本统计矩的平均值,使用平均值来计算Hermite模型的系数,代入式(20)得到极值。

B:认为极值是随机变量,分别计算对应于每一个样本的 Hermite模型的系数,并由式(20)得到一个相应的变换极值,对得到的极值取平均作为最后的结果,这也是Winterstein[3]采用的方式。

C:认为Hermite模型的系数是独立的随机变量,分别计算对应于每一个样本的Hermite模型的系数,将这些模型系数的平均值代入式(20)得到极值。

图2给出了本小节研究方法的的详细流程图。

图2 基于模拟生成的样本数据的极值预报流程图
Fig.2 Flowchart of estimating extrema based on samlpes

置信区间可用来判断极值估计的可信程度,若想要 95%的置信区间处于时域模拟期望值的正负10%范围内,需要[3]

式中:CV=σ/μ是变异系数;R为样本的组数。对于高斯随机过程U(t)来说,其极值分布满足[32]

式中:是为了计算方便引入的新积分变量;N为峰值个数。将u写成ξ的表达形式,并忽略3阶以后的项,可以得到高斯随机过程U(t)的极值的变异系数:

相应的,与U呈单调函数关系的随机变量的极值的变异系数可以写成:

4.3.2 极值预报:基于60段3-hr模拟数据

由式(24)可以得到本算例中的对数正态模型的变异系数为 0.253,因此由式(21)可得到需要至少段3-hr时长的样本数据才能达到可靠的置信度。因此,基于在 4.3.1节中介绍的方法生成了60段3-hr时长的非高斯随机过程X(t),步长dt=0.02 s,每段时程包含540 000个样本点。

表4 由60段3-hr样本模拟得到的中心矩均值
Table 4 Averaged C-moments of 60 simulated 3-hr samples

中心矩 均值μ方差σ2偏度α3峰度α4超偏度α5解析值 1.2207 0.7301 2.4430 15.2050 127.3330样本值 1.2206 0.7294 2.4181 14.3704 103.3636误差/(%) 0.00 -0.09 -1.02 -5.49 -18.82

表5 由60段3-hr样本模拟得到的线性矩均值
Table 5 Averaged L-moments of 60 simulated 3-hr samples

线性矩 1 阶λ11 阶λ2L-偏度τ3L-峰度τ4L-超偏度τ5解析值 1.2207 0.4209 0.3017 0.1946 0.1091样本值 1.2206 0.4209 0.3018 0.1942 0.1091误差/(%) 0.00 0.00 -0.05 -0.22 0.00

表4和表5列出了由样本数据计算得到的中心矩与线性矩的均值。随着阶数的增长,样本中心矩与解析的中心矩的误差越来越大,第 5阶中心矩有高达-18.82%的误差。相对的,线性矩十分精确。这是因为中心矩需要很大的样本容量才能够收敛[33],而线性矩对于样本长度有很好的鲁棒性。

表6给出了使用各Hermite模型得到的预测极值,可以看到,对于上述提及的3种使用方式而言,基于平均矩的方式A最为准确。这是因为当样本长度有限时,统计矩的收敛速度是最快的。相较于方式A,将极值作为随机变量处理的方式B多了从矩到系数再从高斯U到非高斯X的两部分非线性的影响;而将系数作为随机变量处理的方式C,则多了从矩到系数的非线性影响。同时注意到,由于线性矩的收敛速度很快,3阶与4阶L-Hermite模型在这3种方式下得到的结果几乎相同。下面,对方式A的结果进行重点分析。

表6中,3阶的L-Hermite与Hybrid2模型以及4阶的Hybrid1模型是诸模型中最差的,误差超过10%;4阶的Hybrid2和Hybrid4的误差小于5%,其中Hybrid4的结果最为精确。在解析情况下误差最小的4阶C-Hermite模型的精确性不再优秀,误差为-5.19%。这是因为高阶的样本中心矩非常依赖于样本长度,导致4阶C-Hermite模型的偏差变大。

表6中,Gumbel法给出的预测极值为7.4921,误差高达-40.13%,这说明这种大偏度的非高斯随机过程的极值分布并不能用传统的极值I型研究。ACER方法是由Naess和Gaidai提出的极值预报方法[9-11],核心思想是通过蒙特卡洛模拟来得到随机过程中的穿越率,并利用该穿越率来进行之后的极值分析。这一做法一方面规避了在频域分析方法中计算穿越率的问题,另一方面,相对于传统的时域计算法,节约了计算时间。但是,使用ACER法进行分析时需要确定尾端分布的临界点位置,存在较大的经验性因素。表7给出了ACER法的结果,误差结果为-9.17%,逊于多种混合Hermite模型。

图3 非高斯随机变量X随标准高斯随机变量U的变化趋势(A:解析情况下建立的Hermite模型; S:基于模拟的样本数据建立的Hermite模型)
Fig.3 Trends ofXvarying withUfor quartic transformations(A: Models based on analytical moments; S: Models based on simulated moments)

表6 基于60段3-hr样本得到的3-hr极值
Table 6 3-hr extrema of 60 simulated 3-hr samples

注:偏差表示与解析值的误差。

模型 3-hr极值 偏差/(%) 3-hr极值 偏差/(%) 3-hr极值 偏差/(%)解析值 12.5146 — — — — —样本极值 12.5542 0.32 — — — —Gumbel法 7.4921 -40.13 — — — —ACER法 11.3667 -9.17 — — — —方式A 方式B 方式C 3阶C-Hermite 11.6559 -6.86% 11.6251 -7.11% 11.6266 -7.10%3阶L-Hermite 10.3368 -17.40% 10.3366 -17.40% 10.3365 -17.40%3阶Hybrid1 11.6481 -6.92% 11.6257 -7.10% 11.6276 -7.09%3阶Hybrid2 10.7665 -13.97% 10.7684 -13.95% 10.7719 -13.93%4阶C-Hermite 11.8649 -5.19% 11.7859 -5.82% 11.7854 -5.83%4阶 L-Hermite 11.6597 -6.83% 11.6591 -6.84% 11.6590 -6.84%4阶 Hybrid1 17.1503 37.04% 15.5043 23.89% 15.5003 23.86%4阶 Hybrid2 11.9714 -4.34% 11.9512 -4.50% 11.9519 -4.50%4阶 Hybrid3 11.9338 -4.64% 11.8734 -5.12% 11.8755 -5.11%4阶 Hybrid4 12.0077 -4.05% 11.9637 -4.40% 11.9626 -4.41%4阶 Hybrid5 11.9104 -4.83% 11.8373 -5.41% 11.8382 -5.41%4阶 Hybrid6 11.8547 -5.27% 11.7895 -5.79% 11.7914 -5.78%

图 3给出了 4阶的 C-Hermite和 Hybrid2~Hybrid4模型中非高斯随机变量X关于标准高斯随机变量U的变化曲线(方式A),其中4阶C-Hermite模型在解析情况下着实给出了最为精确的近似,与对数正态模型几乎重合。但是,当其使用样本中心矩时,其精度受到高阶样本矩的不确定性影响,反而使其产生了较大的偏移。4阶的Hybrid2、Hybrid3、Hybrid4的曲线非常接近,在样本有限的情况下,表现出较好的准确性。但是注意到,Hybrid3 A到Hybrid3 S的偏移量是比较大的,这是因为其使用了第5阶中心矩的原因,但在表4中可以看到,第5阶中心矩由于样本长度不够发生了高达-18.82%的误差。相对的,Hybrid2和Hybrid4由于使用了第5阶线性矩替代第5阶中心矩,它们的偏移非常小。

4.3.3 极值预报:10组1-hr模拟

现讨论样本更为稀缺只有10段1-hr数据的情形,这类似于海洋工程中,钻井平台受到1-hr短期风暴影响时,能够实际测量得到的横荡运动的数据长度。为提高比较结果的可靠性,讨论了4组样本(每组10段1-hr数据,每段数据包含180000个数据点),编号为Set 1、Set 2、Set 3、Set 4。在此,仅比较几种典型的Hermite模型:C-Hermite,4阶Hybrid2,4阶 Hybrid3以及4阶Hybrid4,仅讨论方式A的结果。

当样本数据非常有限时(180000个数据点),不确定性很强,表7中Set 1~Set 4的模拟结果(样本极值)差别明显。例如,Set 2中给出的模拟的极值为11.0445而Set 4中却是10.1436。尽管如此,4阶的Hybrid2和 Hybrid4依然给出了误差最小的预测结果,特别的,Set 2中Hybrid4 的误差仅为-2.76%。此外,除了 Set 2以外的其余 3个算例,注意到Hybrid2都要略好于Hybrid4,这一结论不同于之前所做的3-hr模拟,这是因为在样本数据更为稀缺的情况下,Hybrid2模型使用的L-偏度(3τ)相较于Hybrid4使用的偏度(3α)更快收敛至真值(限于篇幅,未给出具体结果)。

表7 基于10段1-hr样本得到的1-hr极值(4组)
Table 7 1-hr extrema on basis of 10 simulated 1-hr samples(4 sets)

注:括号内表示与解析值的相对误差。

模型 1-hr 极值Set 1 Set 2 Set 3 Set 4解析值 10.4590样本极值 10.6739 11.0445 10.5186 10.1436(2.05%) (5.60%) (0.57%) (-3.02%)4阶C-Hermite 10.0255 10.1233 9.8967 9.6821(-4.14%) (-3.21%) (-5.38%) (-7.43%)4阶 Hybrid2 10.1517 10.1675 10.0126 9.7806(-2.94%) (-2.79%) (-4.27%) (-6.49%)4阶Hybrid3 10.0369 10.1235 9.9109 9.6934(-4.04%) (-3.21%) (-5.24%) (-7.32%)4阶Hybrid4 10.1347 10.1700 9.9900 9.7695(-3.10%) (-2.76%) (-4.48%) (-6.59%)Gumbel法 6.6500 6.7444 6.7404 6.5751(-36.42%) (-35.52%) (-35.55%) (-37.13%)ACER法 9.7060 9.23251 9.3595 8.9957(-7.20%) (-11.73%) (-10.51%) (-13.99%)

此外,Gumbel法得到的极值其误差远大于其他所有模型,ACER法也因为更小的样本容量导致了预报精度的下降,其中Set 4更是明显,产生了-13.99%的误差。

5 结论

在实际工程中,实验数据和现场实测数据较有限,在小样本条件下,数据给出的统计特性往往存在很大的不确定性。基于此,本文提出了同时基于中心矩和线性矩的复合Hermite模型以解决小样本条件下的极值预报问题。根据建立模型使用的统计矩种类,定义了3种Hermite模型:C-Hermite模型,L-Hermite模型以及复合Hermite模型。针对偏度很大的非高斯随机过程,选取了对数正态方程作为假想的非线性系统,其峰度也明显高于海洋工程中常遇的莫里森拖曳项u|u|。解析情况下的对比结果表明,几种3阶Hermite模型都不能给出满意的结果,相较而言,4阶C-Hermite模型、4阶混合Hybrid2~Hybrid6模型更为精确。此外,4阶Hybrid1模型与4阶 L-Hermite模型由于过多地使用线性矩,极值预测的结果差强人意。

通过蒙特卡洛模拟生成不同长度的样本数据,讨论了各模型应用到实际工程中的情形,并加入了Gumbel法和ACER法进行对比。结果表明,Hermite模型在应用于多组样本时,将统计矩作为随机变量处理的方式A收敛速度最快,好于国外使用平均极值的方式B。小样本计算得到的中心矩往往会较解析值有很大的偏离,尤其是第5阶中心矩,涉及到第5阶中心矩的Hermite模型(4阶C-Hermite模型和4阶Hybrid3、Hybrid5、Hybrid6模型)在这种情形下不确定性很大,极值分析精度大幅下降。传统的Gumbel法不适合于这种偏度很大且非线性很强的随机过程,会明显地低估极值。ACER法对于样本长度也较为敏感,在数据稀缺的情况下,精度下降明显。本文提出的4阶Hybrid2和4阶Hybrid4模型,不仅在解析情况下拥有与4阶C-Hermite模型相媲美的精度,而且在应用到样本数据时保有很好的稳定性,无论是大样本还是小样本。它们通过选用第4阶中心矩(峰度)确保了对于极值的敏感性,又通过使用第5阶线性矩,确保了对于样本长度的鲁棒性。这种混合使用不同类型统计矩的思想,让它们在众多情形下都具备了非常优秀的表现。

本文对于解析情形和蒙特卡洛法得到的数据样本进行了短期极值估计。其中,在使用蒙特卡洛法生成数据样本时严格参照了SNAME规范,生成的样本数据是贴近于实际工程数据的,它们具有近似的物理背景与统计特征,因此,在稳态的情形下,本文提出的复合Hermite模型同样适用于实际工程数据。本文的案例基于对数正态模型而展开讨论,但是,复合Hermite模型亦适用于其他大偏度、大峰度的强非高斯随机过程的极值预报问题,例如莫里森波浪力等。若非高斯性程度较弱,如海面的波高和大多情形下的结构随机响应,则不需要 4阶Hermite模型,3阶就足以精确。

参考文献:

[1]Winterstein S R. Nonlinear vibration models for extremes and fatigue [J]. Journal of Engineering Mechanics, 1988, 114(10): 1772-1790.

[2]Winterstein S R, Ude T C, Marthinsen T. Volterra models of ocean structures: extreme and fatigue reliability [J].Journal of Engineering Mechanics, 1994, 120(6): 1369-1385.

[3]Winterstein S R, Torhaug R. Extreme jack-up response:simulation and nonlinear analysis methods[J]. Journal of Offshore Mechanics & Arctic Engineering, 1996, 118(2):103-108.

[4]Gumbel E J. Statistics of extremes [M]. NewYork:Columbia University Press, 1958.

[5]王飞, 全涌, 顾明. 基于广义极值理论的非高斯风压极值计算方法[J]. 工程力学, 2013, 30(2): 44-49.Wang Fei, Quan Yong, Gu Ming. An extreme-value estimation method of non-Gaussian wind pressure based on generalized extreme value theory [J]. Engineering Mechanics, 2013, 30(2): 44-49. (in Chinese)

[6]Coles S. An Introduction to Statistical modeling of extreme values [J]. Technometrics, 2001, 44(4): 107-111.

[7]Simiu E, Heckert N A. Extreme wind distribution tails: a“peaks over threshold” approach [J]. Journal of Structural Engineering, 1996, 122(5): 539-547.

[8]Naess A, Clausen P H. Combination of the peaks-over-threshold and bootstrapping methods for extreme value prediction [J]. Structural Safety, 2001,23(4): 315-330.

[9]Naess A, Gaidai O, Karpa O. Estimation of extreme values by the average conditional exceedance rate method [J]. Journal of Probability & Statistics, 2013,2013(3): 1-15.

[10]Næss A, Gaidai O. Estimation of extreme values from sampled time series [J]. Structural Safety, 2009, 31(4):325-334.

[11]Naess A, Gaidai O. Monte carlo methods for estimating the extreme response of dynamical systems [J]. Journal of Engineering Mechanics, 2008, 134(8): 628-636.

[12]Ding J, Chen X. Assessment of methods for extreme value analysis of non-Gaussian wind effects with short-term time history samples [J]. Engineering Structures, 2014, 80: 75-88.

[13]Winterstein S R, Mackenzie C A. Extremes of nonlinear vibration: comparing models based on moments,l-moments, and maximum entropy [J]. Journal of Offshore Mechanics & Arctic Engineering, 2013, 135(2):21602-1.

[14]Winterstein S R. Non-normal responses and fatigue damage [J]. Journal of Engineering Mechanics, 1985,111(10): 1291-1295.

[15]Winterstein S R, Kashef T. Moment-based load and response models with wind engineering applications [J].Journal of Solar Energy Engineering, 2000, 122(3):122-128.

[16]Ding J, Chen X. Moment-Based Translation model for hardening non-gaussian response processes [J]. Journal of Engineering Mechanics, 2016, 142(2): 06015006-1.

[17]庄翔, 董欣, 郑毅敏, 等. 矩形高层建筑非高斯风压时程峰值因子计算方法[J]. 工程力学, 2017, 34(7): 177-185, 223.Zhuang Xiang, Dong Xin, Zheng Yimin, et al. Peak factor estimation methods of non-Gaussian wind pressures on a rectangular high-rise building [J].Engineering Mechanics, 2017, 34(7): 177-185, 223. (in Chinese)

[18]Cianetti F, Palmieri M, Morettini G, et al. Correction formula approach to evaluate fatigue damage induced by non-Gaussian stress state [J]. Procedia Structural Integrity,2018, 8: 390-398.

[19]Hosking J R M. L-moments: analysis and estimation of distributions using linear combinations of order statistics[J]. Journal of the Royal Statistical Society, 1990, 52(1):105-124.

[20]Gini C. Variabilità e mutabilità: contributo allo studio delle distribuzioni e delle relazioni statistiche [J]. Studi Economico-Giuridici dell’ Universita di Cagliari, 1912,3: 1-158.

[21]Kaigh W D, Driscoll M F. Numerical and graphical data summary using o-statistics [J]. American Statistician,1987, 41(1): 25-32.

[22]Royston P. Which measures of skewness and kurtosis are best? [J]. Statistics in Medicine, 1992, 11(3): 333-343.

[23]Najafian G. Comparison of three different methods of moments for derivation of probability distribution parameters [J]. Applied Ocean Research, 2010, 32(3):298-307.

[24]Xiao L, Lu H, Xin L, et al. Probability analysis of wave run-ups and air gap response of a deepwater semisubmersible platform using lh-moments estimation method [J]. Journal of Waterway Port Coastal & Ocean Engineering, 2015, 142(2): 4015019-1.

[25]田玉基, 杨庆山. 非高斯风压时程峰值因子的简化计算式[J]. 建筑结构学报, 2015, 36(3): 20-28.Tian Yuji, Yang Qingshan. Reduced formula of peak factor for non-Gaussian wind pressure history [J].Journal of Building Structures, 2015, 36(3): 20-28. (in Chinese)

[26]DNV-RP-C205, Environmental conditions and environmental loads [S]. Norway: Det Norske Veritas,2010.

[27]Newland D E. An introduction to random vibrations and spectral analysis [M]. Longman, 1984.

[28]Zheng X Y, Moan T, Quek S T. Non-gaussian random wave simulation by two-dimensional fourier transform and linear oscillator response to morison force [J].Journal of Offshore Mechanics & Arctic Engineering,2007, 129(4): 327-334.

[29]Masters F, Gurley K R. Non-Gaussian simulation:Cumulative distribution function map-based spectral correction [J]. Journal of Engineering Mechanics, 2003,129(12): 1418-1428.

[30]Grigoriu M. Simulation of stationary non-gaussian translation processes [J]. Journal of Engineering Mechanics, 1998, 124(2): 121-126.

[31]Technical and Research Bulletin 5-5A, Guidelines for site specific assessment of mobile jack-up units [S].Jersey City, New York: SNAME (The Society of Naval Architects and Marine Engineers), 2008.

[32]Davenport A G. Note on the Distribution of the Largest Value of a Random Function with Application to Gust Loading [J]. Proceedings of the Institute of Civil Engineers, 1964, 28(2): 187-196.

[33]Zheng X Y, Liaw C Y. Response cumulant analysis of a linear oscillator driven by Morison force [J]. Applied Ocean Research, 2004, 26(3/4): 154-161.

HYBRID HERMITE MODELS FOR SHORT TERM EXTREMA ESTIMATION OF NON-GAUSSIAN PROCESSES

GAO Shan1, ZHENG Xiang-yuan2, HUANG Yi1

(1. School of Naval Architecture and Ocean Engineering, Dalian University of Technology, Dalian 116024, China;2. Division of Ocean Science and Technology, Tsinghua University, Shenzhen Graduate School, Shenzhen 518055, China)

Abstract:The Hermite model has been widely used in estimating the short term extrema of non-Gaussian processes since late 1980s. When the non-Gaussianity of a process is very strong, especially with a large skewness, the commonly used cubic Hermite model has its limited capacity to capture the characteristics of the tail distribution of the extreme value. However, higher-order models are not recommended for engineering use due to the uncertainty in moments. In this paper, a hybrid use of ordinary central moments (C-moments) and linear moments (L-moments) is proposed to construct Hermite models up to quartic order. A lognormal function is chosen as the original nonlinear system for validating the performance of hybrid Hermite models. Both analytical solutions and numerical solutions using Monte-Carlo simulations are investigated. The comparative study involves the conventional Gumbel method and the averaged conditional exceedance rate (ACER) method. The results show that the proposed hybrid Hermite models render better accuracy and higher robustness in estimating the extreme value.

Key words:hybrid Hermite model; short term extrema estimation; Central moment; Linear moment; strongly non-Gaussian process

黄 一(1964―),男,辽宁人,教授,博士,博导,主要从事船舶与海洋结构物结构分析与环境强度研究(E-mail: huangyi@dlut.edu.cn).

作者简介:高 山(1992―),男,安徽人,博士生,主要从事海洋结构物随机响应的极值与疲劳研究(E-mail: 476734040@qq.com);

通讯作者:郑向远(1975―),男,福建人,教授,博士,博导,主要从事非线性随机动力学等研究(E-mail: zheng.xiangyuan@sz.tsinghua.edu.cn).

基金项目:国家重点研发计划项目(2016YFC0303706);深圳市发改委公共服务平台项目([2015]-75);国家自然科学基金项目(51379035)

修改日期:2018-10-23

收稿日期:2017-11-13;

文章编号:1000-4750(2019)01-0023-09

doi:10.6052/j.issn.1000-4750.2018.10.0855

文献标志码:A

中图分类号:TP391.9