RESEARCH ON FEATURE ENGINEERING OF INTELLIGENT COMPUTATION IN CIVIL ENGINEERING
-
摘要:
数据与特征是智能技术的基础,但现有结构智能计算的文献报道却极少涉猎数据端相关研究。为此,该文围绕土木工程结构计算场景,开展了特征工程研究,实现了结构原始数据的自动去量纲化以及向有效特征的智能转化,进而大幅提升了模型性能表现。该文建立了与下游智能模型无关的特征工程架构,以量纲分析为基础,实现对结构特征的自动无量纲化预处理。在此基础上,提出了一种对模型训练得到的无量纲化参数进行物理意义解读的算法,可对输入数据开展因子分析,增强了模型的物理可解释性。为验证特征工程架构的有效性,以钢筋混凝土柱双向压弯的屈服承载力预测问题为例开展数值试验,结果表明:在设定了充足无量纲参量数目的情形下,相较于无特征工程的对照模型,该架构能够加快模型收敛速度4倍~5倍,并提升预测准确率20%~50%,优势显著;同时,通过物理意义解读算法复现的无量纲参量与经典理论分析结论高度吻合,证明特征工程架构成功捕捉了与目标问题密切相关的影响因素。
Abstract:Data and features are the foundation of intelligent technologies, but the existing literature on structural intelligent computation rarely covers data-side related studies. Therefore, the research on feature engineering of intelligent computation in civil engineering was carried out, which automatically nondimensionalize the raw data of structural problems and transform them into effective features, thus improving the performance of the model. A feature engineering architecture independent of the downstream intelligent computation models was established. The input structural features were automatically nondimensionalized by introducing a dimensionless preprocessing net based on dimensional analysis and using logarithmic activation functions. On this basis, an algorithm was proposed to interpret the physical meaning of the dimensionless parameters obtained by model training, which could perform the factor analysis on the input data and enhance the physical interpretability of the model. In order to validate the proposed model and algorithm, numerical experiments regarding the biaxial bending of reinforced concrete columns were conducted. Compared with the control model without feature engineering, this architecture could speed up the model convergence rate by 4~5 times and improve the prediction accuracy rate by 20%~50%. At the same time, the dimensionless parameters reproduced by the physical meaning interpretation algorithm were highly consistent with the classical theoretical analysis conclusions, which proved that the feature engineering architecture successfully captured the influencing factors closely related to the target problem.
-
根据结构自身属性信息计算其力学性能指标是土木工程研究者与设计人员最为关心的一大问题,例如通过截面尺寸、配筋信息与材料性质预测钢筋混凝土梁的抗剪承载力等。传统上,最广泛采用的方法是通过有限元结合实体试验开展参数分析,进而建立经验公式。然而,随着新材料性质与新结构形式日趋复杂,传统方法的计算效率难以满足工程应用转化的需求;同时,人为构造的拟合函数复杂度有限,尤其当力学指标的影响参量较多时,经验公式计算准确度难以保证,易诱发工程安全隐患。
近年来,人工智能的相关研究不断发展,为研究者提供了强大的不依赖主观经验的函数拟合工具[1-4]。越来越多的研究采用机器学习、深度学习等智能模型预测材料[5-10]、构件[11-16]与体系[17-21]各个层次的力学性能,例如:YAN等[6]采用支持向量机(SVM)利用混凝土抗压强度预测劈裂抗拉强度;DEMIR[7]构建了前馈神经网络(FFNN),利用混凝土抗压强度预测了混凝土弹性模量;FENG等[11]利用自适应增强算法(AdaBoost),通过混凝土柱的几何尺寸、配筋情况、材料性质、加载方式等特征预测了塑性铰长度;HOANG[12]利用FFNN,通过纤维增强混凝土板的厚度、加载端直径、混凝土抗压强度、配筋率、钢纤维含量等参数准确预测了板的抗冲切承载力;郑秋怡等[18]基于长短时记忆神经网络(LSTM)通过大跨拱桥的温度时程准确预测了位移响应时程;MORFIDIS等[19]基于地震波的强度、频谱、持时和框架结构总高、结构偏心率和基底两个正交方向的剪力比等信息,采用FFNN准确预测了结构的层间位移角指标。
虽然结构智能计算的相关研究已取得了不少探索性成果,但目前大部分研究都只侧重模型端,致力于引入前沿智能算法以提升模型的表达能力,却少有关注前期数据端的特征工程,或者只是采用最大最小值归一法对输入数据做简单的归一化处理。结构原始数据通常包含多种物理单位,各输入参数在数值范围上相差极大,若直接对携带量纲且量级悬殊的物理量做代数运算,不仅违反物理直觉,而且会损害下游智能模型的收敛速度与性能表现。此外,在经典物理中应用十分广泛的量纲分析[22]已经对无量纲量的重要性和计算方法给出了较为明确的阐述。根据Pi定理[23-24],如果一个物理问题包含多个自变量和一个因变量,那么一定可以将自变量减少为几个相互独立的无量纲参量,且不损失任何信息。在特征工程研究领域,王琛等[25]曾提出非线性参考值放缩法来对结构数据做前处理,通过人为设定的参考值消除量纲。但该方法依旧依赖人工经验,不具有普适性。SAHA等[26]提出了一种层级式网络模型,主要应用在流体力学中的层流-湍流转换问题中,成功复现了重要的无量纲参量雷诺数与相对粗糙度,为结构智能计算的特征工程研究提供了启发。综上所述,开展结构智能计算的特征工程研究,实现结构特征合理、自动地无量纲化,能够增强模型整体性能及其物理可解释性,具有可观的实际应用价值。
本文开展了土木工程结构智能计算的特征工程研究,以期实现任意结构性能预测问题的输入特征自动无量纲化,进而优化模型表现。首先通过引入无量纲化前处理网络,建立了与下游智能模型无关的特征工程架构。在此基础上,提出了一种对模型训练得到的无量纲化参数进行物理意义解读的方法。最后,为验证该模型的有效性,以钢筋混凝土柱双向压弯的屈服承载力预测问题为例开展数值实验,对比有无特征工程两种情形的模型性能表现,考察特征工程架构学习得到的无量纲化参数与经典理论分析结论的吻合程度。
1 特征工程架构与无量纲化预处理网络
本文提出的结构智能计算特征工程架构由输入层、无量纲化处理层、核心智能模型和输出层组成,如图1所示。输入层对所有输入的静态特征施加对数激活函数,经过无量纲化处理层后得到若干无量纲的参量,再通过核心智能模型,获得结构力学性能的预测值。模型收敛后,可以获得无量纲参量si的量纲表达式;进而对其进行物理意义解读,通过因子分析获知当前问题下各无量纲参量的相对重要性。该特征工程架构中,上游的无量纲化处理层与下游的核心智能模型相互独立,二者可以联合训练,因此具有极强的通用性。
以下将详细介绍无量纲化处理层的原理,这也是整个特征工程架构的核心。
在一个结构力学性能预测问题中,所有相关的静态特征可表示为x = {x1, x2, … , xn}。任何一个物理量的量纲可用基本物理量量纲的幂的乘积表出。在力学中,常用的基本物理量有长度、质量和时间,对应的量纲为L、M与T,则特征xi的量纲 [xi] 可表示为L、M和T的幂的乘积,如式(1)所示:
[xi]=Mα1iLα2iTα3i (1) 将每个静态特征的量纲表达式中的三个指数按次序排成一列,就得到了所有特征的量纲矩阵A3×n,如式(2)所示:
{\boldsymbol{A}} = \left[ {\begin{array}{*{20}{c}} {{\alpha _{11}}}&{{\alpha _{12}}}&{...}&{{\alpha _{1n}}} \\ {{\alpha _{21}}}&{{\alpha _{22}}}&{...}&{{\alpha _{2n}}} \\ {{\alpha _{31}}}&{{\alpha _{32}}}&{...}&{{\alpha _{3n}}} \end{array}} \right] (2) 设量纲矩阵A的秩为r,r ≤ min{n, 3}。求量纲矩阵A的解空间的基矩阵Wn×k,其中k=n−r。即A和W的元素满足式(3)所示的关系:
\sum\limits_{j = 1}^n {{\alpha _{ij}}{w_{jm}}} = 0,\;i = 1,\;2,\;3;\;m = 1,\;2,\;\cdots,\;k (3) 结构静态特征经对数激活函数和量纲解空间基矩阵W的作用后,可得到k个中间参量pj,如式(4)所示:
{p_j} = \sum\limits_{i = 1}^n {{w_{ij}}\log ({x_i})} = \log \left(\prod\limits_{i = 1}^n {x_i^{{w_{ij}}}} \right),\;j = 1,\;2,\;\cdots,\;k (4) 令 {\pi _j} = \displaystyle\prod\limits_{i = 1}^n {x_i^{{w_{ij}}}} ,则πj的量纲[πj]也由基本量纲表出,并可结合式(3)的关系进一步化简,如式(5)所示:
\begin{split} [{\pi _j}] = &\prod\limits_{i = 1}^n {{{[{x_i}]}^{{w_{ij}}}} = } \prod\limits_{i = 1}^n {{{({M^{{\alpha _{1i}}}}{L^{{\alpha _{2i}}}}{T^{{\alpha _{3i}}}})}^{{w_{ij}}}}} = \\ & {M^{\sum\limits_{i = 1}^n {{\alpha _{1i}}{w_{ij}}} }}{L^{\sum\limits_{i = 1}^n {{\alpha _{1i}}{w_{ij}}} }}{T^{\sum\limits_{i = 1}^n {{\alpha _{3i}}{w_{ij}}} }} = 1 \end{split} (5) 可知:πj为无量纲参量,则pj=log(πj)也为无量纲参量。此时pj并没有物理意义,也无法反映问题的内在特征,但是他们可以作为构造有物理意义的无量纲参量的基底。于是再将pj经线性变换矩阵Vk×l的作用得到l个参量si,如式(6)所示:
{s_i} = \sum\limits_{j = 1}^k {{p_j}{v_{ji}}} = \sum\limits_{j = 1}^k {\log ({\pi _j}){v_{ji}}} = \log \left(\prod\limits_{j = 1}^k \pi _j^{{v_{ji}}}\right) (6) 式中:vji为线性变换矩阵V的元素,是模型的可学习的参量。
令 {\sigma _i} = \displaystyle\prod\limits_{j = 1}^k {\pi _j^{{v_{ji}}}} ,则可知σi为无量纲参量,因此si也为无量纲参量。一般假设影响结构力学性能的无量纲参量不超过线性无关的无量纲参量总数,因此取si的个数l小于等于k。至此,通过输入层的对数激活函数的处理,再通过无量纲化处理层中一次固定的线性变换及一次可变参数的线性变换的处理,n个结构静态特征已经转化为l个无量纲化参量,接下来经过下游的智能模型处理得到输出。
在其他智能计算架构中,常采用最大最小值归一法或参考值归一法对输入数据做前处理。最大最小值归一法要求模型预测所用输入数据的最大最小值和训练时一致,实际上很难做到。而参考值归一法需要为每个输入变量选取一个有代表性的参考值,把输入变量和参考值相比来做归一化,这种做法依赖于经验,泛化性较差。本文提出的无量纲化前处理层可以解决最大最小值归一法和参考值归一法的问题,可自动实现输入数据的无量纲化处理,同时实现数值的归一化。
2 无量纲参量物理意义解读
通过设置合适的损失函数,再对整个特征工程架构进行联合训练可得到无量纲参量的表达式,为n个结构静态特征的幂的乘积,其中每个静态特征对应的指数由基矩阵W和线性变换矩阵V相乘得到,如式(7)所示:
{\sigma _r} = \prod\limits_{i = 1}^n {x_i^{{{\beta _{ir}}}}} \;,\;\;{\beta _{ir}} = \sum\limits_{j = 1}^k {{w_{ij}}{v_{jr}}}\;,\;\;r = 1,2,\cdots,l (7) 和问题相关的结构静态特征可能有很多,但力学问题中常用的基本量纲只有三个,因此很多时候只需要两三个静态特征即可组成一个简单的无量纲参量,具有更直观的物理意义或工程意义,如截面高宽比h/b。模型训练给出的无量纲参量表达式一般较为复杂,虽然适用于智能计算模型,但是直接解读其物理意义并不容易。为了尝试从复杂的无量纲参量表达式中找到最重要的一个或几个简单的无量纲量,本文提出无量纲参量自动解读算法,如表1所示。例如,对于一个包含截面高度h、截面宽度b,混凝土圆柱体抗压强度f_{\rm{c}}' ,钢筋屈服强度fy,顶部配筋面积Ax,左侧配筋面积Ay六个结构特征的问题,模型给出的其中一个无量纲参量表达式为h0.54A_{{x}}^{0.06}f_{\rm{y}}^{0.01} f_{\rm{c}}^{\prime -0.01} A_{{y}}^{-0.06}b−0.54。算法可将该表达式可重新组合为(h/b)0.54( Ax/ Ay)0.06(fy/f_{\rm{c}}' )0.01,即转化为三个简单的无量纲量h/b、Ax/ Ay和fy/f_{\rm{c}}' 的幂乘积的形式,使得解读其物理意义成为可能,并且每个简单的无量纲量的指数大小也直观地反映了其对问题的影响大小。
表 1 无量纲参量自动解读算法Table 1. Algorithm for the interpretation of the dimensionless parameters输入1:结构静态特征对应的量纲矩阵 A=[α1, ···, αi , ···, αn]
输入2:无量纲参量的指数向量β=[β1, ···, βi, ··· , βn]
1. 对所有特征计算初始不平衡量纲Fi=βiαi , i=1, 2, ···, n
while 存在某个特征的不平衡量纲不为0 do
2. 找到不平衡量纲的1-范数最大的特征 j = \mathop {\arg \max }\limits_i \left| {{\beta _i}} \right|
3.找到与特征j最互补的特征 k = \mathop {\arg \min }\limits_{i \ne j} {\left\| {{F_i} + {F_j}} \right\|_1}
4. 比较|βj|, |βk|的大小,较大的特征为r,较小的为s
5. 更新{{\boldsymbol{\alpha}} _s} = {{\boldsymbol{\alpha}} _s} + {{\boldsymbol{\alpha}} _r} \cdot {{\rm{trunc}}} \left( {{{{\beta _r}} / {{\beta _s}}}} \right)
6. 更新 {\beta _r} = {{\rm{frac}}} \left( {{{{\beta _r}}/ {{\beta _s}}}} \right) \cdot {\beta _s}
7. 更新Fi=βiαi , i=r, s
end while
输出:按指数大小输出特征总的来说,算法不断地寻找当前最不“平衡”的物理量,并尝试用尽可能少的其他物理量和它组合来使它“平衡”,从而组成一个新的简单无量纲量。具体来说,算法第1步计算得到的不平衡量纲表征了这个特征距离无量纲量的相对位置;第2步找到不平衡量纲的1-范数最大的特征j,即最不“平衡”的特征;第3步从剩下的特征中选取和特征j最互补的特征,即二者组合后最接近无量纲量;但由于两者的指数一般不能相互整除,第5步把大的指数取余,而较小指数对应的特征更新为新的组合特征,其量纲也做更新。举例来说,如果当前最远特征j为轴力N,其量纲为M1L1T −2,指数为1.5,和其最互补的特征k为材料强度fy,其量纲为M1L−1T −2,指数为−1.8,则经过第4步~6步后,特征j更新为N/fy,其量纲为M0L2T0,指数仍为1.5,特征k仍为材料强度fy,但其指数更新为−0.3。反复进行上述步骤直到所有的特征距离无量纲量的距离都为0。
3 数值试验
为了验证结构智能计算特征工程架构的效果,本节针对框架结构地震响应中的钢筋混凝土柱双向弯曲问题,将其与无前处理的普通前馈神经网络进行性能对比,同时设置经验拟合公式结果作为参考组,最后按照第2节提出的无量纲量物理意义解读方法提取对该问题影响较大的无量纲参量。
3.1 钢筋混凝土柱双向弯曲问题简介
笔者在前期理论研究[27]中提出过一种钢筋混凝土柱的双向弯曲承载力计算模型,如式(8)所示:
\begin{split} {M_{{\text{cu}}}}(\theta ) =& {M_{{\text{cu,}x}}}\frac{{{{\cos }^2}\theta + {{\sin }^2}\theta /{e^2}}}{{{{( {{{\cos }^P}\theta + {{\sin }^P}\theta /{e^P}} )}^{1/P}}}} = \\ & {M_{{\text{cu}},{{y}}}}\frac{{{e^2}{{\cos }^2}\theta + {{\sin }^2}\theta }}{{{{( {{e^P}{{\cos }^P}\theta + {{\sin }^P}\theta } )}^{1/P}}}},\;\theta \in [0, \pi /2] \end{split} (8) 式中:Mcu(θ)为柱在任意方向上的弯曲承载力;θ为该方向与x轴的夹角;Mcu,x和Mcu,y分别为柱在x方向和y方向的弯曲承载力。
在此基础上提出了钢筋混凝土柱的双向弯曲放大系数,如式(9)所示,其几何意义就是图2中的弯矩放大值与弯曲承载力之和与弯曲承载力的比值:
\begin{split} \alpha (\theta ) = &\min \left\{ {\frac{{{M_{{\text{cu,}x}}}}}{{{M_{{\text{cu}}}}(\theta )\cos \theta }},\frac{{{M_{{\text{cu,}y}}}}}{{{M_{{\text{cu}}}}(\theta )\sin \theta }}} \right\} = \\ & \min \left\{ {\frac{{{{( {1 + {{\tan }^P}\theta /{e^P}} )}^{1/P}}}}{{{{\cos }^2}\theta + {{\sin }^2}\theta /{e^2}}},\frac{{{{( {1 + {e^P}{{\cot }^P}\theta } )}^{1/P}}}}{{{e^2}{{\cos }^2}\theta + {{\sin }^2}\theta }}} \right\},\\ & \theta \in [0, \pi /2] \end{split} (9) 式(8)和式(9)中有两个重要参数:P和e,都有明确的几何意义。P为控制柱的弯曲承载力曲线饱满程度的参数,例如当P=2时,弯曲承载力曲线就是1/4椭圆,当P=1时,弯曲承载力曲线就退化为直线段。而e则为使图2中的弯矩放大值与弯曲承载力之比(即α−1)取得最大值的方向角θq的正切值。即满足式(10)的关系:
e = \tan ({\theta _{\rm{q}}}) (10) P 和 e都由柱截面的几何尺寸、配筋面积、材料属性、轴压力水平决定。
模型利用图3所示的纤维截面模型生成大量数据,通过线性回归获得了P和e与上述截面参数的经验拟合公式。在构造经验拟合公式时,通过观察数据分布特点来选用合理的函数形式,并且尽量采用无量纲化的参数作为自变量,同时要考虑满足对称性的要求以及公式退化到特殊情况时的合理性。在此基础上,还要尽量追求公式的简洁,以方便使用。总之,在此问题中,建立经验拟合公式并不是一个简单的任务。以参数e为例,它的经验拟合公式如式(11)所示:
e = \frac{{h - a}}{{b - a}}\exp \left\{ 1.6({\rho _{{x}}} - {\rho _{{y}}})\frac{{{f_{\text{y}}}}}{{f_{\text{c}}'}}(1 - |{n_{{\text{AF}}}} - 0.3|)\right\} (11) 式中:h、b分别为截面的高和宽;a为钢筋的保护层厚度;ρx为截面顶(底)部配筋率;ρy为截面左(右)侧配筋率;fy为钢筋屈服强度;f_{\rm{c}}' 为混凝土圆柱体抗压强度;nAF为轴压比。由于e在总体上呈现高宽比的形式,因此也称作广义高宽比。拟合公式的表现如图4所示,可见经验拟合公式可以较好地预测广义高宽比e,相对误差不超过15%,均方根误差为7%。由于用于拟合的e的平均值为1.03,因此平均相对误差也在7%左右。
3.2 数据准备
采用基于特征工程架构的前馈神经网络来预测广义高宽比e。选取的自变量为截面宽度b,截面高度h,混凝土圆柱体抗压强度f_{\rm{c}}' ,钢筋屈服强度fy,顶部配筋面积Ax(假设底部配筋面积与顶部配筋面积相同),左侧配筋面积Ay(假设右侧配筋面积与左侧配筋面积相同),轴压力N。
由于工程中常给出配筋率ρx,ρy限值和轴压比nAF限值,因此按以下步骤获得训练所需数据:
1)首先从工程中的常见的参数范围中按均匀分布随机采样获得1000组参数b~U(400, 800),h~U(400, 800),f_{\rm{c}}' ~U(24, 48),fy~U(235, 420),ρx~U(0.02, 0.2),ρy~U(0.02, 0.2);
2)计算配筋面积Ax= ρxbh,Ay= ρybh;
3)前两步获得的每组数据都相当于确定了一个柱截面,在此基础上,按均匀分布采样10个轴压比nAF~U(0,1),并计算对应的轴压力N=nAF(2Ax fy+2Ay fy+bhf_{\rm{c}}' ),共得到10 000组参数;
4)对每组参数,利用纤维截面模型计算其广义高宽比e。
3.3 模型训练参数
利用纤维截面模型共生成了10 000个随机参数组合,按照训练机器学习模型时的常用比例7∶2∶1,取7000个作为训练集,2000个作为验证集,1000个作为测试集。
模型中无量纲化处理层的可变参数为有物理意义的无量纲参量的个数l,在训练中分别取值1、2、3、4、5、6,以探究无量纲参量个数对拟合效果的影响。
无量纲化处理层之后的前馈神经网络是拟合因变量与无量纲参量的函数依赖关系的主要网络层,为了体现无量纲化处理的效果,前馈神经网络仅设置3层,第一隐层设置32个神经元,第二隐层设置16个神经元,隐层的激活函数为ReLU[28],输出层设置1个神经元,不设置激活函数。因无量纲参量个数选取的不同,整个模型的训练参数最少为614个,最多为799个。
考虑到可比较性,建立了伪前处理网络来处理相同的数据,以比较其与特征工程架构网络的拟合效果,示意如图5所示。与图1相比,伪前处理网络以伪处理层代替了无量纲化前处理层,通过一层无偏置量的线性神经元层将对数化的输入转化为l个有量纲的参量。注意到,虽然伪处理层相比于无量纲化前处理层少了量纲解空间基矩阵W的线性变化层,但由于W是固定参数,在模型输入确定之后根据对应的量纲矩阵求解线性方程组即可确定,因此伪前处理网络的参数数量相比于基于特征工程架构的网络差别细微,实际参数对比如表2所示。
由于此问题为连续函数的拟合问题,模型的损失函数设置为均方误差函数(MSE),如式(12)所示:
{{{{L}}}}=\frac{1}{m}{\displaystyle \sum _{i=1}^{m}{({o}_{i}-{o}_{i}^{e})}^{2}} (12) 式中:oi为第i个样本的模型预测输出值;o_i^e 为第i个样本的真实输出值;m为样本个数。
表 2 模型训练参数数量Table 2. Number of training parameters无(有)量纲参量个数 模型训练参数数量 特征工程架构网络 伪前处理网络 1 614 616 2 651 655 3 688 694 4 725 733 5 762 772 6 799 811 优化器采用Adam优化[29],优化器参数采用默认值β1=0.9,β2=0.999,ε =10−8。学习率使用阶梯下降:初始学习率为0.01,每经过2000个epoch降为之前的50%。训练、验证和测试每一个批次(batch)样本量均为每个集合中全体样本。
模型采用Pytorch框架实现,共训练5000个epoch。
4 结果分析与讨论
4.1 无量纲参数数量的影响
图6给出了特征工程网络中无量纲参数数量对拟合精度的影响,可以看到:随着无量纲参量数量的增加,模型拟合的均方误差逐渐减小,数量增加到4后,再增加无量纲参量的数量,均方误差不再减小。注意到式(11)给出的理论公式使用了截面高宽比、双向配筋率差、钢材混凝土强度比和轴压比4个无量纲参量。这说明特征工程架构可以捕捉到解释问题所需的最少的无量纲参量数量,从而提高结构智能计算的效率。
无量纲参量数量为4时的一次拟合结果如图7所示。可见模型可以较好地预测广义高宽比e,相对误差不超过5%,均方根误差为2%,平均相对误差也在2%左右。与经验拟合公式达到的7%的相对误差相比大幅降低,说明基于特征工程架构的前馈神经网络可以得到比经验公式更好的拟合效果。
4.2 特征工程架构网络与伪前处理网络的对比
图8是在选取不同数目的预处理层参数(即图1和图5中si参数个数)条件下,两种网络的训练损失函数随训练轮次的下降情况。可以看到:特征工程架构网络比伪前处理网络的训练损失更小,并且在预处理层神经元预设数目大于等于3之后更加明显,前者的训练损失分别是后者的49%、38%、22%和34%,这说明使用特征工程架构,可以将训练损失降低至少一半。
从模型的收敛速率上来看,特征工程架构的优势更为显著。特征工程架构网络达到伪前处理网络的最终训练损失所用的轮次数分别为后者的32%、28%、4%、29%、17%、17%。这说明使用特征工程架构,可以将平均收敛速率提高4倍~5倍。从训练损失下降曲线上来看,两种架构网络都出现了震荡现象,这表明当前的学习率过大。而特征工程网络的震荡幅度小于伪前处理网络的震荡幅度,这说明采取特征工程架构可使模型训练更轻松。
综上所述,在所有情形下,基于特征工程架构的网络在训练过程中的训练损失都下降的更快,震荡幅度更小,训练完成损失更低,证明了所提出的特征工程架构能够从输入特征中更有效地挖掘信息,降低数据维度,从而大幅提升下游智能模型的性能表现。
4.3 无量纲参量物理意义解读
根据算法1,可以给出无量纲参量的拆解方式,并按指数降序排列,如表3、表4和表5所示。
表 3 无量纲参量表达式(参量数量=1)Table 3. Dimensionless expression (number = 1)试验ID 参量ID 无量纲参量表达式 1 1 {\left( {\dfrac{h}{b} } \right)^{0.54} }{\left( {\dfrac{ { {A_{{x} } } }}{ { {A_{{y} } } } } } \right)^{0.06} }{\left( {\dfrac{ { {f_{\text{y} } } }}{ { {f_{\text{c} }'} } } } \right)^{0.01} } 2 1 {\left( {\dfrac{h}{b} } \right)^{0.57} }{\left( {\dfrac{ { {A_{{x} } } }}{ { {A_{{y} } } } } } \right)^{0.07} }{\left( {\dfrac{ { {f_{\text{y} } } }}{ { {f_{\text{c} }'} } } } \right)^{0.01} } 3 1 {\left( {\dfrac{h}{b} } \right)^{0.70} }{\left( {\dfrac{ { {A_{{x} } } }}{ { {A_{{y} } } } } } \right)^{0.08} }{\left( {\dfrac{ { {f_{\text{y} } } }}{ { {f_{\text{c} }'} } } } \right)^{0.02} } 表 4 无量纲参量表达式(参量数量=2)Table 4. Dimensionless expression (number = 2)试验
ID参量ID 无量纲参量表达式 1 1 {\left( {\dfrac{ { {f_{\text{y} } } }}{ { {f_{\text{c} }'} } } } \right)^{0.25} }{\left( {\dfrac{ { {A_{{x} } } }}{ { {b^2} } } } \right)^{0.22} }{\left( {\dfrac{ { {A_{{x} } } }}{ { {A_{{y} } } } } } \right)^{0.07} }{\left( {\dfrac{ { {f_{\text{y} } }{A_{{x} } } }}{N} } \right)^{0.05} } 2 {\left( {\dfrac{h}{b} } \right)^{0.26} }{\left( {\dfrac{ { {f_{\text{c} }'} } }{ { {f_{\text{y} } } } } } \right)^{0.22} }{\left( {\dfrac{ { {h^2} } }{ { {A_{{x} } } } } } \right)^{0.19} }{\left( {\dfrac{N}{ { {f_{\text{y} } }{A_{{x} } } } } } \right)^{0.04} } 2 1 {\left( {\dfrac{h}{b} } \right)^{0.43} }{\left( {\dfrac{ { {f_{\text{y} } }{A_{{x} } } }}{N} } \right)^{0.23} }{\left( {\dfrac{ { {h^2} } }{ { {A_{{y} } } } } } \right)^{0.07} }{\left( {\dfrac{ { {A_{{x} } } }}{ { {A_{{y} } } } } } \right)^{0.05} } 2 {\left( {\dfrac{N}{ { {f_{\text{y} } }{A_{{x} } } } } } \right)^{0.28} }{\left( {\dfrac{ { {A_{{y} } } }}{ { {b^2} } } } \right)^{0.07} }{\left( {\dfrac{h}{b} } \right)^{0.04} }{\left( {\dfrac{N}{ { {f_{\text{c} }'}{b^2} } } } \right)^{0.03} } 3 1 {\left( {\dfrac{b}{h} } \right)^{0.51} }{\left( {\dfrac{ { {A_{{y} } } }}{ { {A_{{x} } } } } } \right)^{0.06} }{\left( {\dfrac{ { {f_{\text{c} }'} } }{ { {f_{\text{y} } } } } } \right)^{0.01} }{\left( {\dfrac{ { {b^2} } }{ { {A_{{x} } } } } } \right)^{0.01} } 2 {\left( {\dfrac{N}{ { {f_{\text{y} } }{A_{{x} } } } } } \right)^{0.24} }{\left( {\dfrac{ { {A_{{y} } } }}{ {bh} } } \right)^{0.09} }{\left( {\dfrac{N}{ { {f_{\text{c} }'}{h^2} } } } \right)^{0.08} } 表 5 无量纲参量表达式(参量数量=3)Table 5. Dimensionless expression (number = 3)试验ID 参量ID 无量纲参量表达式 1 1 {\left( {\dfrac{b}{h} } \right)^{0.63} }{\left( {\dfrac{ { {A_{{y} } } }}{ { {A_{{x} } } } } } \right)^{0.18} }{\left( {\dfrac{ { {f_{\text{c} }'} } }{ { {f_{\text{y} } } } } } \right)^{0.05} }{\left( {\dfrac{N}{ { {f_{\text{y} } }{A_{{x} } } } } } \right)^{0.04} } 2 {\left( {\dfrac{ { {f_{\text{y} } }{A_{{x} } } }}{N} } \right)^{0.34} }{\left( {\dfrac{ {bh} }{ { {A_{{y} } } } } } \right)^{0.15} }{\left( {\dfrac{ { {A_{{x} } } }}{ { {A_{{y} } } } } } \right)^{0.07} }{\left( {\dfrac{ { {f_{\text{y} } } }}{ { {f_c'} } } } \right)^{0.04} } 3 {\left( {\dfrac{ { {f_{\text{c} }'}{A_{{y} } } }}{N} } \right)^{0.24} }{\left( {\dfrac{ { {A_{{y} } } }}{ { {A_{{x} } } } } } \right)^{0.11} }{\left( {\dfrac{ { {b^2} } }{ { {A_{{x} } } } } } \right)^{0.09} }{\left( {\dfrac{ { {f_{\text{y} } }bh} }{N} } \right)^{0.04} } 2 1 {\left( {\dfrac{h}{b} } \right)^{0.40} }{\left( {\dfrac{N}{ { {f_{\text{y} } }{A_{{x} } } } } } \right)^{0.15} }{\left( {\dfrac{ { {f_{\text{c} }'} } }{ { {f_{\text{y} } } } } } \right)^{0.13} }{\left( {\dfrac{ { {A_{{y} } } }}{ { {A_{{x} } } } } } \right)^{0.04} } 2 {\left( {\dfrac{h}{b} } \right)^{0.48} }{\left( {\dfrac{ { {f_{\text{y} } }{A_{{x} } } }}{N} } \right)^{0.12} }{\left( {\dfrac{ { {A_{{x} } } }}{ { {A_{{y} } } } } } \right)^{0.08} }{\left( {\dfrac{ { {f_{\text{y} } } }}{ { {f_{\text{c} }'} } } } \right)^{0.07} } 3 {\left( {\dfrac{ { {f_{\text{c} }'}{b^2} } }{N} } \right)^{0.19} }{\left( {\dfrac{ { {f_{\text{y} } }{A_{{y} } } }}{N} } \right)^{0.15} }{\left( {\dfrac{ { {A_{{y} } } }}{ { {A_{{x} } } } } } \right)^{0.07} } 3 1 {\left( {\dfrac{N}{ { {f_{\text{y} } }{A_{{x} } } } } } \right)^{0.25} }{\left( {\dfrac{N}{ { {f_{\text{y} } }{A_{{x} } } } } } \right)^{0.08} }{\left( {\dfrac{b}{h} } \right)^{0.07} }{\left( {\dfrac{ { {f_{\text{c} }'} } }{ { {f_{\text{y} } } } } } \right)^{0.04} } 2 {\left( {\dfrac{ { {f_{\text{y} } }{A_{{y} } } }}{N} } \right)^{0.23} }{\left( {\dfrac{h}{b} } \right)^{0.17} }{\left( {\dfrac{ { {f_{\text{c} }'}{A_{{y} } } }}{N} } \right)^{0.12} }{\left( {\dfrac{ { {A_{{y} } } }}{ { {A_{{x} } } } } } \right)^{0.06} } 3 {\left( {\dfrac{b}{h} } \right)^{0.48} }{\left( {\dfrac{ { {f_{\text{y} } }{A_{{y} } } }}{N} } \right)^{0.12} }{\left( {\dfrac{ { {A_{{y} } } }}{ { {A_{{x} } } } } } \right)^{0.05} }{\left( {\dfrac{ { {f_{\text{c} }'}{A_{{y} } } }}{N} } \right)^{0.04} } 从表3可以看出,当模型中只有一个无量纲参量时,三次试验给出的结果都很接近,在无量纲参量的组成成分中,截面高宽比b/h占据绝对重要的地位,其指数比其他组成成分高出接近一个数量级。其次是两个方向的配筋面积比Ax/Ay。式(11)给出的经验公式中,也是截面高宽比最为重要,是整个公式的基础。这说明此时模型可以捕捉到最重要的一个无量纲参量。
而当模型可以选择两个无量纲参量时,如表4所示,其中一个无量纲参量仍然以截面高宽比为最重要的组成成分,同时算法可以解读出截面轴压比为另一与目标问题密切相关的影响因素。
继续增加到三个无量纲参量时,由表5可知截面高宽比、轴压比和两个方向的配筋面积比是较为重要的组成成分。事实上,这与式(11)中的理论分析结果高度吻合。这说明特征工程架构网络不仅可以从数量上还能从物理意义上捕捉对问题影响较大的无量纲参量。
4.4 讨论
针对特征工程架构网络给出的无量纲参量,本文给出了一种拆解和物理意义解读的算法。在实践中发现,算法对那些主要成分较为突出的无量纲参量,能够给出较为确定和物理意义较为明确的拆解方式,但是对那些各特征占比较为平均的无量纲参量,其本身存在多种合理的拆解方式,而算法给出其中一种,其物理意义可能较为模糊。因此模型的物理意义解读应该和模型的训练结合起来,例如在模型的损失函数中加入无量纲参量的正则化项来使其主成分更加突出,通过更完善的训练来保证获得更明确的解读。
特征工程架构虽然能以很高的精度进行结构力学性能预测,而且具有一定的物理意义,但是仍有一些可扩展的部分,需要进一步研究,具体来说有以下两点:
1)负数输入:特征工程架构中的输入层所采用的log激活函数不能处理负数输入,这会限制模型的应用范围。在结构领域中,很多问题在负数域的行为和在正数域的行为是不对称的,例如钢构件的受压屈曲问题,混凝土构件的受拉开裂问题,如果一根钢结构柱既可能承受压力,也可能承受拉力,由于拉压不对称问题的存在,必须采用正数和负数一起描述轴力,而不能通过对称性去掉负数。一种直观的解决方案是对一个特征的负数和正数问题分类讨论,训练两个模型来分别处理。但是如果有多个结构静态特征同时具有正负数域不对称的问题,那么模型的数量将会成指数级别增长,这在实际应用中是无法接受的。因此,如何处理特征中的负数问题值得在后续研究中重点关注;
2)“0”输入:与负数类似,log激活函数无法处理为0的输入。在实际应用中,结构数据集经常会出现数据或特征缺失,例如在剪力墙问题中可能存在部分构件未被施加轴压力,则一种工程弥补方案是对缺失的数据部分补0值。在传统数值研究中,会对绝对值小于某个阈值(包括0)的参数进行数值截断,代之以预设阈值;但与此同时,预设值须视问题场景的数量级进行设置,例如材性本构研究中应力(MPa为单位)与应变数量级差异可达106,设置阈值时通常会分开考虑,这导致该方法仍旧在一定程度上依赖于人工分辨。因此,上述方法虽然为解决“0”问题提供了可行思路,但仍需进一步改进其自动化程度。
5 结论
本文针对结构智能计算中原始数据物理单位多、数量级差异显著的问题,提出了一个与下游智能模型无关的特征工程通用架构。数值试验表明,该架构成功实现了原始数据自动去量纲化以及有效力学特征的提取,并能够显著加快模型收敛速率,提升模型预测准确率。
主要研究结论总结如下:
(1)引入无量纲化前处理网络,建立了与下游智能模型无关的特征工程架构。该架构基于量纲矩阵分析,在量纲矩阵解空间将基底向量的线性组合问题神经网络化,从而实现原始数据向无量纲参量的自动转化;
(2)提出了一种无量纲参量的物理意义解读方法,并设计了对应算法将训练后模型得到的复杂无量纲参量进行拆解,从而提取与目标问题密切相关的影响因素,大幅提升特征工程架构的物理可解释性;
(3)开展了基于钢筋混凝土柱双向弯曲问题的数值试验,结果表明:在设定了充足无量纲参量数目的情形下,相较于对照模型,本特征工程架构能够加快模型收敛速度4倍~5倍,并提升预测准确率20%~50%;
(4)论述了特征工程架构的扩展性,并对包含负数和0的数据输入情形进行了简要讨论,分析了可行的解决方案与待改进的问题,为未来结构智能计算特征工程研究提供了方向参考。
-
表 1 无量纲参量自动解读算法
Table 1 Algorithm for the interpretation of the dimensionless parameters
输入1:结构静态特征对应的量纲矩阵 A=[α1, ···, αi , ···, αn]
输入2:无量纲参量的指数向量β=[β1, ···, βi, ··· , βn]
1. 对所有特征计算初始不平衡量纲Fi=βiαi , i=1, 2, ···, n
while 存在某个特征的不平衡量纲不为0 do
2. 找到不平衡量纲的1-范数最大的特征 j = \mathop {\arg \max }\limits_i \left| {{\beta _i}} \right|
3.找到与特征j最互补的特征 k = \mathop {\arg \min }\limits_{i \ne j} {\left\| {{F_i} + {F_j}} \right\|_1}
4. 比较|βj|, |βk|的大小,较大的特征为r,较小的为s
5. 更新{{\boldsymbol{\alpha}} _s} = {{\boldsymbol{\alpha}} _s} + {{\boldsymbol{\alpha}} _r} \cdot {{\rm{trunc}}} \left( {{{{\beta _r}} / {{\beta _s}}}} \right)
6. 更新 {\beta _r} = {{\rm{frac}}} \left( {{{{\beta _r}}/ {{\beta _s}}}} \right) \cdot {\beta _s}
7. 更新Fi=βiαi , i=r, s
end while
输出:按指数大小输出特征表 2 模型训练参数数量
Table 2 Number of training parameters
无(有)量纲参量个数 模型训练参数数量 特征工程架构网络 伪前处理网络 1 614 616 2 651 655 3 688 694 4 725 733 5 762 772 6 799 811 表 3 无量纲参量表达式(参量数量=1)
Table 3 Dimensionless expression (number = 1)
试验ID 参量ID 无量纲参量表达式 1 1 {\left( {\dfrac{h}{b} } \right)^{0.54} }{\left( {\dfrac{ { {A_{{x} } } }}{ { {A_{{y} } } } } } \right)^{0.06} }{\left( {\dfrac{ { {f_{\text{y} } } }}{ { {f_{\text{c} }'} } } } \right)^{0.01} } 2 1 {\left( {\dfrac{h}{b} } \right)^{0.57} }{\left( {\dfrac{ { {A_{{x} } } }}{ { {A_{{y} } } } } } \right)^{0.07} }{\left( {\dfrac{ { {f_{\text{y} } } }}{ { {f_{\text{c} }'} } } } \right)^{0.01} } 3 1 {\left( {\dfrac{h}{b} } \right)^{0.70} }{\left( {\dfrac{ { {A_{{x} } } }}{ { {A_{{y} } } } } } \right)^{0.08} }{\left( {\dfrac{ { {f_{\text{y} } } }}{ { {f_{\text{c} }'} } } } \right)^{0.02} } 表 4 无量纲参量表达式(参量数量=2)
Table 4 Dimensionless expression (number = 2)
试验
ID参量ID 无量纲参量表达式 1 1 {\left( {\dfrac{ { {f_{\text{y} } } }}{ { {f_{\text{c} }'} } } } \right)^{0.25} }{\left( {\dfrac{ { {A_{{x} } } }}{ { {b^2} } } } \right)^{0.22} }{\left( {\dfrac{ { {A_{{x} } } }}{ { {A_{{y} } } } } } \right)^{0.07} }{\left( {\dfrac{ { {f_{\text{y} } }{A_{{x} } } }}{N} } \right)^{0.05} } 2 {\left( {\dfrac{h}{b} } \right)^{0.26} }{\left( {\dfrac{ { {f_{\text{c} }'} } }{ { {f_{\text{y} } } } } } \right)^{0.22} }{\left( {\dfrac{ { {h^2} } }{ { {A_{{x} } } } } } \right)^{0.19} }{\left( {\dfrac{N}{ { {f_{\text{y} } }{A_{{x} } } } } } \right)^{0.04} } 2 1 {\left( {\dfrac{h}{b} } \right)^{0.43} }{\left( {\dfrac{ { {f_{\text{y} } }{A_{{x} } } }}{N} } \right)^{0.23} }{\left( {\dfrac{ { {h^2} } }{ { {A_{{y} } } } } } \right)^{0.07} }{\left( {\dfrac{ { {A_{{x} } } }}{ { {A_{{y} } } } } } \right)^{0.05} } 2 {\left( {\dfrac{N}{ { {f_{\text{y} } }{A_{{x} } } } } } \right)^{0.28} }{\left( {\dfrac{ { {A_{{y} } } }}{ { {b^2} } } } \right)^{0.07} }{\left( {\dfrac{h}{b} } \right)^{0.04} }{\left( {\dfrac{N}{ { {f_{\text{c} }'}{b^2} } } } \right)^{0.03} } 3 1 {\left( {\dfrac{b}{h} } \right)^{0.51} }{\left( {\dfrac{ { {A_{{y} } } }}{ { {A_{{x} } } } } } \right)^{0.06} }{\left( {\dfrac{ { {f_{\text{c} }'} } }{ { {f_{\text{y} } } } } } \right)^{0.01} }{\left( {\dfrac{ { {b^2} } }{ { {A_{{x} } } } } } \right)^{0.01} } 2 {\left( {\dfrac{N}{ { {f_{\text{y} } }{A_{{x} } } } } } \right)^{0.24} }{\left( {\dfrac{ { {A_{{y} } } }}{ {bh} } } \right)^{0.09} }{\left( {\dfrac{N}{ { {f_{\text{c} }'}{h^2} } } } \right)^{0.08} } 表 5 无量纲参量表达式(参量数量=3)
Table 5 Dimensionless expression (number = 3)
试验ID 参量ID 无量纲参量表达式 1 1 {\left( {\dfrac{b}{h} } \right)^{0.63} }{\left( {\dfrac{ { {A_{{y} } } }}{ { {A_{{x} } } } } } \right)^{0.18} }{\left( {\dfrac{ { {f_{\text{c} }'} } }{ { {f_{\text{y} } } } } } \right)^{0.05} }{\left( {\dfrac{N}{ { {f_{\text{y} } }{A_{{x} } } } } } \right)^{0.04} } 2 {\left( {\dfrac{ { {f_{\text{y} } }{A_{{x} } } }}{N} } \right)^{0.34} }{\left( {\dfrac{ {bh} }{ { {A_{{y} } } } } } \right)^{0.15} }{\left( {\dfrac{ { {A_{{x} } } }}{ { {A_{{y} } } } } } \right)^{0.07} }{\left( {\dfrac{ { {f_{\text{y} } } }}{ { {f_c'} } } } \right)^{0.04} } 3 {\left( {\dfrac{ { {f_{\text{c} }'}{A_{{y} } } }}{N} } \right)^{0.24} }{\left( {\dfrac{ { {A_{{y} } } }}{ { {A_{{x} } } } } } \right)^{0.11} }{\left( {\dfrac{ { {b^2} } }{ { {A_{{x} } } } } } \right)^{0.09} }{\left( {\dfrac{ { {f_{\text{y} } }bh} }{N} } \right)^{0.04} } 2 1 {\left( {\dfrac{h}{b} } \right)^{0.40} }{\left( {\dfrac{N}{ { {f_{\text{y} } }{A_{{x} } } } } } \right)^{0.15} }{\left( {\dfrac{ { {f_{\text{c} }'} } }{ { {f_{\text{y} } } } } } \right)^{0.13} }{\left( {\dfrac{ { {A_{{y} } } }}{ { {A_{{x} } } } } } \right)^{0.04} } 2 {\left( {\dfrac{h}{b} } \right)^{0.48} }{\left( {\dfrac{ { {f_{\text{y} } }{A_{{x} } } }}{N} } \right)^{0.12} }{\left( {\dfrac{ { {A_{{x} } } }}{ { {A_{{y} } } } } } \right)^{0.08} }{\left( {\dfrac{ { {f_{\text{y} } } }}{ { {f_{\text{c} }'} } } } \right)^{0.07} } 3 {\left( {\dfrac{ { {f_{\text{c} }'}{b^2} } }{N} } \right)^{0.19} }{\left( {\dfrac{ { {f_{\text{y} } }{A_{{y} } } }}{N} } \right)^{0.15} }{\left( {\dfrac{ { {A_{{y} } } }}{ { {A_{{x} } } } } } \right)^{0.07} } 3 1 {\left( {\dfrac{N}{ { {f_{\text{y} } }{A_{{x} } } } } } \right)^{0.25} }{\left( {\dfrac{N}{ { {f_{\text{y} } }{A_{{x} } } } } } \right)^{0.08} }{\left( {\dfrac{b}{h} } \right)^{0.07} }{\left( {\dfrac{ { {f_{\text{c} }'} } }{ { {f_{\text{y} } } } } } \right)^{0.04} } 2 {\left( {\dfrac{ { {f_{\text{y} } }{A_{{y} } } }}{N} } \right)^{0.23} }{\left( {\dfrac{h}{b} } \right)^{0.17} }{\left( {\dfrac{ { {f_{\text{c} }'}{A_{{y} } } }}{N} } \right)^{0.12} }{\left( {\dfrac{ { {A_{{y} } } }}{ { {A_{{x} } } } } } \right)^{0.06} } 3 {\left( {\dfrac{b}{h} } \right)^{0.48} }{\left( {\dfrac{ { {f_{\text{y} } }{A_{{y} } } }}{N} } \right)^{0.12} }{\left( {\dfrac{ { {A_{{y} } } }}{ { {A_{{x} } } } } } \right)^{0.05} }{\left( {\dfrac{ { {f_{\text{c} }'}{A_{{y} } } }}{N} } \right)^{0.04} } -
[1] GOODFELLOW I, BENGIO Y, COURVILLE A. Deep learning [M]. Cambridge, MA, USA: MIT Press, 2016: 1 − 16.
[2] DANGETI P. Statistics for machine learning [M]. Birmingham, England, UK: Packt Publishing Ltd, 2017: 1 − 23.
[3] SAMMUT C, WEBB G I. Encyclopedia of machine learning [M]. New York, NY, USA: Springer, 2011: 44 − 45.
[4] HINTON G E, OSINDERO S, TEH Y W. A fast-learning algorithm for deep belief nets [J]. Neural computation, 2006, 18(7): 1527 − 1554. doi: 10.1162/neco.2006.18.7.1527
[5] 白国良, 刘彪, 许振华, 等. 基于Elman神经网络算法的型钢再生混凝土结构粘结强度预测方法研究[J]. 建筑结构, 2021, 51(16): 35 − 41. BAI Guliang, LIU Biao, XU Zhenhua, et al. Study on the prediction method of bond strength of steel reinforced regenerated concrete structure based on Elman neural network algorithm [J]. Building Structure, 2021, 51(16): 35 − 41. (in Chinese)
[6] YAN K, XU H, SHEN G, et al. Prediction of splitting tensile strength from cylinder compressive strength of concrete by support vector machine [J]. Advances in Materials Science and Engineering, 2013: 597257. doi: 10.1155/2013/597257
[7] DEMIR F. Prediction of elastic modulus of normal and high strength concrete by artificial neural networks [J]. Construction and building Materials, 2008, 22(7): 1428 − 1435. doi: 10.1016/j.conbuildmat.2007.04.004
[8] PHAM T M, HADI M N S. Predicting stress and strain of FRP-confined square/rectangular columns using artificial neural networks [J]. Journal of Composites for Construction, 2014, 18(6): 04014019. doi: 10.1061/(ASCE)CC.1943-5614.0000477
[9] FENG D C, LIU Z T, WANG X D, et al. Machine learning-based compressive strength prediction for concrete: An adaptive boosting approach [J]. Construction and Building Materials, 2020, 230: 117000. doi: 10.1016/j.conbuildmat.2019.117000
[10] ERDAL H I, KARAKURT O, NAMLI E. High performance concrete compressive strength forecasting using ensemble models based on discrete wavelet transform [J]. Engineering Applications of Artificial Intelligence, 2013, 26(4): 1246 − 1254. doi: 10.1016/j.engappai.2012.10.014
[11] FENG D C, CETINER B, AZADI KAKAVAND M R, et al. Data-driven approach to predict the plastic hinge length of reinforced concrete columns and its application [J]. Journal of Structural Engineering, 2021, 147(2): 04020332. doi: 10.1061/(ASCE)ST.1943-541X.0002852
[12] HOANG N D. Estimating punching shear capacity of steel fibre reinforced concrete slabs using sequential piecewise multiple linear regression and artificial neural network [J]. Measurement, 2019, 137: 58 − 70. doi: 10.1016/j.measurement.2019.01.035
[13] FENG D C, LIU Z T, WANG X D, et al. Failure mode classification and bearing capacity prediction for reinforced concrete columns based on ensemble machine learning algorithm [J]. Advanced Engineering Informatics, 2020, 45: 101126. doi: 10.1016/j.aei.2020.101126
[14] ALWANAS A A H, AL-MUSAWI A A, SALIH S Q, et al. Load-carrying capacity and mode failure simulation of beam-column joint connection: Application of self-tuning machine learning model [J]. Engineering Structures, 2019, 194: 220 − 229. doi: 10.1016/j.engstruct.2019.05.048
[15] 韩小雷, 冯润平, 季静, 等. 基于深度学习的RC梁集中塑性铰模型参数研究[J]. 工程力学, 2021, 38(11): 160 − 169. doi: 10.6052/j.issn.1000-4750.2020.11.0793 HAN Xiaolei, FENG Runping, JI Jing, et al. Research on parameters of the RC beam lumped plastic hinge model based on deep learning [J]. Engineering Mechanics, 2021, 38(11): 160 − 169. (in Chinese) doi: 10.6052/j.issn.1000-4750.2020.11.0793
[16] 张书颖, 陈适之, 韩万水, 等. 基于集成学习的FRP加固混凝土梁抗弯承载力预测研究[J]. 工程力学, 2022, 39(8): 245 − 256. doi: 10.6052/j.issn.1000-4750.2021.06.0422 ZHANG Shuying, CHEN Shizhi, HAN Wanshui, et al. Study on prediction of FRP strengthened reinforced concrete beam’s moment bearing capacity based on ensemble learning algorithm [J]. Engineering Mechanics, 2022, 39(8): 245 − 256. (in Chinese) doi: 10.6052/j.issn.1000-4750.2021.06.0422
[17] 赵林鑫, 江守燕, 杜成斌. 基于SBFEM和机器学习的薄板结构缺陷反演[J]. 工程力学, 2021, 38(6): 36 − 46. doi: 10.6052/j.issn.1000-4750.2020.06.0416 ZHAO Linxin, JIANG Shouyan, DU Chengbin. Flaws detection in thin plate structures based on SBFEM and maching learning [J]. Engineering Mechanics, 2021, 38(6): 36 − 46. (in Chinese) doi: 10.6052/j.issn.1000-4750.2020.06.0416
[18] 郑秋怡, 周广东, 刘定坤. 基于长短时记忆神经网络的大跨拱桥温度-位移相关模型建立方法[J]. 工程力学, 2021, 38(4): 68 − 79. doi: 10.6052/j.issn.1000-4750.2020.05.0323 ZHENG Qiuyi, ZHOU Guangdong, LIU Dingkun. Method of modeling temperature-displacement correlation for long-span arch bridges based on long short-term memory neural networks [J]. Engineering Mechanics, 2021, 38(4): 68 − 79. (in Chinese) doi: 10.6052/j.issn.1000-4750.2020.05.0323
[19] MORFIDIS K, KOSTINAKIS K. Seismic parameters’ combinations for the optimum prediction of the damage state of R/C buildings using neural networks [J]. Advances in Engineering Software, 2017, 106: 1 − 16. doi: 10.1016/j.advengsoft.2017.01.001
[20] SUN H, BURTON H, WALLACE J. Reconstructing seismic response demands across multiple tall buildings using kernel‐based machine learning methods [J]. Structural Control and Health Monitoring, 2019, 26(7): e2359.
[21] HWANG S H, MANGALATHU S, SHIN J, et al. Machine learning-based approaches for seismic demand and collapse of ductile reinforced concrete building frames [J]. Journal of Building Engineering, 2021, 34: 101905. doi: 10.1016/j.jobe.2020.101905
[22] TAN Q M. Dimensional analysis: with case studies in mechanics [M]. Berlin, Heidelberg: Springer, 2011: 7 − 16.
[23] BUCKINGHAM E. On physically similar systems; illustrations of the use of dimensional equations [J]. Physical Review, 1914, 4(4): 345 − 376. doi: 10.1103/PhysRev.4.345
[24] BRAND L. The Pi theorem of dimensional analysis [J]. Archive for Rational Mechanics and Analysis, 1957, 1(1): 35 − 45. doi: 10.1007/BF00297994
[25] 王琛, 樊健生. 具有历史依赖效应的材料及结构响应预测通用深度学习模型MechPerformer[J]. 建筑结构学报, 2022, 43(8): 209 − 219. doi: 10.14006/j.jzjgxb.2021.0115 WANG Chen, FAN Jiansheng. A general deep learning model (MechPerformer) for history-dependent response prediction in structural engineering [J]. Journal of Building Structures, 2022, 43(8): 209 − 219. (in Chinese) doi: 10.14006/j.jzjgxb.2021.0115
[26] SAHA S, GAN Z T, CHENG L, et al. Hierarchical Deep Learning Neural Network (HiDeNN): An artificial intelligence (AI) framework for computational science and engineering [J]. Computer Methods in Applied Mechanics and Engineering, 2021, 373: 113452. doi: 10.1016/j.cma.2020.113452
[27] ZHANG C, TAO M X. Strong-column–weak-beam criterion for reinforced concrete frames subjected to biaxial seismic excitation [J]. Engineering Structures, 2021, 241: 112481. doi: 10.1016/j.engstruct.2021.112481
[28] KRIZHEVSKY A, SUTSKEVER I, HINTON G E. Imagenet classification with deep convolutional neural networks [J]. Communications of the ACM, 2017, 60(6): 84 − 90.
[29] KINGMA D, BA J. Adam: a method for stochastic optimization [C]// Proceedings of the 3rd International Conference for Learning Representations. San Diego: ICLR, 2015.
-
期刊类型引用(5)
1. 宋凌寒,王琛,樊健生. 理论驱动的弹性结构体系图神经网络计算模型. 工程力学. 2024(02): 25-34 . 本站查看
2. 陈培尧,王琛,丁然,樊健生. 土木工程设计公式智能发现方法. 建筑结构学报. 2024(07): 80-88 . 百度学术
3. 王伟,付柏超. 基于数据驱动和设计规则约束的钢框架-支撑结构平面布置智能设计方法. 建筑结构学报. 2024(07): 13-21 . 百度学术
4. 王律己,黄晨宇,单伽锃,余桦,苏金蓉. 基于多元特征驱动的既有建筑地震损伤机器学习预测方法. 建筑结构学报. 2024(07): 1-12 . 百度学术
5. 胡烨之,张雅琪,卢昌红. 基于深度学习的结构位移场预测方法. 计算机辅助工程. 2024(04): 69-76 . 百度学术
其他类型引用(3)