MULTI-FACTOR MACHINE LEARNING PREDICTION MODEL FOR THE NATURAL PERIOD OF BUILDINGS
-
摘要:
建筑物基本周期是其最重要的动力特性参数,影响因素众多。受限于曲线拟合的传统建模手段,目前的基本周期预测模型表达式中仅能包含高度或层数等单一因素,而忽略其他因素的影响。数据驱动机器学习方法的出现,为建筑周期多因素预测模型的建立提供了新思路。研究从大量文献中收集整理了2561条建筑周期的实测数据,形成了包含建筑高度、层数、材料、功能、地区等多因素的建筑周期实测数据库。建立了具有自学习能力的建筑基本周期多因素机器学习预测模型,避免了一般机器学习模型中繁琐的参数调节过程,提升模型的鲁棒性和适用性。与传统模型结果的对比表明:所提预测模型的适用结构类型范围广、准确性更高,配合云端服务器可形成一种全新的、开放式自学习的建筑周期预测模式。
Abstract:The natural period of buildings is a very important parameter for structural dynamic characteristic analysis, which is influenced by many factors. Due to the limitations of the traditional modeling method of curve fitting, the current natural period prediction model only includes single factor such as the height or the number of storeys, while the influence of other factors is ignored. The emergence of data-driven machine learning method provides a new idea to establish a multi-factor prediction model. A total of 2561 building period records of existing buildings are collected from a large number of published documents. A building period database is developed, including the building height, the number of floors, materials, functions, et al. A multi-factor machine learning prediction of building fundamental period with self-learning ability is established, which avoids the tedious parameter adjusting procedure. Comparisons with traditional prediction models show that the proposed prediction model has a wider prediction range of various structural types and higher accuracy. Combined with cloud server, it can form a new, publicly-open and self-learning building period prediction model.
-
Keywords:
- natural period /
- measured data /
- multiple factor /
- machine learning /
- AutoML
-
建筑物的基本周期是建筑结构最重要的动力特性,综合反映了结构的刚度、质量及其分布情况,在设计阶段的荷载估计、参数化建模,以及使用阶段的结构健康监测、实际性能评估等方面,都有十分重要的用途。例如,结构基本周期决定了地震下频谱加速度/地震影响系数[1-2],影响基底剪力设计值;已建结构健康监测系统设计时基本周期的预估,周期的变化也往往预示着结构中系统性损伤的发生与演变[3];城市区域抗震分析中,建筑物周期是参数化建模的核心变量[4]。
面向设计阶段对建筑周期快速预测的需要,以及无实测条件时已建建筑物特性评估的需求,学者们提出了大量的结构基本自振周期经验预测模型[5-7]。然而,受传统的指定函数后拟合回归建模手段的限制,目前大多数预测模型仅含有单因素(如建筑高度或层数等),再通过对结构形式或材料进行分类的方式反映其他因素的影响,回归模型形式大多如:
T = αHβ (1) 式中:T为基本周期;H为高度。但是,大量实测数据表明:除高度、材料以外,建筑物结构形式和功能、基础类型、地域等因素对于周期的影响也不能忽视。
近年来,机器学习方法因其强大的数据特征提取能力和处理大规模数据的优势,作为一种新型建模手段备受关注。例如,基于生成对抗网络的方法研究主余震下结构的破坏机制[8]、基于决策树和人工神经网络等方法建立砌体填充混凝土框架的基本周期预测模型[9]、基于BP神经网络的RC框架结构地震易损性曲面分析[10]。上述工作基于机器学习方法得到了有价值的成果,也展示了用于建筑基本周期预测的可行性,但还存在如下需要解决的问题:① 由于实测数据获取困难,现有机器学习模型大多基于数值模拟的数据进行训练,如果要包含多因素影响,特别是语义型因素,必须基于既有建筑的实测数据来建立新模型;② 预测模型的输入参数在结构初步设计阶段难以获取,因此,新模型应使用容易确定的结构参数,并应允许部分输入参数缺失;③ 模型的超参数调节和模型选择过程需要人工参与,难以随着数据量的增加实现模型的高效、动态更新,因此,新模型应具有对新增数据的自学习能力,以及对新型机器学习算法的自适应能力。
针对以上关键问题,本文收集了公开文献中大量的建筑周期的实测数据,并建立了数据库。在此基础上,以新兴的AutoML(Auto Machine Learning, 自动机器学习)技术建立基本周期预测模型,可利用结构初步设计阶段全部或部分已知信息作为输入参数,预测建筑结构的周期。最后,分别采用本文模型、现有规范模型和文献建议公式对未参与训练过程的500多栋实际建筑进行了周期预测,并对结果进行了对比分析。
1 实测结构周期数据库
1.1 数据来源
建筑物基本周期的数据来源分为实测数据和模拟数据。由于数值模型与实际结构显然存在差异,难以反映真实的建筑物周期,本研究只选用实测数据进行分析。作者在文献[5]中报告了实测周期数据收集的详细过程和结果,为全文完整性,本节做简要说明。
研究采用从大量公开发表的文献和书籍中检索建筑物基本周期(及其相关信息)的方式,截至本文撰写时,已经完成了上万篇论文的检索,并建立了原始数据库。进一步,采用查重、离群点检验等手段进行数据清洗,形成用于建模分析的可靠数据库。其中,由于不同文献中可能存在相同的建筑,通过比较位置、结构信息和名称等可识别重复的建筑。此外,由于研究角度的差异,不同文献中对同一建筑的描述信息不同,综合多篇文献的内容可实现信息补全。
本文分析的主要数据来源于文献[7, 11-29],其他仅包含单条数据的文献,由于数量众多,不一一列举。主要数据来源和建筑数量情况见表1。
表 1 主要建筑周期信息数据库来源及相关信息Table 1. Main buildings period information database sources and related information激励方式 数据来源 结构形式 国家&地区 建筑数量/栋 共振法、自由振动法、脉动法等 王广军和樊水荣[11] RC框架、RC剪力墙、砌体及混合结构、钢结构 中国、日本 537 环境振动测试 施卫星等[12-14] 砖石、RC建筑、RC-砖砌体、钢结构等 中国四川、上海 350 环境振动测试 GALLIPOLI等[15] RC框架、RC剪力墙等 意大利、斯洛文尼亚、克罗地亚、
马其顿共和国244 环境振动测试 PAN等[30] RC框-剪结构 新加坡 135 环境振动测试 OLIVEIRA和NAVARRO[31] RC建筑、砌体建筑 葡萄牙 234 地震观测、受迫振动、
环境振动测试日本建筑学会[16-18] RC建筑、钢框架等 日本 205 地震观测 加州强震观测项目
(CSMIP)[7, 19-26]RC框架、框-剪、砌体、SRC结构等 美国 188 地震观测 GATTI[27] 砌体结构、RC结构 意大利 28 环境振动测试 杨东晖[28] RC结构、砌体RC混合结构、土木混合结构 中国结古镇 20 地震观测 HONG和HWANG[29] SRC框架、RC框架 中国台湾 21 注:RC为钢筋混凝土;SRC为钢与钢筋混凝土的组合结构。 1.2 数据特征说明
经数据收集与数据清洗后,目前数据库包含2561条记录。虽然在收集数据时已尽可能全面地收集建筑信息,但不同数据来源所包含的信息完整性会有差别,因此在选择用于机器学习的建筑特征(如材料、抗侧力体系、功能等)时,既要关注它们与基本周期的相关性,也需考虑数据库中包含对应特征的有效记录数量。
结合已有研究的成果,本研究初步从数据库中筛选出了16个能够影响到建筑物周期的特征,并将其归为分类型(即语义型)和数值型两大类,具体见表2。表2和图1同时给出了在2561条数据中,16个特征各自的有效数据量比例。可见,包含“抗侧力体系”“材料”“高度”及“所在国”四个特征的数据均超过了70%。此外,“基础深度”的有效数据量最小,为8.9%,但也有228条。以往研究中,文献[12-13]的预测模型分别用到287条和574条,文献[15]用到244条。因此,认为初筛的建筑特征的最低有效数量满足建模要求。
表 2 特征类型及具体特征Table 2. Feature type and specific features特征类型 具体特征 分类型 所在国(99.9%)、材料(97.6%)、材料*(97.6%)、抗侧力体系(79.4%)、平面形状(32.6%)、平面形状*(32.6%)、建筑功能(27.2%)、基础类型(22.0%)、场地类型(15.8%) 数值型 高度(99.5%)、地上层数(74.5%)、短轴长度(58.0%)、长轴长度(57.5%)、建造测试年间隔(30.4%)、地下层数(18.1%)、基础深度(8.9%) 注:*表示这一特征的补充信息;括号内为有效信息占比。 收集数据过程中,分类型数据的“值”(文本)尽量遵照原文描述,如抗侧力体系中的“框架”“框架剪力墙”等,这可能导致某些分类值所对应的数据偏少。若将此类数据直接用于训练,机器学习模型容易对这些分类值的特征产生过拟合。为此,需要对语义型特征的分类值进行聚合操作,即合并某一种特征中相近的分类值。由于“材料”和“平面形状”两特征在聚合前,其分类值所对应的数据量就比较多,因此将聚合前的数据作为其补充信息用于模型训练,其余的分类型特征则仅保留聚合后的特征数据。对于目前数据量很小且难以与其他分类值聚合的情况,如图2抗侧力体系的“核心筒”“框架-核心筒”“框架-砌体承重墙”分类以及图3材料中的“木材”“砌体+木材”分类,统一聚合为对应特征的“未知类型”。一方面,解决数据量小不利于模型训练的问题;另一方面,提升模型包容未来新增其他类型的能力。表3为聚合完成后,模型具体的分类型输入特征。
表 3 分类型特征输入Table 3. Input of classified features分类型特征 主要信息 所在国 中国、美国、韩国、加拿大等国家 材料 钢筋混凝土、砌体(砖砌体/石块/无筋混凝土)、
钢、砌体+钢筋混凝土、未知类型抗侧力体系 框架、剪力墙、框架剪力墙、砌体承重墙、未知类型 建筑功能 公共建筑、民用建筑、未知类型 平面形状 矩形、非矩形(L形及其他)、未知类型 基础类型 浅基础、桩基础、深基础、未知类型 场地类型 软土、硬土、未知类型 注:括号内为补充信息,“钢筋混凝土”“钢”“矩形”“未知类型”的分类值聚合前后无变化,补充信息与主要信息相同;“砌体+钢筋混凝土”的分类值聚合前各种分类值对应数据较少,不再包含补充信息。 2 基本周期自动机器学习预测模型
2.1 数据填充
不完整性是大数据的重要特点,本文问题中体现为并非每条数据都包含全部上述16个特征信息,用于模型训练前还必须进行填充处理。本研究针对分类型和数值型两类记录,采用了不同的填充方式,具体为:
1) 分类型特征填充。采用缺失值处理为对应分类型特征中的“未知类型”的方式进行填充[32]。表4展示了分类型数据的缺失示例(表4中的“[未知类型]”表示缺失值及其填充处理)。
表 4 分类型数据填充示例Table 4. Classification data filling example建筑物编号 抗侧力体系 建筑功能 基础类型 平面形状 i 框架 公用建筑 浅基础 矩形 j 砌体承重墙 [未知类型] [未知类型] 非矩形 k 框架剪力墙 民用建筑 [未知类型] 矩形 l [未知类型] 公用建筑 桩基础 矩形 2) 数值型特征填充。表5为数值型数据填充示例,对于缺失值分别尝试了常用的中位数、平均数和众数填充,对比表明最终模型的预测效果相差不大。因此,后续分析中均采用了中位数填充。
表 5 数值型数据填充示例Table 5. Numerical data filling example建筑物编号 长轴长度/m 短轴长度/m 基础深度/m i 24.6 9.6 [中位数] j 66.0 57.0 20.3 k 64.0 43.2 [中位数] l 32.5 30.4 8.0 填充好的2561条数据再分为训练集(1844条)、验证集(205条)和测试集(512条)3部分,分别用于后续模型训练和测试。
2.2 基于AutoML的预测模型
选择合适的模型并进行训练调参,是传统机器学习任务中不可避免、十分繁琐但非常重要的一个环节,需要尝试多次并且依赖一定的经验才能得到性能相对优秀的模型。当数据量增加后,往往还需要重新进行模型的调参优化,使用不便。
考虑建筑物类型会不断变化及实测数据会不断增加的需求,本研究采用了AutoGluon[32]策略来实现自动学习,此方法的基本思想类似于采用基函数的线性组合来逼近复杂函数,通过融合多个未进行调参的简单模型来提高最终模型的性能,称为stacking(堆叠)方法。
本研究采用目前常用的三类机器学习模型:BP神经网络、XGBoost[33]和LightGBM[34]作为“基模型”,并预先设置每类模型的超参数选择空间。以BP模型为例,隐藏层有3层(可取50×40×30、100×80×60、300×200×100三种,数字为每层神经元数)、二层(200×100)或一层(100、1000)三种选择;3种激活函数(Relu、Tanh、Softrelu)、学习率在10−5与10−2之间、5种计算轮次(100、200、300、400、500)、神经元丢失(dropout)概率在0与0.5之间。随后,对每类基模型在其对应的参数空间内随机选取N组超参数,可得到3×N个模型,构成底层学习器,本研究将N取为20。此外,为了节约资源AutoGluon会提前终止预测精度不再随训练而显著提升的底层学习器,以便为其他底层学习器释放计算资源。
利用训练集和验证集数据对底层学习器中的每个模型进行训练,训练好的模型在训练集和验证集上的周期预测结果连同对应的真实值,组成新的训练集和验证集,分别是[1844, 61]和[205, 61]的数组(其中61列=3类×20列预测值+1列真实值)。最后,利用新的训练集和验证集对一个线性回归模型进行训练,获得最终的模型。该线性回归模型的输入是前3×N个模型的预测值,输出是这些值加权平均后的结果。
图4是AutoGluon融合建模的全过程。整个建模过程中,超参数的选择、单个模型的训练都无须人工介入、无须先验经验。由于底层学习器中的每个“基模型”自身比较简单,其训练成本不高且可并行完成,模型的计算效率很高。当有新的数据加入或者有更好的“子模型”出现,重复上述建模步骤重新训练即可完成模型的更新和功能提升,实现数据驱动的模型自动学习。
2.3 AutoML预测模型性能对比
为了证明AutoGluon算法的有效性,将融合模型结果与仅使用底层学习器的结果作了对比。表6为模型的预测性能的排序,按照512条测试集数据上的RMSE从小到大排列,受篇幅限制只比较了融合模型和4个最优的底层学习器的预测精度性能和预测时间成本。结果显示,融合模型的预测精度(RMSE)最好,特别是在模型训练中未接触过的测试集上。同时,相较于底层学习器,融合模型的预测时间也非常小。
RMSE=√1mm∑i=1(yi−ˆyi)2 (2) 此外,AutoGluon预测模型中包含2.1节中的数据填充功能,模型使用时就可将结构在初步设计阶段尚未明确的参数(如平面形状、基础类型、基础深度等)作为“未知类型”输入,从而显著提高模型的适应性。因融合模型的预测是底层学习器加权平均后的结果,其预测需在底层学习器预测之后才能计算,所以预测时间高于底层学习器,平均下来每次预测在0.01 s以内,是可以接受的。
训练数据时除了将数据划分为训练集和验证集这种简单交叉验证方式外,还可采用k折交叉验证。k折交叉验证的步骤如下:
1) 将样本分为k个大小相等的样本子集;
2) 依次遍历这k个子集,每次把当前子集作为验证集,其余所有样本作为训练集,进行模型的训练和评估;
3) 最后把k次评估指标的平均值作为最终的评估指标。
表 6 不同机器学习模型性能对比Table 6. Performance comparison of different machine learning models模型 RMSE/s 预测时间/s 验证集 测试集 验证集 测试集 融合模型 0.2496 0.2934 0.5956 2.0703 XGB_1 0.2920 0.3092 0.0126 0.0537 BP_1 0.2640 0.3101 0.0049 0.0187 BP_2 0.2898 0.3210 0.0125 0.0539 XGB_2 0.3227 0.3221 0.0134 0.0503 本研究分别尝试了5折交叉验证以及10折交叉验证,结果发现采用交叉验证后训练时间增加了数十倍,且在测试集上的预测精度也没有明显提升,RMSE分别为0.3585、0.3598。因此本研究采用简单交叉验证的方法进行训练。
3 特征指标重要性的量化分析
1.2节中初步选择了16个影响周期的特征,传统上可进一步采用方差分析、卡方检验、最大信息系数等方式,分析其中是否存在冗余特征或不相关特征。利用已经建立的融合模型,也可以通过置换重要性[35]的方式来量化分析各特征参数的重要性,具体方法如下:
1) 将顺序正确的验证集数据输入已经训练好的预测模型,得到预测结果。
2) 将验证集数据中某一特征对应的某列数据随机打乱后输入预测模型,得到预测结果。重复M次。
3) 比较每次数据打乱前后模型的预测结果,如均方误差RMSE的差异。
4) 对其他特征参数重复上述步骤。
以“高度”特征为例,将205条验证集记录的高度值随机打乱后输入预测模型,由于高度信息是错误的,预测误差应增大,误差增大的程度可用来量化“高度”特征的重要性。若误差不变或减小,说明该特征对于预测模型无效或有害。为了减小计算偶然性,对205条验证集数据的每列数据都进行了100次顺序打乱,最终计算结果如表7所示,其中P值表征特征无效的概率。例如,P值为0.01表示有1%可能性,该特征对建立模型是无用的或有害的。
表 7 特征重要性及相关参数Table 7. Feature importance and related parameters特征 重要性 标准差 P值 置信区间上下限 高度 0.5355 0.0280 0 [0.5428, 0.5281] 所在国 0.1290 0.0101 0 [0.1317, 0.1264] 地上层数 0.0714 0.0090 0 [0.0737, 0.0690] 材料 0.0164 0.0034 0 [0.0174, 0.0156] 抗侧力体系 0.0159 0.0040 0 [0.0169, 0.0148] 短轴长度 0.0095 0.0026 0 [0.0102, 0.0088] 长轴长度 0.0087 0.0033 0 [0.0096, 0.0078] 建筑功能 0.0068 0.0011 0 [0.0071, 0.0065] 建造测试年份间隔 0.0051 0.0021 0 [0.0056, 0.0046] 场地类型 0.0040 0.0012 0 [0.0043, 0.0036] 平面形状 0.0033 0.0010 0 [0.0036, 0.0031] 地下层数 0.0032 0.0014 0 [0.0035, 0.0028] 基础深度 0.0007 0.0017 0 [0.0011, 0.0002] 基础类型 −0.0002 0.0003 100 [−0.0001, −0.0003] 注:标准差为特征重要性得分的标准差;P值为无效假设(特征重要性小于或等于0)的统计t检验的P值;置信区间上下限是置信概率为99%时特征重要性得分的上下限。 表7显示:高度、所在国、地上层数、材料和抗侧力体系五个特征重要性程度高,除去“所在国”,其余特征与以往研究认识相同。对于“所在国”特征,由于过往研究的数据大多集中于某一地区,地域因素的影响未受到重视。由于“所在国”特征暗含了设计规范、经济水平等因素,值得随着数据的增加进一步关注,文献[36]也提出,中国规范《高层建筑混凝土结构技术规程》(JGJ 3−2010)中对于高层建筑的划分显著地影响到了建筑的基本周期。重要性排在最后四位的特征为:平面形状、地下层数、基础深度和基础类型,可以认定为冗余特征。在预测模型中删除这些冗余特征后,发现训练时间未有明显减少,从模型的发展及完备性角度考虑,目前研究中保留了所有特征作为模型输入。
4 预测模型性能分析
4.1 预测性能
图5、图6为最终模型在训练集和测试集数据上的预测结果,其中横轴为真实值,竖轴为预测值,预测结果越靠近图中斜线越好,左上角为平均绝对误差MAE、平均百分比误差MAPE和均方根误差RMSE,训练集和测试集的这三项指标都较小。可见,模型的预测效果良好。
MAE=1mm∑i=1|yi−ˆyi| (3) MAPE=100%mm∑i=1|yi−ˆyiyi| (4) 4.2 对比分析
与以往预测模型以及相比,本研究预测模型基于多源实测数据,可以预测多种类型的建筑。与之前研究[4]采用传统统计回归的建模思路不同的是,本研究采用机器学习的方法建模,模型的参数更加复杂多样,同时进一步应用新兴的AutoML技术,大大简化了模型建立流程。
表8中给出了当前规范和文献中的一些结构周期预测模型,本文将它们的预测结果与自动机器学习模型结果进行对比。
本研究训练模型时采用的训练集包含1844栋建筑,验证集包含205栋建筑,测试集包含512栋建筑未参与任何工作,为了保证验证结果的可靠性,将测试集的建筑用于预测模型的对比。由于传统的预测模型大多针对某类建筑进行预测,在进行预测之前需要进一步筛选出不同预测模型所适用的建筑。
以GOEL和CHOPRA[19]的模型为例,其模型主要针对框架结构,测试集中相应建筑一共有205栋,图7为GOEL和CHOPRA[19]的模型与本文模型预测结果对比。可见,机器学习模型的预测结果在真实值附近,而GOEL模型的预测结果总体上较真实值偏低。
表 8 规范及文献中基本周期预测模型Table 8. Natural period prediction model in specification and literature图8、图9为表8中的四个预测模型与本研究预测模型在MSE和R2两个指标上的对比。MSE是指真实值与预测值之差平方的期望值,MSE越小说明预测精度越好;R2用以衡量整体的拟合度,R2越大表示拟合效果越好。此外,表9给出了MAE、MAPE、RMSE的对比结果。可以发现,本文预测模型在整体上保证预测范围广泛的情况下,整体上预测结果的准确性也是最好的。
MSE=1mm∑i=1(yi−ˆyi)2 (5) R2=m∑i=1(ˆyi−ˉyi)2m∑i=1(yi−ˉyi)2 (6) 5 结论
本文基于多源实测数据,利用机器学习方法建立了建筑结构基本周期的多因素自动机器学习预测模型。所提出的机器学习模型较以往模型可以考虑多因素影响,并适用于多类型建筑,从而显著提高了周期预测的准确性。所建立的自动机器学习模型具有三方面特点:
(1) 无须调参,显著提升了建模效率。
(2) 当有新型、性能更好的“子模型”出现时,仅需对底层学习器进行更换。
(3) 当有新的实测数据加入,也可自动实现模型的更新和功能提升。
将此模型与云端动态更新的建筑周期数据库相结合,可形成一种全新的、网页开放的、在线自学习的建筑周期预测功能。本文模型的源代码将连同文章一起公开,服务于科学研究与工程实践。
-
表 1 主要建筑周期信息数据库来源及相关信息
Table 1 Main buildings period information database sources and related information
激励方式 数据来源 结构形式 国家&地区 建筑数量/栋 共振法、自由振动法、脉动法等 王广军和樊水荣[11] RC框架、RC剪力墙、砌体及混合结构、钢结构 中国、日本 537 环境振动测试 施卫星等[12-14] 砖石、RC建筑、RC-砖砌体、钢结构等 中国四川、上海 350 环境振动测试 GALLIPOLI等[15] RC框架、RC剪力墙等 意大利、斯洛文尼亚、克罗地亚、
马其顿共和国244 环境振动测试 PAN等[30] RC框-剪结构 新加坡 135 环境振动测试 OLIVEIRA和NAVARRO[31] RC建筑、砌体建筑 葡萄牙 234 地震观测、受迫振动、
环境振动测试日本建筑学会[16-18] RC建筑、钢框架等 日本 205 地震观测 加州强震观测项目
(CSMIP)[7, 19-26]RC框架、框-剪、砌体、SRC结构等 美国 188 地震观测 GATTI[27] 砌体结构、RC结构 意大利 28 环境振动测试 杨东晖[28] RC结构、砌体RC混合结构、土木混合结构 中国结古镇 20 地震观测 HONG和HWANG[29] SRC框架、RC框架 中国台湾 21 注:RC为钢筋混凝土;SRC为钢与钢筋混凝土的组合结构。 表 2 特征类型及具体特征
Table 2 Feature type and specific features
特征类型 具体特征 分类型 所在国(99.9%)、材料(97.6%)、材料*(97.6%)、抗侧力体系(79.4%)、平面形状(32.6%)、平面形状*(32.6%)、建筑功能(27.2%)、基础类型(22.0%)、场地类型(15.8%) 数值型 高度(99.5%)、地上层数(74.5%)、短轴长度(58.0%)、长轴长度(57.5%)、建造测试年间隔(30.4%)、地下层数(18.1%)、基础深度(8.9%) 注:*表示这一特征的补充信息;括号内为有效信息占比。 表 3 分类型特征输入
Table 3 Input of classified features
分类型特征 主要信息 所在国 中国、美国、韩国、加拿大等国家 材料 钢筋混凝土、砌体(砖砌体/石块/无筋混凝土)、
钢、砌体+钢筋混凝土、未知类型抗侧力体系 框架、剪力墙、框架剪力墙、砌体承重墙、未知类型 建筑功能 公共建筑、民用建筑、未知类型 平面形状 矩形、非矩形(L形及其他)、未知类型 基础类型 浅基础、桩基础、深基础、未知类型 场地类型 软土、硬土、未知类型 注:括号内为补充信息,“钢筋混凝土”“钢”“矩形”“未知类型”的分类值聚合前后无变化,补充信息与主要信息相同;“砌体+钢筋混凝土”的分类值聚合前各种分类值对应数据较少,不再包含补充信息。 表 4 分类型数据填充示例
Table 4 Classification data filling example
建筑物编号 抗侧力体系 建筑功能 基础类型 平面形状 i 框架 公用建筑 浅基础 矩形 j 砌体承重墙 [未知类型] [未知类型] 非矩形 k 框架剪力墙 民用建筑 [未知类型] 矩形 l [未知类型] 公用建筑 桩基础 矩形 表 5 数值型数据填充示例
Table 5 Numerical data filling example
建筑物编号 长轴长度/m 短轴长度/m 基础深度/m i 24.6 9.6 [中位数] j 66.0 57.0 20.3 k 64.0 43.2 [中位数] l 32.5 30.4 8.0 表 6 不同机器学习模型性能对比
Table 6 Performance comparison of different machine learning models
模型 RMSE/s 预测时间/s 验证集 测试集 验证集 测试集 融合模型 0.2496 0.2934 0.5956 2.0703 XGB_1 0.2920 0.3092 0.0126 0.0537 BP_1 0.2640 0.3101 0.0049 0.0187 BP_2 0.2898 0.3210 0.0125 0.0539 XGB_2 0.3227 0.3221 0.0134 0.0503 表 7 特征重要性及相关参数
Table 7 Feature importance and related parameters
特征 重要性 标准差 P值 置信区间上下限 高度 0.5355 0.0280 0 [0.5428, 0.5281] 所在国 0.1290 0.0101 0 [0.1317, 0.1264] 地上层数 0.0714 0.0090 0 [0.0737, 0.0690] 材料 0.0164 0.0034 0 [0.0174, 0.0156] 抗侧力体系 0.0159 0.0040 0 [0.0169, 0.0148] 短轴长度 0.0095 0.0026 0 [0.0102, 0.0088] 长轴长度 0.0087 0.0033 0 [0.0096, 0.0078] 建筑功能 0.0068 0.0011 0 [0.0071, 0.0065] 建造测试年份间隔 0.0051 0.0021 0 [0.0056, 0.0046] 场地类型 0.0040 0.0012 0 [0.0043, 0.0036] 平面形状 0.0033 0.0010 0 [0.0036, 0.0031] 地下层数 0.0032 0.0014 0 [0.0035, 0.0028] 基础深度 0.0007 0.0017 0 [0.0011, 0.0002] 基础类型 −0.0002 0.0003 100 [−0.0001, −0.0003] 注:标准差为特征重要性得分的标准差;P值为无效假设(特征重要性小于或等于0)的统计t检验的P值;置信区间上下限是置信概率为99%时特征重要性得分的上下限。 表 8 规范及文献中基本周期预测模型
Table 8 Natural period prediction model in specification and literature
-
[1] CEN. European Standard EN1998-1: 2004. Eurocode 8, Design of structures for earthquake resistance—Part1: General rules, seismic actions and rules for buildings [S]. Brussels, Belgium: Comit'e Europ'een de Normalisation (CEN), 2004.
[2] GB 50011−2010, 建筑抗震设计规范[S]. 北京: 中国建筑工业出版社, 2010. GB 50011−2010, Code for seismic design of buildings [S]. Beijing: China Architecture & Building Press, 2010. (in Chinese)
[3] CHENG Y, BAI G, DONG Y. Spectrum characterization of two types of long‐period ground motions and seismic behavior of frame‐core wall structures under multidimensional earthquake records [J]. The Structural Design of Tall and Special Buildings, 2018, 27(16): e1539.
[4] 项梦洁, 陈隽. 考虑场地效应的建筑群动力可靠度PDEM评估[J]. 工程力学, 2021, 38(8): 85 − 96. doi: 10.6052/j.issn.1000-4750.2020.08.0549 XIANG Mengjie, CHEN Jun. Dynamic reliability evaluation of building cluster considering site effect based on PDEM [J]. Engineering Mechanics, 2021, 38(8): 85 − 96. (in Chinese) doi: 10.6052/j.issn.1000-4750.2020.08.0549
[5] WANG Z, CHEN J, SHEN J. Multi-factor and multi-level predictive models of building natural period [J]. Engineering Structures, 2021, 242: 112622.
[6] 蒋利学, 王卓琳, 蒋璐. 多层砌体结构基本周期的近似算法[J]. 建筑结构学报, 2018, 39(增刊 2): 254 − 262. JIANG Lixue, WANG Zhoulin, JIANG Lu. Approximate calculation method for fundamental period of multi-story masonry structures [J]. Journal of Building Structures, 2018, 39(Suppl 2): 254 − 262. (in Chinese)
[7] 公茂盛, 谢礼立, 欧进萍. 基于结构强震记录框剪结构自振周期经验公式[J]. 土木工程学报, 2010, 43(12): 35 − 40. GONG Maosheng, XIE Lili, OU Jinping. Empirical formula for fundamental period of frame-shear wall structures based on structural strong motion records [J]. China Civil Engineering Journal, 2010, 43(12): 35 − 40. (in Chinese)
[8] DING Y, CHEN J, SHEN J. Conditional generative adversarial network model for simulating intensity measures of aftershocks [J]. Soil Dynamics and Earthquake Engineering, 2020, 139: 106281. doi: 10.1016/j.soildyn.2020.106281
[9] CHARALAMPAKIS A E, TSIATAS G C, KOTSIANTIS S B. Machine learning and nonlinear models for the estimation of fundamental period of vibration of masonry infilled RC frame structures [J]. Engineering Structures, 2020, 216: 110765.
[10] 程诗焱, 韩建平, 于晓辉, 等. 基于BP神经网络的RC框架结构地震易损性曲面分析: 考虑地震动强度和持时的影响[J]. 工程力学, 2021, 38(12): 107 − 117. doi: 10.6052/j.issn.1000-4750.2020.11.0837 CHENG Shiyan, HAN Jianping, YU Xiaohui, et al. Seismic fragility surface analysis of rc frame structures based on BP neural networks: Accounting for the effects of ground motion intensity and duration [J]. Engineering Mechanics, 2021, 38(12): 107 − 117. (in Chinese) doi: 10.6052/j.issn.1000-4750.2020.11.0837
[11] 王广军, 樊水荣. 建筑自振周期计算方法和实测资料手册[M]. 北京: 中国建筑科学研究院, 1988. WANG Guangjun, FAN Shuirong. Handbook of calculation method and measured data for building natural vibration period [M]. Beijing: China Academy of Building Research, 1988. (in Chinese)
[12] SHAN J, SHI W, WANG J. Regional study on structural dynamic property of buildings in China [J]. Earthquake Engineering & Structural Dynamics, 2013, 42(7): 1013 − 1029.
[13] 施卫星, 陈希, 曹加良. 多因素型结构基本自振周期预测模型的研究[J]. 工程力学, 2013, 30(3): 146 − 151. SHI Weixing, CHEN Xi, CAO Jialiang. Multi-factor predictive modles of structural fundamental natural period [J]. Engineering Mechanics, 2013, 30(3): 146 − 151. (in Chinese)
[14] 施卫星, 魏丹, 韩瑞龙. 钢结构房屋动力特性脉动法测试研究[J]. 地震工程与工程振动, 2012, 32(1): 114 − 120. doi: 10.13197/j.eeev.2012.01.023 SHI Weixing, WEI Dan, HAN Ruilong. Field tests and research on the dynamic characteristics of steel structure buildings under ambient vibration [J]. Journal of Earthquake Engineering and Engineerging Vibration, 2012, 32(1): 114 − 120. (in Chinese) doi: 10.13197/j.eeev.2012.01.023
[15] GALLIPOLI M R, MUCCIARELLI M, KET-MOTNIKAR B, et al. Empirical estimates of dynamic parameters on a large set of European buildings [J]. Bulletin of Earthquake Engineering, 2010, 8(3): 593 − 607. doi: 10.1007/s10518-009-9133-6
[16] 日本建築学会. 各種建築物の実測データベース [DB]. http://news-sv.aij.or.jp/kouzou/s7/d1.htm, 2020-12-8. Japanese Architectural Society. Database of actual buildings [DB]. http://news-sv.aij.or.jp/kouzou/s7/d1.htm, 2020-12-8. (in Japanese)
[17] Architectural Institute of Japan. Damping in buildings [M]. Tokyo: Architectural Institute of Japan, 2000.
[18] SATAKE N, SUDA K I, ARAKAWA T, et al. Damping evaluation using full-scale data of buildings in Japan [J]. Journal of Structural Engineering, 2003, 129(4): 470 − 477. doi: 10.1061/(ASCE)0733-9445(2003)129:4(470)
[19] GOEL R K, CHOPRA A K. Period formulas for moment-resisting frame buildings [J]. Journal of Structural Engineering, 1997, 123(11): 1454 − 1461.
[20] GOEL R K, CHOPRA A K. Period formulas for concrete shear wall buildings [J]. Journal of Structural Engineering, 1998, 124(4): 426 − 433.
[21] 公茂盛, 孙静, 谢礼立. 抗弯钢框架结构自振周期经验公式研究[J]. 土木工程学报, 2012, 45(增刊 1): 268 − 272. GONG Maosheng, SUN Jing, XIE Lili. Study on empirical formula for natural period of moment resisting steel frame structures [J]. China Civil Engineering Journal, 2012, 45(Suppl 1): 268 − 272. (in Chinese)
[22] LI Y, MAU S T. Learning from recorded earthquake motion of buildings [J]. Journal of Structural Engineering, 1997, 123(1): 62 − 69. doi: 10.1061/(ASCE)0733-9445(1997)123:1(62)
[23] MORALES M. Fundamental period of vibration for reinforced concrete buildings [M]. Ottawa, Canada: University of Ottawa, 2000.
[24] YOUNG K, ADELI H. Fundamental period of irregular moment-resisting steel frame structures [J]. The Structural Design of Tall Special Buildings, 2014, 23(15): 1 − 17.
[25] ELLIS B R. An assessment of the accuracy of predicting the fundamental natural frequencies of buildings and the implications concering the dynamic analysis of structures [J]. Proceedings of the Institution of Civil Engineers, 1980, 69(3): 763 − 776. doi: 10.1680/iicep.1980.2376
[26] CELEBI M. Comparison of damping in buildings under low-amplitude and strong motions [J]. Journal of Wind Engineering Industrial Aerodynamics, 1996, 59(2/3): 309 − 323. doi: 10.1016/0167-6105(96)00014-1
[27] GATTI M. Elastic period of vibration calculated experimentally in buildings hosting permanent GPS stations [J]. Earthquake Engineering and Engineering Vibration, 2018, 17(3): 607 − 625. doi: 10.1007/s11803-018-0466-5
[28] 杨东晖. 地震受损房屋结构自振特性测试[J]. 世界地震工程, 2013, 29(1): 92 − 97. doi: 10.3969/j.issn.1007-6069.2013.01.014 YANG Donghui. Field test to natural characteristics of earthquake damaged building structures [J]. World Earthquake Engineering, 2013, 29(1): 92 − 97. (in Chinese) doi: 10.3969/j.issn.1007-6069.2013.01.014
[29] HONG L L, HWANG W L. Empirical formula for fundamental vibration periods of reinforced concrete buildings in Taiwan [J]. Earthquake Engineering & Structural Dynamics, 2000, 29(3): 327 − 337.
[30] PAN T C, GOH K S, MEGAWATI K J E E. Empirical relationships between natural vibration period and height of buildings in Singapore [J]. Earthquake Engineering & Structural Dynamics, 2014, 43(3): 449 − 465.
[31] OLIVEIRA C S, NAVARRO M. Fundamental periods of vibration of RC buildings in Portugal from in-situ experimental and numerical techniques [J]. Bulletin of Earthquake Engineering, 2010, 8(3): 609 − 642. doi: 10.1007/s10518-009-9162-1
[32] ERICKSON N, MUELLER J, SHIRKOV A, et al. AutoGluon-Tabular: Robust and accurate AutoML for structured data [EB]. https://arxiv.org/abs/2003.06505, 2020-3-13.
[33] CHEN T, GUESTRIN C. Xgboost: A scalable tree boosting system [C]// Proceedings of the 22nd Acm Sigkdd International Conference on Knowledge Discovery and Data Mining. San Francisco, California, USA: Association for Computing Machinery, 2016: 785 − 794.
[34] QI M . LightGBM: A highly efficient gradient boosting decision tree [C]// Anderson, Dana Z. Neural Information Processing Systems. Long Beach, California, USA: Curran Associates Inc, 2017: 3149 − 3157.
[35] PARR T, TURGUTLU K, CSISZAR C, et al. Beware default random forest importances [EB]. https://explained.ai/rf-importance/, 2018-3-26.
[36] 王泽涛, 陈隽, 申家旭. 基于多源实测数据的RC结构基本周期统计分析[J]. 振动与冲击, 2021, 40(19): 212 − 220, 268. WANG Zetao, CHEN Jun, SHEN Jiaxu. Statistical analysis of fundamental period of RC structure based on multi-source measured data [J]. Journal of Vibration and Shock, 2021, 40(19): 212 − 220, 268. (in Chinese)
-
期刊类型引用(5)
1. 项梦洁,陈隽. RC框架结构基本自振周期个体间不确定性量化. 工程力学. 2024(05): 87-95 . 本站查看
2. 王律己,黄晨宇,单伽锃,余桦,苏金蓉. 基于多元特征驱动的既有建筑地震损伤机器学习预测方法. 建筑结构学报. 2024(07): 1-12 . 百度学术
3. 熊青松,熊海贝,孔庆钊,陈琳,丁叶蔚,袁程. 基于振动信号深度表征学习的高层建筑结构振动识别. 工程力学. 2024(09): 134-143 . 本站查看
4. 贺隆平,姚囝,王其虎,叶义成,凌济锁. 基于自动机器学习的岩爆烈度分级预测模型. 岩土力学. 2024(09): 2839-2848 . 百度学术
5. 陈娟,何俊杰,黄志,周旺保,戚菁菁. 四肢钢管混凝土格构柱抗震性能的神经网络优化预测. 自然灾害学报. 2024(06): 192-205 . 百度学术
其他类型引用(2)