1. 서 론
건설현장은 용접 및 용단 작업 등의 작업이 수행되며 목재 및 천 등의 가연 물질을 취급하는 곳이기 때문에 화재 위험에 많이 노출되어있다(
1-
3). 또한, 소화설비 및 피난기구 등의 화재 대응 시설이 확보되지 않은 현장이 대부분이기 때문에 일반 건축물 대비 화재시 소화 및 피난에 불리하다(
4,
5).
Figure 1에는 2022년 기준 업종별 화재 건수를 나타냈으며, 건설업 화재 건수는 다른 업종 대비 높은 수치를 보였다(
6). ‘광물 및 비광물 산업’이 건설업과 유사한 화재 건수를 보였으나, 여러 광물 관련 업종의 통계값이기 때문에 단일업종 기준으로 건설업에서의 화재 위험성이 상대적으로 매우 높을 것으로 판단된다. 이러한 영향으로 소방청에서는 건설현장 화재안전관리 강화를 위해 2022년 12월 일정 규모 이상의 건설현장에 대한 소방안전관리자 의무화를 시행하였으며, 2023년 7월에는 임시소방시설 설치 강화에 관한 법령이 시행되어, 기존 4종(소화기, 간이소화장치, 비상경보장치, 간이피난유도선)에 더해 3종(가스누설경보기, 비상조명등, 방화포)이 추가되어 총 7종의 설치가 의무화되었다(
6,
7). 또한, 현대에는 건축물의 규모가 대형⋅고층화로 진화해 가는 추세이기 때문에 건설현장 화재에 대한 안전관리가 더욱 중요할 것으로 판단된다.
Figure 1
Number of fires by industry.
최근 화재 및 소방안전 분야에서는 소방청 등의 화재 피해 빅데이터(big data)를 활용하여 예방⋅대비 단계를 앞서서 ‘화재 위험 예측’에 연구가 활발하게 수행되고 있다(
8). Seo 등(
9) 연구진은 머신러닝을 활용하여 경기도 지역을 대상으로 화재 위험성을 발화 요인별로 분류하였으며 가장 영향력 높은 화재 위험 요소를 분석하였다. 그러나, 기존 연구는 이미 축조된 건축물을 대상으로 수행된 연구이기 때문에 건설현장에 적용을 위해서는 상이한 환경조건이 필요하다. 건설현장은 4면 이상이 직접적으로 외부 환경에 노출되어있기 때문에 기상 조건과의 관계성이 높을 것으로 판단된다(
10).
본 연구에서는 건설현장 화재 데이터를 활용하여 기상 조건과의 관계성을 분석하고, 다중 회귀분석을 통해 건설현장 화재 위험성을 잘 설명할 수 있는 변수를 평가하였다.
2. 분석 계획 및 방법
2.1 분석 계획
Table 1에는 본 연구의 실험 계획을 나타냈으며, 종속변수는 건설현장 화재 건수, 독립변수는 15개의 기상 조건을 변수로 설정하였다. 해당 변수들로 데이터베이스를 구축 후 건설현장 화재와 기상 조건들의 상관관계를 분석하였다. 이후, 유의미한 관계성이 있는 기상 조건 변수들을 활용하여 다중회귀분석을 수행하였으며, 회귀 분석 적합성 검정을 위해 잔차 분석을 수행하였다.
Table 1
|
Test Items |
Details |
|
Building Database |
Dependent Variable |
• Construction Site Fires - Number of Fires - Date (yyyy-mm-dd) |
|
Independent Variable |
• Average Temperature • The Lowest Temperature • The Highest Temperature • Precipitation • Wind Speed • Maximum Wind Speed • Maximum Instantaneous Wind Speed • Dewpoint • Humidity • The Lowest Humidity • Atmosphere • Effective Humidity • The Lowest Effective Humidity • Apparent Temperature |
|
Statistical Analysis |
Regression Analysis |
• Multiple Regression Analysis |
|
Normality Test |
• Kolmogorov-Smirnov Test |
|
Significance Test |
• Kruskal-Wallis Test |
2.2 분석 방법
Figure 2
기상 조건 데이터는 기상청 주관 ‘기상자료개방포털’에 등록된 데이터(
https://data.kma.go.kr)를 활용했다. 기상 데이터는 기상자료개방포털의 지상(종관) 일자료에서 수집된 일별 기상 데이터를 활용하였으며, 사용된 주요 변수는 평균기온, 최저기온, 최고기온, 강수량, 풍속, 대기압, 습도, 이슬점, 체감온도 등 총 14개이다. 전국 평균 기상 조건 산출을 위해 전국 95개 종관기상관측소의 일별 데이터를 수집한 후, 각 항목별로 산술 평균을 계산하였다.
건설현장 화재 데이터는 발생 일자와 건수에 대한 정보만을 포함하고 있어, 특정 지역의 기상 조건을 직접적으로 고려하기 어렵다. 이에 따라 본 연구에서는 대한민국 전체 지역의 기상 조건에 대한 평균값을 활용하여 통합된 형태의 데이터베이스를 구축하였다.
데이터베이스 구축 이후, 기상 조건과의 관계성검토를 위해, 주간 건설현장 화재 건수로 변환하여 추세를 평가했다. 대한민국의 기상예보 종류는 초기단기예보, 동네예보, 중기예보, 장기예보 및 기후전망으로 분류되며 일반적으로 주별 및 10일간의 기상 조건을 나누어 발표한다. 따라서, 본 연구에서는 주간 기상 정보를 활용하여 건설현장 화재 건수를 예측하기 위해 일별 건설현장 화재 데이터를 최종적으로 주간 건설현장 화재 건수 데이터로 변환하여 분석을 수행하였다.
주간 건설현장 화재 건수와 기상 조건과의 관계성 분석을 위해 상관관계 분석을 수행하였으며, 유의미한 관계성이 있는 기상 조건을 독립변수로 설정하여 다중 회귀분석을 수행하였다. 본 연구에서는 주간 기상 데이터의 이상치를 처리하기 위해 사분위수 범위(interquartile range, IQR) 기반의 탐지 기법을 활용하였다. 전체 데이터는 총 718개 주간 관측치로 구성되어 있으며, 평균기온(ave_temp), 최저기온(low_temp), 최고기온(high_temp) 등 주요 연속형 변수에 대해 이상값을 탐지한 결과, 이상치로 판별된 항목은 존재하지 않았다. IQR 방식은 정규성을 만족하지 않는 환경에서도 안정적으로 이상값을 탐지할 수 있다는 점에서 타당성이 있으며, 극단값이 존재할 경우에도 평균이 아닌 중앙값(median)으로 대체함으로써 분석 결과의 왜곡 가능성을 최소화할 수 있다.
최종적으로 구축된 다중회귀 분석의 적합성 여부를 평가하기 위해 잔차분석(정규성, 등분산성, 독립성)을 수행하였다.
3. 분석 결과
3.1 건설현장 화재와 기상 조건의 관계성 분석
Figure 3에는 2010년~2023년까지의 누적 건설현장 화재 건수를 나타냈다. 일반적으로 화재는 상대적으로 건조하고 기압이 낮은 봄 및 겨울철 기상 조건에서 빈번하게 발생한다. 건설현장 화재도 기상학적으로 정의되고 있는 봄(3월~5월) 및 겨울(12월~2월) 기간에 누적 약 1천건의 화재 건수를 보였다.
Figure 3
Cumulative number of construction site fires per month.
대한민국은 봄⋅가을철 고기압, 여름철 고온 다습한 북태평양 고기압 및 겨울철에는 한랭 건조한 대륙성 고기압의 영향을 받는 국가로서 월별 유의한 차이가 보이는 것은 계절별 기후 조건에 유의한 차이가 나타난다는 가정이 충분하다고 판단된다. 따라서, 건설현장 화재 데이터를 주간별로 분석하여 기상 조건과의 관계성을 평가하였다.
Figure 4에는 주간 건설현장 화재와 기상 조건과의 상관관계 분석 결과를 나타냈다. 온도 관련 변수들과 건설현장 화재 건수 간에는 -0.53~-0.58 수준의 음의 상관관계를 보였으며, 습도 변수 또한 -0.60 수준의 음의 상관관계를 보였다. 반면, 대기압은 약 0.50의 양의 상관관계를 나타냈다. 이러한 결과는 기상 조건이 건설현장 화재에 영향을 미친다는 기존 연구 결과들과 일치한다. 건조한 날씨는 가연성 물질의 착화 가능성을 높이며(
2,
6), 특히 기온이 낮고 습도가 낮은 겨울철에는 정전기 발생 가능성이 커지고 난방기 사용 등 화기 취급이 증가하여 화재 발생 가능성이 높아지는 것으로 보고되어 있다(
1). 또한 기압이 높을수록 일반적으로 기상 조건이 안정되고 바람의 흐름이 약해지기 때문에 열기 및 가연성 증기가 국지적으로 머무를 가능성이 높아지며, 이에 따라 화재 위험성이 증가할 수 있다는 분석도 존재한다(
10). 이러한 방향성은 계절적 특성과도 연관된다. 대한민국의 겨울철(12~2월)은 평균기온과 습도가 낮고 대기압은 높은 특징을 가지며, 이는 본 연구에서 화재 발생이 가장 많이 나타난 시기와 일치한다.
Figure 4
이러한 문헌적⋅계절적 분석 결과는 본 연구의 통계적 상관분석과도 일치하며, 기상 조건이 건설현장 화재 발생에 영향을 미치는 주요 요인임을 시사한다. 따라서, 기상 조건이 건설현장 화재 위험성에 대한 설명력을 높일 수 있을 것으로 판단된다. 이러한 가정을 검증하기 위해, 본 연구에서는 기상 조건을 설명변수로 설정하여 다중회귀분석을 수행하였다.
3.2 다중선형회귀분석 결과
본 연구에서는 종속변수로 주간 누적 건설현장 화재 발생 건수를, 독립변수로는 주간 평균 기상조건을 설정하여 회귀분석을 수행하였다. 회귀분석의 종속변수는 정규화 또는 스케일링 없이 원본값 그대로 활용되었으며, 이에 따라
Table 2에 제시된 회귀계수 및 결정계수(R
2)는 모두 실제 화재 건수 기준에서 도출된 값이다. 이는 모델의 결과가 현실의 화재 발생 건수를 직접적으로 설명하고 해석할 수 있도록 하기 위함이며, 따라서 R
2 또한 실제 주간 화재 건수에 대한 설명력을 나타낸다.
Table 2
Results of Multiple Regression Analysis and Variance Inflation Factors
|
Weather |
Coef |
t-value |
p-value |
VIF |
Cond. No |
|
Ave_temp |
-0.34 |
-14.75 |
< 0.001 |
3.57 |
398 |
|
Atmos |
0.02 |
55.16 |
< 0.001 |
3.35 |
|
Rain |
-0.23 |
-3.02 |
0.003 |
2.95 |
|
p-value |
0.04 |
|
F-value |
1951 |
|
RMSE |
5.25 |
|
R2
|
0.89 |
Table 2는 회귀분석 및 분산팽창요인(variance inflation factors, VIF) 분석 결과를 나타냈으며, 건설현장 화재 위험성에 대해 통계적으로 설명력이 높은 기상 조건 변수는 평균기온, 대기압 및 강수량으로 나타났다. 이러한 결과는 건설현장의 물리적 특성과 기상 조건 간 상호작용에 기반한 것으로 해석될 수 있다. 예를 들어, 평균기온이 낮은 겨울철에는 난방기구, 용접기 등의 화기 사용이 증가하고, 정전기 발생 가능성도 높아져 화재 위험이 증가한다(
6,
10). 또한, 높은 대기압은 기류를 정체시키고, 휘발성 가연물이 국지적으로 머무르며 발화 가능성을 높이는 기상 조건으로 알려져 있다(
10). 강수량이 적은 건조한 환경은 현장의 가연성 폐기물이나 자재의 착화 민감도를 높여 화재 발생에 불리한 조건을 만든다(
2,
3). 이와 같은 변수의 영향력은 선행연구들에서도 반복적으로 확인되고 있으며, 본 연구 결과와도 일관된 방향성을 보인다.
모델의 통계적 유의성을 나타내는 p-value는 유의수준 0.05 이하를 만족하였고, 종속변수에 대한 독립변수의 설명력을 나타내는 결정계수(R2)는 0.89로 높은 설명력을 보였다. 또한, 각 독립변수의 개별 p-value 또한 모두 0.05 이하로 나타나 회귀계수의 통계적 유의성이 확인되었다. 회귀모형의 예측 정확도를 절대 단위로 평가하기 위해 평균제곱근오차(RMSE)를 산출한 결과, 5.25로 나타났다. 이는 본 회귀모델이 주간 누적 건설현장 화재 건수에 대해 평균적으로 약 5건의 오차 범위 내에서 예측이 가능함을 의미한다.
R2와 함께 RMSE가 낮은 수준으로 도출된 점은, 본 회귀모형이 상대적 설명력뿐만 아니라 절대적 예측 정확도 측면에서도 우수한 성능을 보였음을 시사한다. VIF는 다음 식(3)에 의해 계산되며 독립변수 간에 강한 상관관계가 있는지를 검정하는 정량적인 수치이다.
VIF가 10이상이 되면은 변수간에 강한 상관관계가 있다고 가정되며, 본 연구의 분석 결과에서는 2.95~3.57의 낮은 VIF 값을 보였으므로 변수간에는 다중공선성문제(multicollinearity)가 없는 것으로 판단된다.
회귀분석 이후 잔차(residual)분석을 통해 회귀모형에 대한 가정(정규성, 등분산성, 독립성)을 충족하는지에 대한 검정이 필요하다. 정규성 검정 결과에서는 p-value가 0.14로서 유의수준 0.05 이상을 보였으므로 통계적으로 정규성을 만족한다(
Figure 5 참조).
Figure 6에는 회귀값과 잔차와의 관계를 나타냈으며, 잔차의 분산은 유의미한 경향을 보이지 않고 무작위성을 보였으므로 등분산성에 대한 가정을 만족한다고 판단된다.
Table 3에는 독립성 검정(Durbin-Watson test) 결과를 나타냈다. D-W 검정은 잔차에 대하여 자기상관성 존재의 정량적인 판단을 위한 검정법이며 식(4)에 의해 계산된다.
Figure 5
Figure 6
Test for equality of variances of residuals.
Table 3
Analysis Results Durbin-Watson Test
|
dU
|
d |
4 - dU
|
|
Values |
0.78 |
1.58 |
1.89 |
D-W 검정 통게량이 자기상관성이 없는 경우에는 2에 근사한 값을 보이며, 양의 자기상관성과 음의 자기상관성은 각각 0과 4에 근사한 값을 보인다. 또한, 0.05의 유의수준에서 d의 하한 기각값과 상한 기각값 사이에 d가 존재하므로 1차 및 2차 자기상관성이 존재하지 않기 때문에 잔차는 통계적으로 독립성을 만족한다.
3.3 건설현장 화재 위험성에 따른 분산분석
본 연구에서는 통계적인 지표를 활용하여 건설현장 화재 위험성을 설정하였다.
Table 4에는 건설현장 화재 위험성 기준의 정규성 및 K-W 검정(Kruskal-Wallis test) 결과를 나타냈다. 건설현장 화재 건수 데이터는 정규성을 만족하지 못하였기 때문에 평균과 표준편차가 아닌 중앙값 및 사분위수를 활용한 기준을 설정하였다. Risk0~Risk3의 총 4단계로 설정하였으며, 각 기준의 상한값은 0.29 (Q1), 0.42 (Q2), 0.58 (Q3) 및 1 (max)로 설정하였다. 설정한 건설현장 위험성 기준에 대한 통계적 유의성 검정을 수행하였으며, 정규성을 만족하지 못한 집단에 대한 유의성 검정인 K-W 검정(Kruskal-Wallis test)를 수행하였다.
Table 4
Analysis Results of Normality Test and K-W Test
|
Fire-risk |
Ave_temp |
Precip |
Atmos |
|
Risk0 |
< 0.001 |
< 0.001 |
0.001 |
< 0.001 |
|
Risk1 |
< 0.001 |
< 0.001 |
< 0.001 |
< 0.001 |
|
Risk2 |
< 0.001 |
0.005 |
0.003 |
< 0.001 |
|
Risk3 |
< 0.001 |
< 0.001 |
< 0.001 |
< 0.001 |
|
K-W Test |
< 0.001 |
< 0.001 |
< 0.001 |
< 0.001 |
설정한 건설현장 화재 위험성 집단간에는 0.05의 유의수준에서 p-value 0.001 이하로 집단간 유의한 차이를 보였다. 위험성 기준에 따른 다중회귀 분석에 활용된 기상 조건 독립변수도 집단간에 유의한 차이를 보였다.
K-W test의 사후 검정(Dunn’s test) 결과에서는 Risk0과 Risk1에서의 강수량 집단을 제외하면 유의수준 0.05에서 모두 유의한 차이를 보였다.
Figure 7에는 설정된 건설현장 화재 위험성 기준에 따른 평균 온도, 강수량 및 대기압을 나타냈다. 건설현장에서 화기를 다루는 작업시 화재 위험성을 관리하고 예방하기 위해 화재 위험성이 높은 기상 범위를 기준으로 제시하였다. 위험성이 가장 높은 Risk3에서의 기상 범위에서 주위가 필요하며, 평균 온도 강수량 및 대기압은 각각 12.41 °C, 2.83 mm 및 1010.24 Pa 이하 범위에서 높은 위험성을 보였다. 상대적으로 낮은 위험성 단계(Risk0, Risk1, Risk2)에서의 기상 범위와 겹치는 부분에 있어서도 건설현장 안전관리자의 주의 깊은 관리가 필요할 것으로 판단된다.
Figure 7
Weather conditions by risk.
4. 결 론
본 연구에서는 소방청에서 제공하는 건설현장 화재 데이터와 기상청에서 제공하는 기상 데이터에 대한 관계성을 통계적 분석 수행을 통해 평가하였으며, 결과는 다음과 같다.
약 14년간의 누적 건설현장 데이터를 월별로 분석한 결과, 12~3월까지 약 1,013~1,223건 이상의 누적 화재 건수, 7월 및 8월에는 약 500건의 화재 건수를 보였다.
누적 주간 건설현장 화재 데이터와 기상 데이터의 상관관계에서는 모든 온도(평균, 최저, 최고 및 체감)와 관련된 기상 조건은 약 -0.53~-0.58, 습도(이슬점, 상대습도 및 유효습도)에 대한 기상 조건은 약 -0.60의 음의 상관관계를 보였다.
다중선형회귀 분석 결과, 평균 온도, 기압 및 강수량이 통계적으로 유의한 독립변수로 나타났으며, 회귀식의 설명력을 나타내는 지표인 R2값은 약 0.89를 보였다.
건설현장 화재 위험성 기준은 데이터가 정규성을 만족하지 못했기 때문에 통계적으로 중앙값 및 사분위수를 활용하여 Risk0~Risk3까지 총 4단계로 분류하였으며, 위험성별 K-W test를 수행한 결과, 건설현장 화재 위험성 및 위험성 기준에 따른 기상 조건은 통계적으로 유의한 차이를 보였다.
본 연구에서는 건설현장 화재의 예방 및 관리를 위해 구축된 화재 위험성 기준에 따라, 기상 조건의 범위를 제시하였다. 특히, Risk3 단계를 기준으로 회귀 모델에서 유의미하게 도출된 평균기온, 강수량, 대기압에 대해 정량적인 기상 조건의 범위를 제시하였다.
본 분석 연구에서 활용한 건설현장 화재 데이터는 화재 건수 및 화재 발생 연⋅월⋅일에 대한 데이터만을 포함하고 있기 때문에 지역 특성, 화재 요인 및 화재 피해 정도 등에 대한 세부적인 분석이 미흡하다. 대한민국은 지역별 지형에 따른 상이한 기상 조건을 나타내기 때문에, 향후 AI기반 기상 조건을 활용하여 건설현장 화재 예측 모델을 구축하기 위해서는 화재 발생 지역에 대한 정보가 가장 중요할 것으로 판단된다.