Fire Sci. Eng. Search

CLOSE


Fire Sci. Eng. > Volume 36(1); 2022 > Article
한국과 호주 공공데이터 포털의 재난 안전부문 공공데이터셋 품질 및 서비스 비교분석

요 약

본 연구는 한국과 호주의 공공데이터 포털의 재난 안전부문 공공데이터셋 구성내역과 전략 및 운영체계에 대한 비교⋅분석을 통하여 개선방안을 도출할 목적으로 수행하였다. 이를 위해 선행연구, 국가 공공데이터 포털 평가기준 등을 토대로 양 국가의 재난 안전부문 중심의 공공데이터 포털 비교기준을 정립하고, 재난 유형 및 안전관리단계의 구성요소별 데이터셋 비중 분석 등 양적인 구성내용 분석과 데이터셋 내용의 텍스트마이닝 분석, 데이터 품질과 다양한 서비스 분석 등을 진행하였다. 연구결과, 재난안전 공공데이터 개방 수와 비중은 한국 공공데이터 포털이 호주 공공데이터 포털보다 현저하게 적었으며, 재난안전관리에서 양 국가 모두 예방 데이터셋 수가 가장 높은 비중을 차지하였다. 또한 재난대응 협업에서 한국은 ‘물자관리 및 자원지원’이 대부분의 비중을 차지하고 있지만, 호주는 ‘상황관리 총괄’ 비중이 높았다. 데이터 품질 측면에서는, 호주는 불용성 데이터가 전체 중 69.54%를 차지하여 데이터 품질 관리가 잘 이뤄지지 않고 있으나, 한국은 불용성 데이터셋이 거의 없어 품질 관리가 잘 이뤄지고 있었다. 운영체계 비교분석을 통해 호주는 공공데이터에 대한 세부적인 가이드라인이 존재하는 반면 한국은 포괄적인 「지능정보화기본법」에 따라 공공데이터 포털을 운영하고 있었다. 따라서 향후 한국 공공데이터 포털은 재난 안전부문 공공데이터 개방 수와 비중을 늘리는 양적 성장 정책과 병행하여 재난 안전부문 공공데이터 활용을 확대시킬 수 있는 육성전략 및 서비스 운영정책을 강구할 것을 제안한다.

ABSTRACT

The objective of this study is to design improved plans for disaster and safety management through comparative analysis of datasets comprising details regarding the disaster and safety sector that are available in Korean and Australian public data portals and thereby examine the associated portal strategies and national operating systems To this end, based on previous studies and national public data portal evaluation standards, public data portal comparison standards were established. Furthermore, quantitative configuration analysis, data mining analysis, data quality analysis, and various service analyses were conducted. Consequently, it was found that compared to the Australian public data portal, the number and proportion of public data openings for disaster and safety management are significantly smaller in the Korean public data portal. The number of prevention datasets available in both countries accounts for the highest proportion in disaster and safety management. In addition, “supply management and resource support” accounts for the majority of Korean disaster response collaborations, whereas in the case of Australia, “comprehensive situation management” has a high proportion. In terms of data quality, Australian datasets include 69.54% of the total insoluble data, which implies inefficient data quality management. However, there are merely few Korean insoluble datasets. Through comparative analysis of the national operating systems, it was found that detailed guidelines for public data are available in Australia. However, the Korean public data portal is operated in accordance with the comprehensive Framework Act on Intelligence Informatization. Hence, a promotion strategy operation policy has to devise for the Korean public data portal to expand the usage of public data in the disaster and safety sector, along with quantitative growth policies that will increase the number and proportion of public data in the disaster and safety sector.

1. 서 론

21세기 ICT의 발달로 4차 산업혁명 시대인 인공지능 시대가 도래되었다. 세계 각국은 인공지능의 기반이 되는 빅데이터 기술을 가공과 분석에 따라 상황인식, 의사결정, 그리고 미래 예측이 가능하게 하는 영역까지 활용하고자 노력하고 있다(1). 이는 금융, 유통, 환경 뿐만 아니라, 재난안전관리 분야에서도 활발하게 활용되고 있는 실정이다.
한국은 2013년 공공데이터의 제공 및 이용 활성화에 관한 법률에 의해 ‘공공데이터 제공 및 이용 활성화 시행계획’을 중앙행정기관 47개, 지방자치단체 17개의 총 64개 기관에서 수립 및 시행하여 공공데이터 개방, 활용성을 높이도록 정책을 추진하였고, 2015년부터 현재 제3차까지의 ‘국가중점데이터 개방계획’을 세워 사회 현안⋅신산업 분야의 데이터 개방을 꾀하였다. 2021년 4월 공공데이터 개방 2.0으로 패러다임 전환을 추진하여 수요자가 원하는 다양한 형식의 데이터를 개방하고 민관협력을 강화해 데이터 품질을 높이고 공공데이터의 실질적 활용 및 가치를 창출해내고 있다.
호주는 2010년 7월에 ‘열린 정부 선언’ 발표로 공공데이터 개방 정책 도입을 추진하여 본격화하였고, 2011년 7월 데이터 개방을 위한 프레임워크인 AusGOAL을 운영함으로써 신속하고 간편한 가이드라인을 제시하였다. ‘2012년-2015년 공공서비스 ICT 전략’을 통해 공공데이터 개방 체계를 정립하였고, ‘2016-2025년 정부 디지털 혁신 로드맵’ 추진하여 ICT를 기반한 공공서비스 플랫폼을 적용시키고 있으며, 「디지털 전환부」는 2018년에 ‘2025년 디지털 혁신 전략’을 발표하여 보다 앞서나가는 국가가 된다는 목표를 향해 나아나고 있다(2).
IMD 세계 디지털 경쟁력 평가는 지식, 기술, 미래 준비성을 지표로 삼아 국가간 디지털 경쟁력을 평가하고 있는데 한국은 2018년 14위, 2019년 10위, 2020년 8위로 상승세로, 특히 미래 준비성 지표에서 우수한 것으로 평가받고 있다. 반면에 호주는 2018년 13위, 2019년 14위, 2020년 15위로 하락세를 보이고 있다. 디지털 경쟁력면에서는 한국이 호주보다 앞선 것으로 나타나고 있다.
또한 국가별 공공데이터 정책, 운영체계, 성과 등 공공데이터 역량을 평가하는 world wide web의 open data barometer, OECD의 our data index, open knowledge foundation의 global open data index 등의 평가에서는 평가속성에 차이가 있어 국가별 순위가 다르게 나타나고 있다. 먼저 open data barometer에서는 2017년 기준 한국이 5위, 호주가 3위를 기록하였고, OUR data index에서는 2019년 기준 한국이 1위, 호주가 6위를 기록하였다. 국가별 공공데이터 역량 평가에서도 한국이 호주보다 앞서는 것으로 나타나고 있다(3,4).
그러나 Seo(5)의 공공데이터 평가들에 대한 연구에 따르면, 이러한 결과와는 한국의 상반된 결과에 의구심을 가지게 되어 비판적 관점에서 논의를 하였고, Kim(6)에 따르면, 공공데이터 정책은 개방 및 이용 건수는 증가되고 있으나, 실제 개발 및 활용 건수는 높지 않은 것으로 보고 있다. 그 이유로는 민간 부문이 활용할 수 있는 데이터의 분야와 공공데이터의 분야가 부정합(mismatching)하며, 상호운영성에 부합되는 오픈 API양이 상대적으로 적어 빅데이터 비즈니스 솔루션으로 연계하기에는 한계점이 있다고 보고 있다.
최근 정보통신정책연구원의 ‘호주의 빅데이터 AI 동향 및 시사점’에서 언급한 국가별 공공 빅데이터 AI 기술 수준을 비교한 ‘Government AI Readiness Index 2020’(7)를 보면, 종합순위는 한국(7위)이 호주(12위)보다 높지만, 공공데이터 활용 부문에서는 호주(18위)가 한국(21위)보다 높았다. 이는 위에 언급한 Kim(6)의 주장을 뒷받침해 주고 있다.
따라서 Choi와 Kim(8)의 ‘공공분야에서 빅데이터 활용 방안’연구에서 언급하듯이 호주, 미국, 일본 등 데이터 선진국의 정부 및 공공기관에서 빅데이터를 활용한 시스템 구축 우수 사례를 통해 강점을 수용하여 현재 공공데이터 포털 개선 및 빅데이터 플랫폼을 구축할 필요가 있다고 본다. 이에 대해 최근 Lee 등(9)은 한국과 일본의 재난 안전부문 공공데이터를 대상으로 평가항목을 설정하여 양적 분석 및 서비스 활용사례를 분석해 데이터 활용확대 정책방안을 촉구했다.
본 연구에서는 비교대상 국가를 달리하여 공공데이터 활용도가 높게 평가된 호주와 한국 간의 공공데이터 포털에서 제공하는 재난 안전부문의 데이터셋에 대한 양적 비교⋅분석을 수행하고 또한 데이터 품질, 데이터 육성전략 및 운영체계 등 운영체계 속성에 대해서도 비교⋅분석하여 향후 한국 재난안전 부문 공공데이터 포털 정책 및 발전방안을 모색하고자 한다.

2. 본 론

2.1 공공데이터 정의

Kim(10)에 따르면, 공공데이터법이 제정되기 전에 각 개별 법령에서 공공데이터는 지식정보자원, 디지털 정보, 행정 정보, 공공정보 등으로 다양하게 사용되었으나, 2013년 10월 공공데이터법의 시행으로 용어와 정의가 내려졌다. 제2조 2항에 따라 공공데이터란 “데이터베이스, 전자화된 파일 등 공공기관이 법령 등에서 정하는 목적을 위하여 생성 또는 취득하여 관리하고 있는 광(光) 또는 전자적 방식으로 처리된 자료 또는 정보”를 의미하며, 전자정부법에 따른 행정정보와 지능정보화 기본법에 따른 정보 중 공공기관이 생산한 정보, 공공기록물 관리에 관한 법률에서의 전자기록물 중 대통령령으로 정하는 전자기록물, 그 밖에 대통령령으로 정하는 자료 또는 정보도 포함될 수 있다.
공공데이터는 공공기관이 이용자로 하여 기계 판독이 가능한 형태로 접근 및 이용할 수 있게 제공되고 있다. 공공데이터 개방을 통해 국민 누구나 공공데이터를 자유롭게 재이용할 수 있는 권리를 보장하며, 활용 및 융복합하여 가상재화나 서비스를 생산, 이익을 창출하고, 국민 삶의 제고와 신산업, 일자리 창출로 경제 활성 촉진 등 여러 목적이 있다(11).
본 연구에서는 재난 안전부문 공공 데이터셋의 양적 비교와 품질 및 서비스 활용 실태를 비교⋅분석하기 위해 연구대상으로 정부 주도하에 운영되고 있는 한국의 대표적인 공공데이터 포털(data.go.kr)과 호주의 공공데이터 포털(data. gov.au)에서 제공하는 데이터셋을 연구대상으로 하였다.

2.2 재난 안전부문 빅데이터 활용에 관한 선행연구

한국은 세월호 사건을 계기로 재난 안전관리체계에 대한 연구가 활성화되기 시작하였고, 최근 코로나 시대를 겪으면서 국민들의 재난 안전관리에 대한 관심이 높아졌다. Shin과 Kim(1)은 대형재난을 감지하고 예방하기 위해서는 빠른 의사결정과 신속한 대처를 할 수 있는 빅데이터 기술의 도입이 필요하다고 하였으나, 이와 관련된 연구는 미비하며, 아직 재난 안전부문 빅데이터에 관한 연구는 기초단계이라고 할 수 있다.
본 논문에서는 재난 안전부문의 데이터셋 구성내용에 대한 양적 비교⋅분석과 더불어 데이터셋 품질 및 서비스 분석을 통해 한국 공공데이터 서비스 및 경쟁 위치를 진단하고, 향후 정책방향을 제시하고자 하였다.

2.3 연구 설계

본 연구는 공공데이터 포털에서 제공하고 있는 재난 중심의 공공데이터 셋에 대한 양적인 비교와 데이터 내용 및 품질 분석, 데이터 서비스 분석을 통한 한국의 공공데이터 포털의 실질적인 수준을 파악하기 위하여 데이터 진단기준 개발(1∼3단계), 데이터셋 계량 분석(4~6단계), 데이터 품질 및 서비스 분석(7단계), 정책평가 및 발전방향 모색(8단계) 등 총 8단계로 연구를 다음 Table 1과 같이 진행하였다.
Table 1
Procedures for Diagnosing and Eliciting Public Data Portals
Derivation of diagnostic items
step 1 Define open data portal and disaster safety sector data
step 2 Select three key elements (safety management standards, data quality, and service) for the quantitative diagnosis of the open disaster safety data sets
step 3 Select sub items representing of three elements (18 items)
Quantitative analysis of data sets in disaster safety sector of public data platforms
step 4 extract disaster data sets of Korea open data platform data sets and Australia’s
step 5 Design research framework as to diagnose open data portal and analyze disaster safety data sets
step 6 Analyze quantitatively 18 detailed areas
Analysis of data quality and services
step 7 Evaluate data service quality and service structure
Policy direction
step 8 Identify areas for improvement of open data services and suggest directions for improvement
연구 대상 선정을 위하여 먼저, 호주 재난 안전부문 데이터셋은 호주 공공데이터 포털(data.gov.au)에서 ‘safety, disaster, emergency, fire’의 키워드로 검색하여 32,803개 중 2021년 8월 31일 현재 오픈된 9,991개의 데이터를 분석 대상으로 하였다. 또한 한국 데이터셋은 공공데이터 포털(data.go.kr)에서 전체 공공데이터 45,012개 중 재난안전부문 공공데이터인 2,283개를 분석 대상으로 하였다. 이렇게 수집된 데이터 셋은 재난 안전부문 데이터의 분류체계 기준(12)을 참고하여, 재난관리단계, 재난 분류 유형, 재난대응 협업기능으로 데이터를 분류하고, 이를 세분하여 호주 데이터셋과 한국 데이터셋을 비교 분석하였다.
또한 데이터셋의 품질평가 기준을 개발하기 위하여 선행연구들과 국제 오픈데이터 포털 평가기준들을 참고하여, 재난안전 부문 포털과 데이터셋 비교 분석을 위한 특성에 맞게 조정하여, 데이터 품질의 기본 속성으로 데이터 준비성과 일관성, 유효성으로 재구성하였고, 계량적 분석을 위한 재난안전정보 표준 프레임워크 개발(12)을 참고하여 이해 가능성 속성을 추가하였다.
데이터셋의 품질 분석을 위해 데이터 유효성 검사 후, 중복된 데이터 제거 및 공공데이터셋 개방 품질 지표인 data.gov.au에 게시된 팀 버너스리의 five star open data(13)에 따른 호주국가의 데이터셋 표준확장자 분류 항목과 Kim(6)에 언급된 data.go.kr을 운영하는 행정안전부에서 권고한 공공데이터 확장자 분류 항목을 반영하여 품질 속성을 정의하였고 국가 간의 비교⋅분석 기준을 Table 2와 같이 도출하였다. 그리고 전문가 패널 조사를 통하여 국가별 공공데이터 전략 및 운영체계를 대상으로 평가리스트를 재구성하였다.
Table 2
Comparison Criteria for the Quality Evaluation of Public Datasets in Disaster Safety Sector
Data quality machine-readable basis Australian dataset criteria Korean dataset criteria evaluation level
OL, open liecense ZIP, PDF, DOC PDF, TEXT, JPG, PNG 1
OF, open Format XLS, XLSX HWP, XLS, XLSX 2
Re, machine readable CSV, JSON,XML WMS, KMZ, SHP CSV, JSON, XML 3
URI, unifrom resource identifiers JSON-LD, CSV GEO AU ASC RUL 4
LD, linked data RDF RDF 5

2.4 연구 결과

2.4.1 재난 안전부문 공공데이터 포털 내 데이터 분석

데이터셋을 수치적인 측면에서 비교(Table 3)하면, 호주 공공데이터셋(103,311개)은 한국 공공데이터셋(45,012개) 보다 2.3배 많지만, 호주 재난안전 데이터셋(32,803개)은 한국 재난안전 데이터셋(2,283개) 보다 14.4배로 월등하게 많았다. 비율 비교에서도 호주 재난안전 데이터셋의 비중은 공공데이터셋의 31.8%로 한국 재난안전 데이터셋의 비중인 5.1%보다 약 6배 높아 한국은 재난안전 데이터셋의 양적 확보에 더욱 관심을 기울일 필요가 있다.
Table 3
Dataset Comparison Analysis Result Based on Disaster Safety Management System
Country mgt. stage Australia Korea
Unit Ratio (%) Unit Ratio (%)
Prevention 7,905 24.1 1,157 50.7
Preparedness 385 1.2 486 21.3
Response 347 1.1 402 17.6
Recovery 733 2.2 226 9.9
Etc 621 1.9 12 0.5
Data not available 22,812 69.5 - -
Total 32,803 100.0 2,283 100.0
그러나 호주 데이터셋은 불용성 데이터가 69.5%로 매우 높은 비중을 차지하고 있으며, 재난관리단계별로 보면 ‘지질 시리즈 지도’, ‘고도별 그리드 측정치’, 데이터셋을 활용하여 ‘Climate and Disaster Resilience’(14)에서 언급한 바와 같이 기후성 재난 AI 빅데이터 솔루션을 활용하고자 대부분의 데이터셋이 예방단계에 집중되어 있었다. 반면, 한국 데이터셋은 불용성 데이터가 없었고, 재난관리단계별로 보더라도 인적, 물자 자원현황 관리에 관한 예방단계 데이터셋(50.7%)이 가장 높은 비중을 차지하고 있지만 대비(21.3%), 대응(17.6%), 복구(9.9%) 등으로 고른 분포를 보였다. 호주는 기후성 재난을 AI 빅데이터 솔루션으로 해결하고자 노력하고 있으며, 반면 한국은 재난에 대한 통계 현황 데이터로 자원관리 중심의 재난 예방 및 대비에 노력하고 있다고 본다.
재난대응 협업에 대한 구성내용을 비교한 결과(Table 4), 한국은 ‘물자관리 및 자원지원’ 부문 데이터셋이 51.8%로 가장 높은 비중을 차지하는 반면 호주는 ‘상황관리 총괄’ 데이터셋이 19.3%로 높은 비중을 차지하였다. 이를 통해 볼 때, 한국은 예방적 차원으로 시설관리 및 물자관리 중심으로 재난을 대비하고자 한다면 호주는 재난 발생 시 신속하고 정확한 대응과 자연재난 또는 대형 산불을 초기에 감지하여 재난을 예방⋅관리하고자 노력하고 있다고 할 수 있다.
Table 4
Dataset Comparison Analysis Result Based on the Collaboration of Disaster Response
Country Collaboration Australia Korea
Unit Ratio (%) Unit Ratio (%)
Material and resource management 1,353 4.1 1,183 51.8
Transportation response - - 262 11.5
Maintenance of social order 155 0.5 213 9.3
Emergency recovery of damaged facilities 557 1.7 194 8.5
Comprehensive situation management 6,323 19.3 158 6.9
Search, rescue, and first aid 33 0.1 89 3.9
Disaster safety promotion 147 0.5 68 3.0
Restore energy function - - 52 2.3
Environmental maintenance at disaster site 468 1.4 37 1.6
Etc 621 1.9 12 0.5
Medical⋅quarantine 272 0.8 10 0.4
Volunteer management 22 0.1 4 0.2
Emergency life safety support 6 0.0 1 0.0
Emergency communication support 34 0.1 - -
Data not available 22,812 69.5 - -
Total 32,803 100.0 2,283 100.0
재난 및 안전유형에 대한 데이터셋을 비교한 결과 (Table 5), 한국은 ‘공통’부문 데이터셋이 32.3%로 가장 높은 비중을 차지하는 반면, 호주는 ‘사회재난(에너지)’ 부문이 16.5%로 높은 비중을 차지하였다. 이를 통해, 호주는 산불화재를 예방하고자 산불화재 발생 시 방출되는 복사에너지 변화량과 기존 고도에 따른 복사에너지에 대한 데이터셋이 가장 많이 있으며, 환경오염사고, 공통 데이터셋을 통해 특히 환경에 관련된 재난관리가 한국보다 많이 이뤄짐을 알 수 있다. 또한 이러한 결과는 Table 4의 재난대응 협업 결과를 뒷받침해 주고 있다고 본다.
Table 5
Dataset Comparison Analysis Result Based on Disaster Safety Type
Country Type Australia Korea
Unit Ratio (%) Unit Ratio (%)
Common disaster 462 1.4 738 32.3
Life safety 347 1.1 422 18.5
Crime safety 85 0.3 393 17.2
Traffic safety 10 0.0 10 0.4
Social Infrastructure safety 32 0.1 3 0.1
Health and safety 14 0.0 - -
Social disaster - traffic accident 32 0.1 190 8.3
Social disaster - fire 471 1.4 179 7.8
Social disaster - traffic weight, etc. 374 1.1 84 3.7
Social disaster - marine accident 447 1.4 46 2.0
Social disaster - energy 5,398 16.5 42 1.8
Social disaster - water service 91 0.3 33 1.5
Social disaster - CBR accident - - 15 0.7
Social disaster - environmental pollution accident 472 1.4 10 0.4
Social disaster - finance 242 0.7 7 0.3
Social disaster - infectious disease 10 0.0 7 0.3
Social disaster - communication 65 0.2 2 0.1
Social disaster - collapse 23 0.1 - -
Social disaster - explosion - - - -
Social disaster - airline accident 22 0.1 - -
Social disaster - medical 194 0.6 - -
Social disaster - livestock contagious disease 2 0.0 - -
Natural disaster - heavy snow - - 41 1.8
Natural disaster - earthquake 319 1.0 26 1.1
Natural disaster - flood 145 0.4 19 0.8
Natural disaster - heavy rain 17 0.1 2 0.1
Natural disaster - lighting 3 0.0 1 0.0
Natural disaster - drought 1 0.0 1 0.0
Natural disaster - wind storm 18 0.1 - -
Natural disaster - tsunami 22 0.1 - -
Natural disaster - typhoon 24 0.1 - -
Natural disaster - tidal current large occurrence 13 0.0 - -
Natural disaster - tide 3 0.0 - -
Natural disaster - volcanic activity 12 0.0 - -
Natural disaster - space object crash, fall - - - -
Natural disaster - yellow dust - - -
Natural disaster - strong wind - - - -
Etc 621 1.9 12 0.5
Data not available 22,812 69.5 - -
Total 32,803 100.0 2,283 100.0

2.4.2 텍스트 마이닝을 통한 키워드 분석 및 네트워크 분석 결과

재난 안전부문 데이터셋 네트워크 연관 분석하기 위하여 데이터셋의 내용을 토대로 텍스트 마이닝을 통해 핵심키워드를 분석한 후, 그 키워드를 바탕으로 네트워크 연관도를 분석하였다.
1) 한국 재난안전 데이터셋의 키워드 및 네트워크 분석 결과
키워드 분석에 앞서, 한국 재난 안전부문 공공데이터 전체 데이터셋을 재난 안전유형에 따라 분류하고 재난과 안전으로 재분류한 후, 데이터 제목을 대상으로 텍스트 마이닝을 통해 핵심 명사를 추출하여, 그 중 상위 10개 키워드(Table 6)를 도출하였다. 도출된 키워드 중 ‘재난’과 ‘안전’은 Seo와 Lee(15)의 연구에서 실행한 것과 같이 본 연구의 내용 분석에 큰 영향을 미치지 않을 것으로 판단하여 분석에서 제외하였다.
Table 6
Results of Keywords Frequency Analysis in Korea Public Data Disaster Safety Sector Using Text Mining
Disaster sector Frequency ranking Safety sector Frequency ranking
1. Police 6. Survey results 1. Police 6. Data
2. Child 7. Status 2. Safety and health 7. Media
3. Traffic safety 8. Fire fighting 3. Public enterprise 8. Local
4. Facility 9. Elementary 4. Occupational safety 9. Occurrence
5. Online 10. Fire station 5. Health 10. Sign
키워드 빈도분석 결과, Figure 1Table 6에서 보는 바와 같이 재난부문에서 가장 많이 나타난 키워드는 ‘경찰, 어린이, 교통안전, 시설, 온라인, 설문조사 결과, 현황, 소방, 초등, 소방서’ 순으로 나타났다. 10개의 키워드를 보면, 도로교통사고, 교통, 화재 등 사회재난 중심의 데이터 비중이 자연재난 데이터보다 높고, 이를 예방하고 관리하고자 이해관계자 중심의 설문자료와 도로교통사고 현황 같은 통계 데이터를 통해 사회재난에 대한 정보를 공유해 주고 있다고 볼 수 있다.
Figure 1
Results of text mining in Korea public data disaster safety sector (keyword frequency analysis, word cloud analysis).
kifse-36-1-81-g001.jpg
네트워크 분석 결과, Figure 2와 같이 ‘교통사고, 설문조사, 초등학생’ 등 키워드들 간의 연관성을 보았을 때, 키워드 빈도분석 결과를 더욱 뒷받침해 주는 결과가 도출되었다. 안전부문에서 가장 많이 나타난 키워드는 ‘경찰, 안전보건, 공단, 한국산업안전, 보건, 자료, 미디어, 지방, 발생, 표지’이었으며, 생활 안전부문은 작업환경 중심의 데이터로, 한국산업안전보건공단에서 작업장 안전관련 예방 미디어 자료의 빈도가 높음을 알 수 있으며, 경찰이라는 단어를 통해 범죄 안전에 대한 데이터 빈도가 높음을 알 수 있다. 네트워크 분석결과 중 ‘안전보건, 근로자, 외국, 경찰, 검거, 현황, 정보’ 등 키워드들 간의 연관성을 보았을 때, 키워드 빈도분석 결과를 더욱 뒷받침해 주고 있다고 본다.
Figure 2
Results of text mining in Korea public data disaster safety sector (co-occurence network analysis).
kifse-36-1-81-g002.jpg
2) 호주 재난안전 데이터셋의 키워드 및 네트워크 분석 결과
먼저 키워드 분석에 앞서, 호주 재난 안전부문 공공데이터 전체 데이터셋 중 불용성 데이터를 제거하였다. 번역된 데이터를 재난 안전유형에 따라 분류하고 재난과 안전으로 재분류한 후, 데이터 제목을 대상으로 텍스트 마이닝을 통해 상위 10개의 키워드(Table 7)를 도출하였다. 도출된 키워드 중 ‘재난’과 ‘안전’은 앞서 분석한 내용과 같이 본 연구의 분석에 큰 영향을 미치지 않을 것으로 판단하고 분석에서 제외시켰다. 네트워크 분석 또한 앞서 분석한 바와 같이 번역된 초록 설명 부분을 통해 키워드를 먼저 추출한 후, 키워드 간의 네트워크 분석결과를 도출하였다.
Table 7
Results of Keywords Frequency Analysis in Australia Public Data Disaster Safety Sector Using Text Mining
Disaster sector Frequency ranking Safety sector Frequency ranking
1. Datasets 6. Location 1. Data 6. Work place
2. Australia 7. Information 2. Area 7. Annual
3. Area 8. Fire 3. Offer 8. Queensland
4. Offer 9. Grid 4. Information 9. Health
5. Service 10. Research 5. Australia 10. Child
키워드 빈도분석 결과, Figure 3Table 7과 같이 재난부문에서 빈도수가 높은 키워드는 ‘데이터셋, 호주, 제공, 서비스, 위치, 정보, 화재, 그리드, 연구’ 순으로 나타났다. 도출된 10개의 키워드를 참조하면, 자연재난에 대한 공공데이터뿐만 아니라, 화재에 대한 데이터가 많이 분포하는데 이는 호주에서 발생하는 산불과 관련된 데이터가 많음을 데이터 세부 설명을 통해 확인하였다. 호주 정부 부서인 home affairs의 ‘Major Incidents Report 2019-20’(16)에 따르면 호주의 산불은 기후변화와 밀접한 상관관계가 있고 대형 산불을 예방하기 위해서는 AI, 빅데이터 기술 도입이 필요하다고 언급하였다. 빈도분석에서 도출된 키워드들은 이를 더 뒷받침해 주고 있으며, 호주 정부는 재난관리에 필요한 공공데이터를 적극적으로 활용하고자 노력하고 있다고 본다. 반면 안전부문의 키워드 빈도분석 결과를 보면, ‘데이터, 지역, 제공, 정보, 호주, 작업현장, 연도별, 퀸즈랜드, 건강, 어린이’ 순으로 도출되었고, 이를 통해 호주는 작업현장과 보건의료에 대한 데이터의 비중이 높고, 지역별 연도별 데이터에 따라 관리가 많이 이뤄짐을 알 수 있다. 네트워크 분석결과(Figure 4)가 이를 뒷받침해 주고 있다.
Figure 3
Results of text mining in Australia public data disaster safety sector (keyword frequency analysis, word cloud analysis).
kifse-36-1-81-g003.jpg
Figure 4
Results of text mining in Australia public data disaster safety sector (co-occurence network analysis).
kifse-36-1-81-g004.jpg
이러한 분석결과를 종합해보면, 한국은 도로교통사고, 교통, 화재 등 사회재난 중심의 데이터 비중이 자연재난 데이터보다 높았다. 이를 해결하고자, 설문자료와 도로교통사고 현황과 같은 통계 데이터를 통해 이해관계자 중심으로 정보를 공유해 주고 있지만, 호주는 화재(산불)과 여러 자연재난을 AI, 빅데이터 기술로 해결하고자 지리적 정보와 기후변화를 감지하는 여러 요소의 데이터를 확보하고 관리하고 있음을 도출된 키워드 비교분석을 통해 확인하였다.
안전부문 공공데이터 비중은 한국과 호주 모두 생활 안전부문 중 작업 안전에 대한 데이터가 가장 많이 차지하고 있는 것을 보아, 한국과 호주가 비슷한 경향을 띄고 있지만, 한국보다 높은 비중의 의료 및 건강 데이터 수치를 참조하면, 호주는 한국보다 의료 및 건강에 대한 관리가 더 많이 이뤄짐을 알 수 있다.

2.4.3 데이터 품질 및 서비스 비교분석

1) 데이터 품질
재난 안전부문 공공데이터셋 데이터 품질 비교 분석결과, 호주와 한국의 데이터셋 품질은 전체적으로 비슷한 수준이었다. 양국 모두, 4등급, 5등급인 링크드 데이터셋의 양은 미비하였지만, 사용자가 쉽게 기계 판독하며, 다룰 수 있는 3등급의 데이터셋 비중은 가장 높았고 다음으로 1등급, 2등급 데이터셋 비중이 높았다.
또한 호주는 불용성 데이터셋이 69.5%를 차지, 데이터 품질 관리가 잘 이뤄지지 않고 있으나, 한국은 불용성 데이터셋이 없는 등 상대적으로 데이터셋 품질 관리가 제대로 이루어지고 있었다(Table 8).
Table 8
Quality Levels Comparison Analysis of Datasets in Disaster Safety Sector
Country Type Australia Korea
Unit Ratio (%) Unit Ratio (%)
Level1 1,558 4.8 277 12.1
Level2 697 2.1 157 6.9
Level3 7,177 21.9 1,818 79.6
Level4 85 0.3 2 0.1
Level5 - - - -
Data not available 23,286 69.5 - -
Total datasets 32,803 100.0 2,283 100.0
데이터 확장자 분포를 보면, 호주는 다양한 확장자를 가지고 있으며 HTML (37.9%), X-NETCDF (31.3%), CSV (5.3%) 등이 높은 비중을 차지한 반면, 한국은 CSV (30.3%), XML (31%), JSON (29.5%) 등이 높은 비중을 차지하였다(Tables 9 and 10).
Table 9
Open Data Filename Extensions Distribution in Korea Disaster Safety Sector
Data type Unit Ratio (%) Data type Unit Ratio (%) Data type Unit Ratio (%)
XML 1,701 31.0 PPTX 9 0.2 TXT 1 0.0
CSV 1,666 30.4 SHP 7 0.1 DWG 1 0.0
JSON 1,618 29.5 ZIP 5 0.1 PNG 1 0.0
PDF 269 4.9 AVI 3 0.1 XSML 1 0.0
HWP 127 2.3 MP 3 0.1 PPT 1 0.0
XLS 20 0.4 AI 2 0.0 TEXT 1 0.0
TTL 18 0.3 DOC 1 0.0 JPG 1 0.0
XLSX 17 0.3 RUL 2 0.0
MP4 10 0.2 WMV 2 0.0
Table 10
Open Data Filename Extensions Distribution in Australia Disaster Safety Sector
Data type Unit Ratio(%) Data type Unit Ratio(%) Data type Unit Ratio (%)
X-NET CDF 5,200 31.3 GEO JSON 29 0.2 ECW 2 0.0
HTML 6,291 37.9 JSON 26 0.2 GEO TIFF 2 0.0
CSV 886 5.3 JPEG 17 0.1 FTP 2 0.0
PDF 814 4.9 PNG 16 0.1 MAP INFO 2 0.0
XLSX 618 3.7 MIXED 13 0.1 X-FLV 2 0.0
SHP 555 3.3 SLD 13 0.1 TXT 2 0.0
WMS 388 2.3 MAP 11 0.1 PPTX 2 0.0
ESRI RESET 348 2.1 WFS 13 0.1 PSV 2 0.0
ZIP 120 0.7 CSV GEO AU 10 0.1 SHAPE 2 0.0
ARC GIS 95 0.6 RSS 8 0.1 CSW 1 0.0
DOCX 93 0.6 URL 6 0.0 OGC WCS 1 0.0
ASC 67 0.4 OGC WFS 6 0.0 ADF 1 0.0
WEB SERVICE 64 0.4 GDB 5 0.0 TEXT 1 0.0
XML 58 0.4 MP4 4 0.0 ETC 205 1.2
TIF 45 0.3 ESRI MAP SERVICE 4 0.0 data not available 474 2.9
KMZ 42 0.3 GEO DATA BASE GDB 3 0.0
KML 37 0.2 TIFF 3 0.0
2) 재난 안전부문 공공데이터 전략 및 운영체계
한국과 호주의 공공데이터 전략 및 운영체계를 비교해 보면(Table 11), 양 국가 모두 공공데이터 활용으로 데이터 경제 활성화를 통한 일자리 창출, 국민들의 생활 질의 향상을 목표로 하고 있었다.
Table 11
Comparison of Strategies and Operating Systems for Fostering Public Data in the Disaster Safety Sector
National comparative, analysis Korea Australia
Public data platform. data.go.kr data.gov.au
Decision-making agency Public Data Strategy Committee Australian Government (Digital Transformation Agency)
A dedicated administrative department Ministry of the Interior and Safety (32 employees)
National Information Society Agency (11 executives, 289 employees)
Australian National Statistical Office (14employees)
Commonwealth Scientific and Industrial Research Data61 Center (8 executives, 217 employees)
Main Governance √ The existence of a personal information protection committee within the administrative committee.
- A central administrative agency belonging to the Prime Minister that deliberates and decides on the protection of personal information. (It consists of not more than 15 members, including one chairperson and one standing member.)
√ Three data advisory committees are in operation.
- 4th Industrial Revolution Committee (1 chairperson, 9 members in industry, 9 in academia, 2 in research)
- Information and Communication Strategy Committee. (13 civilian members)
- Public Data Strategy Committee
· strategy committee members : 2chairpersons, 16public officials, 17civilian members
· working-level members : 2chairpersons, 7public officials, 16civilian members
· technical expert members : 29members
√ Two data advisory committees are in operation.
- Office of the National Data Commissioner
- National Data Advisory Council
policies and strategies It aims to improve the quality of life of the people by establishing a data ecosystem and expanding data utilization by various fields, and is promoting a basic plan for joint data as follows.
√ The 1st Basic Plan for Public Data(13-17years)
√ The 2nd Basic Plan for Public Data(17-19years)
√ The 3rd Basic Paln for Public Data(20-22years)
The government is promoting the third plan of the open government with the goal of a “people’s participation government” by promoting the expansion of people’s data use through bills and guidelines related to public data sharing.
√ The Ministry of Finance and Deregulation announced the Declaration of Open Government (July 2010).
√ The 1st Open Government National Action Plan(2016-2018)
√ The 2nd Open Government National Action Plan(2018-2020)
√ The 3rd Open Government National Action Plan(2020-2022)
Legal system Enact laws on the opening and activation of public data.
1. status of informatization laws related to the opening of public data
 「Article 14 of the Framework Act on Intelligent Informatization」 (Promotion of Public Intelligent Informatization)
 「Article 12 of the E-Government Act」(Electronic provision of administrative information)
 「Article 15 of the Official Information Disclosure Act」
 「Content Promotion Act」
2. The existing legal system related to the private use of public data
 「Statistics」
 「The Meteorological Industry Promotion Act」
 「Copyright Act」
3. Act on the Provision and Utilization of Public Data
 「Act on the Provision and Utilization of Public Data」
In addition to opening and revitalizing the use of public data, the Act on the Protection of Personal Information Related Public Data has been enacted.
1. Status of informatization laws related to the opening of public data.
 「Freedom of Information Act 1982」
2. 「The Privacy Act 1988」
- Details define public data-related areas.
3. Act on the Provision and Utilization of Public Data.
 「Data Availability and Transparency Bill 2020」
 「Public Sector Data Sharing Act 2016」
먼저 한국은 「지능정보화 기본법」 제 14조(공공지능화의 추진)에 따라 국민 누구에게나 활용할 수 있는 데이터 범위를 산업, 생활, 금융 부문뿐만 아니라, 재난 안전 부문까지 데이터 범위를 넓히고 공공데이터 기본계획에 따라 2013년 공공데이터 포털(www.data.go.kr)을 개방해서 운영해오고 있다. 이러한 운영에 대하여 공공데이터 활용범위 확대 단계를 넘어, 공공데이터 활용 준비 단계에 이르렀다고 평가 받고 있다. 특히 재난관리체계 중 예방⋅대비 단계의 재난 물자관리 및 재난 발생 통계에 관한 공공데이터 확보를 통해 국민들에게 재난 상황을 공유하고, 소통하는 이해관계자적 매체로 활용하고 있다.
반면 호주는 「정보자유법(freedom of information act 1982)」에 따라, 국민들의 데이터 기본권을 보장하고 행정기관의 투명성 확대, 공공데이터 사용 및 재사용 확대로 ‘국민들의 참여 정부’인 열린 정부를 목표로 한국과 같은 2013년도에 공공데이터 포털(www.data.gov.au)을 개방해서 운영해오고 있다. 호주는 중장기적 열린정부 국가 행동 계획 중 발의된 공공부문 데이터 공유 관련 법안인 「공공데이터 공유법(public sector data sharing act 2016)」과 「데이터 가용성 및 투명성 법(Data Availability and Transparency Bill 2020)」을 통해 공공기관별 공공데이터 공유를 확대하고자 세부적인 가이드라인을 제시하고 이를 적극 활용하고 있다. 대표적인 활용사례로 호주는 지리적 정보와 기후변화를 감지하는 여러 요소의 데이터를 확보하고 있으며 확보된 데이터를 활용하고 있으며, 연방과학산업연구원(CSIRO)의 data center 61과 호주국가 통계청이 ‘NationalMap’ 프로그램을 공동으로 운영하여 재난을 미리 감지하고 재난 상황 시 빠른 의사결정을 지원하고 있다.
따라서 한국도 신속한 의사결정을 지원하기 위하여 빅데이터 분석을 바로 진행하기 용이한 데이터 형식으로 올리는 것을 권장하고 AI 학습 프로그램을 강화하는 정책을 강구해야 한다. 또한 공공데이터 공유에 관한 세부적인 가이드라인 마련과 호주처럼 정부 부처 간 공유가 가능한 공공데이터 표준화 절차를 통해 재난 안전부문 공공데이터 수집 및 활용이 선순환으로 이루어지는 체계를 구축해야 한다고 판단된다.

3. 결 론

본 연구에서는 재난 안전부문 공공데이터를 활용하기 위해서는 현재 가용할 수 있는 데이터의 품질과 수준을 파악하는 것이 중요하다고 판단하에 한국과 호주 공공데이터 포털의 재난 안전부문 데이터셋의 양적 분석뿐만 아니라, 재난안전관리단계 등 재난안전관리 특성 유형별 세부 내용에 대한 분석을 하였고, 그 결과 다음과 같은 재난 안전부문 공공데이터 포털의 정책 방향을 도출하였다.
첫째, 한국은 호주에 비해 전체 공공데이터셋 뿐만 아니라, 재난 안전부문 공공데이터셋 역시 양적으로 부족하여 데이터 전반의 양적 확보를 위하여 노력해야 한다.
둘째, 재난안전관리 단계별 구성내용 측면에서 한국은 재난 대비에 관한 물자 중심의 데이터가 많은 반면, 호주는 자연재난을 미리 감지하는 지리적 정보와 기후변화를 감지하는 물리적 요소의 데이터가 많은 것을 보아 한국 역시 실제 재난 현장에서 활용할 수 있는 데이터셋 확보 방안이 필요하다.
셋째, 데이터 품질 측면에서 호주는 불용성 데이터셋이 전체 중 절반 이상인 69.5%를 차지하는 반면, 한국은 불용성 데이터셋이 없는 것을 보아, 한국은 데이터 기본 품질의 관리가 잘 이루어지고 있으나, 확장자 범위 측면에서 볼 때 호주에 비해 재난 안전부문에 활용되는 데이터 범위는 매우 좁다. 따라서 ARC GIS, CSV GEO AU와 같은 지리적 데이터 확장자 범위도 수용하고 이에 해당하는 데이터 확보 방안을 검토해야 한다.
넷째, 한국은 공공데이터에 관한 법안은 「지능정보화 기본법」, 「공공기관의 정보공개에 관한 법률」 등에 포괄적으로 포함하고 있지만, 호주는 공공기관별 공공데이터 공유에 대한 세부적인 가이드 지침을 제시하는 「공공데이터 공유법 (public sector data sharing act 2016)」과 「데이터 가용성 및 투명성 법(data availability and transparency bill2020)」이 있다. 따라서 한국 역시 공공데이터에 관한 세부적인 법안과 가이드 지침이 필요하다.
다섯째, 호주 정부의 재난 상황분석 프로그램‘NationalMap’을 통계청과 연방과학산업연구원(CSIRO)의 Data61센터가 공동으로 운영하는 것을 보아 한국 역시 과학 정부출연연구기관과 함께 재난 안전부문 공공데이터를 공유하고 함께 관리하며 활용해야 한다.
본 연구에서는 한국과 호주의 공공데이터 포털 재난 안전부문 공공데이터셋 비교분석을 통한 재난 안전부문 공공데이터 활용 방향을 모색하였다. 향후 데이터 변화 추이와 다양한 데이터 선진 국가를 대상으로 비교분석 및 국내 지자체별 공공데이터 활용 서비스 성과, 만족도, 포털의 성숙도 평가에 대한 추가적인 연구가 필요할 것으로 본다.

References

1. D. H Shin and Y. M Kim, “The Utilization of Big Data's Disaster Management in Korea”, The Journal of the Korea Contents Association, Vol. 15, No. 2, pp. 377-392 (2015), https://doi.org/10.5392/JKCA.2015.15.02.377.
crossref
2. S. M Im and S. H Song, “Research on open data openness, sharing and utilization”, Audit Researcher, Dongguk University Industry-Academic Cooperation Foundation, (2019).

3. B Marcos, “OECD Open, Useful and Re-usable data (OURdata) Index:2019”, (2020).

4. IDRC, The World Bank, DFID, “public data Barometer 4th Edition-Global Report”, (2017).

5. H. J Seo, “A Critical Review on Open, Useful, Reusable Government Data Index by OECD with Level of Domestic Open Government Data :Focusing on Comparison with open data Barometer”, Informatization policy, Vol. 24, No. 2, pp. 43-67 (2017), https://doi.org/10.22693/NIAIP.2017.24.2.043.
crossref
6. G Kim, “An Evaluation of Public Data Opening Policy:Focused on Public Data Portal”, Public Policy Review, Vol. 31, No. 2, pp. 57-82 (2017), https://doi.org/10.17327/ippa.2017.31.2.003.
crossref
7. S Eleanor, S Richard and P Walter, “Government AI Readiness Index 2020”, Oxford Insights, (2020).

8. H. S Choi and S. J Kim, “How to use big data in the open sector”, Journal of the Korean Smart Media Society, Vol. 2, No. 3, pp. 18-25 (2013).

9. H. Y Lee, M. H Jeong and I. S Park, “Comparison of Disaster Safety Datasets and Service in Korean and Japanese Public Data Portals”, Fire Science and Engineering, Vol. 35, No. 6, pp. 137-146 (2021), https://doi.org/10.7731/KIFSE.569432bc.
crossref
10. J. H Kim, “Service level evaluation through public data portal analysis”, Master's thesis in Korea, Chungbuk National University General Graduate School (2016).

11. C. H Lee, S. Y Kim, S. S Sin, Z. S Seo, S. J Lim, D. H Lee, S. Y Park, J. H Myoung and et al, “Data Quality Assessment Procedure Manual”, Korea Data Agency, (2009).

12. C. S Lee, “Development of a standard framework for disaster safety information”, Ministry of Science, ICT, and Future Planning, Korea Research Foundation, (2017).

13. Australian Government, “Linked Data Rating”, accessed December 25, 2021. Available From:https://data.gov.au/page/linked-data-rating.

14. CSIRO, “Climate and Disaster Resilience”, Australia's National Science Agency, (2020).

15. H. J Seo and J. Y Lee, “Analysis of Future Education Trends Using Semantic Network Analysis”, Education Information Media Research, Vol. 24, No. 4, pp. 649-678 (2018), https://doi.org/10.15833/KAFEIAM.24.4.649.
crossref
16. C Robert, “Major Incidents Report 2019-2020”, Australia Home Affairs Australian Institute for Disaster Resilience, (2020).



ABOUT
BROWSE ARTICLES
EDITORIAL POLICY
AUTHOR INFORMATION
Editorial Office
Room 906, The Korea Science Technology Center The first building, 22, Teheran-ro 7 Gil, Gangnam-gu, Seoul, Republic of Korea
Tel: +82-2-555-2450/+82-2-555-2452    Fax: +82-2-3453-5855    E-mail: kifse@hanmail.net                

Copyright © 2024 by Korean Institute of Fire Science and Engineering.

Developed in M2PI

Close layer
prev next