지역 산업 일자리 미스매칭 분석 사례
최근 대한민국의 전국단위 고용동향을 살펴보면 좋은 고용지표의 수치를 보여주고 있다. 하지만 지역별, 산업별로 접근하면 인력을 구하지 못해 구인난을 겪는 지역과 산업이 있고 반대로 구직을 못해 실업자가 많은 지역 및 산업이 존재한다.
하지만 이러한 일자리 미스매치가 발생하는 실질적인 공간인 시·군·구 차원에서 미스매치를 실시간으로 확인하고 파악할 수 있는 시스템과 자료가 부족한 상황이다.
그동안 많은 정부 정책에 활용하던 통계 및 실태조사에는 한계가 있었다.
예를 들면 1~2년 시차가 있는 통계지표를 활용한 정책을 수립하거나 광역통계만 있고 기초지자체(시·군·구 등) 통계의 부족으로 분석의 한계도 있었으며, 무엇보다도 가장 큰 문제는 각 고용 위기 및 미스매치를 모니터링 할 시스템이 없다는 점이다.
지역산업/고용 지원 및 정책의 효과성 제고를 위해 근거 기반(evidence-based)의 정보시스템 구축 필요하다 특히, 데이터에 근거한 과학적인 행정기반 확보, 의사결정체제가 매우 중요하다.
따라서 고용위기를 지역별로 시·군·구 차원까지 살펴보고 동시에 산업별로도 세분화하여 분석을 진행하였다. 이를 통해 전국의 고용현황과 일자리 미스매치 현황을 한눈에 볼 수 있는 대시보드 모니터링 사례를 데이터스토리로 풀어 설명하겠다.
본 데이터 분석 및 시각화를 통해서 지역산업 고용위기 및 고용동향을 조망하고 문제해결을 위한 지표를 제공한다.
‘지역경제 빅데이터 플랫폼’의 KoDATA(한국평가데이터) 의 데이터 및 외부 통계데이터를 활용하여 분석을 진행하였습니다.
□ 빅데이터 활용 및 데이터 출처
데이터셋 | 데이터 설명 | 데이터 출처 | 비고 |
---|---|---|---|
종업원 현황 데이터 | 전국단위 시군구별 기업의 종업원 수 현황 (입사자수, 퇴사자수, 현재 종업원 수 등) | K0DATA 제공 | 지역경제 빅데이터플랫폼 월별데이터(2015.01~2022.06), 업종 중분류 기준 |
기업 현황 데이터 | 전국단위 시군구별 기업 현황(업력 구간별, 기업규모별 등의 통계데이터) | K0DATA 제공 | 지역경제 빅데이터플랫폼 월별데이터(2015.01~2022.06), 업종 중분류 기준 |
피보험자 현황 데이터 | 전국단위 시군구별 고용보험 피보험자수 현황(피보험자수, 고용장려금 지급 순 인원 현황 등) | 고용행정통계 | (2015.01~2022.06), 업종 중분류 기준 |
전력사용량 데이터 | 전국단위 시군구별 전력사용량 | 한국전력공사 | 정수형태, 월별데이터(2015.01~2022.06) |
유동인구 현황 데이터 | 전국단위 시군구별 유동인구 현황데이터(연령별, 성별로 구분 지어진 데이터) | 국가통계포털(통계청) | 정수형태, 월별데이터(2015.01~2022.06) |
사업장 현황 데이터 | 전국단위 시군구별 소멸사업장, 신규 사업장 수 현황 | 국가통계포털(통계청) | 정수형태, 월별데이터(2015.01~2022.06) |
구인구직 현황 데이터 | 전국단위 시군구별 유효구인인원, 유효 구직자수, 채용인원, 등 구인, 구직 현황 데이터 | 고용행정통계 | 정수형태, 월별데이터(2015.01~2022.06), 업종 중분류 기준 |
□ (대시보드) 수집‧분석된 지역산업통계정보를 기초지자체 단위로 시각화
ㅇ 수집, 분석된 지역산업 통계정보를 지자체 단위로 시각화
- 통계지표의 시각화 뿐만 아니라, 사용자가 해당 통계지표를 이해할 수 있는 정책적 시사점에 대한 가이드 제공
- 데이터 결합/가공/분석을 통한 태블로(tableau)툴로 시각화
대시보드: 데이터 분석으로부터 얻어낸 중요한 발견들을 한눈에 직관적으로 파악할 수 있도록 다양한 차트를 디자인원칙에 따라 구성해 놓은 일종의 시각화 레포트
【 고용지표 대시보드 : 일자리 정책 등 】
【 고용지표 대시보드 : 지역/산업별 종업원수 예시 】
【 고용지표 대시보드 : 1인당 평균임금 예시 】
[분석배경]
【 고용현황과 세분화된 분석의 필요성 】
□ 일자리 미스매치 현황 분석의 필요성
위의 그래프는 2022년 전국 시도단위로 산출된 지역내 총생산 수치이다(GRDP). 해당 그래프를 보게 되면 울산의 GRDP수치가 다른 지역에 비해 월등히 높다는 것을 알 수 있다. GRDP는 해당 지역의 지역 경제 활성화를 보는 수치로 이용될 만큼 지역의 경제상태를 잘 나타내는 지표이다. GRDP가 최상의 수치인 울산은 아이러니하게도 심각한 미스매치를 호소하고 있다. 오른쪽의 표는 2019년과2020년의 울산의 구인, 구직 현황을 볼 수 있는데 이는 울산이 계속해서 고용 및 일자리 미스매치가 심화되고 있는 것이 보여 진다.
울산은 제조업 중심의 산업구조를 가지고 있으며 조선업의 회복세에 따라 현재 울산 전 지역에서 일자리 수요가 굉장히 증가하고 있다.
하지만 오른쪽의 울산 동구의 인구 순 이동 그래프를 보게 되면 울산의 청년층 인구는 계속해서 유출되고 있으며 이는 울산에 심각한 미스매치 문제를 가져왔다.
이는 고용동향과 일자리 미스매치에 대해서 지역별, 업종별로 세분화된 분석의 필요성을 시사하고 있다. 만들어지는 실질적인 공간인 시군구차원에서 미스매치를 분석하는 작업은 매우 중요하지만 현재 나와있는 관련 논문과 연구는 시도차원에서의 분석은 많지만 시군구단위 지역적 차원의 연구는 그렇게 많지 않다. 또한, 이를 모니터링할 수 있는 시스템 또한 부재하고 있음을 알 수 있다.
□ 지역별 산업별 고용동향 모니터링 필요
고용노동부가 발표한 2022년 7월 기준 고용동향 보고서에 기재된 수치에 따르면 현재 우리나라 경제 성장률을 0.7%이며, 취업자는 약 83만 명 정도 상승하였다. 또한 역대 최저 실업률을 달성하였다. 그야말로 최상의 고용동향을 기록했다고 볼 수 있다.
하지만 전국단위 수치가 아니라 지역별로 살펴보게 되면 구인난과 구직난이 심하게 발생되고 있다. 이로 인해 뉴스에서 소멸위기지역, 고용위기지역이라는 기사를 쉽게 볼 수 있다. 이는 해당 지역의 인구구조와 산업구조에 밀접하게 연관이 되어 있다고 생각한다.
따라서 지역별, 산업별로 세분화하여 고용동향을 살펴보는 것이 중요하다는 것을 알 수 있다.
현재 우리나라는 고용위기를 앓고 있는 지역을 살리기 위해 여러 정책을 시행하고 있다. 우리는 고용위기지역 지정이라는 정책에 집중해서 살펴보았다. 해당 정책은 고용보험 피보험자수의 증감률을 토대로 고용위기지역을 선정하고 있었다. 해당 법규에 대해 여러 전문가들은 고용위기지역을 지정하는 데 있어서 너무 많은 시간이 소요되고, 지표의 수치변화를 후행적으로 살펴보아 해당 정책이 사후적으로 작동하는 한계를 갖고 있다고 평가한다. 또한 여러 연구보고서에 의하면 이러한 정책을 펼치는 데에 있어서 고용동향을 여러 지표와 함께 살펴볼 수 있는 상시적인 모니터링 체계 구축이 필요하다고 평가하고 있다.
따라서 여러 지표를 통해 고용위기를 예측하고 고용동향을 살펴볼 수 있는 모니터링 서비스가 필요하다.
□ 고용위기에 대한 즉시 대응 필요
【 거제시 종사자수 모니터링 결과 】
거제 지역의 실업급여 신청자 수는 ‘15년 12월부터 급증하였으나, 위기지역 지정은 약 2년 5개월이 지나서 ’18년 5월에 지정되면서 늦은 정책대응을 함 향후 데이터와 AI분석을 기반하여 선제적인 고용위기 정책 대응이 필요하다.
[데이터 분석] 고용위기
□ 딥러닝을 이용한 고용위기 예측 사례
우리는 고용위기 예측을 위해서 딥러닝 알고리즘을 이용하려고 한다. 일단 딥러닝 학습을 위해서 고용보험 피보험자수를 종속변수로 선정하고, K0DATA(한국평가데이터) 기업/고용정보와 자체수집한 모든 데이터들을 독립변수로 선정하여 분석을 진행하였다.
독립변수로는 고용위기를 예측하는 것이기 때문에 고용동향을 살펴보는 여러 지표들 중에서 고용위기를 기준으로 선행지표와 동행지표만 분석에 사용하고자 하였다.
또한 모든 변수를 상관분석을 통해 독립변수를 확정지었다.
데이터는 모두 시계열 데이터로 최근 1년까지의 데이터를 test data set, 나머지를 모두 train data set으로 선정하여 분석하였고, 시계열 교차검증법을 사용해 여러 머신러닝/딥러닝 모델을 통해 분석 수행 후 성능을 비교하였으며 성능지표로는 MSE(Mean Squared Error)를 사용하였다.
따라서 최종적으로 분석에 사용될 모델은 MSE지표가 가장 적은 수치를 보였고, 딥러닝 모형 중 시계열 데이터 분석에 높은 성능을 보이는 LSTM(Long Short–Term Memory)을 사용하였다.
□ 고용위기지역 분석 시각화 사례 (예시)
모형을 통해 10년간의 지역/산업정보를 기반으로 백테스팅를 진행하였고 관련 산업위기지역에 대한 위기가 선제적으로 잡히는 것을 확인 할 수 있었다.
□ 고용지표 비교 분석 시각화 사례 (예시)
【 경기도 vs 울산시 취업자수 및 연령분포 】
경기도와 경상북도의 취업자수를 비교형식으로 시각화 한 사례이다.
경기도의 취업자수는 계속 증가 추세인데 반하여 경상북도는 정체되어 있는 그래프를 보임
또한 경기도는 전연령에서 고른 취업 분포를 보이는 데 반하여 경상북도는 60세 이상의 취업자가 30%를 초과하는 것을 보여주고 있음
각 지자체별로 고용지표를 비교 할 수 있는 장점이 있다.
【 경기도 vs 울산시 고용율과 실업률 】
【 경기도 vs 울산시 청년 고용율과 청년실업률 】
고용정보 빅데이터 분석을 통한 산업위험 파악
일반적으로 기업의 종업원 현황은 매출액과 정비례하는 관계를 나타내고 있으며, 기업의 생산에 대한 변동을 우회적으로 측정할 수 있다. 따라서, 해당 지표는 대규모 질병감염 사태와 같은 외부 충격에서 가장 선제적으로 모니터링 해야 한다.
【 국민연금 데이터과 기업정보를 결합한 사례(고용지표/실업지표) 】
코로나19 발생에 따라 2020년 2월부터 실업지수(퇴직자 증가율)은 급격히 증가합니다.
2020년 2월 고용지수(국민연금 가입자 증가율) 또한 (-)로 고용인원이 감소하는 것을 확인할 수 있습니다.
□ 업종별 종업원수의 변화 및 퇴직률
고용율에 대한 빅데이터 분석결과 숙박/음식, 항공운송 산업은 대규모 질병 발생에 대한 영향도가 매우 높은 것으로 파악되고 있다.
- 숙박/음식 : 2020년을 기점으로 고용지수가 감소하고 있으며, 3월 기준으로 퇴사율이 25% 수준으로 증가 현상이 관찰됨.
- 항공/운송 :고용지수는 원만하게 감소하고 있으며, 여행자 수요가 본격적으로 감소한 2020년 3월 이후에는 퇴직자율이 100%를 초과하는 결과를 나타냄. 항공운송 업계의 고질적 경영악화 상태에서 COVID-19에 따른 경영난이 추가 가중화된 것을 파악.
인구 구조와 산업 구조 분석
인구구조 모니터링 서비스에서는 지역별/연령별로 나누어서 인구구조를 살펴보는 것이 중요하다고 판단하였으며, 핵심노동연령대인 청년층인구의 이동변화를 중심으로 살펴보고자 대시보드를 제작하였다.
[ 경상남도 창원시의 인구구조 대시보드 ]
인구구조를 보고 싶은 지역을 선택하면 연령별로 순이동 수를 barchart로 확인할 수 있게 하였으며 색 변화를 통해 유출이 많은 지역인지 유입이 많은 지역인지 한눈에 확인할 수 있다. 왼쪽 부분은 청년층의 순 이동수를 보여주며 성별로 구분지어 나타내었고, 연도를 선택하면 해당 연도의 월별 현황을 볼 수 있다.
[ 경기도 화성시의 인구구조 대시보드 ]
위 대시보드는 경기도 화성시의 인구구조를 보여준다. 창원시와는 달리 청년층 유입 수가 월등히 많음을 보여준다.
[ 울산광역시 인구구조 대시보드 ]
반대로 울산광역시 동구를 살펴보면 청년층 인구 유출이 굉장히 많이 발생하고 있는 지역임을 알 수 있다.
□ 일자리 미스매치 현황 분석 (울산광역시 사례)
일자리 미스매치 모니터링 서비스에 사용된 지표로는 워크넷 자료를 이용해 수집한 지표로 유효구인인원, 유효 구직건수, 실제 취업건수, 구인난/구직난 여부(구직건수-구인인원)으로 산업 중분류별/고용형태별로 대시보드를 통해 일자리 미스매치를 살펴보고자 한다.
[ 울산동구 구인/구직 미스매치 대시보드 예시 ]
<관련 대시보드 참조>
https://public.tableau.com/views/_16645131371580/_final?:language=ko-KR&:display_count=n&:origin=viz_share_link
울산동구의 경우는 구직자수 대비 구인에 대한 숫자가 매우 늘어난 상황이며, 특히 20년도 코로나 시기이후 21년 4분기부터 구인난에 시달리고 있음을 볼 수 있다.
[ 울산동구 업종별 구인/구직 7개년 분석 ]
울산광역시 동구는 최근 이례 없는 조선업 호황으로 인해 일자리 수요가 굉장히 증가하고 있다. 하지만 앞서 봤던 인구 이동 현황을 보면 청년층인구 유출이 계속 되고 있어 심각한 일자리 미스매치에 시달리고 있다.
대부분의 취업자들도 60대 이상의 취업자로 청년일자리는 채워지지 않는 상황이다.
이에 따른 직업훈련과 청년인력에 대한 인센티브 정책 등이 중요한 시점이다.
□ 일자리 미스매치 현황 분석 (경기도 사례)
제조업 구인난을 해결하기 위해서는 구직자의 입장에서 바라보는 관점이 필요하며 면밀한 분석이 필요하다.
【 일자리 미스매칭 대시보드 : 경기도 사례 】
위의 대시보드에서 보는 것과 같이 사무직(경영/사무/금융)의 구직건수가 많고 상대적으로 생산직(설치/정비 등)은 구인란이 심각한 것을 확인할 수 있다.
향후 일자리 동향 모니터링과 일자리 미스매칭 대시보드를 통해 향후 노동시장 대응 방안을 도출할 수 있으며, 산업별 인력 수급 및 미스매치 현황파악을 통해 직업 교육훈련 방안을 제시할 수 있다.
[마무리] 데이터 분석/시각화로 본 ‘고용 및 일자리미스매치 분석’
- - 이번 데이터스토리는 광역 및 기초지자체 단위 지역산업별 고용생태계를 조망할 수 있는 데이터 및 통계 기반을 확보하고 고용위기/일자리분석 대시보드를 통해 빅데이터에 기반한 지역/산업 일자리 정책의 의사결정을 지원하는 모델을 보여 주었다.
- - AI 인공지능을 이용한 고용위기패턴을 분석하고 지역별/산업별 위기지수 및 위기원인을 파악한다. 또한 과거의 위기패턴 분석데이터를 통해 향후 발생할 위기상황을 미래 예견적인 예측을 통해 사전에 대응책을 준비 할 수 있다.
- - 향후 본 분석 및 고도화된 추가분석을 통해 지역·산업·고용 지원 정책의 효과성 제고
ㅇ 실시간 모니터링을 통한 지역·산업 고용 상황 파악
ㅇ 주력산업 성장 둔화 등으로 주력산업 집중도가 높은 지역의 경제부진 심화 및 고용 위기 예측
ㅇ 지역·산업별 인력 수요 공급 분석을 통한 일자리 미스매치 및 교육훈련 현황 파악
태그 등록
특수기호 및 숫자는 등록할 수 없으며, 한 번에 하나씩만 등록 가능합니다.
공과 및 욕설, 비속어 등 타인에게 불쾌감을 줄 수 있는 태그는 통보 없이 삭제될 수 있습니다.