데이터 분석을 바탕으로 한 등산로 이용자 세분화
최근 개인의 건강과 환경문제 관심 증대에 따라 LOHAS(Lifestyles of Health And Sustainability) 기반형 여가 문화가 확산 추세에 있다.
그 가장 일반적인 형태로서 자연환경 내 보행 중심의 등산로 이용에 대한 수요가 증가하고 있다.
이에 따라 등산 인구의 증가 및 다양화 흐름이 가속화 되고 있으며, 늘어나는 등산 수요에 맞게 이용자를 세분화하고
이와 관련한 등산 기반 시설 프로그램에 대한 기준을 마련할 필요성이 제기되고 있다.
본 분석은 위와 같은 배경에 따라 등산로 이용자의 인구통계학적 세분화를 시행하고,
해당 결과를 분석함으로써 등산 기반 프로그램의 다양화에 참고가 될 수 있는 자료를 제공하고 방향성 설정에 기여하고자 한다.
본 분석에서는 2019년 등산로 이용객을 대상으로 관심사를 설문한 데이터를 사용하였다. 원 데이터셋에는 이용자의 성별, 연령, 가구소득, 결혼여부, 자녀여부, 주거형태, 거주지역(시도, 군구, 동), 사용하는 자동차 그룹, 휴대전화 제조사, 휴대전화 가입회사, 정치/경제/사회/생활/세계/IT/스포츠 중 어디에 관심이 있는지, 정보획득사이트 등에 대한 정보가 담겨 있으며, 이때 인구통계학적 분석을 위하여 관련한 칼럼들만을 추출하여 기술적으로 분석하였다. 이로써 등산 기반 프로그램을 새롭게 시행하고자 할 때 이용자들의 특성을 분석하는 데 참고가 되는 근거자료를 제공하는 데 도움이 될 수 있을 것으로 기대된다.
활용한 데이터 셋은 다음과 같다.
구분 | 원천 데이터셋 링크 | 비고 |
---|---|---|
등산로 이용자 관심사 | https://www.bigdata-forest.kr/product/FPL020801 | 산림 빅데이터 플랫폼 제공 |
이때 원본 테이블을 이용자의 인구통계학적 특성, 관심사 특성과 관련하여 변수를 따로 추출하였고, 그에 맞게 데이터프레임을 재구성하였다. 그 예는 아래와 같다.
1. Demographic Segmentation Dataframe
성별 | 나이 | 직업 | 소득 | 결혼 여부 | 자녀 여부 | 주거 유형 | 거주지역(시도) | 거주지역(군구) |
---|---|---|---|---|---|---|---|---|
F | 4 | 주부(전업주부, 파트타임 근무 주부) | 300~399만원 | 예 | 자녀 있음 | 아파트/주상복합 | 서울 | 강동구 |
F | 3 | 자영업 (도소매업, 숙박업, 미용업) | 600~699만원 | 아니요 | 자녀 없음 | 아파트/주상복합 | 서울 | 양천구 |
F | 5 | 전문직 (의사, 판검사, 예술가, 종교인) | 700~799만원 | 아니요 | 자녀 없음 | 아파트/주상복합 | 경기 | 가평군 |
M | 3 | 교직 (교사, 유치원교사, 학원강사) | 200~299만원 | 예 | 자녀 있음 | 단독주택 | 인천 | 서구 |
M | 5 | 생산/노무직 (생산감독, 경비원, 공장근로자) | 200~299만원 | 아니요 | 자녀 없음 | 연립주택/다세대/빌라 | 서울 | 마포구 |
M | 4 | 판매직 (상점점원, 보험설계사, 노점상) | 400~499만원 | 예 | 자녀 있음 | 오피스텔 | 경기 | 화성시 |
2. Psychographic Segmentation Dataframe
Index | 주요관심사 |
---|---|
0 | TV연예 |
1 | 스포츠 |
2 | 사회 |
3 | IT |
4 | 정치 |
등산로 이용자의 인구통계학적 특성을 분석한 결과는 다음과 같다.
1. 단변수 탐색 – 시각화 및 변수 별 범주 구성 확인
성별: 등산로 이용자는 여성보다는 남성이 많으며, 비율은 약 4:6으로 나타났다.
1. 단변수 탐색 – 시각화 및 변수 별 범주 구성 확인
성별: 등산로 이용자는 여성보다는 남성이 많으며, 비율은 약 4:6으로 나타났다.
연령대: 등산로 이용자의 연령대는 30대가 가장 많으며, 30~40대 사이에 가장 많은 이용자가 분포해 있다. 비율 상으로는 약 70% 가량이 해당 그룹에 속해 있음을 알 수 있다.
직업: 등산로 이용자의 직업은 사무직에 가장 많이 분포되어 있으며, 약 37% 비율을 보이고 있다. 두 번째로 높은 비율을 차지하는 직업군은 주부였으며, 약 16%의 비율을 차지한다.
소득: 등산로 이용자의 가구 소득은 400-499만원이 가장 많았으며, 약 20%의 이용자가 해당 소득 구간에 포함되었다. 더불어 약 55%의 이용자가 200-499만원 사이의 소득 구간에 분포되어 있음을 알 수 있다.
결혼 여부: 등산로 이용자 중에서는 기혼자가 많지만, 그 비율은 약 6:4로 큰 비율 차이를 보이지는 않았다.
자녀 여부: 전체 등산로 이용자 중에서는 자녀를 가진 사람들의 수가 더 적었지만, 기혼자 중에서는 자녀가 있는 사람들이 월등히 더 많은 것으로 나타났으며 그 비율은 약 84%이다.
주택 거주 유형: 등산로 이용자들은 대부분 아파트/주상복합에서 거주하고 있는 것으로 나타났으며, 약 65%가 이에 분포해 있는 것을 알 수 있다.
소득: 등산로 이용자의 가구 소득은 400-499만원이 가장 많았으며, 약 20%의 이용자가 해당 소득 구간에 포함되었다. 더불어 약 55%의 이용자가 200-499만원 사이의 소득 구간에 분포되어 있음을 알 수 있다.
2. 이변수 탐색 - 시각화
2-1. 성별에 따른 연령대, 거주지역, 결혼여부 이용자 분포
2-2. 직업에 따른 이용자 소득 분포
2-3. 거주지역 별 이용자 주택 유형 분포
등산로 이용자의 관심사 특성을 분석한 결과는 다음과 같다.
해당 데이터스토리를 바탕으로 등산로 이용자를 인구통계학적으로 세분화한 결과는 다음과 같다.
더불어 추가적으로 등산로 이용자의 관심사를 바탕으로 세분화한 결과는 다음과 같다.
태그 등록
특수기호 및 숫자는 등록할 수 없으며, 한 번에 하나씩만 등록 가능합니다.
공과 및 욕설, 비속어 등 타인에게 불쾌감을 줄 수 있는 태그는 통보 없이 삭제될 수 있습니다.