음식물쓰레기와 코로나 (1)
음식물 쓰레기가 나오는 양과 코로나 확진자수는 관련이 있을까?
지역별 음식점 등 주요 상권, 음식물 쓰레기 배출내역, 코로나 확진자 수 및 인구 데이터 분석
"금방 끝날 줄 알았는데"
코로나 때문에 다들 집콕한지 벌써 2년.
언택트, 온택트…
미래를 말하는 새로운 마케팅 용어가 난무하지만 당면해 있는 현실은 아직 희망적이라고 하기 어렵다.
순식간에 택배와 배달이 일상에 굳게 자리잡은 시대. 음식점은 어려움에 처해 있고, “배달” 관련해 많은 사업 모델이 생겨났다.
소상공인의 위기임은 물론, 쓰레기 발생도 사회 문제로 부각되고 있다.
데이터 분석을 통해 코로나와 쓰레기 발생과의 관계를 규명하고 그를 통해 이러한 문제를 어떻게 해결할 수 있을지 전략 도출의 실마리를 찾기 위해 이 시리즈를 기획하였다.
활용한 데이터 셋은 다음과 같다.
구분 | 원천 데이터셋 링크 | 비고 |
---|---|---|
소상공인 매출 및 사업자 정보 | https://www.bigdata-region.kr/#/dataset/266e8af1-d30d-4af0-9c56-cdba6e6c4528 | 소상공인 및 경기신용보증 비대면(모바일)보증 실적 데이터 |
소상공인 진흥공단 상가(상권) 정보 | https://www.data.go.kr/tcs/dss/selectFileDataDetailView.do?publicDataPk=15083033 | 영업 중인 전국 상가업소 데이터 (상호명, 업종코드, 업종명, 지번주소, 도로명주소, 경도, 위도 등) |
지역별 음식물 쓰레기 배출 추정정보 | https://www.bigdata-environment.kr/user/data_market/detail.do?id=b5341100-3074-11eb-bc79-3b11eb915d6d | 지자체별 음식물 쓰레기 배출내역 |
서울시 코로나 발생 동향 | https://www.seoul.go.kr/coronaV/coronaStatus.do | 서울시 공식 페이지 제공 정보 웹크롤링 (실시간 갱신) |
서울시 주민등록인구 구별 통계 | https://data.seoul.go.kr/dataList/419/S/2/datasetView.do | 서울시 열린데이터 광장에서 제공하는 자치구별 주민등록인구수 일반 보고통계 |
“어느 곳에 어떤 업종이 장사가 잘 될까?”
[ 경기도 지역 소상공인 성별 분포 ]
경기신용보증* 비대면(모바일) 보증 실적 데이터를 분석해본 결과, 경기도에서 비대면으로 보증 신청을 한 소상공인 중 남자는 473명, 여자는 305명으로 남자의 보증 신청이 여자보다 55% 더 많다. 데이터를 좀더 확보하면 “성별 예측”을 하기 적합하다.
* 소상공인 및 중소기업 등이 금융기관으로부터 사업자금을 대출받고자 할 때 신용보증기관이 신용을 담보로 금융기관에 보증을 서주는 제도
M | F |
---|---|
860 | 560 |
M | F |
---|---|
60.8% | 39.2% |
[ 경기도 지역 소상공인 연령대 분포 ]
40대가 310명으로 가장 보증 신청을 많이 했고, 30대와 50대 순이다. 20대의 나이에 벌써 자신의 사업으로 소상공인 활동을 시작한 부분도 눈에 뜨인다. 70대 이후 고령자의 경우, 경제활동인구가 적은 동시에 모바일 신청에도 익숙하지 않아 신청 인원도 확연히 적은 것이라 판단된다.
[ 보증 신청금액 분포 ]
<보증 신청금액> 히스토그램을 살펴보면 5천만원과 1억원의 신청이 가장 많다. 5천만원 이하 신청액은 일부 있으나, 5천만원과 1억원 사이의 보증 신청은 거의 없다. <5천만원>이상 신청에는 추가 절차가 필요해 보증 신청을 부담스러워 하는 것으로 보인다. <1억원>이 한도이나, 소상공인들의 어려움을 감안해 보증액 증대를 고려할 필요가 있다.
[ <업종 대분류> 보증 신청액 순위 ]
<숙박 및 음식점업>, <도매 및 소매업>, <운수업> 순으로 보증 신청액이 많고<정보통신업>, <과학기술 서비스업> 등의 보증 신청액이 적은 것을 통해
<음식점>이 어려움을 겪는 반면, <정보/과학>업종은 여건이 비교적 나은 편임을 알 수 있다.
[ <업종 중분류> 보증 신청액 순위 ]
<음식점업>의 보증 신청액이 가장 많아 해당 업종의 어려움을 알 수 있다. <교육업>은 안정적이나, 언택트로 온라인 교육이 대세인 현재는 다를 것이다. (코로나 이전 데이터) <의원>의 보증 신청이 많은 것을 통해 요즘은 의사도 이전 같지 않다는 것을 알 수 있다.
[ <업종 소분류> 보증 신청액 순위 ]
<한의원> 보증 신청액이 2위인 점이 의외였다. <일반음식점업>에 비해 <치킨 전문점>은 상대적으로 신청액이 작았다. 역시 치맥이다.
[ 연령대별 신청금액 <총액> vs. <평균액> 비교 ]
연령대별 신청금액의 총액은 40대가 가장 많으나, 신청금액 평균은 70대가 가장 많다.
<모바일 보증 신청> 절차가 어려워 신청 자체는 많이 이루어지지 않지만
고연령자가 일단 신청하게 될 경우엔 많은 액수를 신청하는 것이다.
특히 70대 소상공인에게 모바일 보증 신청을 쉽게 만들고, 활용성을 알릴 필요가 있다.
[ <연령>과 <과세금액>, <보증신청금액> 등과의 상관관계 분석 ]
<사업소득과세금액>과 <근로소득과세금액>은 함께 증가하는 패턴을 보인다. 자영업자는 부가가치세에 더해, 사업소득에 대한 소득세도 납부해야 하기 때문이다. 소상공인에게 다양한 세금 혜택을 줄 수 있는 길이 열려야 한다.
[ <전국 상권> 데이터에서 <서울>, <경기도> 상권 추출 ]
지금까지 <소상공인>이라는 사람, 즉 “상인”을 분석하였다. 이제 소상공인이 “활동”하고 있는 지역, 즉 “상권”을 분석해보기로 한다. 원본인 <전국 상권> 데이터에서 <서울> 과 <경기도> 상권을 추출하였다.
[ <서울>, <경기도> 세부 지역별 상권 분포 분석 ]
세분화된 분석을 위해 전국에서 <서울>과 <경기도> 지역만 추출하였다. 업종/업태별, 구별, 시군별로 다양하게 상권을 분석해보겠다.
[ <경기도> 상권 업종 대분류 순위 ]
경기도에서 가장 많은 업종은 <음식> 이며, 이것은 앞의 “소상공인 분석”에서 확인한 결과와 같다. <숙박> 업종이 다른 업종에 비해 상대적으로 적었으며, <스포츠> 상권은 거의 없음을 알 수 있었다.
[ 경기도 <음식> 업종 상위 30개 시군구 ]
경기도에서 <음식점>이 가장 많은 곳은 <화성시>, 다음은 <남양주시>, <파주시> 순이다. 산업시설이 많은 화성시로 출퇴근하는 인구때문에 음식점이 화성시에 가장 많은 것으로 추측해 보았다.
[ 경기도 음식 업종 중 <한식> 상위 30개 시군구 ]
음식 업종 중 <한식>이 가장 많은 지역은 <화성시>, <파주시>, <남양주시> 순이다. 전체 음식점은 남양주가 파주보다 많으나, 음식점 중 <한식> 업종은 파주가 더 많다.
[ <화성 맛집>과 <파주 맛집>에 대한 관심도 비교 분석 (네이버 검색 트렌드) ]
음식점과 한식당의 “개수”는 화성시가 파주보다 많지만, <지역의 맛집>에 대한 “관심”은 파주시가 화성시보다 훨씬 많다. 맛집 방문을 목적으로 파주시를 찾는 사람이 많다는 사실을 알 수 있다.
[ <파주 맛집> 관련 컨텐츠 (구글 이미지 검색) ]
망고플레이트, 페이스북, 카카오, 네이버포스트 등 다양한 채널에 “동네 주민이 직접 다녀온 파주 맛집” , “파주는 금촌이지”등 자발적 맛집 컨텐츠가 생산되고 있다. SNS 인플루언서들의 “맛집 컨텐츠”를 통해 파주 여행코스를 홍보하면 효과가 있을 것으로 판단된다.
[ 서울 음식 업종 중분류 순위 ]
서울의 음식 업종 중 가장 많은 것은 <한식> 이며 그 다음이 <카페>, <주점> 순이다. <음식 배달서비스>는 거의 없는데, 코로나 발생 이전의 데이터이기 때문으로 생각된다.
[ 서울 음식 중 <한식> 업종 구별 순위 ]
음식 업종 중 <한식>이 가장 많은 구는 <강남구>, <마포구>, <송파구> 순이다. 거주 인구가 많거나, 회사가 많은 지역에 한식 업종이 많이 분포한다. 면적의 상당 부분을 도봉산이 차지하는 도봉구에는 한식당이 가장 적은 것을 확인할 수 있다.
[ <강남 맛집>과 <마포 맛집>에 대한 관심도 비교 분석 (네이버 검색 트렌드) ]
한식당의 개수는 강남과 마포가 큰 차이가 나지 않지만 <동네 맛집>에 대한 “관심”은 강남구가 마포구보다 훨씬 많은 것을 알 수 있다.
[ <강남 맛집>관련 컨텐츠 (구글 이미지 검색) ]
망고플레이트, 핀터레스트, 유투브, 네이버포스트 등 다양한 채널에
“가장 사랑받은 강남역 맛집 베스트”, “실패 없는 강남 맛집”등 흥미로운 <강남 맛집> 컨텐츠들이 보인다.
<강남 맛집>이 하나의 “트렌드 키워드”가 된 현상이다.
[ 서울시 구별 한식당 분포 밀도 ]
강남구, 마포구, 송파구, 서초구 등 한식당이 많은 구를 지도상에서 쉽게 찾을 수 있다. 지금까지 <상권> 정보를 파악하였다. 다음번에는 여러 데이터를 결합해 추가 분석을 시작해보자.
[ 시사점 및 다음 분석 방향 ]
1. 곤란을 겪고 있는 소상공인과 업종들
· 전반적으로 <일반음식점>, <한식> 업종이 어려움을 겪고 있는 상황이다.
· 최근의 <배달> 업종의 급성장까지 반영한다면 문제는 더욱 심각해질 것이다.
· 보증 신청액 확대, 신청 절차 간편화로 소상공인과 업종을 지원할 필요가 있다.
2. 데이터를 통한 상권 활성화 전략 모색 필요
· 지역 맛집, 동네 맛집에 대한 관심이 큰 것을 확인하였다.
· 현 데이터에서는 한계가 있으므로, 이 분석에 맞는 데이터를 수집/분석하여 화성시 등 “한식당은 많은데 맛집 검색이 적은” 지역의 활성화 전략을 도출해야 한다.
전반적으로 소상공인, 상권, 업종들의 현황과 트렌드를 살펴보았다. 지금은 현재 상황에서 구할 수 있는 데이터로 다음 분석을 진행하고자 한다.
“음식점이 많은 지역에 음식물 쓰레기도 많이 나올까?”
[ 전국 시도별 쓰레기 배출량 순위 ]
가장 음식물 쓰레기가 많은 지역은 <경기도>, <서울>, <부산> 순이다. 충청남도에 쓰레기가 나오지 않는 것은 결측치가 의심된다. 경기도에 가장 쓰레기가 많은 것과 <쓰레기 매립지>와의 관계는 다른 데이터를 통해 확인해볼 예정이다.
[ <경기도> 시군별 음식물 쓰레기 배출량 상위 20 ]
<용인시>, <화성시> 순으로 음식물 쓰레기가 많이 배출되고 있다.
앞의 “상권 데이터” 에서는 용인시를 <용인시 처인구>, <용인시 수지구>, <용인시 기흥구> 등으로 나누었으나 “쓰레기 데이터”는 3개 구를 합해 <용인시>로 수집해 순위가 달라졌다.
지역명 처리가 필요하나 여기에선 생략한다.
[ <서울시> 구별 음식물 쓰레기 배출량 순위 ]
음식물 쓰레기가 가장 많은 지역은 <송파구>, <도봉구>, <노원구> 순이며 <관악구>, <중구>, <은평구> 는 상대적으로 쓰레기가 많이 나오지 않는 것을 볼 수 있다. “지역명”이 잘 분류된 서울시 데이터셋으로 추가 분석을 진행한다.
[ 서울시 구별 음식물 쓰레기 배출량 밀도 ]
음식물 쓰레기가 많은 <송파구>, <도봉구>, <노원구> 등을 지도상에서 쉽게 찾을 수 있다. 그런데 <음식점 수> 와 <음식물 쓰레기 양> 은 관계가 있을까?
[ 서울시 구별 <음식점 수>와 <음식물 쓰레기 양> 비교 ]
음식점 수가 가장 적은 <도봉구>가 음식물 쓰레기는 많은 것을 확인할 수 있다. <마포구>의 경우 음식점 수도 음식물 쓰레기도 많지만, 전반적으로 두 데이터는 달라 보인다. 음식점 수와 음식물 쓰레기가 어떤 관계가 있는지 상관분석을 통해 “정확한 수치”로 확인해보자.
[ 구별 <음식점 수>와 <음식물 쓰레기 양> 사이의 관계 – 산포도(scatterplot) ]
<강남구>, <마포구> 등은 음식점 수도 많고 음식물 쓰레기도 많은 반면 <도봉구>처럼 음식점 수는 적은 반면, 나오는 음식물 쓰레기는 많은 구도 있다. 이 시각화에서는 정확한 상관관계 판단이 어려우므로 추가 분석을 실시한다.
[ 구별 <음식점 수>와 <음식물 쓰레기 양> 사이의 관계 – 회귀선 추가 ]
상관관계의 크기와 방향을 나타내는 <회귀선>을 그어본 결과 기울기, 즉 <피어슨 상관계수>는 0에 가까워 음식점 수와 음식물 쓰레기 양은 상관관계가 거의 없다.
[ <음식점 수>와 <음식물 쓰레기 양> 사이의 상관분석 – heatmap ]
<음식점수>와 <음식물 쓰레기 양>의 상관계수는 -0.036이다. 이것은 오히려, 음식점 수가 많아질수록 음식물 쓰레기는 조금이나마 줄어드는 것을 의미한다.
[시사점 및 다음 분석 방향 ]
<음식점수가 많을수록 음식물 쓰레기 양은 많을 것이다> 라는 가설 하에 <상권 데이터>와 <음식물 쓰레기 배출량 데이터>를 결합, 다양한 시각화 분석을 거쳐 최종 상관관계 분석까지 진행하였다. 그러나, 해당분석에서는 예상과 달리 <음식점 수>와 <음식물 쓰레기 양>은 상관관계가 별로 없는 것으로 나타났다. 그 이유로는 :
1. <음식점>만 분석 대상으로 삼은 결과
· <일반 가정집>에서 나오는 쓰레기 배출량은 고려되지 않았다.
· <지역별 가구수>를 포함한다면 더 정확한 분석 결과가 도출될 것이다.
2. 코로나로 인해 <배달> 트렌드가 대세
· 절대 배달이 되지 않을 것 같았던 “곱창”, “삼겹살” 등도 배달이 되는 요즘이다.
· 본 데이터는 코로나 이전 수집된 것으로 최근 상황이 반영되지 않았다.
3. <배달>로 생기는 쓰레기는 주로 <재활용 쓰레기>
· 여기에서 사용한 데이터는 <음식물 쓰레기> 데이터로, 목적대로의 분석을 위해서는 <재활용 쓰레기> 데이터가 필요하다.
이상의 문제가 해결되면 현 상황을 정확히 반영한 결과를 도출할 수 있을 것이나, 지금은 현재 상황에서 구할 수 있는 데이터로 추가 분석을 진행하고자 한다.
※ 본 데이터스토리 작성을 위해 사용된 코드와 결과물은 통합 데이터지도 교육자료 게시판 URL이나 아래의 붙임파일을 통해 확인하실 수 있습니다.
구분 | 링크 | 비고 |
---|---|---|
통합 데이터지도 교육자료 게시판 | https://www.bigdata-map.kr/board/review | |
음식물쓰레기와 코로나 (1) 교육자료 게시글 | https://www.bigdata-map.kr/board/review/216?fromBoard=review | |
음식물쓰레기와 코로나 (1) 소스코드 다운로드 | pdf | html1 | html2 |
태그 등록
특수기호 및 숫자는 등록할 수 없으며, 한 번에 하나씩만 등록 가능합니다.
공과 및 욕설, 비속어 등 타인에게 불쾌감을 줄 수 있는 태그는 통보 없이 삭제될 수 있습니다.