다목적댐 운영 정보 데이터 분석
최근 지구온난화, 엘리뇨현상 등 기상이변으로 인한 홍수 피해가 급증하고 있다.
댐은 홍수가 일어나면 물을 저장하고 가뭄이 발생할 때 저장한 물을 다시 공급하는 역할을 한다.
또한 산간지역의 토사유출방지, 수위 상승 방지, 붕괴 방지 등의 역할을 수행하고 있어 댐을 효율적으로 관리하여 홍수 피해를 최소화하는 것이 중요하다.
이에 따라 댐의 운영 정보 데이터를 분석하고 패턴을 파악하여 합리적으로 댐을 관리 및 운영할 수 있는 방안을 제안하고자 한다.
본 분석에서는 K-water에서 관리중인 다목적댐 21개 운영 정보 데이터를 통해 패턴분석, 군집분석, 예측모델 개발에 활용할 수 있게 시각화 방법을 이용해서 분석하였다.
데이터셋 정보가 다음과 같다.
컬럼명 | 설명 | 비고 |
---|---|---|
댐이름 | 댐이름 | 예: 충주, 대청 |
일자/시간 | 년,월,일,시간 | 예: 202009092400 |
저수위 | 하천의 물이 가장 낮아질 때의 수위 | 단위: m |
강우량 | 일정 기간 동안 일정한 곳에 내린 비의 분량 | 단위: mm |
유입량 | 흘러 들어오는 양 | 단위: ㎥/s |
방류량 | 유출되는 양 | 단위: ㎥/s |
저수량 | 모아둔 물의 양 | 단위: 백만㎥ |
저수위 | 하천의 물이 가장 낮아질 때의 수위 | 단위: 백분율 |
구분 | 원천 데이터셋 링크 | 비고 |
---|---|---|
수자원 | https://www.bigdata-environment.kr/user/data_market/detail.do?id=baec4e70-38bb-11ea-be28-4fa0eb812a46 | |
컬럼수 | 8 | |
로우수 | 12658453 |
본 분석에서 2019년 12월 부터 2020년 8월 까지 총 9개 CSV파일을 취합해서 연결시켜 처리를 진행하였다. 데이터 분석에서 데이터의 전체적인 특성과 분포를 살펴보고 이상치 처리, 시간별 통계 등 기법을 이용해 다목적댐 운영 정보 데이터중의 패턴과 변수 관계를 파악하였다.
댐 별 샘플개수가 다음과 같다.
댐 별 저수총량(저수량×저수율)
댐 별 지표들의 평균값이 다음과 같다.
월 별 지표들의 평균값이 다음과 같다.
각 댐의 운영 정보를 월 별 단위로 표시한 결과가 다음과 같다. (각 댐의 월별 평균값)
히트맵을 사용해 지표 간의 상관도가 다음과 같다.
댐의 월별 평균 유입량과 평균 방류량의 상관도가 다음과 같다.
(샘플 개수 = 댐 개수 * 월 개수 = 168)
댐의 월별 평균 강우량과 다른 지표의 상관도가 다음과 같다.
댐 지역 분포
지역 별 강우량
다음은 댐의 지역 별 운영정보 그래프이고 지역정보를 통해 어떤 영향을 미치는지 확인할 수 있다.
X축은 각 지표의 수치를 표기하고 Y축은 각 지역과 해당된 댐을 의미한다.
결론 : 위의 실험을 통해 우리는 다음과 같이 정리할 수 있다.
- 1.
각 댐의 저수총량과 지역이 다르기 때문에 유입량과 방류량이 큰 차이가 있지만 저수위가 큰 파동 없이 계속 제어하고 있다. (댐의 월별 평균 저수위 그래프)
- 2.
여름철에 집중되는 한국 강우특성을 고려해 홍수기 중 강우로 댐에 유입되는 물을 최대한 저류(유입량>방류량)함으로써 하류 홍수피해를 최소화 하고 내년도 홍수기 전까지 안정적인 용수공급을 도모할 수 있다.
- 3.
히트맵과 선형관계 그래프를 통해 유입량, 방류량은 강우량과 높은 상관도를 가지고 월별 그래프에서 매년의 7,8월에 동시에 급격한 증가추세를 볼 수 있다.
- 4.
지역별 분석을 통해 같은 지역에 있더라도 강우량이 지리적 위치에 따라 큰 파동이 있을 수 있고 같은 지역에 있는 댐들의 저수율은 유사한 관리전략으로 사용하기 때문에 관계성이 상대적으로 높다는 것으로 생각한다.
태그 등록
특수기호 및 숫자는 등록할 수 없으며, 한 번에 하나씩만 등록 가능합니다.
공과 및 욕설, 비속어 등 타인에게 불쾌감을 줄 수 있는 태그는 통보 없이 삭제될 수 있습니다.