서울시 자전거 이동경로 분석은 보아즈(수도권 대학생 빅데이터 연합 동아리, 지도교수 : 이원석 연세대 교수)에서 2016년 8월 ~ 2017년 2월에 서울의 사회문제를 녹색교통운동과 함께 데이터 기반으로 해결방안을 마련하기 위해 분석한 내용을 서울시에 재구성하여 웹 콘텐츠화 하였습니다.
서울시 자전거 이동경로 분석
Chapter.1 “자전거 이동경로 데이터를 분석하다”
데이터 분석을 위해 개선해야할 대상은 첫번째로 시민이 되어야 할 것입니다.
일반적인 시민 교통수단 중 남녀노소 누구나 쉽게 사용할 수 있는 대중교통은 무엇이 있을까?
서울시에서는 녹색교통운동의 ‘자전거 마일리지’앱에서 수집되는 이용자들의 자전거 이동경로 데이터를 제공받을 수 있었고 이 데이터를 BOAZ(수도권 빅데이터 분석 연합 동아리)와 협업 분석 하기로 하였습니다.
녹색교통운동의 자전거 마일리지 앱에서 수집할 수 있는 데이터는 2012~2015년 사이에 이용자들의 데이터였고 이용자들의 자전거 이동경로 데이터 중 위도, 경도, 고도, 속도 등 총 23개의 변수를 확인할 수 있었습니다.
Chapter.2 “데이터 정형화 하기”
분석하기에 앞서 데이터 전처리 작업이 필요합니다.
우선, 데이터를 일정기준에 맞춰 분석처리하기 위해 중복되는 불필요한 파일을 제거하였고, 반정형 데이터(KML)를 분석에 용이한 CSV 형태 파일로 변환 하였습니다.
이렇게 생성된 데이터로 파생변수를 생성하고 이동경로 4분위 지점을 추출한 후, 각 4분위 점의 위도, 경도와 서울 지역 지도데이터를 대조하여 한번도 서울을 거치지 않은 이동경로를 제거하였습니다.
이렇게 생성된 데이터로 파생변수를 생성하고 이동경로 4분위 지점을 추출한 후, 각 4분위 점의 위도, 경도와 서울 지역 지도데이터를 대조하여 한번도 서울을 거치지 않은 이동경로를 제거하였습니다.
녹색교통 기준 평균 속력 6~30km/h, 최대 순간 속력 50km/h 미만
평균 속력(km/h) = 총 이동거리 / (도착시간–출발시간)
최대 순간 속력 = 한 경로의 순간 속력 (speed속성)
* 최대값을 구한 후 mile→km/h으로 변환
마지막으로 아래와 같이 정리한 데이터를 한눈에 보기 쉽게 시각화 작업도 진행하였습니다.
Chapter.3 “의미있는 데이터 만들기”
이렇게 만들어낸 빅데이터는 다양한 방향으로 해석될 수 있습니다. 우리생활에 상당히 유용하게 쓰일 수 있습니다.
“출발지에서 목적지 까지 연결하기 (OD 매트릭스 생성)”
우선, 이용자의 이용행태분석을 위한 수도권(서울, 경기, 인천)만 포함하는 출발지 데이터와 도착지 데이터를 합쳐 ‘edge list’를 생성하였습니다.
“정형화된 데이터 테이블 생성”
위도와 경도로 이뤄진 점 데이터를 서울은 423개의 행정동, 경기/인천은 시군구로 지역단위를 상향했습니다.
지역단위 상향을 통해 데이터 크기를 줄이고, 각 지역 단위의 통행빈도를 늘리는 효과와 더불어 시각화 시 직관적으로 표현이 가능해졌습니다.
“출발지와 도착지는 거의 같은 수준”
출발지 빈도 상위 10위 안의 9개 지역이 도착지 빈도 상위 10위 안에 포함되어 있습니다. 이를 통해 대부분의 이용자들은 출발한 지역으로 되돌아 가는 것으로 보여졌습니다.
창4동에 자전거 라이딩을 즐겨하는 주민들이 많이 포진되어 있고 여의도, 가산동 등의 출퇴근 인구가 많이 모여있다는 해석도 가능합니다.
“라이딩은 서울시내보다는 수도권으로”
이렇게 모여진 데이터 중 출/도착지를 연결하여 왕복 라이딩 빈도 조사를 해보니 양주시에서 수색동으로 이동 빈도가 가장 많았고 TOP 10위건내 6개지역에서 서울시계를 벗어나 이동을 하고있었습니다. (예시_ 출발지 : 앙주시-> 도착지 : 수색동)
다음으로 OD(출발지-도착지) 매트릭스 데이터를 활용하여 지역 단위 별 출발지-도착지 빈도를 측정하였고,대표 좌표를 할당해 주는 'Flow mapper' 플러그인을 활용하여 'Network map' 시각화로 표출하여 분석했습니다.
“자전거 출/도착 이동분포를 한눈에보다”
분석결과를 통해 출발지-도착지 이동 분포를 파악하는 보조자료에 활용할 수 있으며 자전거 관련 대형 시설물의 주요 거점 선정에 인사이트를 제공할 수 있습니다.
Chapter.4 “자전거 라이딩은 5~9월이 적기”
“1년중에 5개월은 라이딩으로”
우리는 다른 시점에서 데이터를 확인하기위해 이동구간분석이 아닌 월간 자전거 이용율을 확인해보기로 했습니다. 자전거 이용자의 데이터 분석결과 연중 5월부터 9월까지 자전거 이용자가 가장 많은 것으로 확인되었습니다. 날씨가 추워지기 시작하는 10월 이후 급감하고 있으나, 1~2월에도 일정 비율이 자전거를 계속 이용하는 것으로 분석되어 보였습니다.
“이용시간으로 보는 자출 패턴”
월별 이용현황 데이터 분석 후에 우리는 시간대 분석을 같이 진행하였습니다.
자전거 이용 시간대별로는 오전 08시에서 09시, 오후 19시~20시 사이가 가장 높은 이용률을 보이고 있어, 출퇴근시 자전거를 이용 하는 것으로 보여졌습니다. 이 부분에서 또 하나의 중요한 데이터를 확인해볼 수 있습니다. 예를 들어 시간대별 데이터 분석결과를 가지고 출퇴근시간의 지하철이나 버스 등 대중교통 이용 패턴과 자전거 이용 패턴을 매핑하여 수송 분담 부문에서의 추가 데이터 추 적과 이에 따른 대중교통과의 연계 방안도 모색할 수 있으며, 야간 자전거 이용자, 특히 01시~05시까지 이용자에 대한 도로상 안전 확보 대책마련에 좋은 데이터활용이 가능합니다.
Chapter.5 “자전거 통행량 한눈에 알아보기”
“한강공원 자전거도로와 안양천”
자전거 통행량 분석을 위해 이미 위에서 분석한 데이터에 장/단거리 데이터를 대입하면 아래와 같은 시각화 이미지가 출력됩니다.
이제 한눈에 자전거도로 정체구간을 파악할 수 있게 되었습니다. 또한, 연도별 장/단거리 별 자전거 시각화한 결과 한강공원 자전거 도로와 안양천, 중랑천, 양재천 등 하천 주변 자전거도로가 다른 도로에 비해 많이 이용하고 있는 노선으로 나타났고 출퇴근 시간대 에 이용자가 많은 특정지역에 대해 자전거 전용도로나 편의시설 등의 추가 설치나 정비 시 우선순위로 결정하는 것으로 검토할 필요 가 있어 보인다는 결과를 도출할 수 있었습니다.
“계절별, 시간별, 거리별로 구분하기”
위에 만들어진 데이터를 조금더 세분화해서 데이터를 도출해보도록 하겠습니다.
대표적으로 위에서 우리가 분석한 월별데이터를 계절별로 정리하고, 시간대별 데이터를 시각화하여 표기하면 아래와 같이 한눈에 알아볼 수 있는 시각화 지도가 표현됩니다.
계절별 장/단거리 이동 데이터 시각화
장/단거리 이동 데이터를 시각화한 결과 봄·여름·가을은 거의 유사하였고, 겨울에는 이용자가 확연히 줄어드는 것으로 한 여름 이용 자가 많은 구간에 대한 폭염대비 쉼터 등 사전 정비가 필요하다는 사실을 알 수가 있었습니다.
출퇴근 시간대별 장/단거리 이동 데이터 시각화
시간대별 장/단거리 데이터를 대입하면 출근 대비 퇴근시간대는 임진각 자전거길 이용이 확연히 적었으며, 장거리는 주로 한강변 자전거 도로를 중심으로 이용하는 것을 알 수 있었습니다.
기타 시간대별 장/단거리 이동 데이터 시각화
특히 출퇴근 이외의 시간대는 전반적으로 고르게 분포되어 있으나 종로, 독산동 일대에서의 자전거 이용자가 많은 것으로 나타나네 요. 이로써 자전거 전용도로가 없는 종로에는 자전거 전용도로의 추가 개통을 고려해 볼 수 있고 기존 전용도로 중 이용자가 많지 않 은 구간에 대해서는 도로 변경도 검토할 필요가 있어 보입니다.
Chapter.6 “시민의 안전한 라이딩을 위해”
“자전거 과속은 사고의 지름길”
이렇게 다양한 데이터를 대입하여 시민생활에 도움이 될 수 있는 의미 있는 데이터를 산출할 수 있었습니다. 하지만 지금까지 시민 “편의”의 측면에서 바라보았다면 이제는 “안전”에 대한 측면도 바라볼 필요가 있습니다. 우선 자전거 속도에 대한시각화로 표현하였습니다.
우리가 가지고 있는 헥사곤 셀 단위 지도에 자전거 평균 이동속도를 반영하여 지역별 평균이동속도를 아래와 같은 시각화 지도를 확인할 수 있었습니다.
이렇게 도출한 지도 데이터를 가지고 과속 구역을 나누어 보았습니다.
우선 과속의 기준은 서울시내에서 헥사곤 셀 내 평균속도 상위 약 10%에 해당되는 속도인 8.5km/h (최대 12.3km/h) 이상을 “과속 ”으로 정의하고 분석한 결과 아래와 같은 시각화 이미지가 도출되었습니다.
여기서 고려해야 할 특이사항은 평지와 경사 지역에 평균속도 차이 입니다. 내리막길에서는 당연히 자전거의 평균 속도가 높을 것이 며, 오르막길에서는 자전거 속도가 낮을 것입니다. 이 부분에 대해서는 경사지 자전거운행에 대한 정책이 필요할 것으로 판단 되었 습니다. 대표적인 경사지로는 북악스카이웨이 내리막길 지점이 확인되었습니다. 이외, 서울시내 과속은 한강변 자전거 도로에 집중 적으로 분포되어 있었습니다.
“면목동, 성내동, 둔촌동은 교통사고 빈발지역”
다음으로 사고다발 지역을 분석해보았습니다.
도로교통공단 교통사고분석시스템(TAAS)의 2013 ~ 2015년의 자전거 사고 다발 지역의 데이터를 활용하여 분석한 결과, 자전거 도로보다 주거지역 내 일반도로에서 자전거 사고가 다수 발생한 것으로 분석되었습니다.
※교통사고 데이터에서 피해/가해 차종 항목이 ‘자전거’인 경우를 추출하고 QGIS에서 자전거 트래픽 또는 평균속도 map과 공간 결합 및 시각화, 자전거 교통사고 지점과 자전거 이동 평균속도 대비 교통사고량을 위의 지도에 시각화 표현
자전거 관련 교통사고 빈발지역으로는 면목동, 성내동, 둔총동으로 나타났으며 해당지역의 자전거 교통사고 방지를 위해 자전거 안전시설 및 과속 방지 표지판 등을 설치하거나 도로선형 개선이 필요한것으로 나타났습니다.
“즐거운 라이딩을 위한 편의시설”
자전거 관련 편의시설 데이터를 활용하여 자전거 이동 트래픽 map에 편의시설 위치 공간 결합과 이동량을 대비한 관련 편의 시설 비율 및 설치 여부를 분석한 결과 자전거 이동이 많은 지점에서 이동량 대비 편의시설이 부족한 지점을 도출하여 편의시설 추가 설 치가 필요한 지점 3곳을 도출할 수 있었습니다.
“보다 질 높은 생활을 위해”
우리는 이렇게 빅데이터를 활용하여 다양하고도 뜻 깊은 자료를 도출하였습니다. 우리가 흔히 “이 길은 왜 이렇게 자주 막힐까?”, “여긴 편의 시설이 부족해서 불편해” 말을 하면서도 왜 이렇게 되어있는지 모르는 경 우가 많습니다. 빅데이터는 이런 시민들의 이야기를 보다 객관적인 근거를 제시하며 개선방향을 도출할 수도 있습니다. 이렇듯, 우리가 빅데이터를 분석하는 이유는 우리의 생활을 더욱 질 높게 개선해주고 많은 사람들이 공평하게 혜택을 받을 수 있도 록 객관적인 데이터를 도출하기 위함입니다.
서울시 빅데이터 캠퍼스소개말의 “서울시 빅데이터 캠퍼스는 시민과 함께 사회혁신을 위한 새로운 가치를 만듭니다” 라는 글처럼 지금까지 모여온 여러가지 빅데이터는 앞으로도 우리생활에 더욱더 가치 있는 방향으로 우리에게 다가오고 있습니다.
이 게시물은 "공공누리 제4유형(출처표시 + 상업적 이용금지 + 변경금지)" 조건에 따라 자유롭게 이용이 가능합니다.