[Pythonlibrary 기초] 17. Mat plotlib 2017년도 전국 교통사고 시각화 실습

20211230x, y, z 변수를 3개 주고 show를 한번 써서 한번에 3개의 그래프를 출력시켰다. 보기 좋게.. blog.naver.com 20211231

2017년도 전국 교통사고 파일로서 실습을 실시했다.판다즈 라이브러리에서 파일을 읽고 한국어로 인코딩했다.head()를 하면 0~4번째 인덱스에 포함된 데이터를 볼 수 있고 tall()을 하면 마지막 5개의 인덱스에 포함된 데이터를 볼 수 있다.

.info()를 하면 컬럼 수마다 몇 개의 데이터가 있는지, 인덱스가 몇 개인지 등.데이터의 요약 정보를 볼 수 있다.

차대차 사건 중 죽거나 다친 사람이 많은 발생지의 시도를 알아보고 시각화하기 위해.columns로 하여금 컬럼을 줄이지 말고 모두 보여주라고 한 후 다시.head( )를 실행시켰다.중간에 라고 끊지 않고 모든 컬럼을 볼 수 있었다.

먼저 차대차가 적힌 사건만 보기 위해 칼럼에 적힌 데이터를 봤다.차대차는 사고 유형_대분류로 적혀 있었다.

데이터[‘사고유형_대분류’]를 해서 사고유형_대분류만 인덱스하고 불리한 인덱스로 차대차사건만 골라봤다.데이터 [‘사고 유형_대분류’] == ‘차대차’

그러면 사고 유형_대분류로 ‘차대차’라고 적힌 사건만 True로 분리할 수 있다.데이터 속에서 차대차라고 적힌 사건 정보를 계속 보기 위해 data[‘사고 유형_대분류’==’차대차’]를 써서 acc라는 변수에 넣었다.

다음으로 차대차 사건 중 (1) 죽거나 다친 사람이 (2) 많은 발생 지시도를 조사하려고 색상을 재검토했다.(1)사상자 수(2) 발생지 시도를 선택하면 된다고 생각해서 인덱스를 해 주었다.인덱스는 하나뿐이므로 acc[[사상수], [발생지시도]]를 정리하여 실행하였다.

시도별 사상자 수를 합산한 값을 보기 위해 발생지 시도를 그룹으로 묶어 값을 더했다.acc[‘사상자수’, ‘발생지시도’] groupby[‘발생지시’] sum( )혼자 했다면 여기까지는 생각할 수 없을 것 같다…

원하는 값을 끌어냈기 때문에 마지막으로 시각화했다. x값에는 시도별 사상자 수를 뺀 인덱스(발생지시도)를 넣었고 y값에는 시도별 사상자 수를 넣었다.plt.bar(x,y)plt.show()를 실행시키고,

그래프 크기를 수정하기 위해 위의 행에 plt.figure 값을 주었다.plt.title() 그래프 제목과 plt.xlabel(), plt.ylabel()x,y축 이름도 붙였다.

error: Content is protected !!