반응형

데이터시각화 4

[Pandas] 데이터 시각화 | Matplotlib | 파이차트 | 박스그래프

안녕하세요! 오늘은 Matplotlib 모듈을 사용한 시각화 마지막 시간입니다. 파이차트와 박스그래프를 사용해 데이터를 시각화 해보도록 하겠습니다. # 파이 차트(Pie chart) 흔히 생각하는 파이(Pie)라는 빵 종류의 모양을 띈 그래프입니다. 파이의 각 크기는 해당 변수가 차지하는 비율로 나타납니다. 실제 데이터의 양이나 개수가 아닌, 전체 데이터를 100으로 보았을 때 백분율을 사용하여 데이터를 나타냅니다. 데이터의 종류가 너무 많거나, 적은 비율을 차지하는 데이터가 많은경우 시각화를 해도 정확하게 확인하기 힘들 수 있습니다. import matplotlib.pyplot as plt import csv f=open('d:\\판다스 실습\\emp2.csv','r') job=[] data=f.rea..

[Pandas] 데이터 시각화 | Matplotlib | 면적 그래프 | 막대 그래프

지난 포스팅에서는 그래프를 분할, 누적 및 꾸미는 방법을 알아봤습니다. 이번 시간에는 다양한 그래프를 그래는 방법을 공부하도록 하겠습니다. # 면적 그래프 면적 그래프는 선 그래프와 x축 사이에 색을 입힙니다. 선이나 점이 아닌 도형의 면적을 이용 통계 수치의 크기를 나타냅니다. 선or 막대 그래프 -> 변화의 추이를 살펴보는데 유용 면적 그래프 -> 두 개 이상의 자료 비교시 유용 투명도(alpha), 누적여부(stacked) 등의 옵션을 사용할 수 있습니다. 누적 여부는 각 열의 선 그래프를 다른 열에 쌓아 올리는 방식입니다. ㆍstacked=True 분기별 판매량과 같은 수치를 누적해서 확인할 때 사용합니다. ㆍstacked=False 분기별 판매량과 같은 수치를 비교할 때 사용합니다. import..

[Pandas] 데이터 시각화 | Matplotlib | 그래프 꾸미기

Oracle SQL 데이터 분석에서 다루는 데이터의 종류는 매우 다양합니다. 따라서 다양한 종류에 따라 알맞은 시각화 방법을 알아야 합니다. Matplotlib 모듈은 평면 그래프에 대한 다양한 포맷, 시각화 기능을 제공합니다. # 선 그래프 import pandas as pd import matplotlib.pyplot as plt ## 데이터 전처리 df=pd.read_excel('d:\\판다스 실습\\인구수데이터.xlsx') df.fillna(method='ffill',inplace=True) mask=(df['전출지별']=='서울특별시') &(df['전입지별']!='서울특별시') df2=df[mask] df2.drop('전출지별',axis=1,inplace=True) df2.rename({'전입지..

[Pandas] 데이터 시각화 | 판다스 내장 그래프

안녕하세요 이승혁입니다. 오늘은 판다스의 내장 그래프를 이용해 데이터를 시각화 하겠습니다. 데이터를 분석해보면서 시각화가 정말 중요하단 것을 느꼈습니다. 내가 이해하기에도, 남을 이해시키기에도 가장 좋은 방법이었습니다. 데이터를 간략하고 예쁘게 시각화 할 수 있는 능력은 데이터 분석가에게 필수라고 생각합니다. ## 판다스 내장 그래프 판다스는 데이터를 시각화 하는 라이브러리인 Matplotlib의 기능을 일부분 내장하고 있습니다. 별도로 import 하지 않아도 간단하게 데이터를 그래프로 표현할 수 있습니다. Option 종류 Option 종류 'line' 선 그래프 'kde' 커널 밀도 그래프 'bar' 막대 그래프 - 수직 'area' 면적 그래프 'barh' 막대 그래프 - 수평 'pie' 원형 그..

반응형
반응형