반응형
산술 데이터를 갖는 DataFrame의 열에 통계 함수를 적용해 결과를 확인합니다.
특정 열에 적용할 수 있습니다.
# mean - 평균값
산술 데이터를 갖는 각 열에 대한 평균값을 시리즈 객체로 반환
# median - 중앙값
데이터의 모든 열의 중앙값을 시리즈 객체로 반환
# max , min - 최대값 , 최소값
각 열 데이터의 최대값과 최소값을 반환
# std - 표준 편차
각 열 데이터의 1 표준 편차 값을 시리즈 객체로 반환합니다.
스칼라 값인 경우 float 유형으로 반환합니다.
# corr - 상관계수
두 열 간의 상관계수를 반환합니다.
상관 계수의 범위는 -1 <= 0 <= +1 입니다.
상관 계수 1 : 자기 자신과의 상관 계수는 1입니다.
상관 계수 +0.95 : 매우 강한 양의 상관관계
상관 계수 -0.80 : 매우 강한 음의 상관관계
상관 계수를 파악해 변수간의 의미를 파악할 수 있습니다.
양의 상관 관계는 하나의 변수가 증가할 때, 함께 증가하는 양의 성질을 띄고 있습니다.
음의 상관 관계가 강한 두 변수는 하나의 변수가 증가할 때, 다른 변수는 감소하는 음의 성질을 띄게 됩니다.
좌측 그래프는 displacement & cylinders 데이터의 그래프입니다.
상당히 많은 부분이 겹치고 있고, 하나의 데이터가 증감할 때 다른 데이터 역시 증감합니다.
우측 그래프는 displacement & mpg 데이터의 그래프 입니다.
서로 겹치는 부분이 거의 없고 하나의 변수가 증가할 때 다른 변수는 감소하는 모습을 보입니다.
반응형
'프로그래밍 > Pandas' 카테고리의 다른 글
[Pandas] 데이터 시각화 | Matplotlib | 히스토그램 | 산점도 (4) | 2021.02.01 |
---|---|
[Pandas] 데이터 시각화 | Matplotlib | 면적 그래프 | 막대 그래프 (0) | 2021.01.30 |
[Pandas] 데이터 시각화 | Matplotlib | 그래프 꾸미기 (1) | 2021.01.11 |
[Pandas] 데이터 시각화 | 판다스 내장 그래프 (2) | 2021.01.06 |
Pandas - 데이터 분석 (4) | 2021.01.02 |
Pandas - 판다스 연산 (6) | 2020.12.30 |
Pandas - Index 활용 (2) | 2020.12.29 |
Pandas - Dataframe 열 , 행 , 값 (0) | 2020.12.29 |