프로그래밍/Pandas

Pandas - 통계 함수 max min corr

LeeSeunghyuk 2021. 1. 5. 11:40
반응형

산술 데이터를 갖는 DataFrame의 열에 통계 함수를 적용해 결과를 확인합니다.

특정 열에 적용할 수 있습니다.

 

# mean  -  평균값

산술 데이터를 갖는 각 열에 대한 평균값을 시리즈 객체로 반환

 

 

# median  - 중앙값

데이터의 모든 열의 중앙값을 시리즈 객체로 반환

 

 

 

# max , min  -  최대값 , 최소값

 

각 열 데이터의 최대값과 최소값을 반환

 

 

# std  -  표준 편차

 

각 열 데이터의 1 표준 편차 값을 시리즈 객체로 반환합니다.

스칼라 값인 경우 float 유형으로 반환합니다.

 

 

 

# corr  -  상관계수

 

두 열 간의 상관계수를 반환합니다.

상관 계수의 범위는 -1 <= 0 <= +1 입니다.

 

 

상관 계수 1 : 자기 자신과의 상관 계수는 1입니다.

 

상관 계수 +0.95 : 매우 강한 양의 상관관계

 

상관 계수 -0.80 : 매우 강한 음의 상관관계

 

상관 계수를 파악해 변수간의 의미를 파악할 수 있습니다.

양의 상관 관계는 하나의 변수가 증가할 때, 함께 증가하는 양의 성질을 띄고 있습니다.

음의 상관 관계가 강한 두 변수는 하나의 변수가 증가할 때, 다른 변수는 감소하는 음의 성질을 띄게 됩니다.

 

좌측 그래프는 displacement & cylinders 데이터의 그래프입니다.

상당히 많은 부분이 겹치고 있고, 하나의 데이터가 증감할 때 다른 데이터 역시 증감합니다.

 

우측 그래프는 displacement & mpg 데이터의 그래프 입니다.

서로 겹치는 부분이 거의 없고 하나의 변수가 증가할 때 다른 변수는 감소하는 모습을 보입니다.

 

반응형