[R]의 summary 의미
R에서 iris 라는 data.frame 클래스의 테스트 샘플 데이터를 제공한다. 이를 이용하서 summary의 의미를 보았다.
소스
head(iris)
summary(iris)
결과
> head(iris)
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa
> summary(iris)
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
Min. :4.300 Min. :2.000 Min. :1.000 Min. :0.100 setosa :50
1st Qu.:5.100 1st Qu.:2.800 1st Qu.:1.600 1st Qu.:0.300 versicolor:50
Median :5.800 Median :3.000 Median :4.350 Median :1.300 virginica :50
Mean :5.843 Mean :3.057 Mean :3.758 Mean :1.199
3rd Qu.:6.400 3rd Qu.:3.300 3rd Qu.:5.100 3rd Qu.:1.800
Max. :7.900 Max. :4.400 Max. :6.900 Max. :2.500
각 컬럼별로 통계를 6가지 정보를 보여준다.
1. min (최소값)
2. 1st Qu.(1사 분위수) - 컬럼 데이터를 오름차순으로 정렬하여 아래에서부터 25% 위에 있는 값 (즉, 하위 25%의 값)을 의미한다.
3. Median (중앙값) - 컬럼 데이터를 오름차순으로 정렬하여 가운데에 있는 값을 의미한다.
4. Mean (평균값) - 평균
5. 3st Qu.(1사 분위수) - 컬럼 데이터를 오름차순으로 정렬하여 아래에서부터 75% 위에 있는 값 (즉, 상위 25%의 값)을 의미한다.
6. 최대값 (Max)