데이터 다루기/데이터 시각화
[R을 활용한 시각화] 9. ggplot2 (ECDF: 경험적 누적 밀도 함수)
분석벌레
2020. 12. 11. 17:49
728x90
반응형
ㄸ이번 포스팅에서는 ggplot2 패키지를 활용해서 다양한 ECDF: 경험적 누적 밀도 함수를 그려보도록 하겠습니다.
1. 실습 데이터 정의
set.seed(1234)
df <- data.frame(height = round(rnorm(200, mean=60, sd=15)))
head(df)
<< Result >>
height
1 42
2 64
3 76
4 25
5 66
6 68
이번에 사용할 데이터는 평균이 60, 표준편차가 15인 정규분포에서 200개를 샘플링해서 뽑았습니다.
2. 패키지 불러오기
library(ggplot2)
library 함수를 통해 먼저 ggplot2 패키지를 불러왔습니다.
3. ECDF 꾸미기
ggplot(df, aes(height)) + stat_ecdf(geom = "point")
ECDF는 stat_ecdf 함수를 통해 그릴 수 있습니다.
geom 인자로 point를 주면 위와 같이 점으로 찍힙니다.
ggplot(df, aes(height)) + stat_ecdf(geom = "step")
반면에, geom 인자로 step으로 주면 위와 같이 계단 형식으로 그려집니다.
# Basic ECDF plot
ggplot(df, aes(height)) + stat_ecdf(geom = "step")+
labs(title="Empirical Cumulative \n Density Function",
y = "F(height)", x="Height in inch")+
theme_classic()
반응형