본문 바로가기

데이터 다루기/데이터 시각화

(20)
[R을 활용한 시각화] 9. ggplot2 (ECDF: 경험적 누적 밀도 함수) ㄸ이번 포스팅에서는 ggplot2 패키지를 활용해서 다양한 ECDF: 경험적 누적 밀도 함수를 그려보도록 하겠습니다. ​ 1. 실습 데이터 정의 set.seed(1234) df height 1 42 2 64 3 76 4 25 5 66 6 68 이번에 사용할 데이터는 평균이 60, 표준편차가 15인 정규분포에서 200개를 샘플링해서 뽑았습니다. ​ 2. 패키지 불러오기 library(ggplot2) library 함수를 통해 먼저 ggplot2 패키지를 불러왔습니다. ​ 3. ECDF 꾸미기 ggplot(df, aes(height)) + stat_ecdf(geom = "point") ECDF는 stat_ecdf 함수를 통해 그릴 수 있습니다. geom 인자로 point를 주면 위와 같이 점으로 찍힙니다. ..
[R을 활용한 시각화] 8. ggplot2 (Violin plot) 이번 포스팅에서는 ggplot2 패키지를 활용해서 다양한 Vilolin plot을 그려보도록 하겠습니다. ​ 1. 실습 데이터 정의 # Convert the variable dose from a numeric to a factor variable ToothGrowth$dose len supp dose 1 4.2 VC 0.5 2 11.5 VC 0.5 3 7.3 VC 0.5 4 5.8 VC 0.5 5 6.4 VC 0.5 6 10.0 VC 0.5 오늘 사용할 데이터는 내장 데이터인 ToothGrowth입니다. ​ 2. 패키지 불러오기 library(ggplot2) library 함수를 통해 먼저 ggplot2 패키지를 불러왔습니다. ​ 3. Violin plot 꾸미기 p
[R을 활용한 시각화] 7. ggplot2 (Histogram) 이번 포스팅에서는 ggplot2 패키지를 활용해서 다양한 Histogram을 그려보도록 하겠습니다. ​ 1. 실습 데이터 정의 # Convert cyl column from a numeric to a factor variable set.seed(1234) df sex weight 1 F 49 2 F 56 3 F 60 4 F 43 5 F 57 6 F 58 이번에 사용할 데이터는 성별 별로, 각각 남성은 평균이 55, 표준편차가 5인 정규분포에서, 그리고 여성은 평균이 65, 표준편자차 5인 정규분포에서 200개씩 샘플링해서 뽑았습니다. ​ 2. 패키지 불러오기 library(ggplot2) library 함수를 통해 먼저 ggplot2 패키지를 불러왔습니다. ​ 3. Histogram 꾸미기 # Basic..
[R을 활용한 시각화] 6. ggplot2 (Pie Chart) 이번 포스팅에서는 ggplot2 패키지를 활용해서 다양한 Pie chart을 그려보도록 하겠습니다. ​ 1. 실습 데이터 정의 df group value 1 Male 25 2 Female 25 3 Child 50 우선 단순한 데이터를 정의 하였습니다. ​ 2. 패키지 불러오기 library(ggplot2) ​library 함수를 통해 먼저 ggplot2 패키지를 불러왔습니다. ​ ​ ​3. Pie chart 꾸미기 # Barplot bp
[R을 활용한 시각화] 5. ggplot2 (Area plot) 이번 포스팅에서는 ggplot2 패키지를 활용해서 다양한 Area plot을 그려보도록 하겠습니다. ​ 1. 실습 데이터 정의 # Convert cyl column from a numeric to a factor variable set.seed(1234) df sex weight 1 F 49 2 F 56 3 F 60 4 F 43 5 F 57 6 F 58 이번에 사용할 데이터는 성별 별로, 각각 남성은 평균이 55, 표준편차가 5인 정규분포에서, 그리고 여성은 평균이 65, 표준편자차 5인 정규분포에서 200개씩 샘플링해서 뽑았습니다. ​ 2. 패키지 불러오기 library(ggplot2) library 함수를 통해 먼저 ggplot2 패키지를 불러왔습니다. 3. Area plot 꾸미기 p
[R을 활용한 시각화] 5. ggplot2 (Area plot) 이번 포스팅에서는 ggplot2 패키지를 활용해서 다양한 Area plot을 그려보도록 하겠습니다. ​ 1. 실습 데이터 정의 # Convert cyl column from a numeric to a factor variable set.seed(1234) df sex weight 1 F 49 2 F 56 3 F 60 4 F 43 5 F 57 6 F 58 이번에 사용할 데이터는 성별 별로, 각각 남성은 평균이 55, 표준편차가 5인 정규분포에서, 그리고 여성은 평균이 65, 표준편자차 5인 정규분포에서 200개씩 샘플링해서 뽑았습니다. ​ 2. 패키지 불러오기 library(ggplot2) library 함수를 통해 먼저 ggplot2 패키지를 불러왔습니다. 3. Area plot 꾸미기 p
[R을 활용한 시각화] 4. ggplot2 (Box plot) 이번 포스팅에서는 ggplot2 패키지를 활용해서 다양한 Box plot을 그려보도록 하겠습니다. ​ 1. 실습 데이터 정의 # Convert the variable dose from a numeric to a factor variable ToothGrowth$dose len supp dose 1 4.2 VC 0.5 2 11.5 VC 0.5 3 7.3 VC 0.5 4 5.8 VC 0.5 5 6.4 VC 0.5 6 10.0 VC 0.5 이번에 사용할 데이터는 R에 내장되어 있는 ToothGrowth 데이터입니다. 분석을 위해서 cyl 변수를 factor 형으로 바꾸겠습니다. (0.5, 1, 2) ​ ​ 2. 패키지 불러오기 library(ggplot2) library 함수를 통해 먼저 ggplot2 패키지..
[R을 활용한 시각화] 3. ggplot2 (Scatter plot) 이번 포스팅에서는 ggplot2 패키지를 활용해서 다양한 Scatter plot을 그려보도록 하겠습니다. ​ 1. 실습 데이터 정의 # Convert cyl column from a numeric to a factor variable mtcars$cyl mpg cyl disp hp drat wt qsec vs am gear carb Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4 Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4 Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1 Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1 Ho..