데이터 다루기/데이터 시각화 (20) 썸네일형 리스트형 [R을 활용한 시각화] 9. ggplot2 (ECDF: 경험적 누적 밀도 함수) ㄸ이번 포스팅에서는 ggplot2 패키지를 활용해서 다양한 ECDF: 경험적 누적 밀도 함수를 그려보도록 하겠습니다. 1. 실습 데이터 정의 set.seed(1234) df height 1 42 2 64 3 76 4 25 5 66 6 68 이번에 사용할 데이터는 평균이 60, 표준편차가 15인 정규분포에서 200개를 샘플링해서 뽑았습니다. 2. 패키지 불러오기 library(ggplot2) library 함수를 통해 먼저 ggplot2 패키지를 불러왔습니다. 3. ECDF 꾸미기 ggplot(df, aes(height)) + stat_ecdf(geom = "point") ECDF는 stat_ecdf 함수를 통해 그릴 수 있습니다. geom 인자로 point를 주면 위와 같이 점으로 찍힙니다. .. [R을 활용한 시각화] 8. ggplot2 (Violin plot) 이번 포스팅에서는 ggplot2 패키지를 활용해서 다양한 Vilolin plot을 그려보도록 하겠습니다. 1. 실습 데이터 정의 # Convert the variable dose from a numeric to a factor variable ToothGrowth$dose len supp dose 1 4.2 VC 0.5 2 11.5 VC 0.5 3 7.3 VC 0.5 4 5.8 VC 0.5 5 6.4 VC 0.5 6 10.0 VC 0.5 오늘 사용할 데이터는 내장 데이터인 ToothGrowth입니다. 2. 패키지 불러오기 library(ggplot2) library 함수를 통해 먼저 ggplot2 패키지를 불러왔습니다. 3. Violin plot 꾸미기 p [R을 활용한 시각화] 7. ggplot2 (Histogram) 이번 포스팅에서는 ggplot2 패키지를 활용해서 다양한 Histogram을 그려보도록 하겠습니다. 1. 실습 데이터 정의 # Convert cyl column from a numeric to a factor variable set.seed(1234) df sex weight 1 F 49 2 F 56 3 F 60 4 F 43 5 F 57 6 F 58 이번에 사용할 데이터는 성별 별로, 각각 남성은 평균이 55, 표준편차가 5인 정규분포에서, 그리고 여성은 평균이 65, 표준편자차 5인 정규분포에서 200개씩 샘플링해서 뽑았습니다. 2. 패키지 불러오기 library(ggplot2) library 함수를 통해 먼저 ggplot2 패키지를 불러왔습니다. 3. Histogram 꾸미기 # Basic.. [R을 활용한 시각화] 6. ggplot2 (Pie Chart) 이번 포스팅에서는 ggplot2 패키지를 활용해서 다양한 Pie chart을 그려보도록 하겠습니다. 1. 실습 데이터 정의 df group value 1 Male 25 2 Female 25 3 Child 50 우선 단순한 데이터를 정의 하였습니다. 2. 패키지 불러오기 library(ggplot2) library 함수를 통해 먼저 ggplot2 패키지를 불러왔습니다. 3. Pie chart 꾸미기 # Barplot bp [R을 활용한 시각화] 5. ggplot2 (Area plot) 이번 포스팅에서는 ggplot2 패키지를 활용해서 다양한 Area plot을 그려보도록 하겠습니다. 1. 실습 데이터 정의 # Convert cyl column from a numeric to a factor variable set.seed(1234) df sex weight 1 F 49 2 F 56 3 F 60 4 F 43 5 F 57 6 F 58 이번에 사용할 데이터는 성별 별로, 각각 남성은 평균이 55, 표준편차가 5인 정규분포에서, 그리고 여성은 평균이 65, 표준편자차 5인 정규분포에서 200개씩 샘플링해서 뽑았습니다. 2. 패키지 불러오기 library(ggplot2) library 함수를 통해 먼저 ggplot2 패키지를 불러왔습니다. 3. Area plot 꾸미기 p [R을 활용한 시각화] 5. ggplot2 (Area plot) 이번 포스팅에서는 ggplot2 패키지를 활용해서 다양한 Area plot을 그려보도록 하겠습니다. 1. 실습 데이터 정의 # Convert cyl column from a numeric to a factor variable set.seed(1234) df sex weight 1 F 49 2 F 56 3 F 60 4 F 43 5 F 57 6 F 58 이번에 사용할 데이터는 성별 별로, 각각 남성은 평균이 55, 표준편차가 5인 정규분포에서, 그리고 여성은 평균이 65, 표준편자차 5인 정규분포에서 200개씩 샘플링해서 뽑았습니다. 2. 패키지 불러오기 library(ggplot2) library 함수를 통해 먼저 ggplot2 패키지를 불러왔습니다. 3. Area plot 꾸미기 p [R을 활용한 시각화] 4. ggplot2 (Box plot) 이번 포스팅에서는 ggplot2 패키지를 활용해서 다양한 Box plot을 그려보도록 하겠습니다. 1. 실습 데이터 정의 # Convert the variable dose from a numeric to a factor variable ToothGrowth$dose len supp dose 1 4.2 VC 0.5 2 11.5 VC 0.5 3 7.3 VC 0.5 4 5.8 VC 0.5 5 6.4 VC 0.5 6 10.0 VC 0.5 이번에 사용할 데이터는 R에 내장되어 있는 ToothGrowth 데이터입니다. 분석을 위해서 cyl 변수를 factor 형으로 바꾸겠습니다. (0.5, 1, 2) 2. 패키지 불러오기 library(ggplot2) library 함수를 통해 먼저 ggplot2 패키지.. [R을 활용한 시각화] 3. ggplot2 (Scatter plot) 이번 포스팅에서는 ggplot2 패키지를 활용해서 다양한 Scatter plot을 그려보도록 하겠습니다. 1. 실습 데이터 정의 # Convert cyl column from a numeric to a factor variable mtcars$cyl mpg cyl disp hp drat wt qsec vs am gear carb Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4 Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4 Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1 Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1 Ho.. 이전 1 2 3 다음