본문 바로가기

분류 전체보기

(297)
[R을 활용한 시각화] 5. ggplot2 (Area plot) 이번 포스팅에서는 ggplot2 패키지를 활용해서 다양한 Area plot을 그려보도록 하겠습니다. ​ 1. 실습 데이터 정의 # Convert cyl column from a numeric to a factor variable set.seed(1234) df sex weight 1 F 49 2 F 56 3 F 60 4 F 43 5 F 57 6 F 58 이번에 사용할 데이터는 성별 별로, 각각 남성은 평균이 55, 표준편차가 5인 정규분포에서, 그리고 여성은 평균이 65, 표준편자차 5인 정규분포에서 200개씩 샘플링해서 뽑았습니다. ​ 2. 패키지 불러오기 library(ggplot2) library 함수를 통해 먼저 ggplot2 패키지를 불러왔습니다. 3. Area plot 꾸미기 p
[R을 활용한 시각화] 4. ggplot2 (Box plot) 이번 포스팅에서는 ggplot2 패키지를 활용해서 다양한 Box plot을 그려보도록 하겠습니다. ​ 1. 실습 데이터 정의 # Convert the variable dose from a numeric to a factor variable ToothGrowth$dose len supp dose 1 4.2 VC 0.5 2 11.5 VC 0.5 3 7.3 VC 0.5 4 5.8 VC 0.5 5 6.4 VC 0.5 6 10.0 VC 0.5 이번에 사용할 데이터는 R에 내장되어 있는 ToothGrowth 데이터입니다. 분석을 위해서 cyl 변수를 factor 형으로 바꾸겠습니다. (0.5, 1, 2) ​ ​ 2. 패키지 불러오기 library(ggplot2) library 함수를 통해 먼저 ggplot2 패키지..
[R을 활용한 시각화] 3. ggplot2 (Scatter plot) 이번 포스팅에서는 ggplot2 패키지를 활용해서 다양한 Scatter plot을 그려보도록 하겠습니다. ​ 1. 실습 데이터 정의 # Convert cyl column from a numeric to a factor variable mtcars$cyl mpg cyl disp hp drat wt qsec vs am gear carb Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4 Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4 Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1 Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1 Ho..
[R을 활용한 시각화] 2. ggplot2 (Lineplot) 이번 포스팅에서는 ggplot2 패키지를 활용해서 다양한 Barplot을 그려보도록 하겠습니다. ​ 1. 실습 데이터 정의 df dose len 1 D1 4.2 2 D2 10.0 3 D3 29.5 우선 단순한 데이터를 정의 하였습니다. ​ ​ 2. 패키지 불러오기 library(ggplot2) library 함수를 통해 먼저 ggplot2 패키지를 불러왔습니다. ​ 3. Linegraph 꾸미기 # Basic line plot with points ggplot(data=df, aes(x=dose, y=len, group=1)) + geom_line()+ geom_point() + geom_text(aes(label = len), vjust = -0.8, size = 5) line graph는 geom_l..
[R을 활용한 시각화] 1. ggplot2 (Barplot) (2) 이번 포스팅에서는 ggplot2 패키지를 활용해서 다양한 그룹이 있는 Barplot을 그려보도록 하겠습니다. ​ 1. 실습 데이터 정의 ### Data definition (multiple groups) df2 supp dose len 1 VC D1 6.8 2 VC D2 15.0 3 VC D3 33.0 4 OJ D1 4.2 5 OJ D2 10.0 6 OJ D3 29.5 이번 데이터는 두 개의 그룹을 가지고 있습니다. 이런 경우 Bargraph를 어떻게 그릴 수 있을까요?? ​ 2. 패키지 불러오기 library(ggplot2) library 함수를 통해 먼저 ggplot2 패키지를 불러왔습니다. ​ 3. Bargraph 꾸미기 # Stacked barplot with multiple groups ggpl..
[R을 활용한 시각화] 1. ggplot2 (Barplot) (1) 이번 포스팅에서는 ggplot2 패키지를 활용해서 다양한 Barplot을 그려보도록 하겠습니다. ​ 1. 실습 데이터 정의 df Name Weight 1 JW 57 2 HJ 80 3 SY 42 우선 단순한 데이터를 정의 하였습니다. ​ ​ 2. 패키지 불러오기 library(ggplot2) library 함수를 통해 먼저 ggplot2 패키지를 불러왔습니다. ​ 3. Bargraph 꾸미기 # Basic barplot p
[R을 활용한 시각화] 1. ggplot2 (Barplot) (1) 이번 포스팅에서는 ggplot2 패키지를 활용해서 다양한 Barplot을 그려보도록 하겠습니다. ​ 1. 실습 데이터 정의 df Name Weight 1 JW 57 2 HJ 80 3 SY 42 우선 단순한 데이터를 정의 하였습니다. ​ ​ 2. 패키지 불러오기 library(ggplot2) library 함수를 통해 먼저 ggplot2 패키지를 불러왔습니다. ​ 3. Bargraph 꾸미기 # Basic barplot p
6. 데이터 정규화 1. 데이터 정규화 ​ ▶ 릴레이션에 데이터의 삽입, 삭제, 갱신 시 발생하는 이상 현상이 발생하지 않도록 릴레이션을 보다 작은 릴레이션으로 표현하는 과정 ​ ① 제1 정규형 (1NF) ​ ▶ 모든 도메인이 원자 값으로만 된 릴레이션으로 모든 속성값은 도메인에 해당한다. ▶ 기본 키에서 부분 함수가 종속된 속성이 존재하므로 이상 현상이 발생할 수 있다. ​ ​ ② 제2 정규형 (2NF) ​ ▶ 제1 정규형을 만족하고 모든 속성들이 기본 키에 완전 함수 종속인 경우 ​ ​ ③ 제3 정규형 (3NF) ​ ▶ 제 1, 2 정규형을 모두 만족하고, 모든 속성들이 기본 키에 이행적 함수 종속이 아닌 경우 ▶ 이행 함수적 종속 (A -> B, B -> C, A -> C)을 제거한다. ​ ④ 보이스-코드 정규형 (B..