본문 바로가기

데이터 다루기/Base of R

(23)
[R] Ridge, Lasso, ElasticNet Regression #ridge, lasso, elastic install.packages("glmnet"); install.packages('dplyr'); library(glmnet) library('dplyr') glmnet 패키지는 Ridge, Lasso, ElasticNet Regression에 대한 함수를 제공하는 패키지입니다. dplyr 패키지는 데이터 전처리에 자주 사용되는 패키지구요. prostate
[R] Data Partition (데이터 분할) # data partition install.packages('caret') library(caret) train
[R] 회귀 분석 (변수선택) # variable selection install.packages('MASS') library(MASS) reg
[R] 회귀 분석 German credit data를 사용하겠습니다. 독일의 credit 평가 데이터로 첨부하도록 하겠습니다. ​ 회귀 분석 모델 적합 #데이터 불러오기 german 위 데이터는 값이 커질수록 분산이 커지는 패턴이 보임. 3 번 그래프 : 오차의 정규성 검정 (직선이면 정규분포를 따름) -> 위 데이터는 직선이 아니기 때문에 정규성 만족 x 4 번 그래프 : 각 관측치들이 오차에 미치는 영향 -> 몇 관측치들이 이상치로 보임 (766, 973, 972)
[Data] LendingClub (P2P Default 예측 데이터) 안녕하세요. 머신러닝 실습으로 좋은 데이터를 하나 찾아서 가져와보았습니다. https://www.kaggle.com/wendykan/lending-club-loan-data
[R] dplyr 패키지로 데이터 전처리하기 안녕하세요, 이번 포스팅에서는 dplyr 패키지에 대해서 배워보도록 하겠습니다. dplyr 패키지는 R에서 전처리를 할 때, 가장 많이 사용되는 패키지중에 하나입니다. 저도 실제로 가장 많이 사용한 패키지를 고르라고 한다면 이 패키지라고 단언할 수 있어요! 이 패키지에 있는 모든 함수를 알 필요는 없지만, 유용한 함수들은 익혀 두시는 것은 굉장한 이점이라고 생각합니다. ​ 우선 dplyr 패키지를 설치하고 라이브러리에 불어오도록 하겠습니다. install.packages('dplyr') library('dplyr') 저번 포스팅에서 배웠다시피 정말 쉽죠?? ​ 저희가 실습해볼 데이터는 R에서 기본으로 제공되는 iris 데이터입니다. iris 데이터를 간단하게 설명해드리면, 변수로 Sepal (꽃받침), ..
[R] 패키지 설치하기 안녕하세요, 이번 포스팅에서는 R studio에 패키지를 설치하는 방법을 배워보도록 하겠습니다. R 이 다른 프로그래밍에 비해서 큰 장점 중 하나가 패키지 시스템이 굉장히 잘 되있다는 것입니다. install.packages('package 이름') library('package 이름') R에서 패키지를 불러오는 방법은 굉장히 단순합니다. install.packages 함수를 통해 원하는 패키지를 다운 받고, library 함수를 사용하여 패키지를 불러오는 것입니다. ​ R 프로그래밍에서 데이터를 전처리하거나 머신러닝을 할 때, 패키지를 불러오는 것은 필수적입니다. 예를 들어서, 데이터를 전처리할 때, dplyr 이라는 패키지가 굉장히 유용하며 많이 쓰입니다. 머신러닝을 할 때는 로지스틱 회귀모형을 적합..
[R] grep, grepl, gsub, strsplit, substr 함수 (문자열 다루기) 안녕하세요, 이번 포스팅에서는 문자열을 다루는 함수에 대해서 알아보도록 하겠습니다. 최근에 텍스트마이닝에 대한 중요성이 강조되고 있기 때문에 텍스트 데이터를 다루는 일이 많아졌습니다. 텍스트를 다루는데에 유용하고, 자주 사용되는 함수를 알려드리도록 하겠습니다. 우선 함수들에 대해 알아보기에 앞서 텍스트의 패턴을 찾을 때 사용되는 정규 표현식을 알려드리도록 하겠습니다. ​ [:digit:] 혹은 \d : 숫자, 0,1,2,3,4,5,6,7,8,9, 동등한 표현 [0-9]. \D : 숫자가 아님, 동등한 표현 [^0-9]. [:lower:] : 영문 소문자, 동등한 표현 [a-z]. [:upper:] : 영문 대문자, 동등한 표현 [A-Z]. [:alpha:] : 알파벳 대소문자, 동등한 표현 [[:lowe..