분류 전체보기 (297) 썸네일형 리스트형 R에서의 데이터 프레임 다루기 (2) eng R에서의 데이터 프레임 다루기 (1) 안녕하세요. 이번 시간에는 R에서 데이터 프레임을 다루는 법에 대해서 알려드리도록 하겠습니다. 데이터 프레임은 분석에 있어서 데이터 셋을 저장하는 형태 중 하나로 벡터와 마찬가지로 가장 많이 사용됩니다. 데이터 실습에 필요한 데이터는 첨부를 했으므로, 이전에 설정한 워킹디렉토리에 저장해주시면 됩니다. ① 데이터 불러오기. 우선 저희는 Kospi 2011y.csv 파일을 이용해 실습을 진행하도록 하겠습니다. csv 파일은 아래와 같이 데이터가 ,(쉼표)로 구분되어지는 확장명 입니다. csv는 데이터 분석 과정에서 가장 많이 쓰이는 확장명이므로 친숙해지기를 권장합니다. stock 변수 선언하기 & 데이터 타입 & 자료 구조 안녕하세요, 이번에는 변수를 선언해보고, 데이터 타입에 대해서 알아보도록 하겠습니다. 1. 변수의 선언 변수 (Variable): 데이터를 담는 공간으로 상황에 따라 값을 바꿀수 있음. 변수는 우선 상수와는 다르게 정해진 값이 아니라 데이터를 담고, 없애거나 다른 데이터로 대체할 수 있는 특징이 있습니다. R에서의 변수의 할당은 총 3가지 방법으로 할 수 있습니다. 3가지 모두 x라는 변수에 3의 값을 할당하는 것을 의미합니다. 또한 rm 함수를 이용하여 지정된 변수를 제거할 수 있습니다. 2. 데이터 타입 R에서도 일반적인 프로그래밍 언어에서와 같이 숫자, 문자, 논리값, 결측값 등과 같이 다양한 유형의 데이터 타입이 존재합니다. 분석에 들어가기 앞서, 데이터와 변수들의 자료구조와 데이터.. R의 기능 & 연산 안녕하세요, 지난번에는 R의 설치를 알려드렸다면 이번에는 R의 기본적인 기능들과 제가 R을 사용해오면서 자주 쓰이는 수학적 연산에 대해서 설명하려고 합니다. 우선 R studio를 키시면 아래와 같은 화면이 나타납니다. 여기서 1번을 누르시면 Source 창이 뜨게 되고, 코드를 작성할 수 있는 공간이 생기게 됩니다. 그리고 2번 창은 콘솔 창으로써, 코드를 실행 (Ctrl + Enter)시키면 결과가 이 창에 출력되게 됩니다. 3번창은 Environment로 현재 어떠한 변수가 저장되어있는지를 알려주는 창입니다. 현재 x라는 변수에 1이 담겨져 있는것을 보실 수 있습니다. 4번창의 Files는 현재 워킹 디렉토리에 저장되어있는 파일을 보여주며, Plots는 시각화의 결과를, Packages에서는 설치되.. R에 대한 소개 & 설치 안녕하세요, 저는 데이터분석 툴로써 R을 추천드리려고 합니다. R은 뉴질랜드 오클랜드 대학교의 로스 이하카 (Rose Ihaka)와 로버트 젠틀맨 (Robert Gentleman)에 의해서 만들어진 통계 분석 툴입니다. R의 장점은 무수히 많지만, 그 중에서 몇가지를 뽑아보자면, 우선 무료로 사용할 수 있다는 점과, 패키지 시스템이 잘 적용되있기 때문에 머신러닝과 같은 복잡한 알고리즘도 패키지를 불러옴으로써, 서너줄의 코드만으로도 분석을 쉽게 진행할 수 있다는 점이 있습니다. 그래서 오늘은 R을 설치하는 방법에 대해서 알아보도록 하겠습니다. 1. 아래의 링크에 들어갑니다. https://ftp.harukasan.org/CRAN/ The Comprehensive R Archive Network Down.. [응용통계] 6. 지수분포 (Exponential Distribution) (2) [Ref] introduction to probability models (Sheldon Ross) 안녕하세요, 이번 포스팅에서는 지수분포에 대한 연습문제를 풀이해보려고 합니다. 큐잉이론에 대한 문제들이므로 생소하고 어려울 수 있으니 나중에 실제로 혼자서 풀어보면서 익혀보도록 합시다. 문제는 총 4문제 준비해보았습니다. [응용통계] 5. 지수분포 (Exponential Distribution) (1) 안녕하세요, 이번 포스팅에서는 지수분포에 대해서 배워보도록 하겠습니다. 포아송과정이 특정시간동안 발생하는 사건의 수에 대한 확률분포였다면, 지수분포는 한 사건이 발생한 후, 다음 사건이 발생하기까지 걸리는 시간에 대한 분포입니다. 예를 들어서, 버스가 1시간에 3대가 포아송분포에 따라 도착한다고 가정합시다. 그렇다면 버스사이의 시간 간격은 지수분포를 따릅니다. 이러한 관계를 아래의 그림을 통해 쉽게 이해할 수 있습니다. 그리고 지수분포는 아주 중요한 성질이 있습니다. 바로 비기억성입니다. 예를 들어서, 버스가 도착 시간의 간격이 지수분포 30분을 따른다고 할 때, 20분동안 기다린 후에도 여전히 기다리기 전과의 버스 올 때까지의 걸리는 시간에 대한 분포는 같다는 것입니다. (신기하죠??) 비기억성은 앞으.. [수리통계학] 30. 최대가능도 추정법 [Ref] 수리통계학 (송명주, 전명식) 안녕하세요, 이번 포스팅에서는 최대가능도 추정법 (Maximum likehood estimation) 에 대해서 배워보도록 하겠습니다. 이 때 가능도는 우도라고도 합니다. 제가 생각하기에 수리통계학에서 가장 중요한 파트가 어디라고 질문을 받는다면 저는 망설임이 1도없이 최대가능도 추정법이라고 말할것입니다. (그만큼 중요하단뜻!!) 우선 가능도에 대한 정의를 알아봅시다. 가능도는 '실제로 관측된' 자료가 얻어질 확률을 나타냅니다. 예를 들어, 동전던지기를 100번 하였는데, 앞면이 56번 나왔다고 가정해봅시다. 이 경우, 앞면이 나올 확률 p를 어느 정도라고 예측해야 가장 타당할까요?? p likehood 0.48 0.022 0.50 0.039 0.52 0.059 .. 이전 1 ··· 30 31 32 33 34 35 36 ··· 38 다음