본문 바로가기

데이터 다루기

(175)
[Vision] Image Augmentation 1. 사용할 패키지 불러오기. import matplotlib.pyplot as plt import numpy as np import tensorflow as tf import tensorflow_datasets as tfds from tensorflow.keras import layers from tensorflow.keras.datasets import mnist import를 활용하여 사용할 패키지를 불어왔습니다. ​ 2. 데이터 불러오기. 이번 실습에서 사용할 데이터는 꽃 사진입니다. (train_ds, val_ds, test_ds), metadata = tfds.load( 'tf_flowers', split=['train[:80%]', 'train[80%:90%]', 'train[90%:]'],..
[Vision] CNN을 통한 이미지 분류 1. 사용할 패키지 불러오기. import matplotlib.pyplot as plt import numpy as np import os import PIL import tensorflow as tf from tensorflow import keras from tensorflow.keras import layers from tensorflow.keras.models import Sequential import를 활용하여 사용할 패키지를 불어왔습니다. ​ 2. 데이터 불러오기. 이번 실습에서 사용할 데이터는 꽃 사진입니다. import pathlib dataset_url = "https://storage.googleapis.com/download.tensorflow.org/example_images/fl..
[Vision] 이미지 분류 1. 사용할 패키지 불러오기. import tensorflow as tf from tensorflow import keras import numpy as np import matplotlib.pyplot as plt import를 활용하여 사용할 패키지를 불어왔습니다. ​ 2. 데이터 불러오기. fashion_mnist = keras.datasets.fashion_mnist (train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data() 저희는 이번 실습에서 굉장히 유명한 Open dataset 중에 하나인 패션 MNIST를 활용하겠습니다. 패션 MNIST 일반적인 숫자로 알려져 있는 기본 MNIST보다 어려운 과제입..
[Vision] 이미지 불러오기 1. 사용할 패키지 불러오기. import numpy as np import os import PIL import PIL.Image import tensorflow as tf import tensorflow_datasets as tfds import pathlib import matplotlib.pyplot as plt import를 활용하여 사용할 패키지를 불어왔습니다. 2. 데이터 불러오기. dataset_url = "https://storage.googleapis.com/download.tensorflow.org/example_images/flower_photos.tgz" data_dir = tf.keras.utils.get_file(origin=dataset_url, fname='flower_ph..
Tensorflow 2.0 (GPU) 설치하기 안녕하세요. 이번 포스팅에서는 Tensorflow 2.0 (GPU) 툴을 설치하는 방법에 대해서 알아보겠습니다. Tensorflow는 구글에서 개발되었기 때문에, 머신 및 딥러닝 분야에서 Tutorial이 매우 활발히 이루어지고 있다는 장점이 있습니다. ​ 실제로 해외의 뛰어는 데이터 분석가들은 Tensorflow를 기반으로 개발을 많이 하고 있다고 합니다. 이 부분이 구글이 이 분야에서는 가장 뛰어난 기업으로 평가받고 있는 이유가 되는 것 같다는 생각이 드네요. ​ 그러면 이제 본격적으로 설치 방법에 대해서 알아보도록 하겠습니다. ​ 1. Cuda 설치 pytorch나 tensorflow든 뭐든지 간에 GPU를 사용하기 위해서는 Cuda를 설치해주어야 합니다. Cuda는 구글에서 검색만 해봐도 설치하는..
[R을 활용한 시각화] 9. ggplot2 (ECDF: 경험적 누적 밀도 함수) ㄸ이번 포스팅에서는 ggplot2 패키지를 활용해서 다양한 ECDF: 경험적 누적 밀도 함수를 그려보도록 하겠습니다. ​ 1. 실습 데이터 정의 set.seed(1234) df height 1 42 2 64 3 76 4 25 5 66 6 68 이번에 사용할 데이터는 평균이 60, 표준편차가 15인 정규분포에서 200개를 샘플링해서 뽑았습니다. ​ 2. 패키지 불러오기 library(ggplot2) library 함수를 통해 먼저 ggplot2 패키지를 불러왔습니다. ​ 3. ECDF 꾸미기 ggplot(df, aes(height)) + stat_ecdf(geom = "point") ECDF는 stat_ecdf 함수를 통해 그릴 수 있습니다. geom 인자로 point를 주면 위와 같이 점으로 찍힙니다. ..
[R을 활용한 시각화] 8. ggplot2 (Violin plot) 이번 포스팅에서는 ggplot2 패키지를 활용해서 다양한 Vilolin plot을 그려보도록 하겠습니다. ​ 1. 실습 데이터 정의 # Convert the variable dose from a numeric to a factor variable ToothGrowth$dose len supp dose 1 4.2 VC 0.5 2 11.5 VC 0.5 3 7.3 VC 0.5 4 5.8 VC 0.5 5 6.4 VC 0.5 6 10.0 VC 0.5 오늘 사용할 데이터는 내장 데이터인 ToothGrowth입니다. ​ 2. 패키지 불러오기 library(ggplot2) library 함수를 통해 먼저 ggplot2 패키지를 불러왔습니다. ​ 3. Violin plot 꾸미기 p
[R을 활용한 시각화] 7. ggplot2 (Histogram) 이번 포스팅에서는 ggplot2 패키지를 활용해서 다양한 Histogram을 그려보도록 하겠습니다. ​ 1. 실습 데이터 정의 # Convert cyl column from a numeric to a factor variable set.seed(1234) df sex weight 1 F 49 2 F 56 3 F 60 4 F 43 5 F 57 6 F 58 이번에 사용할 데이터는 성별 별로, 각각 남성은 평균이 55, 표준편차가 5인 정규분포에서, 그리고 여성은 평균이 65, 표준편자차 5인 정규분포에서 200개씩 샘플링해서 뽑았습니다. ​ 2. 패키지 불러오기 library(ggplot2) library 함수를 통해 먼저 ggplot2 패키지를 불러왔습니다. ​ 3. Histogram 꾸미기 # Basic..