본문 바로가기

머신러닝

(8)
빅테크에 취직하고 싶은 취준생들을 위한 인사이드 머신러닝 인터뷰 근래의 머신러닝 업계를 이끄는 양대 산맥은 중국과 미국이라고 합니다. 인사이드 머신러닝 인터뷰의 저자는 중국인으로써 아마존, 트위터 등에서 머신러닝 엔지니어로 근무했습니다. 이 책에서는 빅테크 기업들이 면접에서 자주 묻는 질문들이 저자의 해설과 함께 수록되어있습니다. 물론 면접을 주제로 집필된 도서이지만 단지 인터뷰 만을 위한 책은 아닙니다. 초심자도, 중급자도, 상급자도 이 책을 읽으며 현업에 적용할 수 있는 다양한 인사이트를 얻을 수 있을 것입니다. 이 책은 면접, 기본지식, 코딩, 시스템 설계, 인프라 설계, 예제 등으로 구성되어있습니다. 다양한 카테고리로 책을 구성하여 독자들이 폭넓은 정보를 얻어갈 수 있도록 하였습니다. 대부분의 취업 준비생들은 면접에서 어떤 질문이 나올지, 내가 그 질문에 답할..
openCV[1] - 라즈베리파이에 openCV 설치하기 안녕하세요. 오늘은 라즈베리파이에 openCV를 설치해보겠습니다. 1. 개요 (1) openCV란? opencv는 인텔에서 개발을 주도하던 오픈소스 이미지 처리 라이브러리입니다. python을 공식 지원하고 있으며 굉장히 다양한 기능을 갖고 있지만 특히 머신러닝 중 이미지 학습 분야에서 널리 쓰이고 있습니다. (2) 사용처 openCV를 이용한 프로젝트는 쉽게 검색해보실 수 있는데 얼굴 인식하기, 마스크 유무 체크하기 등 다양한 용도로 사용하실 수 있습니다. (3) 들어가기에 앞서 라즈베리파이에 카메라를 연결해주시고, 라즈베리파이에서 카메라를 사용할 수 있도록 설정해줍니다. [기본 설정(Preferences)]-[Raspberry Pi Configuration]으로 진입해주세요. [Interfaces]탭..
비전공자의 코딩 독학 - 파이썬&텐서플로우(14) <오토인코더> 안녕하세요. 오늘의 파이썬 코딩 독학 주제는 오토인코더(Autoencoder)입니다. 1. 오토인코더란? 과거에 설명드렸듯이 2019/12/27 - [코딩/텐서플로우] - 비전공자의 코딩 독학 - 파이썬&텐서플로우(1) 비전공자의 코딩 독학 - 파이썬&텐서플로우(1) 안녕하세요. 오늘의 파이썬 코딩 독학 주제는 텐서플로우입니다. 1. 텐서플로우(tensor flow)란? 구글에서 공개한 오픈소스 머신러닝 라이브러리로써 C++, JAVA, R등 다양한 언어를 지원하지만 파이썬에 가장 최적.. bebutae.tistory.com 머신러닝의 방법에는 크게 세가지 종류가 있습니다. 그 중에서도 아무런 설명이나 라벨 없이 단지 대량의 데이터만 입력시켜 컴퓨터가 스스로 데이터를 정의하도록 하는 것을 비지도학습이라고..
비전공자의 코딩 독학 - 파이썬&텐서플로우(13) <CNN> 안녕하세요. 오늘의 파이썬 코딩 독학 주제는 CNN(Convolutional Neural Network)입니다. 1. CNN이란? CNN은 합성곱(Convolution) 신경망을 의미합니다. 합성곱 신경망은 이미지의 특징을 추출하는 단계와 이미지를 분류하는 단계를 반복하며 학습을 진행하게 됩니다. 2. 파라미터의 종류 (1) Convolution Filter의 개수 각 레이어에서의 연산시간과 양을 일정하게 유지하기 위해 개수를 증가시켜줍니다. (2) Filter 사이즈 작은 필터를 여러개 중첩하면 원하는 특징을 더 돋보이게 하면서 연산량을 줄일 수 있습니다. (3) Padding 여부 Convolution전에 입력데이터 주변을 특정 픽셀값으로 채워 늘려줍니다. 입력 이미지의 크기를 줄이지 않고 학습할 수..
비전공자의 코딩 독학 - 파이썬&텐서플로우(12) <Matplotlib> 안녕하세요. 오늘의 파이썬 코딩 독학 주제는 Matplotlib 입니다. 1. Matplotlib란? 파이썬에서 데이터를 시각화하도록 도와주는 패키지입니다. 그래프를 그려주고, 차트를 만들어주는 등 다양한 기능을 제공하여 다양한 방면으로 사용되고 있습니다. 2. 필요한 라이브러리 이번 예제를 다루기 위해서는 두가지 라이브러리가 추가로 필요합니다. 다음 명령어를 이용하여 라이브러리를 다운받아주세요. pip install matplotlib pip install numpy 3. 전체 소스코드 import tensorflow as tf import matplotlib.pyplot as plt import numpy as np from tensorflow.examples.tutorials.mnist import..
비전공자의 코딩 독학 - 파이썬&텐서플로우(11) <과적합> 안녕하세요. 오늘의 파이썬 코딩 독학 주제는 과적합(Overfitting)입니다. 1. 과적합이란? 학습데이터를 과도하게 학습하여 학습데이터에 대해서는 정확도가 높지만 실제데이터나 테스트데이터에 대해서는 정확도가 낮은 현상을 의미합니다. 이를 해결하기 위해서는 (1) 데이터의 양을 늘리는 방법 (2) 가중치 규제(Regularization)를 적용하는 방법 (3) 드롭아웃(Dropout)을 사용하는 방법 이 있습니다. 하나씩 알아보도록 하겠습니다. 2. 데이터의 양을 늘리는 방법 과적합은 간단히 말해서 머신러닝 모델이 테스트데이터에 너무 맞춰지는 현상 이므로 테스트데이터가 실제데이터와 비슷해질수록 모델이 실제데이터를 더 잘 예측하게 되므로 자연스레 과적합 현상이 해결됩니다. 3. 가중치 규제를 적용하는 ..
비전공자의 코딩 독학 - 파이썬&텐서플로우(10) <MNIST> 안녕하세요. 오늘의 파이썬 코딩 독학 주제는 MNIST 입니다. MNIST는 손으로 쓴 숫자들의 이미지를 모아놓은 데이터셋으로써 0부터 9까지의 숫자를 28*28 픽셀 크기로 구성해놓은 이미지 집합입니다. MNIST는 머신러닝에서 상당히 유명한 예제 중 하나로써 전처리도 잘 되어있어서 번거로운 작업없이 바로 머신러닝을 진행할 수 있습니다. 1. 텐서플로우 외에 필요한 라이브러리 tensorflow.examples.tutorials.mnist.input_data : MNIST 예제가 들어있는 라이브러리입니다. 2. 전체 소스코드 import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data mnist = input_dat..
비전공자의 코딩 독학 - 파이썬&텐서플로우(4) <활성화 함수> 안녕하세요. 오늘의 파이썬 코딩 독학 주제는 활성화 함수(Activation Function) 입니다. 지난 포스팅에서 활성화 함수에 어떤 것들이 있는지만 알려드렸는데 오늘은 각 활성화 함수가 어떤 역할을 하는지까지 알아보려고 합니다. 1. 활성화 함수란? 인공신경망에서는 각 노드로 데이터가 들어오면 다음 레이어로 전달하기 전에 특정 함수를 거치도록 하는데 이때 데이터들이 거쳐가는 함수를 활성화 함수라고 합니다. 2. 활성화 함수의 종류 활성화 함수는 정말 많은 종류가 있지만 가장 흔히 접할 수 있는 6가지를 우선 정리해보고자 합니다. (1) 시그모이드(Sigmoid) 함수 로지스틱 함수(Logistic Function)라고도 불리며 0과 1사이의 연속적인 값을 가지는 비선형 함수입니다. *경사소실(Gr..