1-7[Machine learning] 머신 러닝 기초 정리 #1

오늘 할 일 (계획)

1. 웹 프로젝트 3 마무리 - 지연중

2. 머신러닝 강의 1주차

3. Coder'sTagram 로그인 기능 수정

오늘 한 일 (회고)

1. 머신러닝 강의 1주차 완료

2. Coder'sTagram 로그인 기능 수정

* 강의 내용 요약

머신러닝

수학과 컴퓨터 과학, 언어할 또는 관련 분야에서 어떠한 문제를 해결하기 위해 정해진 일련의 절차나 방법을 공식화한 형태로 표현한 것 , 계산을 실행하기 위한 단계적 절차 - 위키피디아

머신러닝의 종류

회귀 : 입력값과 출력값이 있으며 출력값이 연속적인 소수점으로 예측하게 하도록 푸는 방법

ex : 사진을 보면서 나이를 추측하는 문제

분류 : 어떠한 원인에 따른 결과를 여러가지 케이스에 따라 분류하는 방법

여기서 두가지 케이스로 나누는 경우에는 이진분류라고 하며 여러가지 케이스로 나누는 경우에는 다중분류라고한다.

ex : 대학교 시험전날 공부한 시간을 가지고 해당 과목의 이수 여부 예측, 대학교 시험전날 공부한 시간을 가지고 해당과목의 성적( A, B, C )를 예측

이렇게 기본적으로 나누고는 있지만 회귀와 분류 둘다 가능한 문제도 있고 이것을 예를 들면 회귀의 예로 들었던 사진을 보면서 나이를 추측하는 문제에서 출력값인 나이의 분류를 카테고리화하여 범위를 적어서 분류하고 그 분류에 맞는 케이스로 찾는다고 하면 이것또한 분류 방법이 될 수 있는 것과 같은 경우가 많다.

추가 주요 개념

지도학습 / 비지도 학습 / 강화 학습

지도 학습 : 정답을 알려주면서 학습 시키는 방법

비지도 학습 : 정답을 알려주지 않고 군집화 하는 방법

강화 학습 : 주어진 데이터 없이 실행과 오류를 반복하면서 학습하는 방법

04. 선형 회귀 (Linear Regression)

1. 선형 회귀와 가설, 손실 함수 Hypothesis & Cost function (Loss function)
2. 다중 선형 회귀(Multi-variable linear regression)
선형 회귀와 똑같지만 입력 변수가 여러개라고 생각하면 쉬워요. 예를 들면 아래 표와 같죠.위에서는 마신 커피 잔 수만 입력값으로 들어갔지만 만약 입력값이 2개 이상이 되는 문제를 선형 회귀로 풀고 싶을 때 다중 선형 회귀를 사용합니다.손실 함수 $Cost = {{1\over N}\sum{(H(x_1, x_2, x_3, ..., x_n) - y) ^ 2}}

05. 경사 하강법 (Gradient descent method)

1. 경사 하강법이란?
컴퓨터는 사람처럼 수식을 풀 수 없기때문에 경사 하강법이라는 방법을 써서 점진적으로 문제를 풀어갑니다. 처음에 랜덤으로 한 점으로부터 시작합니다. 좌우로 조금씩 그리고 한번씩 움직이면서 이전 값보다 작아지는지를 관찰합니다. 한칸씩 전진하는 단위를 Learning rate라고 부르죠. 그리고 그래프의 최소점에 도달하게 되면 학습을 종료하면 됩니다.

목표는 손실 함수를 최소화(Optimize)하는 것입니다. 손실 함수를 최소화하는 방법은 이 그래프를 따라 점점 아래로 내려가야합니다.

Learning rate

말그대로 배우는 비율로 테스트하는 간격을 나타냄

데이터셋 분할

- 학습 검증 테스트 데이터로 분할함

1. Training set (학습 데이터셋, 트레이닝셋) = 교과서
2. 머신러닝 모델을 학습시키는 용도로 사용합니다. 전체 데이터셋의 약 80% 정도를 차지함
3. Validation set (검증 데이터셋, 밸리데이션셋) = 모의고사손실 함수, Optimizer 등을 바꾸면서 모델을 검증하는 용도로 사용함
4. 전체 데이터셋의 약 20% 정도를 차지함
5. 머신러닝 모델의 성능을 검증하고 튜닝하는 지표의 용도로 사용함 이 데이터는 정답 라벨이 있고, 학습 단계에서 사용하기는 하지만, 모델에게 데이터를 직접 보여주지는 않으므로 모델의 성능에 영향을 미치지는 않음
6. Test set (평가 데이터셋, 테스트셋) = 수능
7. 정답 라벨이 없는 실제 환경에서의 평가 데이터셋입니다. 검증 데이터셋으로 평가된 모델이 아무리 정확도가 높더라도 사용자가 사용하는 제품에서 제대로 동작하지 않는다면 소용이 없음

내일 할 일

1. 머신러닝 3주차까지 수강

2. 기존 수강완료한 강의 개발일지 작성

저작자표시 비영리 변경금지 (새창열림)

'TIL' 카테고리의 다른 글

1-9[Machine learning] 머신 러닝 기초 정리 #3 (0)	2022.01.09
1-8[Machine learning] 머신 러닝 기초 정리 #2 (0)	2022.01.08
1-6[PROFILE] GITHUB 프로필, LinkedIn (0)	2022.01.06
1-5[GIT HUB] 사용법 정리 (0)	2022.01.05
1-4 [Project] 교육일정 참여 (0)	2022.01.04

오늘 할 일 (계획)

오늘 한 일 (회고)

내일 할 일

'TIL' 카테고리의 다른 글

티스토리툴바