새벽_나그네
12시 지난 새벽
새벽_나그네
전체 방문자
오늘
어제
  • 분류 전체보기
    • TIL
    • DevLog
    • Algorithm
    • ComputerScience
    • etc

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

인기 글

태그

  • Selenium 4
  • docker
  • 내일배움카드
  • Github
  • Python
  • portfolio
  • 개발일지
  • 국비지원
  • 코딩프로젝트
  • 코딩
  • 자기주도학습
  • 코린이
  • 내일배움캠프
  • 프로그래머스
  • til
  • 스파르타코딩클럽
  • TodayILearned
  • 내일배움단
  • AI트랙
  • machine learning

최근 댓글

최근 글

티스토리

hELLO · Designed By 정상우.
새벽_나그네

12시 지난 새벽

TIL

1-7[Machine learning] 머신 러닝 기초 정리 #1

2022. 1. 7. 21:20

오늘 할 일 (계획)

1. 웹 프로젝트 3 마무리 - 지연중

 

2. 머신러닝 강의 1주차 

3. Coder'sTagram 로그인 기능 수정

 

오늘 한 일 (회고)

1. 머신러닝 강의 1주차 완료

2. Coder'sTagram 로그인 기능 수정

 

* 강의 내용 요약 

 

머신러닝

수학과 컴퓨터 과학, 언어할 또는 관련 분야에서 어떠한 문제를 해결하기 위해 정해진 일련의 절차나 방법을 공식화한 형태로 표현한 것 , 계산을 실행하기 위한 단계적 절차 - 위키피디아

 

머신러닝의 종류 

회귀 : 입력값과 출력값이 있으며 출력값이 연속적인 소수점으로 예측하게 하도록 푸는 방법

ex : 사진을 보면서 나이를 추측하는 문제

 

분류 : 어떠한 원인에 따른 결과를 여러가지 케이스에 따라 분류하는 방법

여기서 두가지 케이스로 나누는 경우에는 이진분류라고 하며 여러가지 케이스로 나누는 경우에는 다중분류라고한다.

ex : 대학교 시험전날 공부한 시간을 가지고 해당 과목의 이수 여부 예측, 대학교 시험전날 공부한 시간을 가지고 해당과목의 성적( A, B, C )를 예측 

 

이렇게 기본적으로 나누고는 있지만 회귀와 분류 둘다 가능한 문제도 있고 이것을 예를 들면 회귀의 예로 들었던 사진을 보면서 나이를 추측하는 문제에서 출력값인 나이의 분류를 카테고리화하여 범위를 적어서 분류하고 그 분류에 맞는 케이스로 찾는다고 하면 이것또한 분류 방법이 될 수 있는 것과 같은 경우가 많다.

 

추가 주요 개념

지도학습 / 비지도 학습 / 강화 학습

지도 학습 : 정답을 알려주면서 학습 시키는 방법

비지도 학습 : 정답을 알려주지 않고 군집화 하는 방법 

강화 학습 : 주어진 데이터 없이 실행과 오류를 반복하면서 학습하는 방법

 

04. 선형 회귀 (Linear Regression)

    1. 선형 회귀와 가설, 손실 함수 Hypothesis & Cost function (Loss function)
    2. 다중 선형 회귀(Multi-variable linear regression)
  • 선형 회귀와 똑같지만 입력 변수가 여러개라고 생각하면 쉬워요. 예를 들면 아래 표와 같죠.위에서는 마신 커피 잔 수만 입력값으로 들어갔지만 만약 입력값이 2개 이상이 되는 문제를 선형 회귀로 풀고 싶을 때 다중 선형 회귀를 사용합니다.손실 함수 $Cost = {{1\over N}\sum{(H(x_1, x_2, x_3, ..., x_n) - y) ^ 2}}

05. 경사 하강법 (Gradient descent method)

    1. 경사 하강법이란?
    컴퓨터는 사람처럼 수식을 풀 수 없기때문에 경사 하강법이라는 방법을 써서 점진적으로 문제를 풀어갑니다. 처음에 랜덤으로 한 점으로부터 시작합니다. 좌우로 조금씩 그리고 한번씩 움직이면서 이전 값보다 작아지는지를 관찰합니다. 한칸씩 전진하는 단위를 Learning rate라고 부르죠. 그리고 그래프의 최소점에 도달하게 되면 학습을 종료하면 됩니다.
  • 목표는 손실 함수를 최소화(Optimize)하는 것입니다. 손실 함수를 최소화하는 방법은 이 그래프를 따라 점점 아래로 내려가야합니다.

Learning rate

  • 말그대로 배우는 비율로 테스트하는 간격을 나타냄

데이터셋 분할

- 학습 검증 테스트 데이터로 분할함

    1. Training set (학습 데이터셋, 트레이닝셋) = 교과서
    2. 머신러닝 모델을 학습시키는 용도로 사용합니다. 전체 데이터셋의 약 80% 정도를 차지함
    3. Validation set (검증 데이터셋, 밸리데이션셋) = 모의고사손실 함수, Optimizer 등을 바꾸면서 모델을 검증하는 용도로 사용함
    4. 전체 데이터셋의 약 20% 정도를 차지함
    5. 머신러닝 모델의 성능을 검증하고 튜닝하는 지표의 용도로 사용함 이 데이터는 정답 라벨이 있고, 학습 단계에서 사용하기는 하지만, 모델에게 데이터를 직접 보여주지는 않으므로 모델의 성능에 영향을 미치지는 않음
    6. Test set (평가 데이터셋, 테스트셋) = 수능
    7. 정답 라벨이 없는 실제 환경에서의 평가 데이터셋입니다. 검증 데이터셋으로 평가된 모델이 아무리 정확도가 높더라도 사용자가 사용하는 제품에서 제대로 동작하지 않는다면 소용이 없음

내일 할 일

1. 머신러닝 3주차까지 수강

2. 기존 수강완료한 강의 개발일지 작성

 

저작자표시 비영리 변경금지 (새창열림)

'TIL' 카테고리의 다른 글

1-9[Machine learning] 머신 러닝 기초 정리 #3  (0) 2022.01.09
1-8[Machine learning] 머신 러닝 기초 정리 #2  (0) 2022.01.08
1-6[PROFILE] GITHUB 프로필, LinkedIn  (0) 2022.01.06
1-5[GIT HUB] 사용법 정리  (0) 2022.01.05
1-4 [Project] 교육일정 참여  (0) 2022.01.04
    'TIL' 카테고리의 다른 글
    • 1-9[Machine learning] 머신 러닝 기초 정리 #3
    • 1-8[Machine learning] 머신 러닝 기초 정리 #2
    • 1-6[PROFILE] GITHUB 프로필, LinkedIn
    • 1-5[GIT HUB] 사용법 정리
    새벽_나그네
    새벽_나그네
    IT, 프로그래밍, 정보, 스마트스토어

    티스토리툴바