전처리

    [WIL]머신러닝 - 2주차 강의 개발일지

    [WIL]머신러닝 - 2주차 강의 개발일지

    2주 차의 목표는 논리 회귀의 개념과 다양한 머신러닝 모델을 알아본다. 머신러닝에서 쓰이는 전처리 기법들에 대해 배운다. 논리 회귀 : 입력값과 결과 사이에 연관성을 찾아내는 것을 말함 전처리 : 로우 데이터의 값에서 오류나 잘못된 점을 걸러내는 기법, 또는 분석하기 쉽게 먼저 가공해놓는 방법 1. 논리 회귀 (Logistic regression) 1주 차에는 선형 회귀에 대하여 알아보는 시간이 있었는데 이 선형 회귀는 연속된 값으로 선의 형태로 나타내는 방법이었다. 하지만 논리 회귀는 단어에서도 나타내어져 있듯이 해당 값은 시험의 합격, 불합격 또는 일의 성공과 실패와 같은 결과값이 연속된 것이 아닌 특정한 결과값을 가르치는 형태이기에 연속된 입력값에 의해서 동등하게 정비례 또는 반비례하여 결과값을 나..

    1-8[Machine learning] 머신 러닝 기초 정리 #2

    오늘 할 일 (계획) 1. 머신러닝 3주 차까지 수강 2. 기존 수강완료한 강의 개발일지 작성 오늘 한 일 (회고) 1. 머신러닝 강의 2-6까지 수강 완료 * 강의 내용 요약 논리 회귀는 입력값과 결과 사이에 연관성을 찾아내는 것을 말하며 전처리는 말 그대로 이렇게 연관성을 찾아내기 전에 데이터를 미리 가공하여 연관성을 더욱 빠르고 정확하게 찾아낼 수 있도록 하는 과정을 말한다. 논리 회귀를 크게 두 가지로 나눠보자면 이진 논리 회귀와 다항 논리 회귀가 있고 논리 회귀라는 특성상 결괏값이 0과 1로 수렴하여야 하기에 sigmoid함수를 쓰게 되며 이진 논리 회귀의 경우에는 keras binary_crossentropy를 사용한다. 다항 논리회로에서는 원할 인코딩, Softmax 함수를 사용하며 kera..