목차
레이블(정답)이 있는 입력 데이터를 모델에 학습 시켜 데이터와 정답 간의 관계를 찾는 과정.
이를 통해 새로운 데이터가 입력되면 모델이 학습한 관계식을 적용하여 결과를 예측할 수 있음.
머신 러닝은 학습 과정에서 정답의 유무에 따라 크게 두 가지로 나눌 수 있음.
지도 학습은 학습 과정에서 정답이 주어짐. 즉, 입력 데이터(x)와 출력 데이터(y)를 모두 알고
y=ax+b와 같이 x와 y 사이의 관계식을 알아내는 머신 러닝 알고리즘이다.
예측 목표가 되는 y 변수를 목표 변수(target)이라 하고, 목표 변수를 예측하는데 사용되는
x변수를 설명 변수(feature)라고 부른다.
지도 학습은 학습 과정에서 정답이 주어지지 않고 x 데이터만 제공되는 머신 러닝 유형이다.
y 를 예측하는 것이 목표가 아닌, x 데이터 사이에 존재하는 패턴이나 규칙을 찾는 것이 목표.
데이터 분석은 다음의 과정을 거친다.