인공지능

AI Linear Regression

KyooDong 2020. 5. 24. 00:10
728x90

Regression

Training Data를 이용하여 데이터의 특성과 상관관계를 파악하고, 그 결과를 바탕으로 미지의 데이터에 대해 그 결과를 연속적인 숫자값으로 예측하는 것

 

학습(Learn) 이란?

학습이란 Training data의 분포를 잘 표현하는 방정식 y = Wx + b 를 찾는 것입니다.

즉 최적의 W와 b를 찾는 것이 학습의 목적입니다.

 

오차(Error)란?

t가 정답 데이터라고 할 때

오차 = t - y = t - (Wx + b)

 

 

손실함수(Loss function)

Training data의 정답 t 와 입력 x에 대한 계산 값 y 의 차를 모두 더해 수식으로 표현하는 함수

단, 아래 그림과 같이 error 가 음수일 수도 있기 때문에 그냥 더해주는 것으로는 오차끼리 상쇄되는 문제가 생깁니다.

 

따라서 각각의 오차에 제곱하여 더하는 기법을 써서 오차끼리 상쇄되는 문제를 해결함과 동시에 큰 오차는 더 큰 가중치를 갖도록 합니다.

 

 

 

손실함수 E(W, b) 값이 최소 값을 갖도록 적절한 W, b를 구하는 것이 Linear regression 의 목표가 되겠습니다.