최소 제곱 선형 회귀 계산기
최소 제곱 회귀는 데이터에 가장 잘 맞는 직선, 즉 "최적 적합선"을 찾는 방법입니다. (x, y) 쌍의 형태로 데이터를 입력하고 데이터에 가장 잘 맞는 선의 방정식을 찾습니다.
가장 잘 맞는 라인
다음과 같이 몇 가지 점이 있고 그 점에 가장 잘 맞는 선을 원한다고 가정해 보세요.
우리는 "육안으로" 선을 관찰할 수 있습니다. 선 위와 아래에 비슷한 수의 점을 사용하여 선을 모든 점에 최대한 가깝게 만드십시오.
하지만 정확도를 높이기 위해 최소 제곱 회귀를 사용하여 직선을 계산하는 방법을 살펴보겠습니다.
직선 계산
우리의 목표는 직선 방정식에서 m(기울기)과 b(y절편) 값을 계산하는 것입니다.
단계
N개 점에 가장 적합한 선을 찾으려면 다음을 수행하십시오.
1단계: 각 (x, y) 점에 대해 x2와 xy를 계산합니다.
2단계: x, y, x 2 및 xy를 모두 더하여 Σx, Σy, Σx2 및 Σxy를 얻습니다(Σ는 "합계"를 의미함).
3단계: 기울기 m 계산:
m = N Σ(xy) − Σx ΣyN Σ(x 2) − (Σx)2
(N은 포인트 개수입니다.
4단계: 절편 b 계산:
b = Σy − m ΣxN
5단계: 선 방정식 조합
y = mx + b
어떻게 작동하나요?
이는 제곱 오류의 합을 가능한 한 작게 만드는 방식으로 작동합니다(이것이 "최소 제곱"이라고 불리는 이유입니다).
직선은 오차 제곱의 합을 최소화합니다.
따라서 이러한 각 오류를 제곱하고 모두 더하면 총합은 가능한 한 작습니다.
각 데이터 포인트가 스프링으로 막대에 연결되어 있다고 상상할 수 있습니다(정확하지는 않지만).
최소제곱은 이상치에 민감합니다. 이상한 값이 선을 그쪽으로 끌어 당깁니다.