회귀분석 2

[ADsP] ADsP 요점정리 : Part 3. 통계 분석(3). 회귀분석

- 독립변수(x)가 종속변수(y)에 미치는 영향을 파악오차와 잔차의 차이 : 오차는 모집단 기준, 잔차는 표본집단 기준 - 회귀계수를 추정하는 방법 : 최소제곱법 잔차의 제곱합이 최소가 되는 회귀계수(a)와 절편(b)를 구하는 방법 - 회귀모형 평가 : R-square(모형으로 설명가능한 변동 / 총 변동)    ★ ★ ★ 선형성x와 y가 선형관계일 것등분산성잔차의 분산이 그르게 분포할 것정상성 = 정규성잔차가 정규분포의 특성을 가질 것Q-Q plot, 샤피로 윌그 검정, 히스토그램, 왜도/첨도 등으로 확인 가능독립성독립변수 간에는 상관관계가 없을 것   단순회귀하나의 독립변수만이 영향을 미침y = ax + b다중회귀독립변수가 둘 이상y = a1x1 + a2x2 + ... + anxn + b다항회귀독립변..

[TIL] [KT AIVLE School] KT 에이블스쿨 6기(DX 트랙) 7주차 2일. 머신러닝 - 지도학습(2). 분류 평가지표 심화, Linear 모델

머신러닝 2일차. 대충 그런게 있다-라고 알고 애써 멀리해 왔던 모델링 수학이 본격적으로 시작되었다. 그야말로 하늘은 높고 공부할 건 늘어나는 가을이다.             모델 평가지표 지난 포스팅(https://guoyee94.tistory.com/40)에서 다룬 모델들의 평가지표. 아무래도 좀 모자란 부분이 보이니까 한번만 더 짚는다. 다시 한 번 머신러닝의 평가지표를 살펴 보자.  회귀 문제회귀MAE(Mean Absolute Error)평균절대오차Σ(오차의 절댓값) ÷ 데이터 수MSE보다 직관적, 이상치에 민감하지 않음 MSE(Mean Squared Error) 평균제곱오차Σ(오차의 제곱) ÷ 데이터 수MAE보다 비직관적, 이상치에 민감함RMSE(Root Mean Squared Error)  √..