Statistics/ADP

Regression Analysis by Example

jchung56 2020. 1. 17. 19:28

 

양적(quantitative) 

-로지스틱 희귀(logistic regression) - 반응변수 (response variable: Y) 가 이항(binary)인 경우 사용되는 기법

 

질적(qualitative) 

-분산분석(Analysis of variance) - 예측변수(Predictor variable)이 질적인 경우 사용되는 기법

 

-어떤예측변수가 질적이고 다른예측변수가 양적이면 공산분석(analysis of covariance) 사용

 

 

모형설정

-주관적/객관적인 판단에 근거하여 전문가에 의해 설정될 수있다. 

-알려지지않은 모수 parameter 가 있을 수있다.

-선형/비선형 두개의 유형으로 분류가능 ( *선형 비선형은 y 와 x 와의 관계를 나타내는 것이 아니라 회귀모수가 방정식에 선형적/비선형적으로 삽입되어 있다는 이야기를 하는것이다) 

-선형함수로 변환할수있는 비선형 함수를 linearizable equation 이라고 함

-하나의 x (예측변수) 만 가진 회귀 방정식을 단순회귀방정식 (simple regression equation) 

-하나이상의 x (예측변수)들을 가진 회귀 방정식을 다중회귀방정식 (multiple regression equation)  ex) 사회경제적요인 , 여러지리학적 지역에서 발생하는 연령조정 사망률을 설명하려하는 것

 

단순회귀 (simple regression): 하나의 x (예측변수) 

다중회귀 (multiple regression) : 다수의 x (예측변수)

일변량 회귀(univariate regression) : 하나의 반응변수(y)

다변량 회귀(multivariate regression) : 다수의 반응변수(y)

선형

비선형

분산분석(analysis of variance) : x가 양적

공분산분석(analysis of covariance): x가 양적 질적 모두잇음

로지스틱(Logistic) : y가 질적

 

모수추정(parameter estimation) or  모형적합(model fitting) : 모형정의와 데이터 수집 후, 모형의 모수 추정 해야된다. 

-최소 제곱법(Least squares): 가장 일반적으로 모형적합, 모수추정 방법/ 추정량(estimator)들을 산출함 (가중최소제곱법: weighed least squares사용하기도 함