20대 성장기/공부

계량경제학 2. 단순회귀모형

방구석주희 2021. 5. 10. 14:13
728x90
  • 단순회귀모형의 정의

모집단에서 y와 x 간에 다음의 간단한 식이 성립한다고 가정했을 때 아래의 식이 단순 선형회귀분석의 정의이다.

y : 종속변수(dependent variable)

x : 독립변수(independent variable), 설명변수(explanatory variable), 통제변수(control variable)

β1 : 상관계수(correlation coefficient)

 

예를 들어 y = yield, x = fertilizer인 경우, 이 농업 연구자는 여타 요소들을 고정시킨 상태에서 비료가 수확에 미치는 영향에 관심이 있다. 이 효과는 β1으로 주어진다. 오차항은 토지의 질, 강수량 등을 포함할 것이다. β1계수는 여타 요소들을 고정할 때 비료가 수확에 미치는 영향을 측정한다. 상관계수가 0이면 두 변수는 상관되지 않았다(uncorrelated)고 하고, 상관계수가 0이 아니면 두 변수는 상관되었따(correlated)고 한다.

 

  • 보통최소제곱 추정값의 도출

불편추정량

"보통최소제곱법"이라는 이름은 이 추정값들이 잔차 제곱합을 최소화시킨다는 사실 때문에 붙었다. 

 

  • 모든 자료 표본에서 성립하는 OLS의 성질

- OLS 잔차들의 합과 표본평균은 0이다. 

- 설명변수 값들과 OLS 잔차들의 표본공분산이 0이다.

- SST = SSE + SSR

- 총 제곱합 = 설명된 제곱합 + 잔차 제곱합

- R제곱(결정계수, codfficient of determination)은 y의 전체 차이 중 x의 차이에 의하여 설명되는 비중

- 예를 들어 R제곱이 0.35라면 표본 낸 종속변수 값들의 차이(SST)의 35%가 설명변수 x에 의해 설명된다.

 

  • 측정단위와 함수형태

- R제곱은 y나 x의 단위 변화에 따라 달라지지 않는다.

 

로그-수준

해석 : educ의 계수에 100을 곱하여 백분율로 "매 추가적 교육연수마다 임금은 8.3% 증가한다.", 이 식에서 로그 wage를 사용하는 주된 이유는 교육이 wage에 미치는 백분율 효과가 일정핟록 하기 위함이다. 추가적 1년의 교육이 log(wage)를 8.3% 증가시킨다는 것은 옳지 않다. R제곱에 따르면 log(wage)의 차이의 약 18.6%를 educ이 설명한다.

 

로그-로그

해석 : 기업 매출이 1%증가하면 CEO급여는 0.257%증가한다.

 

 

728x90