- 단순회귀모형의 정의
모집단에서 y와 x 간에 다음의 간단한 식이 성립한다고 가정했을 때 아래의 식이 단순 선형회귀분석의 정의이다.
y : 종속변수(dependent variable)
x : 독립변수(independent variable), 설명변수(explanatory variable), 통제변수(control variable)
β1 : 상관계수(correlation coefficient)
예를 들어 y = yield, x = fertilizer인 경우, 이 농업 연구자는 여타 요소들을 고정시킨 상태에서 비료가 수확에 미치는 영향에 관심이 있다. 이 효과는 β1으로 주어진다. 오차항은 토지의 질, 강수량 등을 포함할 것이다. β1계수는 여타 요소들을 고정할 때 비료가 수확에 미치는 영향을 측정한다. 상관계수가 0이면 두 변수는 상관되지 않았다(uncorrelated)고 하고, 상관계수가 0이 아니면 두 변수는 상관되었따(correlated)고 한다.
- 보통최소제곱 추정값의 도출
"보통최소제곱법"이라는 이름은 이 추정값들이 잔차 제곱합을 최소화시킨다는 사실 때문에 붙었다.
- 모든 자료 표본에서 성립하는 OLS의 성질
- OLS 잔차들의 합과 표본평균은 0이다.
- 설명변수 값들과 OLS 잔차들의 표본공분산이 0이다.
- SST = SSE + SSR
- 총 제곱합 = 설명된 제곱합 + 잔차 제곱합
- R제곱(결정계수, codfficient of determination)은 y의 전체 차이 중 x의 차이에 의하여 설명되는 비중
- 예를 들어 R제곱이 0.35라면 표본 낸 종속변수 값들의 차이(SST)의 35%가 설명변수 x에 의해 설명된다.
- 측정단위와 함수형태
- R제곱은 y나 x의 단위 변화에 따라 달라지지 않는다.
해석 : educ의 계수에 100을 곱하여 백분율로 "매 추가적 교육연수마다 임금은 8.3% 증가한다.", 이 식에서 로그 wage를 사용하는 주된 이유는 교육이 wage에 미치는 백분율 효과가 일정핟록 하기 위함이다. 추가적 1년의 교육이 log(wage)를 8.3% 증가시킨다는 것은 옳지 않다. R제곱에 따르면 log(wage)의 차이의 약 18.6%를 educ이 설명한다.
해석 : 기업 매출이 1%증가하면 CEO급여는 0.257%증가한다.
'20대 성장기 > 공부' 카테고리의 다른 글
계량경제학 4. 다중회귀분석_추론 (0) | 2021.05.11 |
---|---|
계량경제학 3. 다중회귀분석_추정 (0) | 2021.05.10 |
계량경제학 1. 계량경제학과 경제 자료의 속성 (0) | 2021.05.10 |
논문 작성을 위한 통계 읽기 (0) | 2021.04.23 |
기사 공부 :: 마크 카니, 기후 위험은 코로나보다 심각하다 / 탄소가격제의 필요성 / (0) | 2021.04.05 |