Tóm tắt kiến thức ôn tập chương 5 - Kinh tế lượng (NEU)

Tổng hợp kiến thức ôn thi Kinh tế lượng Chương 5 (Giáo trình ĐH Kinh tế Quốc dân) đầy đủ nhất. Tóm tắt lý thuyết và công thức cốt lõi về: Đa cộng tuyến, Phương sai sai số thay đổi, Sai dạng hàm (Ramsey RESET), Thiếu biến và Kiểm định phân phối chuẩn (Jarque-Bera). Hướng dẫn chi tiết cách phát hiện và các biện pháp khắc phục khuyết tật mô hình.

kinh tế lượng neutóm tắt kinh tế lượng chương 5kiểm định mô hìnhđa cộng tuyếnphương sai sai số thay đổisai dạng hàmôn thi kinh tế lượnggiáo trình kinh tế lượng neukiểm định ramseykiểm định white

 

5.1. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG

Giả thiết quan trọng số 2 của phương pháp OLS là kỳ vọng có điều kiện của sai số ngẫu nhiên phải bằng 0: E(uX2,...,Xk)=0E(u|X_2, ..., X_k) = 0. Nếu giả thiết này vi phạm, các ước lượng OLS sẽ bị chệch và không vững.

5.1.1. Nguyên nhân

Có 4 nguyên nhân chính dẫn đến việc vi phạm giả thiết này:
+ Thiếu biến quan trọng (Omitted Variable): Bỏ sót một biến ZZ có tác động đến YY và biến ZZ này lại có tương quan với các biến độc lập XX trong mô hình.
+ Dạng hàm sai (Functional Form Misspecification): Sử dụng dạng tuyến tính trong khi thực tế là dạng logarit, hoặc bỏ sót các biến bậc cao (bình phương, lập phương...).
+ Tính tác động đồng thời (Simultaneity): Xảy ra trong các mô hình hệ phương trình (ví dụ cung - cầu), khi biến độc lập và sai số ngẫu nhiên có tương quan hai chiều.
+ Sai số đo lường của biến độc lập (Measurement Error): Biến độc lập bị đo sai dẫn đến phần sai lệch đi vào sai số ngẫu nhiên và tạo ra tương quan.

5.1.2. Hậu quả của kỳ vọng sai số ngẫu nhiên khác không

- Ước lượng chệch (Biased): E(β^j)βjE(\hat{\beta}_j) \neq \beta_j. Lượng chệch này không mất đi kể cả khi kích thước mẫu tăng lên vô cùng (ước lượng không vững).
- Suy diễn thống kê sai: Các thống kê tt và FF không còn đáng tin cậy, dẫn đến việc kiểm định giả thuyết và khoảng tin cậy không còn giá trị.

Lượng chệch do thiếu biến: Xét mô hình đúng là Y=β1+β2X2+β3X3+uY = \beta_1 + \beta_2 X_2 + \beta_3 X_3 + u nhưng lại ước lượng mô hình thiếu biến Y=α1+α2X2+vY = \alpha_1 + \alpha_2 X_2 + v. Khi đó kỳ vọng của hệ số ước lượng là:

E(α^2)=β2+β3b^2E(\hat{\alpha}_2) = \beta_2 + \beta_3 \hat{b}_2

Trong đó b^2\hat{b}_2 là hệ số hồi quy của X3X_3 theo X2X_2.

Bảng tổng hợp: Chiều của lượng chệch (Bias Direction)

Dấu của β3\beta_3 (Tác động của biến bỏ sót)Tương quan giữa X2X_2 và X3X_3 (Corr(X2,X3)>0Corr(X_2, X_3) > 0)Tương quan giữa X2X_2 và X3X_3 (Corr(X2,X3)<0Corr(X_2, X_3) < 0)
β3>0\beta_3 > 0 (+)Chệch lên (Bias > 0)Chệch xuống (Bias < 0)
β3<0\beta_3 < 0 (-)Chệch xuống (Bias < 0)Chệch lên (Bias > 0)

*Lưu ý sinh viên: Chệch lên (Upward bias) tức là ước lượng cao hơn giá trị thực, chệch xuống (Downward bias) là thấp hơn giá trị thực.

5.1.3. Phát hiện

- Với biến bỏ sót đã biết: Dùng kiểm định t (cho 1 biến) hoặc kiểm định F (cho nhiều biến) để xem hệ số của biến đó có ý nghĩa thống kê không.
- Kiểm định Ramsey RESET (Regression Equation Specification Error Test): Dùng để phát hiện dạng hàm sai (thiếu các biến dạng lũy thừa của biến phụ thuộc).
+ Thực hiện: Hồi quy mô hình gốc, lấy Y^\hat{Y}. Chạy hồi quy phụ thêm các biến Y^2,Y^3...\hat{Y}^2, \hat{Y}^3... vào. Kiểm định F cho các hệ số của các biến thêm vào.
- Kiểm định Davidson - MacKinnon (J Test): Dùng để lựa chọn giữa hai mô hình không bao nhau (non-nested), ví dụ: dạng tuyến tính và dạng logarit.

5.1.4. Một số biện pháp khắc phục

- Nếu thiếu biến đã biết: Đưa thêm biến đó vào mô hình.
- Nếu sai dạng hàm: Chuyển đổi dạng hàm (ví dụ: log-log, lin-log) hoặc thêm các biến bình phương/lập phương.
- Nếu thiếu biến không quan sát được: 
+ Sử dụng biến đại diện (Proxy variable): Biến quan sát được có tương quan cao với biến bị thiếu. 
+ Sử dụng phương pháp biến công cụ (Instrumental Variable - IV) (chi tiết xem Phụ lục 5 của giáo trình).

5.2. PHƯƠNG SAI SAI SỐ THAY ĐỔI (HETEROSKEDASTICITY)

Giả thiết OLS yêu cầu phương sai sai số không đổi (Homoskedasticity): Var(uiX)=σ2Var(u_i|X) = \sigma^2. Khi Var(ui)=σi2Var(u_i) = \sigma_i^2 thay đổi theo các quan sát, ta có hiện tượng phương sai sai số thay đổi.

5.2.1. Nguyên nhân

- Bản chất số liệu: Ví dụ thu nhập càng cao thì biên độ dao động chi tiêu càng lớn.
- Mô hình thiếu biến quan trọng hoặc sai dạng hàm.
- Thường gặp ở số liệu chéo (cross-sectional data) hơn là chuỗi thời gian.

5.2.2. Hậu quả

Lưu ý quan trọng cho sinh viên: Phải phân biệt rõ hậu quả của Phương sai sai số thay đổi so với Thiếu biến.
+ Các ước lượng OLS VẪN LÀ ước lượng không chệch và vững (Unbiased & Consistent).
+ Tuy nhiên, ước lượng OLS KHÔNG còn là ước lượng hiệu quả nhất (Not BLUE - Best Linear Unbiased Estimator).
+ Công thức tính phương sai của hệ số ước lượng Var(β^)Var(\hat{\beta}) bị chệch \rightarrow Sai số chuẩn (SE) không đúng \rightarrow Kiểm định t, F và khoảng tin cậy không còn đáng tin cậy.

5.2.3. Phát hiện

- Đồ thị phần dư: Vẽ đồ thị của bình phương phần dư ei2e_i^2 theo biến Y^\hat{Y} hoặc biến độc lập XX. Nếu thấy hình phễu hoặc có quy luật, khả năng cao có phương sai thay đổi.
- Kiểm định Breusch-Pagan (BP): 
+ Hồi quy phụ: ei2=α1+α2X2i+...+αkXki+ve_i^2 = \alpha_1 + \alpha_2 X_{2i} + ... + \alpha_k X_{ki} + v 
+ Kiểm định giả thuyết H0H_0: Phương sai sai số không đổi (tất cả α\alpha dốc bằng 0). Dùng thống kê χ2\chi^2 (LM test) hoặc F.
- Kiểm định White: Tổng quát hơn BP, không cần giả định sai số phân phối chuẩn. 
+ Hồi quy phụ: ei2e_i^2 theo các biến độc lập XX, bình phương của chúng X2X^2 và tích chéo XiXjX_i X_j
+ Có thể dùng dạng rút gọn: Hồi quy ei2e_i^2 theo Y^\hat{Y} và Y^2\hat{Y}^2.

5.2.4. Khắc phục

- Phương pháp Bình phương bé nhất tổng quát (GLS/WLS): Nếu biết dạng của phương sai σi2\sigma_i^2, chia hai vế phương trình cho σi\sigma_i (hoặc ước lượng của nó) để đưa về mô hình có phương sai đồng nhất. Đây là cách để có ước lượng BLUE.
- Ước lượng Sai số chuẩn vững (Robust Standard Errors / White's SE): Vẫn dùng ước lượng OLS (chấp nhận không hiệu quả nhất) nhưng tính lại công thức Sai số chuẩn (SE) để khắc phục sự chệch của phương sai. Phương pháp này rất phổ biến vì đơn giản và không cần biết dạng cụ thể của phương sai.

5.3. SAI SỐ NGẪU NHIÊN KHÔNG TUÂN THEO QUY LUẬT CHUẨN

5.3.1. Hậu quả

- Nếu sai số không chuẩn: Các thống kê kiểm định t và F sẽ không tuân theo quy luật phân phối Student và Fisher chính xác.
- Với mẫu nhỏ: Suy diễn thống kê (kiểm định, khoảng tin cậy) không đáng tin cậy.
- Với mẫu lớn: Theo luật số lớn và định lý giới hạn trung tâm, các ước lượng xấp xỉ phân phối chuẩn. Do đó, suy diễn thống kê vẫn có giá trị tiệm cận (Asymptotic validity).

5.3.2. Phát hiện

- Biểu đồ tần suất (Histogram): Xem hình dạng phân phối của phần dư.
- Kiểm định Jarque-Bera (JB): Dựa trên hệ số bất đối xứng (Skewness - S) và độ nhọn (Kurtosis - K). 
+ Công thức: JB=n[S26+(K3)224]JB = n \left[ \frac{S^2}{6} + \frac{(K-3)^2}{24} \right] 
+ Với phân phối chuẩn: S=0,K=3S=0, K=3 nên JB0JB \approx 0
+ Nếu JB>χα2(2)JB > \chi^2_{\alpha}(2): Bác bỏ giả thiết sai số phân phối chuẩn.

5.4. VẤN ĐỀ ĐA CỘNG TUYẾN (MULTICOLLINEARITY)

5.4.1. Khái niệm

- Đa cộng tuyến hoàn hảo: Một biến độc lập là tổ hợp tuyến tính chính xác của các biến khác. Không thể ước lượng được OLS.
- Đa cộng tuyến cao (thực tế hay gặp): Các biến độc lập có tương quan tuyến tính mạnh (nhưng không hoàn hảo).

5.4.2. Hậu quả của đa cộng tuyến cao

Lưu ý: Đa cộng tuyến cao không vi phạm giả thiết Gauss-Markov, nên ước lượng OLS vẫn là không chệch và có phương sai bé nhất (BLUE). Tuy nhiên, "bé nhất" này vẫn là rất lớn.
- Phương sai của hệ số ước lượng lớn: Var(β^j)Var(\hat{\beta}_j) lớn \rightarrow Sai số chuẩn (SE) lớn.
- Khoảng tin cậy rộng: Kém chính xác.
- Tỷ số t bé: Dễ dẫn đến kết luận biến không có ý nghĩa thống kê (mặc dù R2R^2 của toàn mô hình vẫn cao).
- Dấu của hệ số ước lượng có thể sai so với lý thuyết.
- Kết quả ước lượng rất nhạy cảm với thay đổi nhỏ của dữ liệu.

5.4.3. Phát hiện

R2R^2 cao nhưng ít (hoặc không) tỷ số t có ý nghĩa thống kê.
- Hệ số tương quan cặp giữa các biến độc lập cao (> 0.8).
- Nhân tử phóng đại phương sai (VIF - Variance Inflation Factor): 
+ Công thức: VIFj=11Rj2VIF_j = \frac{1}{1 - R_j^2} (với Rj2R_j^2 là hệ số xác định khi hồi quy XjX_j theo các biến độc lập còn lại). 
+ Quy ước: Nếu VIF>10VIF > 10 (một số tài liệu là > 2.5 hoặc 5) thì có đa cộng tuyến cao.

5.4.4. Biện pháp khắc phục

- Không làm gì: Nếu mục tiêu là dự báo hoặc nếu đa cộng tuyến không ảnh hưởng đến biến quan trọng cần nghiên cứu.
- Gia tăng kích thước mẫu.
- Sử dụng thông tin tiền định (ví dụ ràng buộc hệ số từ lý thuyết).
- Biến đổi biến số (ví dụ: dùng sai phân, hoặc tỷ số).
- Bỏ bớt biến (cần thận trọng vì dễ gây ra lỗi thiếu biến - nghiêm trọng hơn đa cộng tuyến).

5.5. MÔ HÌNH CHỨA BIẾN KHÔNG THÍCH HỢP (IRRELEVANT VARIABLE)

5.5.1. Hậu quả

- Nếu đưa vào mô hình một biến không có tác động thực tế (hệ số tổng thể bằng 0): 
+ Các ước lượng OLS vẫn không chệch (Unbiased). 
+ Nhưng phương sai của các ước lượng sẽ lớn hơn (Inefficient) so với mô hình đúng. Điều này làm giảm độ chính xác của ước lượng.

So sánh quan trọng: 
- Thừa biến (Irrelevant): Không chệch, nhưng kém hiệu quả. 
- Thiếu biến (Omitted): Bị chệch (nghiêm trọng hơn).

5.5.2. Phát hiện

Sử dụng kiểm định t (cho 1 biến) hoặc kiểm định F (cho nhóm biến) để xem xét ý nghĩa thống kê. Nếu không có ý nghĩa, cân nhắc loại bỏ khỏi mô hình.

Mục lục
5.1. KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG
5.1.1. Nguyên nhân
5.1.2. Hậu quả của kỳ vọng sai số ngẫu nhiên khác không
5.1.3. Phát hiện
5.1.4. Một số biện pháp khắc phục
5.2. PHƯƠNG SAI SAI SỐ THAY ĐỔI (HETEROSKEDASTICITY)
5.2.1. Nguyên nhân
5.2.2. Hậu quả
5.2.3. Phát hiện
5.2.4. Khắc phục
5.3. SAI SỐ NGẪU NHIÊN KHÔNG TUÂN THEO QUY LUẬT CHUẨN
5.3.1. Hậu quả
5.3.2. Phát hiện
5.4. VẤN ĐỀ ĐA CỘNG TUYẾN (MULTICOLLINEARITY)
5.4.1. Khái niệm
5.4.2. Hậu quả của đa cộng tuyến cao
5.4.3. Phát hiện
5.4.4. Biện pháp khắc phục
5.5. MÔ HÌNH CHỨA BIẾN KHÔNG THÍCH HỢP (IRRELEVANT VARIABLE)
5.5.1. Hậu quả
5.5.2. Phát hiện
Khoá học liên quan
Kiến thức tương tự