Tóm tắt kiến thức ôn tập chương 3 - Kinh tế lượng (NEU)

Tổng hợp lý thuyết và công thức cốt lõi Chương 3 môn Kinh tế lượng theo giáo trình ĐH Kinh tế Quốc dân (NEU). Nội dung tóm tắt chi tiết về quy luật phân phối của các thống kê mẫu, phương pháp xây dựng khoảng tin cậy cho hệ số hồi quy, các bài toán kiểm định giả thuyết (Kiểm định T, Kiểm định F, Kiểm định Wald) và kỹ thuật dự báo giá trị biến phụ thuộc. Tài liệu được hệ thống hóa logic, giúp sinh viên dễ dàng ôn tập và nắm vững các công thức quan trọng.

Kinh tế lượngEconometricsTóm tắt kinh tế lượng chương 3Suy diễn thống kêDự báo hồi quyKhoảng tin cậyKiểm định giả thuyếtKiểm định TKiểm định FKinh tế lượng NEULý thuyết kinh tế lượngÔn thi kinh tế lượng

 

3.1. QUY LUẬT PHÂN PHỐI XÁC SUẤT CỦA MỘT SỐ THỐNG KÊ MẪU

Để thực hiện suy diễn thống kê, mô hình hồi quy tuyến tính cổ điển cần thỏa mãn Giả thiết 5: Sai số ngẫu nhiên tuân theo quy luật chuẩn uiN(0,σ2)u_i \sim N(0, \sigma^2).

Định lý 3.1: Khi các giả thiết 1-5 thỏa mãn, các ước lượng OLS β^j\hat{\beta}_j tuân theo quy luật chuẩn:
 

β^jN(βj,var(β^j))\hat{\beta}_j \sim N(\beta_j, var(\hat{\beta}_j))

Định lý 3.2: Thống kê t (được chuẩn hóa) tuân theo quy luật Student với (nk)(n-k) bậc tự do:
 

t=β^jβjse(β^j)Tnkt = \frac{\hat{\beta}_j - \beta_j}{se(\hat{\beta}_j)} \sim T_{n-k}


Tổng quát cho tổ hợp tuyến tính của hai hệ số:
 

t=(aβ^j+bβ^s)(aβj+bβs)se(aβ^j+bβ^s)Tnkt = \frac{(a\hat{\beta}_j + b\hat{\beta}_s) - (a\beta_j + b\beta_s)}{se(a\hat{\beta}_j + b\hat{\beta}_s)} \sim T_{n-k}

Lưu ý quan trọng cho sinh viên:
Nếu giả thiết 5 (sai số phân phối chuẩn) không được thỏa mãn, các kiểm định t và F chỉ có giá trị xấp xỉ khi kích thước mẫu lớn (n lớn). Với mẫu nhỏ và u không chuẩn, kết quả kiểm định có thể không đáng tin cậy.

3.2. BÀI TOÁN XÂY DỰNG KHOẢNG TIN CẬY CHO CÁC HỆ SỐ HỒI QUY

3.2.1. Khoảng tin cậy cho một hệ số hồi quy

Khoảng tin cậy đối xứng (1α)(1-\alpha) cho hệ số βj\beta_j được xác định bởi công thức:
 

(β^jtα/2,nkse(β^j);β^j+tα/2,nkse(β^j))(\hat{\beta}_j - t_{\alpha/2, n-k} \cdot se(\hat{\beta}_j); \,\, \hat{\beta}_j + t_{\alpha/2, n-k} \cdot se(\hat{\beta}_j))


Trong đó:
tα/2,nkt_{\alpha/2, n-k}: Giá trị tới hạn của phân phối Student (tra bảng).
se(β^j)se(\hat{\beta}_j): Sai số chuẩn của hệ số ước lượng.

Ý nghĩa: Với độ tin cậy 1α1-\alpha, khi biến XjX_j tăng 1 đơn vị (các yếu tố khác không đổi), trung bình biến Y sẽ thay đổi trong khoảng này.

3.2.2. Khoảng tin cậy cho biểu thức của hai hệ số hồi quy

Dùng để đánh giá tác động khi hai biến độc lập cùng thay đổi. Khoảng tin cậy cho biểu thức aβ2+bβ3a\beta_2 + b\beta_3:
 

((aβ^2+bβ^3)±tα/2,nkse(aβ^2+bβ^3))\left( (a\hat{\beta}_2 + b\hat{\beta}_3) \pm t_{\alpha/2, n-k} \cdot se(a\hat{\beta}_2 + b\hat{\beta}_3) \right)


Công thức tính sai số chuẩn (Lưu ý phải có thành phần hiệp phương sai):
 

se(aβ^2+bβ^3)=a2var(β^2)+b2var(β^3)+2abcov(β^2,β^3)se(a\hat{\beta}_2 + b\hat{\beta}_3) = \sqrt{a^2 var(\hat{\beta}_2) + b^2 var(\hat{\beta}_3) + 2ab cov(\hat{\beta}_2, \hat{\beta}_3)}

Sai lầm thường gặp: Sinh viên thường quên cộng thành phần 2abcov(β^2,β^3)2ab cov(\hat{\beta}_2, \hat{\beta}_3) khi tính sai số chuẩn của tổng/hiệu các hệ số. Nếu a=1,b=1a=1, b=-1 (hiệu hai hệ số), công thức sẽ là 2cov(...)-2 cov(...).

3.2.3. Ý nghĩa của khoảng tin cậy

- Khoảng tin cậy là một khoảng ngẫu nhiên.
- Ý nghĩa: Nếu lấy mẫu lặp lại nhiều lần, khoảng 95%95\% số các khoảng tin cậy xây dựng được sẽ chứa giá trị thực βj\beta_j của tổng thể.

3.2.4. Các yếu tố ảnh hưởng đến độ dài khoảng tin cậy

Độ dài khoảng tin cậy phản ánh độ chính xác của ước lượng (càng hẹp càng chính xác). Độ dài phụ thuộc vào:
+ Bậc tự do (n-k): Mẫu (n) càng lớn hoặc số biến (k) càng nhỏ -> bậc tự do lớn -> tα/2t_{\alpha/2} nhỏ -> khoảng hẹp hơn.
+ Phương sai sai số (σ2\sigma^2): Sai số càng nhỏ -> ước lượng càng chính xác.
+ Đa cộng tuyến (Rj2R^2_j): Tương quan giữa các biến độc lập cao -> se(β^j)se(\hat{\beta}_j) lớn -> khoảng rộng ra (kém chính xác).

3.3. BÀI TOÁN KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ VỀ HỆ SỐ HỒI QUY

3.3.1. Kiểm định giả thuyết về một hệ số hồi quy (Kiểm định T)

Thống kê kiểm định:
 

tqs=β^jβse(β^j)t_{qs} = \frac{\hat{\beta}_j - \beta^*}{se(\hat{\beta}_j)}

Bảng tổng hợp các dạng giả thuyết và miền bác bỏ:

Loại kiểm địnhGiả thuyết H0H_0Giả thuyết H1H_1Điều kiện bác bỏ H0H_0
Hai phía (bằng/khác)βj=β\beta_j = \beta^*βjβ\beta_j \neq \beta^*tqs>tα/2,nk|t_{qs}| > t_{\alpha/2, n-k}
Một phía (phải)βjβ\beta_j \le \beta^*βj>β\beta_j > \beta^*tqs>tα,nkt_{qs} > t_{\alpha, n-k}
Một phía (trái)βjβ\beta_j \ge \beta^*βj<β\beta_j < \beta^*tqs<tα,nkt_{qs} < -t_{\alpha, n-k}

Lưu ý: Kiểm định ý nghĩa thống kê của biến (biến có tác động hay không) tương ứng với β=0\beta^* = 0.

3.3.2. Kiểm định giả thuyết về một ràng buộc giữa các hệ số hồi quy

Sử dụng khi so sánh tác động của hai biến hoặc kiểm định tổng các hệ số. 
Thống kê kiểm định cho H0:aβ2+bβ3=aH_0: a\beta_2 + b\beta_3 = a^*:
 

tqs=(aβ^2+bβ^3)ase(aβ^2+bβ^3)t_{qs} = \frac{(a\hat{\beta}_2 + b\hat{\beta}_3) - a^*}{se(a\hat{\beta}_2 + b\hat{\beta}_3)}


Quy tắc bác bỏ tương tự như bảng trên.

3.3.3. Giá trị xác suất P (P-value)

- Định nghĩa: Mức ý nghĩa nhỏ nhất mà tại đó H0H_0 bị bác bỏ.
- Quy tắc quyết định:
+ Nếu P-value<αP\text{-value} < \alpha (mức ý nghĩa): Bác bỏ H0H_0.
+ Nếu P-valueαP\text{-value} \ge \alpha: Chưa đủ cơ sở bác bỏ H0H_0.
- Eviews/Stata luôn báo cáo P-value cho kiểm định 2 phía (βj=0\beta_j = 0). Với kiểm định 1 phía, cần lấy P-value/2 (nếu dấu của t phù hợp).

3.3.4. Kiểm định giả thuyết về nhiều ràng buộc - Kiểm định F

Áp dụng khi cần kiểm định đồng thời từ 2 ràng buộc trở lên (Ví dụ: H0:β2=0 vaˋ β3=0H_0: \beta_2 = 0 \text{ và } \beta_3 = 0).
Nguyên tắc: So sánh mô hình không ràng buộc (U - Unrestricted) và mô hình có ràng buộc (R - Restricted).

Công thức F tổng quát (theo RSS):
 

Fqs=(RSSRRSSU)/mRSSU/(nkU)F_{qs} = \frac{(RSS_R - RSS_U) / m}{RSS_U / (n - k_U)}


Trong đó:
RSSRRSS_R: Tổng bình phương phần dư của mô hình có ràng buộc (luôn lớn hơn hoặc bằng RSSURSS_U).
RSSURSS_U: Tổng bình phương phần dư của mô hình gốc (không ràng buộc).
mm: Số ràng buộc (số dấu bằng trong H0H_0).
kUk_U: Số tham số của mô hình gốc.
- Quy luật: F(m,nkU)F(m, n - k_U).

Công thức F theo R2R^2 (chỉ dùng khi biến phụ thuộc Y giống hệt nhau):
 

Fqs=(RU2RR2)/m(1RU2)/(nkU)F_{qs} = \frac{(R^2_U - R^2_R) / m}{(1 - R^2_U) / (n - k_U)}

3.3.5. Kiểm định về sự phù hợp của hàm hồi quy

Mục đích: Kiểm định xem TẤT CẢ các biến độc lập có đồng thời bằng 0 hay không.
H0:β2=β3=...=βk=0H_0: \beta_2 = \beta_3 = ... = \beta_k = 0 (Mô hình không phù hợp).
H1H_1: Có ít nhất một hệ số khác 0 (Mô hình phù hợp).
Công thức F đặc biệt:
 

Fqs=R2/(k1)(1R2)/(nk)F_{qs} = \frac{R^2 / (k - 1)}{(1 - R^2) / (n - k)}


Nếu Fqs>Fα(k1,nk)F_{qs} > F_{\alpha}(k-1, n-k) hoặc P-value (Prob F-stat) < α\alpha => Bác bỏ H0H_0 (Mô hình phù hợp).

3.3.6. So sánh kiểm định T và kiểm định F

Tiêu chíKiểm định TKiểm định F
Phạm viKiểm định một ràng buộc (1 hệ số hoặc 1 tổ hợp).Kiểm định nhiều ràng buộc đồng thời (hoặc 1 ràng buộc).
Loại ràng buộcĐẳng thức (=) và Bất đẳng thức (<, >, $\ge$, $\le$).Chỉ dùng cho ràng buộc Đẳng thức (=).
Mối quan hệKhi kiểm định 1 ràng buộc đẳng thức: tnk2=F1,nkt_{n-k}^2 = F_{1, n-k}. Kết luận là tương đương.
Lưu ýKhông dùng nhiều kiểm định t riêng lẻ để thay thế cho 1 kiểm định F gộp (do sai lầm loại I tích lũy).Giải quyết được vấn đề đa cộng tuyến khi các biến riêng lẻ không có ý nghĩa (t thấp) nhưng tổng thể mô hình lại có ý nghĩa (F cao).

3.4. MỘT SỐ KIỂM ĐỊNH KHÁC

Khi mẫu lớn (tiệm cận), nếu giả thiết phân phối chuẩn của sai số không thỏa mãn, có thể dùng:
- Kiểm định Wald.
- Kiểm định Tỷ số hợp lý (Likelihood Ratio - LR).
- Kiểm định Nhân tử Lagrange (LM).
Các thống kê này tuân theo quy luật Chi-bình-phương (χ2\chi^2).

3.5. DỰ BÁO GIÁ TRỊ CỦA BIẾN PHỤ THUỘC VÀ SAI SỐ DỰ BÁO

3.5.1. Dự báo giá trị của biến phụ thuộc

Dự báo giá trị trung bình E(YX0)E(Y|X_0) bằng khoảng tin cậy. 
Sai số chuẩn của giá trị dự báo trung bình (se(Y^0)se(\hat{Y}_0)):
 

se(Y^0)=σ^1n+(X0X)2(XiX)2se(\hat{Y}_0) = \hat{\sigma} \sqrt{\frac{1}{n} + \frac{(X_0 - \overline{X})^2}{\sum (X_i - \overline{X})^2}}


Khoảng tin cậy dự báo:
 

(Y^0±tα/2,nkse(Y^0))(\hat{Y}_0 \pm t_{\alpha/2, n-k} \cdot se(\hat{Y}_0))


Nhận xét: Dự báo càng xa giá trị trung bình mẫu (X\overline{X}) thì sai số dự báo càng lớn (khoảng tin cậy càng rộng).

3.5.2. Đánh giá sai số dự báo

Các chỉ tiêu đánh giá độ chính xác của dự báo (so sánh giá trị thực tế YY và giá trị dự báo Y^\hat{Y}):

+ RMSE (Căn bậc hai của trung bình bình phương sai số): 

RMSE=(Y^iYi)2nRMSE = \sqrt{\frac{\sum (\hat{Y}_i - Y_i)^2}{n}}

 
+ MAE (Sai số trung bình tuyệt đối): 

MAE=Y^iYinMAE = \frac{\sum |\hat{Y}_i - Y_i|}{n}

 
+ MAPE (Sai số trung bình tuyệt đối theo %): (Không phụ thuộc đơn vị đo) 

MAPE=1nY^iYiYi×100MAPE = \frac{1}{n} \sum \left| \frac{\hat{Y}_i - Y_i}{Y_i} \right| \times 100
Mục lục
3.1. QUY LUẬT PHÂN PHỐI XÁC SUẤT CỦA MỘT SỐ THỐNG KÊ MẪU
3.2. BÀI TOÁN XÂY DỰNG KHOẢNG TIN CẬY CHO CÁC HỆ SỐ HỒI QUY
3.2.1. Khoảng tin cậy cho một hệ số hồi quy
3.2.2. Khoảng tin cậy cho biểu thức của hai hệ số hồi quy
3.2.3. Ý nghĩa của khoảng tin cậy
3.2.4. Các yếu tố ảnh hưởng đến độ dài khoảng tin cậy
3.3. BÀI TOÁN KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ VỀ HỆ SỐ HỒI QUY
3.3.1. Kiểm định giả thuyết về một hệ số hồi quy (Kiểm định T)
3.3.2. Kiểm định giả thuyết về một ràng buộc giữa các hệ số hồi quy
3.3.3. Giá trị xác suất P (P-value)
3.3.4. Kiểm định giả thuyết về nhiều ràng buộc - Kiểm định F
3.3.5. Kiểm định về sự phù hợp của hàm hồi quy
3.3.6. So sánh kiểm định T và kiểm định F
3.4. MỘT SỐ KIỂM ĐỊNH KHÁC
3.5. DỰ BÁO GIÁ TRỊ CỦA BIẾN PHỤ THUỘC VÀ SAI SỐ DỰ BÁO
3.5.1. Dự báo giá trị của biến phụ thuộc
3.5.2. Đánh giá sai số dự báo
Khoá học liên quan
Kiến thức tương tự