Tóm tắt ôn tập kiến thức chương 2 - Kinh tế lượng (NEU)

Tổng hợp kiến thức trọng tâm Kinh tế lượng Chương 2 về mô hình hồi quy bội (đa biến) theo giáo trình Đại học Kinh tế Quốc dân. Bài viết tóm tắt chi tiết các nội dung cốt lõi: phương pháp ước lượng OLS, định lý Gauss-Markov, ý nghĩa hệ số hồi quy riêng, hệ số xác định R² và R² hiệu chỉnh, cùng các dạng hàm thông dụng (Log-log, Bán loga, Đa thức). Tài liệu ôn tập súc tích, đầy đủ công thức giúp sinh viên nắm chắc lý thuyết để giải bài tập và thi cử hiệu quả.

kinh tế lượng neuchương 2 kinh tế lượngmô hình hồi quy bộihồi quy đa biếnước lượng OLSđịnh lý gauss markovr bình phươnghệ số co giãnôn thi kinh tế lượng

 

2.1. SỰ CẦN THIẾT CỦA MÔ HÌNH HỒI QUY BỘI.

Mục này giải thích lý do tại sao mô hình hồi quy đơn (2 biến) thường không đủ để phân tích thực tế và dẫn đến sai số.

2.1.1. Mô hình hai biến - vấn đề về kỳ vọng sai số khác 0.

Trong mô hình 2 biến, nếu một biến độc lập X có tương quan với sai số ngẫu nhiên u (do u chứa các yếu tố khác tác động lên Y mà có quan hệ với X), thì giả thiết quan trọng E(uX)=0E(u|X) = 0 bị vi phạm. Khi đó: 
- Biến độc lập nội sinh: Là biến độc lập có tương quan với sai số ngẫu nhiên trong mô hình (cov(X,u)0cov(X, u) \neq 0). 
- Hậu quả: Các ước lượng OLS sẽ là ước lượng chệch (biased). 
- Giải pháp: Đưa thêm các biến khác vào mô hình để tách tác động của chúng ra khỏi sai số u.

Ví dụ minh họa: 
Mô hình chi tiêu (CT) theo thu nhập (TN): CT=β1+β2TN+uCT = \beta_1 + \beta_2 TN + u
Biến u chứa yếu tố "tài sản". Vì "tài sản" thường tương quan dương với "thu nhập", nên cov(TN,u)0cov(TN, u) \neq 0. Cần thêm biến Tài sản (TS) vào mô hình: CT=β1+β2TN+β3TS+uCT = \beta_1 + \beta_2 TN + \beta_3 TS + u.

2.1.2. Một số ưu việt khác của mô hình hồi quy bội.

Ngay cả khi không vi phạm giả thiết, mô hình hồi quy bội (nhiều biến) vẫn tốt hơn vì: 
- Chất lượng dự báo tốt hơn: Thêm biến phù hợp giúp tăng khả năng giải thích (R2R^2 tăng), giảm sai số chuẩn của mô hình (σ2\sigma^2 giảm). 
- Dạng hàm phong phú hơn: Cho phép mô hình hóa các quan hệ phi tuyến (ví dụ thêm biến bình phương X2X^2 để thể hiện quy luật cận biên giảm dần). 
- Phân tích tinh tế hơn: Cho phép đánh giá tác động riêng phần (partial effect) của một biến khi giữ các biến khác không đổi.

2.2. MÔ HÌNH HỒI QUY BỘI VÀ PHƯƠNG PHÁP ƯỚC LƯỢNG OLS.

2.2.1. Mô hình và các giả thiết.

Mô hình tổng quát k biến: 
Y=β1+β2X2+...+βkXk+uY = \beta_1 + \beta_2 X_2 + ... + \beta_k X_k + u 
Trong đó: Y là biến phụ thuộc, XjX_j là các biến độc lập, u là sai số ngẫu nhiên.

Các giả thiết của mô hình (QUAN TRỌNG): 
- Giả thiết 1: Mẫu ngẫu nhiên. 
- Giả thiết 2: Kỳ vọng có điều kiện của sai số bằng 0: E(uX2,...,Xk)=0E(u | X_2, ..., X_k) = 0
- Giả thiết 3: Phương sai sai số không đổi (Homoscedasticity): Var(uX2,...,Xk)=σ2Var(u | X_2, ..., X_k) = \sigma^2
- Giả thiết 4: Không có đa cộng tuyến hoàn hảo. Không tồn tại mối quan hệ tuyến tính chính xác giữa các biến độc lập (không biến nào là tổ hợp tuyến tính của các biến còn lại).

Ý nghĩa hệ số hồi quy riêng (βj\beta_j): 
βj=E(YX)Xj\beta_j = \frac{\partial E(Y|X)}{\partial X_j} 
Thể hiện lượng thay đổi trung bình của Y khi XjX_j tăng thêm 1 đơn vị, trong điều kiện giữ nguyên các biến độc lập khác không đổi (ceteris paribus).

2.2.2. Phương pháp OLS và giải thích kết quả ước lượng.

Phương pháp OLS tìm các ước lượng β^j\hat{\beta}_j sao cho tổng bình phương phần dư (RSS) là nhỏ nhất: 
Mini=1nei2=Min(Yiβ^1β^2X2i...β^kXki)2Min \sum_{i=1}^n e_i^2 = Min \sum (Y_i - \hat{\beta}_1 - \hat{\beta}_2 X_{2i} - ... - \hat{\beta}_k X_{ki})^2

Việc giải hệ phương trình chuẩn tắc sẽ cho ra nghiệm duy nhất nếu thỏa mãn Giả thiết 4.

2.2.3. Độ phù hợp của hàm hồi quy.

Hệ số xác định bội (R2R^2): 
Đo lường tỷ lệ thay đổi của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình. 
Công thức: 
R2=ESSTSS=1RSSTSSR^2 = \frac{ESS}{TSS} = 1 - \frac{RSS}{TSS} 
Trong đó: TSS=(YiY)2TSS = \sum (Y_i - \overline{Y})^2RSS=ei2RSS = \sum e_i^2ESS=TSSRSSESS = TSS - RSS
0R210 \le R^2 \le 1.

Hệ số xác định đã hiệu chỉnh (R2\overline{R}^2 - Adjusted R-squared): 
Dùng để so sánh các mô hình có số lượng biến khác nhau (vì R2R^2 luôn tăng khi thêm biến, bất kể biến đó có ý nghĩa hay không). 
Công thức: 
R2=1(1R2)n1nk\overline{R}^2 = 1 - (1 - R^2) \frac{n - 1}{n - k}

Bảng so sánh: R-bình phương vs R-bình phương hiệu chỉnh 
+ R² thường: Luôn tăng hoặc giữ nguyên khi thêm biến mới. Không dùng để so sánh hai mô hình khác số biến. Ý nghĩa: Mức độ phù hợp của mô hình với dữ liệu mẫu. 
+ R² hiệu chỉnh: Có thể tăng hoặc giảm khi thêm biến mới. Phạt việc thêm biến không cần thiết. Dùng để so sánh "độ tốt" giữa các mô hình có số biến khác nhau.

2.2.4. Tính tốt nhất của ước lượng OLS - Định lý Gauss-Markov.

Định lý Gauss-Markov: 
Nếu các giả thiết 1-4 thỏa mãn, ước lượng OLS là ước lượng BLUE (Best Linear Unbiased Estimator). 
- Tuyến tính: Hàm bậc nhất của Y. 
- Không chệch: E(β^j)=βjE(\hat{\beta}_j) = \beta_j
- Tốt nhất (Hiệu quả): Có phương sai nhỏ nhất trong lớp các ước lượng tuyến tính không chệch.

Độ chính xác của ước lượng (Phương sai của β^j\hat{\beta}_j): 
Công thức tính phương sai của hệ số ước lượng β^j\hat{\beta}_j
var(β^j)=σ2(1Rj2)xji2var(\hat{\beta}_j) = \frac{\sigma^2}{(1 - R_j^2) \sum x_{ji}^2} 
Sai số chuẩn (Standard Error): 
se(β^j)=var(β^j)se(\hat{\beta}_j) = \sqrt{var(\hat{\beta}_j)}

Phân tích các yếu tố ảnh hưởng đến độ chính xác (Variance): 
σ2\sigma^2 (Phương sai sai số): Càng nhỏ càng tốt -> Mô hình càng chính xác. 
xji2\sum x_{ji}^2 (Biến động của biến độc lập X): Càng lớn càng tốt -> X càng phân tán thì ước lượng càng chính xác. 
Rj2R_j^2 (Hệ số xác định khi hồi quy XjX_j theo các X khác): Càng nhỏ càng tốt. Nếu Rj2R_j^2 lớn -> Đa cộng tuyến cao -> Phương sai lớn (kém chính xác). 
+ VIF (Nhân tử phóng đại phương sai): VIFj=11Rj2VIF_j = \frac{1}{1 - R_j^2}. VIF càng cao thì đa cộng tuyến càng nghiêm trọng.

2.2.5. Mô hình hồi quy hai biến và mô hình hồi quy bội.

Khi nào ước lượng của biến X trong mô hình đơn và mô hình bội (khi thêm biến Z) giống nhau? 
- Hệ số hồi quy của Z bằng 0 (α^3=0\hat{\alpha}_3 = 0). 
- HOẶC: Hệ số tương quan mẫu giữa X và Z bằng 0 (cov(X,Z)=0cov(X, Z) = 0).

2.3. MỘT SỐ DẠNG CỦA MÔ HÌNH HỒI QUY.

Đây là phần quan trọng để diễn giải ý nghĩa kinh tế của các hệ số.

Dạng mô hìnhPhương trìnhÝ nghĩa hệ số góc (β2\beta_2)Ghi chú
Log-Logln(Y)=β1+β2ln(X)+uln(Y) = \beta_1 + \beta_2 ln(X) + uHệ số co giãn (Elasticity). 
X tăng 1% -> Y tăng β2\beta_2%.
Thường dùng cho hàm cầu, hàm sản xuất (Cobb-Douglas). β\beta không phụ thuộc đơn vị đo.
Log-Lin (Bán loga)ln(Y)=β1+β2X+uln(Y) = \beta_1 + \beta_2 X + uTốc độ tăng trưởng (bán đàn hồi). 
X tăng 1 đơn vị -> Y tăng 100×β2100 \times \beta_2 %.
Thường dùng cho mô hình tiền lương theo số năm đi học.
Lin-Log (Bán loga)Y=β1+β2ln(X)+uY = \beta_1 + \beta_2 ln(X) + uX tăng 1% -> Y tăng β2100\frac{\beta_2}{100} đơn vị.Mô hình Engel (chi tiêu theo thu nhập).
Đa thức (Bậc 2)Y=β1+β2X+β3X2+uY = \beta_1 + \beta_2 X + \beta_3 X^2 + uTác động biên thay đổi theo X: 
dYdX=β2+2β3X\frac{dY}{dX} = \beta_2 + 2\beta_3 X
Dùng để thể hiện quy luật năng suất biên giảm dần hoặc cực trị (Parabol).

Lưu ý cho sinh viên: 
- Khi biến số có giá trị âm hoặc bằng 0, không thể dùng dạng Logarit. 
- Đối với mô hình đa thức, hai biến XX và X2X^2 thường có tương quan cao (đa cộng tuyến), nhưng vẫn giữ lại để phản ánh đúng bản chất kinh tế (phi tuyến).

2.4. TÍNH VỮNG CỦA ƯỚC LƯỢNG OLS.

Tính vững (Consistency) là tính chất với mẫu lớn (nn \to \infty). 
Định lý: Nếu các giả thiết 1-4 thỏa mãn (hoặc giả thiết 2 được nới lỏng thành E(u)=0E(u)=0 và cov(Xj,u)=0cov(X_j, u) = 0), thì ước lượng OLS là ước lượng vững. 
Công thức giới hạn xác suất: 
limnP(β^j(n)βj>ϵ)=0\lim_{n \to \infty} P(|\hat{\beta}_j^{(n)} - \beta_j| > \epsilon) = 0

2.5. MÔ HÌNH HỒI QUY SỬ DỤNG NGÔN NGỮ MA TRẬN.

Phần này giúp viết gọn các công thức cho mô hình nhiều biến.

2.5.1. Mô hình và các giả thiết OLS.

Phương trình dạng ma trận: 
Y=Xβ+uY = X\beta + u 
Trong đó: Y là vector (nx1), X là ma trận (nxk), β\beta là vector tham số (kx1), u là vector sai số (nx1).

Các giả thiết dưới dạng ma trận: 
E(uX)=0E(u|X) = 0 
E(uuX)=σ2InE(uu'|X) = \sigma^2 I_n (Phương sai đồng nhất và không tự tương quan). 
- Tồn tại ma trận nghịch đảo (XX)1(X'X)^{-1} (Hạng của ma trận X là k).

2.5.2. Ước lượng OLS và ma trận hiệp phương sai.

Công thức ước lượng hệ số OLS: 
β^=(XX)1XY\hat{\beta} = (X'X)^{-1}X'Y

Ma trận hiệp phương sai của hệ số ước lượng: 
Var(β^X)=σ2(XX)1Var(\hat{\beta}|X) = \sigma^2 (X'X)^{-1} 
Trong thực tế, σ2\sigma^2 được ước lượng bằng σ^2=RSSnk\hat{\sigma}^2 = \frac{RSS}{n-k}.

Tổng kết quan trọng cần nhớ để thi: 
1. OLS là tốt nhất (BLUE) nếu thỏa mãn 4 giả thiết. 
2. Vi phạm giả thiết 2 (nội sinh) -> Ước lượng bị chệch và không vững. 
3. Vi phạm giả thiết 3 (phương sai thay đổi) -> Ước lượng vẫn không chệch nhưng công thức tính sai số chuẩn (SE) bị sai -> Kiểm định t, F không còn tin cậy. 
4. Thêm biến vào mô hình luôn làm tăng R2R^2, nhưng có thể làm giảm độ chính xác của ước lượng nếu biến đó gây ra đa cộng tuyến cao.

Mục lục
2.1. SỰ CẦN THIẾT CỦA MÔ HÌNH HỒI QUY BỘI.
2.1.1. Mô hình hai biến - vấn đề về kỳ vọng sai số khác 0.
2.1.2. Một số ưu việt khác của mô hình hồi quy bội.
2.2. MÔ HÌNH HỒI QUY BỘI VÀ PHƯƠNG PHÁP ƯỚC LƯỢNG OLS.
2.2.1. Mô hình và các giả thiết.
2.2.2. Phương pháp OLS và giải thích kết quả ước lượng.
2.2.3. Độ phù hợp của hàm hồi quy.
2.2.4. Tính tốt nhất của ước lượng OLS - Định lý Gauss-Markov.
2.2.5. Mô hình hồi quy hai biến và mô hình hồi quy bội.
2.3. MỘT SỐ DẠNG CỦA MÔ HÌNH HỒI QUY.
2.4. TÍNH VỮNG CỦA ƯỚC LƯỢNG OLS.
2.5. MÔ HÌNH HỒI QUY SỬ DỤNG NGÔN NGỮ MA TRẬN.
2.5.1. Mô hình và các giả thiết OLS.
2.5.2. Ước lượng OLS và ma trận hiệp phương sai.
Khoá học liên quan
Kiến thức tương tự