Tóm tắt kiến thức ôn tập chương 10 - Kinh tế lượng (NEU)
Tổng hợp lý thuyết và công thức cốt lõi Chương 10 Kinh tế lượng (giáo trình NEU) về hồi quy với biến phụ thuộc rời rạc. Nắm vững các mô hình: Xác suất tuyến tính (LPM), Logit, Probit, Tobit và Poisson. Tài liệu ôn tập ngắn gọn, dễ hiểu, so sánh ưu nhược điểm và cách ước lượng từng mô hình, hỗ trợ sinh viên ôn thi hiệu quả.
Kinh tế lượng NEUTóm tắt chương 10Hồi quy biến rời rạcMô hình LogitMô hình ProbitMô hình TobitMô hình PoissonLPMÔn thi Kinh tế lượngBiến phụ thuộc bị giới hạn
10.1. MÔ HÌNH XÁC SUẤT TUYẾN TÍNH (LMP)
10.1.1. Mô hình
Mô hình xác suất tuyến tính (Linear Probability Model - LPM) là dạng đơn giản nhất để xử lý biến phụ thuộc rời rạc (nhị phân, nhận giá trị 0 hoặc 1).
- Phương trình mô hình:
- Trong đó: là biến ngẫu nhiên rời rạc (0 hoặc 1).
- Ý nghĩa kỳ vọng có điều kiện: . Giá trị dự báo của Y chính là xác suất để sự kiện xảy ra (Y=1) tại điều kiện X cho trước.
10.1.2. Các giả thiết của OLS trong LPM
Khi áp dụng OLS cho LPM, ta gặp phải 4 vấn đề vi phạm giả thiết nghiêm trọng:
1. Phương sai sai số thay đổi (Heteroskedasticity): Phương sai của u không hằng số mà phụ thuộc vào X. .
2. Phân phối của sai số không chuẩn: chỉ nhận hai giá trị tương ứng với Y=0 và Y=1, tuân theo phân phối nhị thức, không phải phân phối chuẩn. Tuy nhiên, với mẫu lớn, ước lượng OLS vẫn không chệch và tiệm cận chuẩn.
3. Giá trị dự báo có thể nằm ngoài khoảng [0, 1]: Điều này vô lý về mặt xác suất (xác suất không thể âm hoặc lớn hơn 1).
4. Hệ số thường thấp: Do đường hồi quy tuyến tính khó khớp tốt với các điểm dữ liệu chỉ nằm ở hai cực 0 và 1.
Lưu ý quan trọng cho sinh viên:
| Vấn đề của LPM | Hậu quả | Cách khắc phục tạm thời |
|---|---|---|
| Phương sai thay đổi | Kiểm định t, F không đáng tin cậy | Dùng WLS (Bình phương nhỏ nhất có trọng số) |
| ngoài [0,1] | Dự báo sai ý nghĩa xác suất | Gán nếu < 0, nếu > 1 (hoặc chuyển sang Logit/Probit) |
10.1.3. Ước lượng mô hình LPM
Để khắc phục phương sai thay đổi, quy trình ước lượng gồm 2 bước (Phương pháp bình phương nhỏ nhất có trọng số - WLS):
- Bước 1: Chạy OLS gốc để thu được (ước lượng của ). Loại bỏ các quan sát có hoặc .
- Bước 2: Tính trọng số . Biến đổi mô hình bằng cách chia cả hai vế cho và chạy OLS trên mô hình mới:
10.2. MÔ HÌNH LOGIT
Để khắc phục nhược điểm của LPM (xác suất nằm ngoài [0,1] và quan hệ phi tuyến), người ta dùng hàm phân phối tích lũy Logistic.
10.2.1. Mô hình Logit - phương pháp Goldberger (1964)
- Xác suất được xác định bằng hàm logistic:
- Hàm này đảm bảo với mọi giá trị của X.
- Phương pháp ước lượng: Không dùng OLS mà dùng Ước lượng hợp lý tối đa (MLE).
- Hàm hợp lý (Likelihood function): .
- Tối đa hóa hàm Log-Likelihood bằng các phương pháp lặp (như Newton-Raphson) để tìm .
Ý nghĩa hệ số và tác động biên (Marginal Effect):
Khác với LPM, trong Logit, tác động của lên xác suất p không phải là hằng số mà phụ thuộc vào giá trị của p:
-> Chú ý: Khi giải thích kết quả, không được nói "X tăng 1 đơn vị thì p tăng đơn vị", mà phải tính tại một điểm cụ thể (thường là giá trị trung bình).
10.2.2. Mô hình Logit - phương pháp Berkson (1953)
Phương pháp này dùng cho số liệu đã phân nhóm (grouped data) chứ không phải số liệu cá thể.
- Tuyến tính hóa mô hình bằng logarit của tỷ số odds (Log-odds):
(gọi là Logit).
- Khi số liệu lặp lại lần tại mỗi giá trị , ta dùng tần suất thực nghiệm để thay thế cho .
- Ước lượng: Dùng WLS với trọng số .
10.2.3. Xác suất p, chỉ số OR và ROR
- Odds Ratio (OR): Tỷ số giữa xác suất xảy ra và không xảy ra sự kiện.
- Ý nghĩa: Nếu , khả năng Y=1 gấp 3 lần khả năng Y=0.
- Logit: Chính là .
- Risk Odds Ratio (ROR): So sánh Odds tại hai trạng thái của X (ví dụ và ). Nếu tăng 1 đơn vị, ROR thay đổi một lượng .
10.3. MÔ HÌNH PROBIT
Sử dụng phân phối chuẩn tắc (Standard Normal Distribution) thay vì phân phối Logistic.
- Giả thuyết về biến ẩn (Latent variable) hay độ thỏa dụng :
với
- Quy tắc quyết định:
+ nếu
+ nếu
- Xác suất: (với F là hàm phân phối tích lũy chuẩn tắc).
- Tác động biên: (với f là hàm mật độ chuẩn).
10.4. KIỂM ĐỊNH GIẢ THUYẾT ĐỐI VỚI MÔ HÌNH LOGIT VÀ PROBIT
10.4.1. Kiểm định bằng tỷ số hàm hợp lý (Likelihood Ratio - LR)
Dùng để kiểm định sự phù hợp của mô hình hoặc kiểm định thu hẹp hồi quy (tương tự kiểm định F trong OLS).
- Thống kê kiểm định:
- Phân phối: Xấp xỉ với m là số ràng buộc.
- Độ đo độ phù hợp:
+ Tỷ lệ phần trăm dự báo đúng (So sánh Y thực tế và Y dự báo với điểm cắt c=0.5).
+ Pseudo R-squared: (với là mô hình chỉ có hệ số chặn).
10.4.2 đến 10.4.5. Các kiểm định khác
- Kiểm định sai số chuẩn Huber/White (QML): Dùng cho sai số vững (Robust standard errors) khi có hiện tượng phương sai sai số thay đổi hoặc sai dạng phân phối.
- Kiểm định Hosmer-Lemeshow & Andrews: Kiểm định sự phù hợp của mô hình (Goodness-of-Fit) bằng cách chia dữ liệu thành các nhóm và so sánh tần số thực tế với tần số dự báo (dùng thống kê ).
10.4.6. So sánh mô hình LPM, Logit và Probit
Bảng so sánh nhanh và quy đổi hệ số:
| Đặc điểm | Logit | Probit |
|---|---|---|
| Phân phối nhiễu | Logistic (đuôi dày hơn chuẩn) | Chuẩn tắc (Normal) |
| Quy đổi (Amemiya) |
Lưu ý: Dù hệ số ước lượng khác nhau về độ lớn (do phương sai của Logistic là còn Probit là 1), nhưng ý nghĩa dấu và xác suất dự báo của hai mô hình thường rất tương đồng.
10.5. MÔ HÌNH TOBIT
Dùng cho trường hợp Biến phụ thuộc bị giới hạn (Censored Data): Biến liên tục nhưng bị chặn tại một ngưỡng (thường là 0). Ví dụ: Chi tiêu cho rượu (nhiều người bằng 0), số giờ làm việc.
10.5.1. Mô hình
- Sử dụng biến ngẫu nhiên ẩn (thỏa mãn hồi quy cổ điển với ):
- Quan sát thực tế Y:
nếu
nếu
- Phương pháp ước lượng: MLE (Hợp lý tối đa). Nếu dùng OLS cho toàn bộ mẫu hoặc chỉ mẫu đều sẽ bị chệch.
10.5.2. Kỳ vọng có điều kiện và Tỷ số Mills nghịch đảo
Đây là lý do chính khiến OLS bị chệch. Kỳ vọng của Y với điều kiện là:
- Trong đó: là Tỷ số Mills nghịch đảo (Inverse Mills Ratio), với .
- Ý nghĩa: Nếu bỏ qua mà chạy OLS, ta đang bỏ sót biến, dẫn đến ước lượng chệch.
10.5.3. Ảnh hưởng của biến độc lập
Tác động biên trong Tobit phức tạp hơn OLS:
-> Để so sánh Tobit với OLS, ta nhân hệ số OLS với hệ số điều chỉnh (tỷ lệ quan sát không bị chặn).
10.6. MÔ HÌNH POISSON
Dùng cho biến phụ thuộc là Biến đếm (Count data): Nhận giá trị nguyên không âm (0, 1, 2...). Ví dụ: Số con, số lần bị bắt, số bằng sáng chế.
10.6.1. Mô hình
- Phân phối Poisson được xác định bởi kỳ vọng:
- Xác suất:
- Ý nghĩa hệ số: là bán co giãn (semi-elasticity) hoặc co giãn (nếu log-log). .
- Ước lượng: MLE hoặc Phi tuyến (Non-linear Least Squares).
10.6.2. Kiểm định giả thiết về phân bố Poisson
- Giả thiết quan trọng nhất của Poisson: Kỳ vọng = Phương sai ().
- Vấn đề thường gặp: Sự quá phân tán (Overdispersion), tức là (thường ).
- Kiểm định Cameron & Trivedi hoặc Wooldridge: Kiểm tra xem phương sai có tỉ lệ với giá trị kỳ vọng hay không. Nếu có hiện tượng quá phân tán, cần hiệu chỉnh sai số chuẩn hoặc dùng mô hình khác (như Binomial Neg).
2.285 xem 15 kiến thức 15 đề thi
18.686 lượt xem 07/01/2026

19.444 lượt xem 19/01/2026

3.401 lượt xem 11/07/2025

19.278 lượt xem 19/01/2026
16.594 lượt xem 10/12/2025

7.194 lượt xem 24/06/2025

6.223 lượt xem 11/07/2025
15.084 lượt xem 05/12/2025

4.216 lượt xem 11/07/2025

