Tóm tắt kiến thức chương 2 (P2) - Thống kê xã hội học USSH
Tổng hợp lý thuyết và công thức trọng tâm Chương 2 (Phần 2) giáo trình Thống kê Xã hội học (Đào Hữu Hồ - USSH). Nội dung chi tiết bao gồm: Các bài toán Kiểm định giả thiết (so sánh trung bình, tỷ lệ), Kiểm định phi tham số (Mann-Whitney, Wilcoxon), Kiểm định Chi bình phương (tính độc lập, sự phù hợp) và Phân tích Tương quan - Hồi quy tuyến tính đơn. Tài liệu ôn tập thiết yếu cho sinh viên.
Thống kê xã hội họcUSSHĐào Hữu HồKiểm định giả thiếtHồi quy tuyến tínhTương quan PearsonMann-WhitneyWilcoxonChi bình phươngSo sánh trung bìnhSo sánh tỷ lệ
II.4. MỘT SỐ BÀI TOÁN KIỂM ĐỊNH GIẢ THIẾT ĐƠN GIẢN
II.4.1. Đặt bài toán
Trong thực tế, chúng ta phải ra quyết định dựa trên thông tin không đầy đủ (mẫu). Bài toán kiểm định giả thiết giúp chọn một trong hai tình huống với sai lầm thấp nhất.
- Giả thiết (Null Hypothesis): Tình huống ban đầu, thường chứa dấu bằng (=).
- Đối thiết (Alternative Hypothesis): Tình huống đối lập, thường chứa dấu .
- Quy tắc:
+ Chia miền giá trị mẫu thành 2 phần: (miền bác bỏ ) và (miền chấp nhận ).
+ Nếu giá trị kiểm định thuộc Bác bỏ , chấp nhận .
+ Nếu giá trị kiểm định thuộc Chưa có cơ sở bác bỏ .
Hai loại sai lầm:
- Sai lầm loại I: Bác bỏ khi đúng. Xác suất mắc phải là mức ý nghĩa .
- Sai lầm loại II: Chấp nhận khi sai.
Mục tiêu: Khống chế sai lầm loại I () và cực tiểu hóa sai lầm loại II.
II.4.2. Kiểm định giả thiết về giá trị trung bình
Bài toán: Kiểm định với giá trị .
-
- : có 3 trường hợp ()
Phân loại trường hợp và Công thức kiểm định (Thống kê tiêu chuẩn):
| Trường hợp | Điều kiện | Thống kê tiêu chuẩn |
|---|---|---|
| a | Biết (hoặc đủ lớn) | (Phân phối Chuẩn) |
| b | Chưa biết , X chuẩn | (Phân phối Student ) |
| c | Chưa biết , n lớn | (Xấp xỉ Chuẩn) |
Miền bác bỏ (Quyết định bởi đối thiết K):
- Nếu (kiểm định 2 phía)
- Nếu (kiểm định phía phải)
- Nếu (kiểm định phía trái)
Lưu ý cho sinh viên: Dấu của miền bác bỏ luôn "cùng chiều" với dấu của đối thiết . Ví dụ: dùng dấu thì lấy giá trị dương lớn hơn ().
II.4.3. Kiểm định giả thiết về tỷ lệ
- Bài toán: So sánh tỷ lệ thực với giá trị .
- Giả thiết .
- Thống kê kiểm định (luôn dùng phân phối chuẩn khi lớn):
(Trong đó là tỷ lệ mẫu).
- Miền bác bỏ : Tương tự như kiểm định trung bình (dựa vào là ).
II.4.4. So sánh hai giá trị trung bình
Kiểm định xem hai trung bình và có bằng nhau không.
(hay ).
Các trường hợp tham số (Parametric):
- TH a (Biết hoặc n lớn): Dùng thống kê .
- TH b (Chưa biết , giả thiết bằng nhau, X, Y chuẩn): Dùng thống kê với bậc tự do .
- TH c (Chưa biết , n lớn): Dùng thống kê với sai số chuẩn thay bằng .
Các tiêu chuẩn Phi tham số (Non-parametric):
Dùng khi không thỏa mãn giả thiết phân phối chuẩn hoặc nhỏ.
d) Tiêu chuẩn Mann - Whitney (Hai mẫu độc lập):
- Bước 1: Gộp 2 mẫu, xếp hạng (Rank) từ bé đến lớn.
- Bước 2: Tính tổng hạng .
- Bước 3: Tính và kiểm định dựa trên phân phối xấp xỉ chuẩn của .
e) Tiêu chuẩn Wilcoxon (Hai mẫu phụ thuộc/cặp):
- Bước 1: Tính hiệu . Loại bỏ .
- Bước 2: Xếp hạng trị tuyệt đối .
- Bước 3: Tính tổng hạng của các dương () và âm (). Kiểm định dựa trên .
II.4.5. So sánh hai tỷ lệ
- Bài toán: .
- Thống kê kiểm định:
Trong đó là tỷ lệ chung của mẫu gộp.
II.4.6. Tiêu chuẩn phù hợp (Chi bình phương)
- Mục đích: Kiểm tra xem số liệu mẫu thực tế có phù hợp với một phân phối lý thuyết (các tỷ lệ cho trước) hay không.
- Công thức:
Trong đó: là tần số thực tế, là tần số lý thuyết.
- Miền bác bỏ: .
- Điều kiện dùng: Các tần số lý thuyết .
II.4.7. Kiểm tra tính độc lập
- Mục đích: Kiểm tra xem 2 biến định tính (hoặc định lượng phân nhóm) X và Y có độc lập hay phụ thuộc.
- Bảng tiếp liên (Contingency table) kích thước (hàng cột).
- Tần số lý thuyết của ô .
- Công thức:
- Miền bác bỏ: .
- Kết luận: Nếu thuộc miền bác bỏ Bác bỏ tính độc lập Hai biến có phụ thuộc nhau.
II.4.8. So sánh nhiều tỷ lệ
- Bài toán: .
- Phương pháp: Quy về bài toán kiểm tra tính độc lập với bảng . (Dấu hiệu A và so với s đối tượng).
- Công thức và miền bác bỏ giống hệt mục II.4.7.
II.5. TƯƠNG QUAN VÀ HỒI QUY ĐƠN
Nghiên cứu mối quan hệ phụ thuộc tuyến tính (bậc nhất) giữa 2 biến: .
II.5.1. Hệ số tương quan
- Hệ số tương quan mẫu (): Đo mức độ phụ thuộc tuyến tính.
- Tính chất:
+ .
+ càng gần 1: Tương quan càng chặt chẽ (gần đường thẳng).
+ : Đồng biến (tương quan dương); : Nghịch biến (tương quan âm).
+ : Không có tương quan tuyến tính (nhưng có thể có tương quan phi tuyến).
Bảng đánh giá mức độ tương quan theo :
- : Yếu / Rất yếu.
- : Trung bình.
- : Chặt.
- : Rất chặt.
II.5.2. Đường hồi quy bình phương trung bình tuyến tính
- Là đường thẳng xấp xỉ tốt nhất đám mây số liệu thực tế, dùng để dự báo Y theo X.
- Điều kiện sử dụng tốt: Khi (Tương quan chặt).
- Phương trình đường hồi quy thực nghiệm của Y theo X:
- Hoặc viết dạng: với .
- Sai số dự báo (Sai số bình phương trung bình):
(Nhận xét: càng lớn thì sai số càng nhỏ, dự báo càng chính xác).
2.192 xem 3 kiến thức 3 đề thi

4.472 lượt xem 09/04/2026
11.678 lượt xem 01/10/2025

3.386 lượt xem 11/07/2025
11.850 lượt xem 01/10/2025

15.149 lượt xem 21/11/2025
18.961 lượt xem 14/04/2026
16.064 lượt xem 08/12/2025
17.288 lượt xem 24/12/2025
15.350 lượt xem 25/11/2025

