Tóm tắt kiến thức chương 1 - Thống kê xã hội học (USSH)

Tổng hợp chi tiết lý thuyết và công thức cốt lõi Chương 1 môn Thống kê xã hội học, biên soạn sát theo giáo trình của GS.TS Đào Hữu Hồ (Trường ĐH KHXH&NV - USSH). Tài liệu hệ thống hóa các nội dung quan trọng: Giải tích tổ hợp, các định nghĩa và công thức tính xác suất, dãy phép thử Bernoulli, biến ngẫu nhiên (rời rạc/liên tục) và các quy luật phân phối xác suất thông dụng (Nhị thức, Siêu bội, Chuẩn, Student, Khi bình phương). Đây là tài liệu ôn tập ngắn gọn, giúp sinh viên nắm bắt nhanh trọng tâm để làm bài tập và thi cử hiệu quả.

Thống kê xã hội họcUSSHChương 1Tóm tắt lý thuyếtXác suất thống kêĐào Hữu HồBiến ngẫu nhiênPhân phối chuẩnÔn thi cuối kỳGiải tích tổ hợpCông thức xác suất

 

1.1. GIẢI TÍCH TỔ HỢP

Đây là công cụ toán học cơ bản để đếm số biến cố sơ cấp. Trong khuôn khổ môn học, cần tập trung kỹ nhất vào Tổ hợpLuật tích.

Tổ hợp (CnkC_{n}^{k})

- Định nghĩa: Lấy ngẫu nhiên kk phần tử từ tập nn phần tử (knk \le n) mà không quan tâm đến thứ tự sắp xếp.
- Công thức: Cnk=n!k!(nk)!C_{n}^{k} = \frac{n!}{k!(n-k)!}
- Quy ước: 0!=10! = 1Cn0=Cnn=1C_{n}^{0} = C_{n}^{n} = 1Cn1=nC_{n}^{1} = n.
- Tính chất: Cnk=CnnkC_{n}^{k} = C_{n}^{n-k} (Chọn lấy ra kk phần tử cũng chính là chọn để lại nkn-k phần tử).

Luật tích (Quy tắc nhân)

- Áp dụng khi một công việc được chia thành nhiều bước liên tiếp (kk bước).
- Nếu bước 1 có n1n_1 cách, bước 2 có n2n_2 cách... thì tổng số cách thực hiện là: n1.n2...nkn_1 . n_2 ... n_k

Lưu ý quan trọng: Phân biệt "Tổ hợp" và "Luật tích":
+ Dùng Tổ hợp khi lấy ra cùng lúc, lấy 1 lần (ví dụ: thò tay bốc 1 nắm 3 viên bi).
+ Dùng Luật tích khi thực hiện nhiều lần, nhiều bước (ví dụ: bốc lần 1, rồi bốc lần 2...).

1.2. PHÉP THỬ VÀ BIẾN CỐ

- Phép thử ngẫu nhiên: Hành động mà kết quả không thể khẳng định chắc chắn trước khi thực hiện.
- Biến cố (Event): Một khả năng/tình huống có thể xảy ra của phép thử.
- Biến cố sơ cấp: Biến cố không thể phân tích nhỏ hơn được nữa.

Loại biến cốKý hiệuĐặc điểm
Biến cố không thểϕ\phiKhông bao giờ xảy ra. Xác suất = 0.
Biến cố chắc chắnΩ\OmegaNhất định xảy ra. Xác suất = 1.
Biến cố ngẫu nhiênA,B,C...A, B, C...Có thể xảy ra hoặc không.

1.3. ĐỊNH NGHĨA XÁC SUẤT (Cổ điển)

- Định nghĩa: Xác suất của biến cố AA, ký hiệu P(A)P(A), là tỷ số giữa số biến cố sơ cấp thuận lợi cho AA và tổng số biến cố sơ cấp của phép thử.
- Công thức: P(A)=Soˆˊ bieˆˊn coˆˊ sơ caˆˊp thuận lợi cho ASoˆˊ bieˆˊn coˆˊ sơ caˆˊp của pheˊp thử=mnP(A) = \frac{\text{Số biến cố sơ cấp thuận lợi cho A}}{\text{Số biến cố sơ cấp của phép thử}} = \frac{m}{n}
- Điều kiện áp dụng: Các biến cố sơ cấp phải có tính đồng khả năng (khả năng xảy ra như nhau).

Tính chất cơ bản:
0P(A)10 \le P(A) \le 1
P(ϕ)=0P(\phi) = 0P(Ω)=1P(\Omega) = 1
P(A)+P(A)=1P(A) + P(\overline{A}) = 1 (với A\overline{A} là biến cố đối lập).

1.4. CÔNG THỨC XÁC SUẤT CỦA TỔNG VÀ TÍCH HAI BIẾN CỐ

Các khái niệm quan hệ

- Tổng (ABA \cup B): AA hoặc BB xảy ra (ít nhất một trong hai xảy ra).
- Tích (ABAB): Cả AA và BB cùng xảy ra.
- Xung khắc: AA và BB không thể cùng xảy ra (AB=ϕAB = \phi).
- Đối lập: A\overline{A} là phần bù của AAAA và A\overline{A} vừa xung khắc vừa tạo thành hệ đầy đủ (AA=ΩA \cup \overline{A} = \Omega).
- Độc lập: Việc xảy ra của AA không ảnh hưởng đến xác suất của BB và ngược lại.

Công thức tính toán

Phép toánTrường hợp tổng quátTrường hợp đặc biệt
Công thức Cộng
(Tính P(AB)P(A \cup B))
P(A)+P(B)P(AB)P(A) + P(B) - P(AB)Nếu A,BA, B xung khắc:
P(AB)=P(A)+P(B)P(A \cup B) = P(A) + P(B)
Công thức Nhân
(Tính P(AB)P(AB))
(Dùng xác suất có điều kiện - ít dùng ở chương này)Nếu A,BA, B độc lập:
P(AB)=P(A).P(B)P(AB) = P(A).P(B)

Mẹo ghi nhớ:
- Thấy từ "Hoặc" / "ít nhất 1" \rightarrow nghĩ đến phép Tổng (++).
- Thấy từ "" / "đồng thời" / "cả hai" \rightarrow nghĩ đến phép Tích (..).
- Khi tính xác suất "có ít nhất một...", nên dùng biến cố đối lập: P(A)=1P(khoˆng coˊ caˊi naˋo)P(A) = 1 - P(\text{không có cái nào}).

1.5. DÃY PHÉP THỬ BERNOULLI

Định nghĩa

Một dãy gồm nn phép thử độc lập được gọi là Bernoulli nếu:
1. Mỗi phép thử chỉ có 2 kết cục: AA (thành công) và A\overline{A} (thất bại).
2. Xác suất xảy ra AA là không đổi trong mọi phép thử: P(A)=pP(A) = p (suy ra P(A)=1pP(\overline{A}) = 1-p).

Công thức Bernoulli

Xác suất để trong nn phép thử, biến cố AA xuất hiện đúng kk lần (hoặc mm lần):
Pn(k;p)=Cnk.pk.(1p)nkP_n(k; p) = C_{n}^{k} . p^k . (1-p)^{n-k}

Số có khả năng nhất (m0m_0)

Là số lần xuất hiện của AA có xác suất lớn nhất trong nn phép thử. Quy tắc tìm m0m_0:
- Tính giá trị: np+p1np + p - 1
- Nếu kết quả là số nguyên: có 2 giá trị m0m_0 là (np+p1)(np + p - 1) và (np+p)(np + p).
- Nếu kết quả là số thập phân: m0m_0 là phần nguyên của kết quả cộng thêm 1: m0=[np+p1]+1m_0 = [np + p - 1] + 1 (hoặc hiểu đơn giản là số nguyên nằm giữa khoảng (npq;np+p)(np-q; np+p)).

1.6. BIẾN NGẪU NHIÊN

Phân loại biến ngẫu nhiên (BNN):

- Rời rạc: Giá trị nhận được là các điểm rời rạc, đếm được (ví dụ: số con cái, số điểm thi). Được xác định bằng Bảng phân phối xác suất.
- Liên tục: Giá trị lấp đầy một khoảng (ví dụ: chiều cao, cân nặng). Được xác định bằng Hàm mật độ xác suất p(x)p(x).

Chú ý: Tổng xác suất trong bảng phân phối rời rạc phải bằng 1 (pi=1\sum p_i = 1). Diện tích dưới đường cong hàm mật độ liên tục phải bằng 1 (p(x)dx=1\int p(x)dx = 1).

1.7. HÀM PHÂN PHỐI

- Định nghĩa: F(x)=P(X<x)F(x) = P(X < x). (Xác suất để BNN nhận giá trị nhỏ hơn xx).
- Tính chất:
+ Miền giá trị: 0F(x)10 \le F(x) \le 1.
+ Là hàm không giảm.
F()=0F(-\infty) = 0F(+)=1F(+\infty) = 1.
+ Công thức quan trọng: P(aX<b)=F(b)F(a)P(a \le X < b) = F(b) - F(a).

1.8. CÁC SỐ ĐẶC TRƯNG CỦA BIẾN NGẪU NHIÊN

1. Kỳ vọng (Expectation - EX)

- Ý nghĩa: Là giá trị trung bình (trung bình có trọng số).
- Công thức (Rời rạc): EX=ixi.piEX = \sum_{i} x_i . p_i
- Tính chất: E(C)=CE(C) = CE(CX)=C.EXE(CX) = C.EXE(X±Y)=EX±EYE(X \pm Y) = EX \pm EY.

2. Phương sai (Variance - DX)

- Ý nghĩa: Đo mức độ phân tán (độ rủi ro, độ lệch) của các giá trị quanh kỳ vọng.
- Công thức tính nhanh: DX=E(X2)(EX)2DX = E(X^2) - (EX)^2
trong đó E(X2)=xi2.piE(X^2) = \sum x_i^2 . p_i (với rời rạc).
- Độ lệch tiêu chuẩn (σ\sigma): σX=DX\sigma_X = \sqrt{DX} (cùng đơn vị đo với biến ngẫu nhiên).
- Tính chất: D(C)=0D(C) = 0D(CX)=C2.DXD(CX) = C^2.DX; Nếu X,YX, Y độc lập thì D(X±Y)=DX+DYD(X \pm Y) = DX + DY.

3. Mode và Median

- Mode (ModX): Giá trị có xác suất lớn nhất (với rời rạc) hoặc hàm mật độ cực đại (với liên tục).
- Median (MedX): Giá trị chia đôi khối lượng xác suất (phần bên trái và bên phải đều là 0.50.5).

1.9. MỘT VÀI PHÂN PHỐI CẦN DÙNG

Phân phốiKý hiệu & Đặc điểmCác số đặc trưng
Nhị thức
(Binomial)
B(n;p)B(n; p)
Dùng cho dãy Bernoulli (nn phép thử, xác suất pp).
EX=n.pEX = n.p
DX=n.p(1p)DX = n.p(1-p)
ModX = Số có khả năng nhất (m0m_0)
Siêu bội
(Hypergeometric)
Lấy nn phần tử từ tập NN phần tử có MM tính chất AA (lấy không hoàn lại).P(X=k)=CMk.CNMnkCNnP(X=k) = \frac{C_M^k . C_{N-M}^{n-k}}{C_N^n}
Chuẩn
(Normal)
N(μ;σ2)N(\mu; \sigma^2)
Hình chuông đối xứng. Phổ biến nhất trong thực tế.
EX=ModX=MedX=μEX = ModX = MedX = \mu
DX=σ2DX = \sigma^2

Lưu ý về Phân phối chuẩn

- Phân phối chuẩn tắc N(0;1)N(0; 1): Là phân phối chuẩn với μ=0,σ=1\mu=0, \sigma=1. Hàm phân phối ký hiệu là Φ(x)\Phi(x) (tra bảng).
- Chuyển đổi: Mọi biến XN(μ;σ2)X \sim N(\mu; \sigma^2) đều có thể chuyển về dạng chuẩn tắc bằng công thức: Z=XμσZ = \frac{X - \mu}{\sigma}.
- Công thức tính xác suất trên đoạn:
P(a<X<b)=Φ(bμσ)Φ(aμσ)P(a < X < b) = \Phi\left(\frac{b-\mu}{\sigma}\right) - \Phi\left(\frac{a-\mu}{\sigma}\right)
(Lưu ý: Φ(x)=1Φ(x)\Phi(-x) = 1 - \Phi(x)).

Các phân phối khác (Dùng trong thống kê suy diễn)

- Phân phối Khi bình phương (χk2\chi^2_k): Liên quan đến tổng bình phương các biến chuẩn tắc.
- Phân phối Student (tkt_k): Dùng khi cỡ mẫu nhỏ, σ\sigma chưa biết. Có hình dạng giống phân phối chuẩn nhưng "thấp" hơn ở đỉnh và "cao" hơn ở 2 đuôi.

Mục lục
1.1. GIẢI TÍCH TỔ HỢP
Tổ hợp (C_{n}^{k})
Luật tích (Quy tắc nhân)
1.2. PHÉP THỬ VÀ BIẾN CỐ
1.3. ĐỊNH NGHĨA XÁC SUẤT (Cổ điển)
1.4. CÔNG THỨC XÁC SUẤT CỦA TỔNG VÀ TÍCH HAI BIẾN CỐ
Các khái niệm quan hệ
Công thức tính toán
1.5. DÃY PHÉP THỬ BERNOULLI
Định nghĩa
Công thức Bernoulli
Số có khả năng nhất (m_0)
1.6. BIẾN NGẪU NHIÊN
1.7. HÀM PHÂN PHỐI
1.8. CÁC SỐ ĐẶC TRƯNG CỦA BIẾN NGẪU NHIÊN
1. Kỳ vọng (Expectation - EX)
2. Phương sai (Variance - DX)
3. Mode và Median
1.9. MỘT VÀI PHÂN PHỐI CẦN DÙNG
Lưu ý về Phân phối chuẩn
Các phân phối khác (Dùng trong thống kê suy diễn)
Khoá học liên quan
Kiến thức tương tự