NGÂN HÀNG ĐỀ THI
NGÂN HÀNG ĐỀ THI
Chương 6 · Lớp 10

Thống kê

17 mục4 loại nội dung

§1. Định nghĩa(9)

1.1

Trung vị $M_e$

Số trung bình và trung vị
Sắp mẫu theo thứ tự không giảm $x_{(1)} \leq x_{(2)} \leq \dots \leq x_{(N)}$:
  • $N$ lẻ: $M_e = x_{(\dfrac{N+1}{2})}$.
  • $N$ chẵn: $M_e = \dfrac{x_{(N/2)} + x_{(N/2 + 1)}}{2}$.
Trung vị ít chịu ảnh hưởng bởi giá trị ngoại lai (outliers).
1.2

Mốt $M_o$

Số trung bình và trung vị
Mốt là giá trị có tần số lớn nhất trong mẫu.
  • Mẫu có thể có 1 mốt (đơn mốt), 2 mốt (lưỡng mốt), hoặc nhiều mốt.
  • Có thể không có mốt nếu mọi giá trị xuất hiện cùng số lần.
Mốt thường dùng cho dữ liệu định tính (màu, loại) hoặc dữ liệu rời rạc.
1.3

Tứ phân vị $Q_1, Q_2, Q_3$

Số trung bình và trung vị
Chia mẫu đã sắp xếp thành 4 phần bằng nhau (mỗi phần ≈ 25% dữ liệu):
  • $Q_2 = M_e$: trung vị.
  • $Q_1$: trung vị của nửa dưới (các phần tử trước $Q_2$).
  • $Q_3$: trung vị của nửa trên (các phần tử sau $Q_2$).
Khoảng tứ phân vị: $\Delta_Q = Q_3 - Q_1$.
1.4

Khoảng tứ phân vị $\Delta_Q$

Phương sai và độ lệch chuẩn
$$\Delta_Q = Q_3 - Q_1.$$ Đo độ phân tán của 50% dữ liệu giữa — không bị ảnh hưởng bởi 25% nhỏ nhất + 25% lớn nhất. Ổn định hơn $R$ và $s$ khi có ngoại lai.
1.5

Giá trị ngoại lai

Phương sai và độ lệch chuẩn
Giá trị $x$ là ngoại lai nếu: $$x < Q_1 - 1.5 \Delta_Q \quad \text{hoặc} \quad x > Q_3 + 1.5 \Delta_Q.$$ Khi mẫu có outliers → ưu tiên dùng trung vị + IQR thay cho mean + variance.
1.6

Khoảng biến thiên $R$

Phương sai và độ lệch chuẩn
$$R = x_{\max} - x_{\min}.$$ Đo phạm vi của mẫu. Nhược điểm: nhạy với 2 giá trị cực.
1.7

Tần số tích lũy

Bảng tần số ghép nhóm
Tần số tích lũy đến nhóm $i$: $$N_i = n_1 + n_2 + \dots + n_i.$$ Cho biết có bao nhiêu phần tử $\leq$ đầu phải của nhóm $i$. Dùng để tìm trung vị, tứ phân vị cho mẫu ghép nhóm.
1.8

Tần số + tần số tương đối

Bảng tần số ghép nhóm
Cho mẫu số liệu kích thước $N$:
  • Tần số $n_i$: số lần xuất hiện của giá trị $x_i$ (hoặc số phần tử trong nhóm $i$).
  • Tần số tương đối: $f_i = \dfrac{n_i}{N}$, thường tính theo %.
  • $\sum n_i = N, \sum f_i = 1$.
1.9

Giá trị đại diện

Bảng tần số ghép nhóm
Giá trị đại diện của nhóm $[a_i; a_{i+1})$ là trung điểm: $$x_i = \dfrac{a_i + a_{i+1}}{2}.$$ Dùng khi tính trung bình + phương sai cho mẫu ghép nhóm — vì không có giá trị thật của từng phần tử.

§2. Công thức(3)

2.1

Số trung bình $\overline{x}$

Số trung bình và trung vị
Mẫu $x_1, x_2, \dots, x_N$: $$\overline{x} = \dfrac{x_1 + x_2 + \dots + x_N}{N} = \dfrac{1}{N} \sum_{i=1}^N x_i.$$ Nếu cho dưới dạng bảng tần số: $\overline{x} = \dfrac{\sum n_i x_i}{N}$ ($n_i$ = tần số của $x_i$).
2.2

Độ lệch chuẩn $s$

Phương sai và độ lệch chuẩn
$$s = \sqrt{s^2}.$$ Cùng đơn vị với số liệu — dễ giải thích hơn $s^2$. $s$ nhỏ → dữ liệu tập trung gần $\overline{x}$; $s$ lớn → dữ liệu phân tán.
2.3

Phương sai $s^2$

Phương sai và độ lệch chuẩn
$$s^2 = \dfrac{1}{N} \sum_{i=1}^N (x_i - \overline{x})^2.$$ Nếu cho bằng tần số: $$s^2 = \dfrac{1}{N} \sum n_i (x_i - \overline{x})^2.$$ Công thức rút gọn: $$s^2 = \overline{x^2} - \overline{x}^2 = \dfrac{\sum x_i^2}{N} - \overline{x}^2.$$

§3. Phương pháp(2)

3.1

Khi nào dùng mean / median / mode

Số trung bình và trung vị
  • Trung bình: mẫu đối xứng, không có giá trị ngoại lai → đại diện chuẩn.
  • Trung vị: mẫu có ngoại lai, phân bố lệch → ổn định hơn.
  • Mốt: dữ liệu định tính (categorical) hoặc khi cần biết 'giá trị phổ biến nhất'.
Nguyên tắc: mean nhạy với outliers, median ổn định.
3.2

Cách ghép nhóm dữ liệu

Bảng tần số ghép nhóm
Khi mẫu lớn / liên tục, chia thành các nhóm $[a_i; a_{i+1})$: Bước 1. Xác định $R = a_{\max} - a_{\min}$. Bước 2. Chọn số nhóm $k$ (thường 5-10) và độ rộng $L = R / k$. Bước 3. Lập bảng các nhóm $[a_i; a_{i+1})$ với độ rộng đều. Bước 4. Đếm tần số mỗi nhóm. Lưu ý: dùng nửa khoảng để mỗi giá trị thuộc đúng 1 nhóm.

§4. Mẹo(3)

4.1

Mẹo: luôn sắp xếp mẫu trước

Số trung bình và trung vị
Trước khi tính median, quartiles: bắt buộc sắp xếp mẫu theo thứ tự tăng dần. Trước khi tìm mode: lập bảng tần số từng giá trị. → Nhiều bài sai vì quên bước sắp xếp.
4.2

Mẹo: dùng công thức rút gọn

Phương sai và độ lệch chuẩn
Thay vì tính $(x_i - \overline{x})^2$ cho từng giá trị (dễ sai số): $s^2 = \dfrac{\sum x_i^2}{N} - \overline{x}^2$. → Chỉ cần tính $\sum x_i$ và $\sum x_i^2$. Phương sai có thể tính trong 1 lần quét dữ liệu — hiệu quả hơn.
4.3

Mẹo: chọn số nhóm phù hợp

Bảng tần số ghép nhóm
  • Mẫu nhỏ ($N < 30$): ít nhóm (3-5), tránh nhóm có 0 phần tử.
  • Mẫu vừa ($30 \leq N \leq 100$): 5-10 nhóm.
  • Mẫu lớn ($N > 100$): 8-15 nhóm.
Quy tắc Sturges: $k \approx 1 + \log_2 N$. Mục tiêu: phân bố thể hiện rõ xu hướng, không quá thưa hay quá dày.
Thống kê — Cẩm nang lớp 10 — NGÂN HÀNG ĐỀ THI · NGÂN HÀNG ĐỀ THI