• Địa chỉ: 82 Nguyễn Tuân , Thanh Xuân , Hà Nội
  • Hotline: 0973872184 - 0987779734
  • Email: clbcmath@gmail.com

Toán 10 – Phân tích thống kê và xử lý số liệu

25/07/2022 - 07:24 AM - 147 Lượt xem

Trong chương trình toán lớp 10, các em sẽ được làm quen với các phương pháp phân tích, thống kê và xử lý số liệu. Đây là nội dung mới đòi hỏi học sinh phải có sự tập trung nghiên cứu và vận dụng giải các bài tập. Bài viết dưới đây, Cmath cung cấp cho các bạn các kiến thức cơ bản về thống kê và ứng dụng giải các bài tập liên quan. Cùng tìm hiểu nhé.

Kiến thức cần nhớ về thống kê

Để làm tốt các bài tập dạng này, học sinh cần nắm chắc một số kiến thức lý thuyết sau đây:

Bảng phân bố tần số, tần suất

Một số khái niệm cơ bản

  • Tập hợp con hữu hạn các đơn vị điều tra được gọi là mẫu số liệu thống kê.
  • Số các phần tử trong mẫu được gọi là kích thước mẫu.

Chú ý: Trước khi thực hiện điều tra thống kê (theo mục đích định trước), ta cần xác tập hợp các đơn vị điều tra, dấu hiệu điều tra và thu thập các số liệu.

Ví dụ: Số liệu điều tra thống kê điểm kiểm tra môn Toán lớp 10A:

Định nghĩa

Giả sử trong n dãy số liệu thống kê có k giá trị khác nhau ( k ≤ n). Gọi xi là một giá trị bất kỳ trong k giá trị đó, ta có:

  • Tần số là số lần xuất hiện giá trị xi trong dãy số liệu đã cho, kí hiệu là ni.

Ví dụ: Ta thấy trong bảng số liệu đã cho có 7 giá trị khác nhau là: 4, 5, 6, 7, 8, 9, 10.

Giá trị 4 xuất hiện 3 lần => Tần số của giá trị 4 = 3.

  • Số fi = ni/n gọi là tần suất của giá trị xi (tỉ lệ của ni, tỉ lệ phần trăm)

Ví dụ: Giá trị x1 có tần số là 3. Do đó: f1 = 3/45 hay f1 = 5%.

Bảng phân bố tần số, tần suất

Tên dữ liệu

Tần số

Tần suất (%)

x1

x2

.

.

.

xk

n1

n2

.

.

.

nk

f1

f2

.

.

.

fk

Cộng

n1 + … + nk

100%

Chú ý: Nếu bỏ cột tần số thì ta được bảng phân bố tần suất; bỏ cột tần suất thì ta được bảng phân bố tần số.

Bảng phân bố tần số, tần suất ghép lớp

Giả sử ta có p dãy số liệu thống kê được phân vào k lớp ( k < n). 

Xét lớp thứ i bất kỳ trong số k lớp đó, ta có:

  • Số ni các số liệu thống kê thuộc lớp thứ i được tần số của lớp đó.
  • Số fi = ni/n được gọi là tần số của lớp thứ i.

Biểu đồ

Trong chương này các bạn sẽ được tìm hiểu và học cách biểu diễn số liệu bằng biểu đồ. Các dạng biểu đồ thường gặp trong chương trình là: biểu đồ tần suất hình cột, đường gấp khúc tần suất và biểu đồ hình quạt.

Biểu đồ tần suất hình cột

Cách vẽ:

  • Vẽ hai đường thẳng vuông góc. Trên đường thẳng nằm ngang (trục số) ta đánh dấu các khoảng xác định lớp.
  • Tại mỗi khoảng ta dựng lên một hình chữ nhật, với đáy là khoảng đó, và chiều cao bằng tần suất của lớp mà khoảng đó xác định.

Đường gấp khúc tần suất

Cách vẽ: 

  • Vẽ hai đường thẳng vuông góc (như vẽ biểu đồ cột)
  • Trên mặt phẳng tọa độ vừa vẽ, xác định các điểm (ci+1; fi+1), i = 1, 2, 3,…, n
  • Vẽ các đoạn thẳng nối các điểm (ci, fi) với các điểm (ci+1; fi+1) ta thu được 1 đường gấp khúc.
  • Đường gấp khúc này được gọi là đường gấp khúc tần suất.

Biểu đồ hình quạt

Cách vẽ: 

  • Vẽ hình tròn.
  • Chia hình tròn vừa vẽ thành những hình quạt.
  • Mỗi lớp tương ứng với một hình quạt sao cho diện tích của nó tỉ lệ với tần suất của lớp đó.
    Biểu diễn số liệu bằng biểu đồ

    Biểu diễn số liệu bằng biểu đồ

Số trung bình cộng, số trung vị, mốt

Số trung bình cộng

Kí hiệu: X

Bảng phân bố tần suất, tần số:

Tên dữ liệu

Tần số

Tần suất (%)

x1

x2

.

.

.

xk

n1

n2

.

.

.

nk

f1

f2

.

.

.

fk

Cộng

n = n1 + … + nk

100%

Công thức tính trung bình cộng của các số liệu thống kê là:

Trong trường hợp đề bài cho bảng phân bố tần số, tần suất ghép lớp, ta áp dụng công thức:

Trong đó: ci, fi, ni là giá trị đại diện của lớp thứ i.

Ý nghĩa của số trung bình:

Số trung bình là một đặc trưng quan trọng của mẫu số liệu, được dùng làm đại diện cho các số liệu của mẫu.

Số trung vị

Trong trường hợp các số liệu trong mẫu có sự chênh lệch rất lớn với nhau ta chọn số trung vị làm đại diện cho các số liệu trong mẫu thay cho số trung bình.

Định nghĩa: Giả sử ta có dãy n số liệu được sắp xếp thành các dãy không giảm ( hoặc không tăng). Khi đó, số trung vị, kí hiệu là Me, của các số liệu thống kê đã cho được tính bằng:

  • Số ở vị trí giữa dãy số, nếu N có số phần tử lẻ: Me = x(N/2 + 1)
  • Số trung bình cộng của hai số đứng giữa dãy nếu N có số phần tử chẵn:

Mốt

Mốt của bảng phân bố tần số kí hiệu là Mo, là giá trị (xi) có tần số (ni ) lớn nhất.

Chú ý: Trong trường hợp có hai giá trị tần số bằng nhau và có tần số lớn hơn tần số các giá trị khác, thì ta nói bảng phân bố tần số này có hai Mốt, kí hiệu là: Mo1,Mo2.

Chọn giá trị đại diện 

  • Trường hợp các số liệu thống kê cùng loại và số lượng thống kê đủ lớn (n ≥ 30), ta chọn số trung bình làm đại diện cho các số liệu thống kê.
  • Trong trường hợp không tìm được giá trị trung bình, ta chọn Mốt hoặc số trung bình làm đại diện cho các số liệu thống kê.
  • Những trường hợp dưới đây không nên dùng số trung bình làm đại diện cho các số liệu thống kê:
    • Kích thước mẫu khảo sát nhỏ (n ≤ 10).
    • Có sự chênh lệch quá lớn giữa các số liệu thống kê.
    • Đường gấp khúc tần suất không cân xứng.

Phương sai và độ lệch chuẩn là gì?

Hai đơn vị quan trọng nữa trong bài toán thống kê chính là phương sai và độ lệch chuẩn. Hãy tìm hiểu ngay sau đây.

Phương sai

Kí hiệu: sx2

Trong trường hợp đề bài cho bảng phân bố tần số, tần suất, phương sai được tính bằng công thức:

Trường hợp đề bài cho bảng phân bố tần số, tần suất ghép lớp, ta áp dụng công thức sau:

Trong đó, ni, fi, ci lần lượt là tần số, tần suất, giá trị đại diện của lớp thứ i; n là kích thước mẫu; x là số trung bình cộng của các số liệu thống kê đã cho.

Chú ý: Có thể tính phương sai bằng công thức: 

Trong đó:

(đối với bài cho bảng phân bố tần số, tần suất)

hoặc:

(đối với bài cho bảng phân bố tần số, tần suất ghép lớp).

Ý nghĩa phương sai

Phương sai được sử dụng để đánh dấu mức độ phân tán của các số liệu thống kê (so với số trung bình).

Nếu hai dãy số liệu thống kê có số trung bình xấp xỉ nhau, dãy số nào có phương sai nhỏ hơn thì mức độ phân tán của các số liệu thống kê càng bé.

Độ lệch chuẩn

Ta thấy phương sai có đơn vị đo là bình phương của đơn vị đo được nghiên cứu, để tránh tình trạng này ta dùng căn bậc hai của phương sai, gọi là độ lệch chuẩn.

Kí hiệu

Ý nghĩa độ lệch chuẩn

Độ lệch chuẩn cũng dùng để đánh giá mức độ phân tán của các số liệu thống kê. Người ta ưu tiên dùng độ lệch chuẩn để đánh giá. Vì độ lệch chuẩn có cùng đơn vị với dấu hiệu được nghiên cứu.

Phương sai và độ lệch chuẩn là gì?

Phương sai và độ lệch chuẩn là gì?

Bài tập vận dụng

Bài 1. Tiền lãi (nghìn đồng) mỗi ngày trong 30 ngày được khảo sát ở một quầy bán báo được mô tả ở bảng dưới đây:

Lập bảng phân bổ tần suất ghép lớp với các lớp như sau: [29,5; 40,5]; [40,5; 51,5]; [51,5; 62,5]; [62,5; 73,5]; [73,5; 84,5]; [84,5; 95,5].

Lời giải:

Lớp tiền lãi mỗi ngày (nghìn đồng)

Tần số

Tần suất (%)

[29,5; 40,5]

3

10

[40,5; 51,5]

5

16,7

[51,5; 62,5]

7

23,3

[62,5; 73,5]

6

20

[73,5; 84,5]

5

16,7

[84,5; 95,5]

4

13,3

Cộng

30

100 (%)

Bài 2. Khi khảo sát tuổi thọ của 30 bóng đèn điện (đơn vị: giờ) người ta thu được các số liệu thống kê sau:

a) Hãy lập bảng phân bố tần suất, tần số.

b) Dựa vào kết quả ở câu a, hãy đưa ra nhận xét về tuổi thọ của các bóng đèn nói trên.

Phương pháp giải:

Trước hết ta liệt kê các giá trị khác nhau là: 1150, 1160, 1170, 1180, 1190.

Với mỗi giá trị khác nhau vừa tìm được, ta đếm tần số xuất hiện của giá trị ấy.

Tính tần suất tương ứng.

Lời giải:

a) Bảng phân bố tần số, tần suất:

Tuổi thọ

Tần số

Tần suất (%)

1150

3

10

1160

6

20

1170

12

40

1180

6

20

1190

3

10

Cộng

30

100 %

b) Nhận xét: Các bóng đèn trong mẫu khảo sát đa phần có tuổi thọ từ 1160 đến 1180 giờ.

Bài 3. Khi khảo sát độ dài của 60 lá dương xỉ trưởng thành người ta thu được bảng số liệu sau:

Lớp của độ dài (cm)

Tần số

[10; 20)

8

[20; 30)

18

[30; 40)

24

[40; 50)

10

Cộng

60

a) Lập bảng phân bố tần suất ghép lớp

b) Dựa vào kết quả ở câu a, hãy nêu rõ trong 60 lá dương xỉ được khảo sát:

  • Số lá có độ dài nhỏ hơn 30cm chiếm bao nhiêu %?
  • Số lá có độ dài trong khoảng từ 30cm đến 50cm chiếm bao nhiêu %?

Lời giải:

a) Bảng phân bố tần suất ghép lớp

Lớp của độ dài (cm)

Tần suất (%)

[10; 20)

13,3

[20; 30)

30

[30; 40)

40

[40; 50)

16,7

Cộng

100 %

b) Số lá có độ dài dưới 30cm chiếm: 13,3% + 30% = 43,4%

Số lá có độ dài trên 30cm dưới 50cm chiếm: 100% – 43,3% = 56,7%.

Bài tập vận dụng

Bài tập vận dụng

Tham khảo thêm:

Tạm kết

Bài viết trên đây là tổng hợp những kiến thức cơ bản về thống kê, phân tích và xử lý số liệu. Hy vọng qua bài viết các bạn có thể nắm chắc kiến thức về thống kê và vận dụng làm các bài tập liên quan. Chúc các bạn học tốt và đừng quên đón chờ những bài viết mới của Cmath nhé!