Để có thể làm các dạng bài tập biểu diễn dữ liệu bằng biểu đồ sau này, bài viết dưới đây của Cmath sẽ giúp các em làm quen bước đầu với thu thập và phân loại dữ liệu. Bài viết bao gồm các kiến thức trọng tâm của cũng như vận dụng các kiến thức đã học vào giải bài tập. Hãy cùng tìm hiểu các kiến thức toán học thú vị ngay thôi nào!
Thu thập và phân loại dữ liệu
Ta thường thu thập dữ liệu từ các nguồn như: sách báo, tivi, internet, lập phiếu hỏi, phỏng vấn, làm thí nghiệm,…
Dữ liệu được phân thành 2 loại là: Dữ liệu là số (số liệu) và dữ liệu không là số.
- Dữ liệu là số hay còn được gọi với tên gọi là dữ liệu định lượng.
- Dữ liệu không là số còn có tên gọi khác là dữ liệu định tính.
- Dữ liệu không là số lại được chia thành hai loại chính là: Không thể sắp thứ tự và có thể sắp thứ tự.
Ví dụ:
- Chiều cao (đơn vị centimet) của 6 bạn học sinh trong lớp: 148, 153, 140, 160, 146, 155 là số liệu.
- Tên của một số quốc gia: Việt Nam, Thái Lan, Pháp, Lào, Mỹ là dữ liệu không là số và không thể sắp thứ tự.
- Đánh giá học lực của học sinh: Xuất sắc, Giỏi, Khá, Trung bình, Yếu, Kém là dữ liệu không là số và có thể sắp thứ tự.
Tính đại diện của dữ liệu
Dữ liệu thu được phải thỏa mãn tính đại diện cho toàn bộ đối tượng đang được quan tâm.
Nhận xét:
- Để có thể đưa ra kết luận hợp lý, dữ liệu thu được phải đảm bảo tính đại diện cho toàn bộ đối tượng đang được quan tâm.
- Chẳng hạn, khi đối tượng quan tâm là toàn thể học sinh thì không chỉ lấy ý kiến của các bạn nam hoặc chỉ lấy ý kiến của các bạn trong câu lạc bộ Toán học,… mà phải lấy ý kiến của các bạn học sinh được chọn ngẫu nhiên.
Ví dụ: Một hãng hàng không muốn khảo sát ý kiến khách hàng về mức độ hài lòng về chất lượng phục vụ trên chuyến bay đó.
a) Hãng hàng không có cần lấy ý kiến của tất cả hành khách không?
b) Trong hai cách sau, cách nào hợp lý hơn:
Cách 1: Khảo sát ý kiến của 20 hành khách ở khoang hạng thương gia.
Cách 2: Chọn ra 100 hành khách trên chuyến bay và đánh số ngẫu nhiên. Sau đó, xin ý kiến của những hành khách số 5, 10, 15, 20,…, 100.
Lời giải:
a) Không. Hãng hàng không chỉ cần lấy ý kiến của một số hành khách làm đại diện.
b) Theo cách 1, chỉ có hành khách hạng thương gia tham gia khảo sát nên chưa đảm bảo được tính đại diện. Do vây, khảo sát theo cách 2 sẽ hợp lý hơn.
Bài tập thực hành
Bài 1. Tìm hiểu mức độ yêu thích đối với việc đọc sách trong thư viện của 8 bạn học sinh được một trường Trung học cơ sở được cho bởi bảng thống kê sau:
STT |
Tuổi |
Giới tính |
Mức độ yêu thích |
1 |
14 |
Nam |
Thích |
2 |
14 |
Nam |
Rất thích |
3 |
14 |
Nữ |
Không thích |
4 |
12 |
Nữ |
Thích |
5 |
15 |
Nam |
Rất thích |
6 |
14 |
Nữ |
Không quan tâm |
7 |
12 |
Nam |
Không thích |
8 |
14 |
Nữ |
Không quan tâm |
Hãy cho biết:
a) Các loại mức độ thể hiện sự yêu thích đối với việc đọc sách trong thư viện của 8 bạn học sinh trên.
b) Có bao nhiêu bạn học sinh nam và nữ được điều tra?
c) Đâu là dữ liệu định tính, đâu là dữ liệu định lượng?
Lời giải:
a) Các loại mức độ thể hiện sự yêu thích của 8 học sinh đối với việc đọc sách trong thư viện là: không quan tâm, không thích, thích, rất thích.
b) Trong số 8 học sinh được điều tra thì có 4 học sinh nam và 4 học sinh nữ.
c) Dữ liệu về tuổi là dữ liệu định lượng vì dữ liệu này được biểu diễn bằng số.
Dữ liệu về giới tính và mức độ yêu thích là dữ liệu định tính vì dữ liệu này không được biểu diễn bằng số.
Bài 2. Dựa trên các tiêu chí định tính và định lượng, hãy phân loại các dãy dữ liệu sau:
a) Thời gian tự học ở nhà (tính theo giờ) của các học sinh lớp 7: 2, 1,5, 3,…
b) Các môn thể thao yêu thích: bóng đá, cầu lông, đá cầu,…
c) Các món ăn sáng: xôi, bánh mì, cháo,…
d) Điểm kiểm tra môn Ngữ Văn: 5, 6,5, 7,…
Lời giải:
Dữ liệu định tính là dữ liệu được biểu diễn bằng từ ngữ, chữ cái, kí hiệu, tên gọi,…
Dữ liệu định lượng là các dữ liệu được biểu diễn bằng số.
Do đó, trong các dãy dữ liệu kể trên:
- Dữ liệu định tính là: b, c.
- Dữ liệu định lượng là a, d.
Bài 3. Tìm hiểu về khả năng chạy 100m của các bạn học sinh lớp 7C được cho bởi bảng thống kê sau:
Khả năng chạy 100m |
Chưa đạt |
Đạt |
Khá |
Tốt |
Số bạn nam được đánh giá |
3 |
4 |
6 |
7 |
a) Hãy phân loại các dữ liệu trong bảng thống kê trên dựa vào tiêu chí định tính và định lượng.
b) Dữ liệu trên có đại diện cho học sinh lớp 7C được hay không?
Lời giải:
a) Dữ liệu định tính trong bảng là khả năng chạy 100m: chưa đạt, đạt, khá, tốt.
Dữ liệu định lượng trong bảng số liệu trên là số bạn nam được đánh giá: 3, 4, 6, 7.
b) Vì các bạn nữ chưa được đánh giá nên dữ liệu trên chưa đủ để đại diện cho học sinh lớp 7C.
Bài 4. Bảng dưới đây thống kê khả năng viết Email của các bạn học sinh lớp 7A:
Khả năng viết Email |
Chưa biết viết |
Biết viết |
Khá |
Tốt |
Số bạn nữ đạt |
3 |
7 |
5 |
4 |
Hãy phân loại dữ liệu các dữ liệu trong bảng thống kê trên dựa theo tiêu chí định tính và định lượng.
Lời giải:
Dữ liệu định lượng là dữ liệu được biểu diễn bằng số thực.
Dữ liệu định tính là dữ liệu được biểu diễn bằng từ ngữ, tên gọi, kí hiệu,…
Do đó, trong bảng thống kê đã cho:
- Dữ liệu định tính trong bảng thống kê trên là khả năng viết Email: chưa biết viết, biết viết, khá , tốt.
- Dữ liệu định lượng được cho trong bảng là: số bạn nữ đạt: 3, 7, 5, 4.
Bài 5. Tìm điểm chưa hợp lý của dữ liệu trong bảng thống kê sau:
Loại sách |
Tỉ số phần trăm |
Sách giáo khoa |
45% |
Truyện tranh |
20% |
Sách tham khảo |
15% |
Các loại sách khác |
40% |
Lời giải:
Tổng tỉ số phần trăm tất cả các loại sách là:
45% + 20% + 15% + 40% = 120%
Ta thấy: 120% > 100% nên dữ liệu tỉ số phần trăm ở đây chưa hợp lý.
Tham khảo thêm:
Số thập phân – Kiến thức hay Toán 6
Toán 8 – Khái niệm, tính chất về hình lăng trụ đứng và bài luyện tập
Toán 9 – Tất tần tật về phương trình bậc hai một ẩn
Tạm kết
Bài viết trên đây là bước khởi đầu giúp các em làm quen với thu thập và phân loại dữ liệu phục vụ cho việc biểu diễn dữ liệu sau này. Hy vọng qua bài viết các em có thể nắm được cách phân loại dữ liệu. Đây là phần lý thuyết khá đơn giản, chỉ cần tập trung để y là đã có thể dễ dàng nắm được. Chúc các em luôn chăm chỉ và học tốt môn Toán.