BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM THÀNH PHỐ HỒ CHÍ MINH
Lê Thị Nga
MỘT NGHIÊN CỨU DIDACTIC VỀ BÀI TOÁN
CHỌN MẪU TRONG DẠY HỌC THỐNG KÊ
Ở TRƯỜNG PHỔ THÔNG
LUẬN VĂN THẠC SĨ KHOA HỌC GIÁO DỤC
Thành phố Hồ Chí Minh – 2019
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM THÀNH PHỐ HỒ CHÍ MINH
Lê Thị Nga
MỘT NGHIÊN CỨU DIDACTIC VỀ BÀI TOÁN
CHỌN MẪU TRONG DẠY HỌC THỐNG KÊ
Ở TRƯỜNG PHỔ THÔNG
Chuyên ngành: Lý luận và phương pháp dạy học bộ môn Toán
Mã số: 60 14 01 11
LUẬN VĂN THẠC SĨ KHOA HỌC GIÁO DỤC
NGƯỜI HƯỚNG DẪN KHOA HỌC:
TS. ĐÀO HỒNG NAM
Thành phố Hồ Chí Minh – 2019
LỜI CAM ĐOAN
Tôi xin cam đoan luận văn này là một công trình nghiên cứu khoa học dưới sự hướng
dẫn của TS. Đào Hồng Nam. Tất cả những trích dẫn trong luận văn này đều hoàn toàn
chính xác và trung thực.
LỜI CẢM ƠN
Tôi xin bày tỏ lòng biết ơn sâu sắc đến TS. Đào Hồng Nam. Hơn cả việc hướng
dẫn, đưa ra những góp ý và giúp tôi hoàn thiện luận văn của mình, thầy đã rất kiên
nhân và bao dung với tôi.
Tôi xin cảm ơn các thầy cô khoa Toán trường Đại học Sư Phạm thành phố Hồ Chí
Minh: PGS.TS. Lê Thị Hoài Châu, PGS.TS. Lê Văn Tiến, PGS.TS. Lê Thái Bảo
Thiên Trung, TS. Vũ Như Thư Hương, TS. Nguyễn Thị Nga, TS. Tăng Minh Dũng
vì đã tận tận giảng dạy cho chúng tôi những kiến thức về Didactic toán, cung cấp
những công cụ cần thiết và hiệu quả cho việc nghiên cứu khoa học.
Tôi xin cảm ơn những anh/chị/bạn lớp Phương pháp Toán Khóa 27 đã luôn đồng
hành, động viên, khích lệ tinh thần và chia sẻ những niềm vui, nỗi buồn cùng nhau.
Cuối cùng, gia đình luôn là nguồn động lực to lớn giúp tôi có thể hoàn thành luận
văn cũng như khóa học của mình. Vì vậy, lời cảm ơn to lớn nhất xin được dành
cho bố mẹ của tôi, những người luôn bên cạnh, ủng hộ tinh thần, vật chật để tôi có
thể hoàn thành chương trình cao học.
Lê Thị Nga
MỤC LỤC
1. Đặt vấn đề ................................................................................................................ 1
1.1. Lý do chọn đề tài ................................................................................................ 1
1.2. Tổng quan công trình nghiên cứu ...................................................................... 3
2. Phạm vi lý thuyết tham chiếu .................................................................................. 4
3. Đối tượng và phạm vi nghiên cứu ........................................................................... 6
3.1. Đối tượng nghiên cứu ........................................................................................ 6
3.2. Phạm vi nghiên cứu ............................................................................................ 6
4. Mục tiêu và câu hỏi nghiên cứu .............................................................................. 7
4.1. Mục tiêu nghiên cứu .......................................................................................... 7
4.2. Câu hỏi nghiên cứu ............................................................................................ 7
5. Phương pháp nghiên cứu và cấu trúc của luận văn ................................................. 7
5.1. Phương pháp nghiên cứu ................................................................................... 7
5.2. Cấu trúc của luận văn ......................................................................................... 9
Chương 1: Một vài cơ sở lý luận liên quan đến chọn mẫu trong thống kê ................... 11
1. Vai trò của chọn mẫu trong thống kê ................................................................ 11
2. Các phương pháp chọn mẫu .............................................................................. 14
2.1. Một số nguyên tắc cơ bản ......................................................................... 14
2.2.
Các phương pháp chọn mẫu ...................................................................... 15
3. Suy rộng kết quả điều tra chọn mẫu .................................................................. 19
3.1.
Bài toán ước lượng .................................................................................... 19
3.2.
Bài toán kiểm định giả thuyết thống kê .................................................... 20
3.3.
Bài toán tính kích thước mẫu .................................................................... 22
3.4.
Suy rộng kết quả điều tra chọn mẫu .......................................................... 23
Tổng kết chương 1 ......................................................................................................... 23
Chương 2: Bài toán chọn mẫu trong sách giáo khoa Toán Việt Nam và Mỹ ............... 25
1. Bài toán chọn mẫu trong dạy học thống kê ở Việt Nam ................................... 25
1.1.
Phân tích chương trình .............................................................................. 25
1.2.
Phân tích SGK ........................................................................................... 27
1.2.1. Về lý thuyết ..............................................................................................29
1.2.2. Các tổ chức toán học ................................................................................32
2. Bài toán chọn mẫu trong dạy học thống kê ở Mỹ ............................................. 40
2.1 Về các bài toán thể hiện được vai trò và điều kiện của việc chọn mẫu ........ 41
2.2 Về các bài toán đề cập đến kĩ thuật chọn mẫu ............................................. 45
2.3 Về các bài toán đề cập đến suy rộng cho quần thể ....................................... 47
Tổng kết chương 2 ......................................................................................................... 49
Chương 3: Thực nghiệm ................................................................................................ 54
1. Đối tượng, thời điểm thực nghiệm .................................................................... 54
2. Mục đích thực nghiệm ....................................................................................... 54
3. Nội dung thực nghiệm ....................................................................................... 54
3.1. Dàn dựng kịch bản: ................................................................................... 57
3.2.
Phân tích tiên nghiệm ................................................................................ 59
3.3.
Phân tích hậu nghiệm ................................................................................ 64
Kết luận .......................................................................................................................... 87
TÀI LIỆU THAM KHẢO ............................................................................................. 89
DANH MỤC CÁC TỪ VIẾT TẮT
GV : Giáo viên
HS : Học sinh
SGK : Sách giáo khoa
SBT : Sách bài tập
SGV : Sách giáo viên
S10NC : Sách giáo khoa Đại số lớp 10 nâng cao
KNV : Kiểu nhiệm vụ
XSTK : Xác suất thống kê
TK : Thống kê
DANH MỤC CÁC BẢNG
Bảng 2.1: Bảng tóm tắt nội dung các bài học trong chương V ........................... 28
Bảng 2.2: Thống kê số lượng bài tập theo từng KNV ........................................ 34
Bảng 2.3: So sánh sự lựa chọn trình bày chọn mẫu trong chương tình dạy học ở
Việt Nam và Mỹ .................................................................................................. 51
Bảng 3.1: Kết quả thống kê dựa trên chiến lược của học sinh ............................ 64
Bảng 3.2: Thống kê chiến lược ở bài toán 1 của các nhóm ................................ 73
Bảng 3.3: Thống kê lựa chọn tờ báo của các nhóm ........................................... 74
1
MỞ ĐẦU
1. Đặt vấn đề
1.1. Lý do chọn đề tài
Lý thuyết xác suất thống kê (XSTK) là một ngành khoa học đang giữ vị trí quan
trọng trong các lĩnh vực đời sống. XSTK giúp chúng ta phân tích số liệu một cách
khách quan và rút ra các tri thức thông tin chứa đựng trong số liệu đó, cho phép ta
có một cơ sở khoa học để đưa ra những dự đoán, quyết định trước một sự việc.
Các kiến thức và phương pháp của XSTK đã hỗ trợ hữu hiệu các nhà nghiên cứu
trong các lĩnh vực khoa học khác như vật lý, hóa học, sinh y học, kinh tế học, xã
hội học… Như vậy có thể nói, XSTK là một trong những ngành khoa học có tính
ứng dụng thực tiễn và thường xuyên bắt gặp trong cuộc sống. Nhận thấy tầm quan
trọng cũng như tính ứng dụng rộng rãi này, XSTK đã được đưa vào chương trình
giảng dạy ở rất nhiều nước, trong đó có Việt Nam. Việc đưa XSTK vào chương
trình giảng dạy không nằm ngoài mục tiêu giáo dục của Bộ Giáo Dục và Đào Tạo,
đó là: Đảm bảo cho học sinh có điều kiện phát huy năng lực cá nhân để lựa chọn
hướng phát triển, tiếp tục học chương trình giáo dục đại học, giáo dục nghề nghiệp
hoặc tham gia lao động, xây dựng và bảo vệ Tổ Quốc (Luật Giáo Dục năm 2019,
điều 29)
Chọn mẫu là khâu đầu tiên trong một nghiên cứu thống kê và có vai trò vô cùng
quan trọng, có ảnh hướng lớn đến kết quả nghiên cứu. Trong thực tiễn, chúng ta
gặp rất nhiều những tình huống đòi hỏi việc chọn mẫu cần phù hợp: Điều tra đặc
trưng của dân số, điều tra chất lượng của các sản phẩm... Dù có áp dụng đúng đắn
các kiến thức về xử lý các số liệu nhưng khâu chọn mẫu không đúng cũng sẽ dẫn
đến kết quả sai. Lê Thị Hoài Châu (2012), đã đưa ra nhiệm vụ đầu tiên mà việc
giảng dạy thống kê cần đạt được:
2
Mọi hoạt động thống kê đều diễn ra trên cơ sở mẫu dữ liệu ban đầu, do đó kết quả
của quá trình phụ thuộc hoàn toàn vào nó. Việc chọn mẫu đóng một vai trò quan
trọng vì đằng sau nó là một hệ quả về tính biến động của các kết quả nhận được, là
những nguy cơ có thể xảy ra khi suy rộng kết quả cho toàn thể. Điều này là một tất
yếu nhưng lại không sẵn có trong nhận thức của mỗi người chúng ta. Nếu không ý
thức được chúng ta sẽ dễ dàng bị đánh lừa trước những thông tin sai lệch, dễ đưa ra
những nhận xét chủ quan, phiến diện về hiện tượng. Do đó dạy học thống kê cần thiết
phải làm cho học sinh nhận thức rõ những điều này. Qua đó hình thành thái độ cẩn
trọng, biết cân nhắc khi làm việc với các mẫu dữ liệu, biết nhận thức kết quả thu
được từ mẫu nhận được có hợp lý và phản ánh chính xác hiện tượng cần quan sát
hay không.
Tuy nhiên, tìm hiểu sơ lược chương trình giảng dạy TK, chúng tôi nhận thấy vấn
đề chọn mẫu chỉ được đề cập đến trong một bài giảng ở chương trình toán lớp 10.
Hiểu được tầm quan trọng của việc chọn mẫu cũng như mục tiêu dạy học thống
kê giúp chúng tôi có những câu hỏi đầu tiên trong việc nghiên cứu của mình: Vấn
đề chọn mẫu được SGK trình bày như thế nào? Việc trình bày này đã đáp ứng
được mục tiêu giảng dạy hay chưa? Học sinh có nắm được tầm quan trọng của
việc chọn mẫu? SGK đã cung cấp những kiến thức hay kĩ thuật gì liên quan đến
chọn mẫu giúp học sinh “không dễ bị đánh lừa trước những thông tin sai lệch”?
Đồng thời trong quá trình tìm kiếm tài liệu tham khảo, chúng tôi được tiếp xúc với
luận văn thạc sĩ của tác giả Quách Huỳnh Hạnh. Trong luận văn này, tác giả đã
đưa ra một giả thuyết nghiên cứu: Học sinh không có nhiệm vụ kiểm tra tính hợp
lý của những kết quả tính được khi giải toán thống kê, tuy nhiên trong phạm vi
khuôn khổ của luận văn, tác giả chưa kiểm chứng được điều này. Việc chọn sai
mẫu cũng là một trong các lý do dẫn đến kết quả suy luận thống kê không hợp lý.
Chúng tôi quan tâm đến việc học sinh sẽ ứng xử như thế nào trước một kết quả
3
thu được từ mẫu? Vì vậy, chúng tôi sẽ xây dựng một tình huống dạy học vừa có
thể kiểm chứng được giả thuyết nghiên cứu đặt ra, vừa khắc phục sự khiếm khuyết
về kĩ thuật chọn mẫu trong dạy học thống kê ở trường phổ thông.
Từ tất cả những ghi nhận trên, chúng tôi thực hiện nghiên cứu:
MỘT NGHIÊN CỨU DIDACTIC VỀ BÀI TOÁN CHỌN MẪU TRONG DẠY
HỌC THỐNG KÊ Ở TRƯỜNG PHỔ THÔNG.
Trong luận văn này, bài toán chọn mẫu mà chúng tôi chọn để nghiên cứu bao gồm
các nội dung: Vai trò của chọn mẫu, các phương pháp chọn mẫu, cách suy rộng
kết quả thu được từ mẫu cho tổng thể.
1.2. Tổng quan công trình nghiên cứu
Với những câu hỏi đặt ra chúng tôi tiến hành thu thập tài liệu và tìm thấy những
tài liệu liên quan sau đây:
Đào Hồng Nam (2014), Dạy học xác suất thống kê ở trường đại học Y, luận án
tiến sĩ: Mặc dù bài toán chọn mẫu không phải là đối tượng nghiên cứu chính của
tác giả, nhưng tác giả cũng đã có 2 kết quả nghiên cứu có liên quan đến bài toán
chọn mẫu. Tác giả đồng ý với việc chọn mẫu là quá trình quan trọng trong nghiên
Chọn mẫu là công việc rất quan trọng của một công trình nghiên cứu. Nếu mẫu
chọn không đại diện được cho quần thể thì nghiên cứu trên mẫu không cho phép
đưa ra những dự đoán thỏa đáng cho mẫu.
cứu:
Đồng thời tác giả cũng đã chỉ ra việc không đảm bảo nguyên tắc lấy mẫu là một
trong các nguyên nhân dẫn đến sự sai lầm trong các nghiên cứu.
Lê Thị Hoài Châu (2012), Dạy học xác suất thống kê ở trường phổ thông: Trong
tài liệu này, bên cạnh việc nhấn mạnh đến tầm quan trọng của bài toán chọn mẫu,
4
tác giả đã nêu ra 2 bài toán gắn với chọn mẫu: Bài toán ước lượng và kiểm định
thống kê. Chúng tôi sẽ sử dụng kết quả này để tìm kiếm các cơ sở lý thuyết liên
quan đến bài toán chọn mẫu.
Đinh Thị Mạnh (2012), Vấn đề chọn mẫu trong thống kê lớp 10, luận văn thạc sĩ
giáo dục: Mặc dù cùng chọn một đối tượng nghiên cứu là chọn mẫu trong thống
kê toán 10, tuy nhiên vấn đề mà tác giả Đinh Thị Mạnh tập trung nghiên cứu là
vai trò của mẫu trong TK và quan tâm tới việc trong dạy học TK lớp 10 vai trò của
mẫu được thể hiện ra sao, có những kiểu nhiệm vụ (KNV) nào giúp học sinh nhận
ra vai trò của mẫu. Bên cạnh đó, tác giả đã cố gắng xây dựng một tình huống giúp
học sinh ý thức được về những kết luận suy ra từ mẫu, từ đó thấy được sự cần thiết
của việc chọn mẫu. Tuy nhiên, tác giả chưa đưa ra những sai lầm trong việc chọn
mẫu hay đề xuất những biện pháp, giới thiệu kĩ thuật chọn mẫu giúp học sinh có
thể giải quyết các bài toán liên quan. Đây cũng là những vấn đề mới mà chúng tôi
sẽ cố gắng tìm kiếm câu trả lời trong nghiên cứu của mình.
2. Phạm vi lý thuyết tham chiếu
Để tìm kiếm công cụ cho phép trả lời những câu hỏi trong đề tài nghiên cứu của
mình, chúng tôi đặt nghiên cứu trong khuôn khổ của lý thuyết Didactic toán, cụ
thể chúng tôi sử dụng:
Công cụ lý thuyết của thuyết nhân học: Mối quan hệ thể chế với tri thức, mối quan
hệ của cá nhân với tri thức, tổ chức toán học. Các công cụ này giúp chúng tôi có
thể trả lời cho câu hỏi: Vấn đề chọn mẫu tồn tại như thế nào trong sách giáo khoa
toán 10? Chương trình dạy học thống kê ở Việt Nam ưu tiên đến những kiểu nhiểm
vụ nào? Những ảnh hưởng, tác động đến học sinh từ sự lựa chọn của thể chế là gì?
5
Công cụ lý thuyết của lý thuyết tình huống: Chúng tôi sử dụng các khái niệm biến,
chiến lược, các pha để tiến hành xây dựng một tình huống thực nghiệm nhằm đạt
được mục đích nghiên cứu của mình.
Các lý thuyết trên đã được trình bày trong cuốn giáo trình song ngữ Việt – Pháp
của Bessot và các cộng sự (2009). Trong phần này, chúng tôi chỉ mô tả ngắn ngọn
một số khái niệm cần tham chiếu của các lý thuyết trên.
Quan hệ thể chế:
Quan hệ R (I, O) của một thể chế I đối với tri thức O là tập hợp các tác động giữa
thể chế I đến tri thức O và ngược lại. Mối quan hệ này cho biết O xuất hiện khi
nào, ở đâu, như thế nào, nội dung và ý nghĩa như thế nào.
Quan hệ cá nhân:
Quan hệ R (X, O) của một cá nhân X với đối tượng tri thức O là tập hợp các tác
động qua lại giữa cá nhân X với tri thức O, nghĩa là X hiểu gì, nghĩ gì, hình dung
ra sao về O, có thể sử dụng O và thao tác O thế nào.
Trong thuyết nhân học, ta công nhận một điều: Mỗi hoạt động của con người như
là việc thực hiện một nhiệm vụ t thuộc kiểu nhiệm vụ T, nhờ một kĩ thuật 𝜏, được
giải thích bằng một công nghệ 𝜃, và công nghệ lại được giải thích dựa vào lý
thuyết Φ. Ta gọi bộ (𝑇, 𝜏, 𝜃, Φ) là một tổ chức tri thức.
Nhiệm vụ, kiểu nhiệm vụ:
Là câu trả lời cho câu hỏi dạng “làm thế nào?” Kiểu nhiệm vụ phải liên quan đến
một đối tượng O đã được xác định rõ và được thể chế xây dựng.
Kỹ thuật:
6
Là cách làm, cách giải quyết T. Trong thể chế I, đối với mỗi kiểu nhiệm vụ T, chỉ
tồn tại một 𝜏 hay cùng lắm là một số ít kỹ thuật 𝜏 được I thừa nhận.
Công nghệ: Mọi kỹ thuật đều cần một công nghệ giải thích nó. Trong thể chế I,
việc tồn tại công nghệ là một điều kiện sinh thái chủ yếu cho sự tồn tại kỹ thuật.
Công nghệ có thể khác nhau tùy vào từng thể chế.
Lý thuyết: Là yếu tố giải thích cho công nghệ, hay nói cách khác, lý thuyết là “công
nghệ của công nghệ”.
Nếu một tổ chức tri thức gắn với toán học, nghĩa là các thành phần của nó mang
bản chất toán học, ta gọi là Tổ chức toán học. Như vậy, để phân tích mối quan hệ
thể chế đối với đối tượng tri thức O, ta có thể chỉ ra tất cả các tổ chức tri thức hay
tổ chức toán học liên quan đến O trong I, đồng thời phân loại, đánh giá chúng.
Biến:
Một biến Didactic là một tham số, có thể nhận nhiều giá trị. Sự thay đổi giá trị của
biến didactic sẽ dẫn đến sự thay đổi thứ tự các chiến lược giải của học sinh. Như
vậy, thông qua sự lựa chọn giá trị của biến didactic, nhà nghiên cứu có thể tạo ra
những thích nghi và những điều chỉnh mong muốn, tức là tạo ra việc học tập. Cụ
thể hơn, giá trị của biến phải được chọn sao cho chiến lược cũ trở nên đắt giá, quá
tốn kém, quá phức tạp hoặc thậm chí dẫn đến sai lầm.
3. Đối tượng và phạm vi nghiên cứu
3.1. Đối tượng nghiên cứu
Bài toán chọn mẫu trong thống kê.
3.2. Phạm vi nghiên cứu
Dạy học thống kê ở trường phổ thông.
7
4. Mục tiêu và câu hỏi nghiên cứu
4.1. Mục tiêu nghiên cứu
Nghiên cứu bài toán chọn mẫu trong dạy học thống kê ở trường phổ thông.
4.2. Câu hỏi nghiên cứu
Trong khuôn khổ của phạm vi lý thuyết tham chiếu đã lựa chọn, các câu hỏi tạo
thành mục đích nghiên cứu của chúng tôi được trình bày lại như sau:
Q1: Các cơ sở lý thuyết liên quan đến chọn mẫu? Có những bài toán liên quan
nào? Có các kĩ thuật chọn mẫu nào? Vai trò của việc chọn mẫu là gì?
Q2: Bài toán chọn mẫu tồn tại như thế nào trong chương trình thống kê ở Việt
Nam? Nhìn sang chương trình giảng dạy khác (chương trình giảng dạy thống kê
của Mỹ), bài toán chọn mẫu được trình bày ra sao? Có sự khác biệt nào trong việc
lựa chọn của những chương trình này?
Q3: Làm thế nào để xây dựng một tình huống dạy học có nội dung về chọn mẫu
để khắc phục những thiếu hụt về kỹ thuật chọn mẫu trong dạy học thống kê ở
trường phổ thông?
5. Phương pháp nghiên cứu và cấu trúc của luận văn
5.1. Phương pháp nghiên cứu
Để có thể đạt được mục tiêu nghiên cứu của mình, chúng tôi áp dụng các phương
pháp nghiên cứu sau:
Phương pháp nghiên cứu lý luận: Chúng tôi sử dụng phương pháp nghiên cứu này
để tìm hiểu cơ sở lý thuyết của bài toán chọn mẫu. Trước hết, chúng tôi nghiên
cứu các cơ sở khoa học của chọn mẫu trong các giáo trình toán XSTK ở bậc đại
học. Cụ thể, chúng tôi nghiên cứu về các kiến thức: Vai trò của chọn mẫu trong
8
thống kê, các phương pháp chọn mẫu và các bài toán có liên quan đến chọn mẫu.
Sau đó, chúng tôi nghiên cứu sự tồn tại của bài toán chọn mẫu trong chương trình
giảng dạy xác suất thông kê ở Việt Nam và Mỹ. Từ sự phân tích này, chúng tôi rút
ra những điểm giống và khác nhau trong sự lựa chọn của hai chương trình, tìm ra
các KNV mới xuất hiện trong thể chế dạy học ở Mỹ nhưng lại không xuất hiện
trong thể chế dạy học ở Việt Nam. Cuối cùng dựa trên kết quả thu được, chúng tôi
tiến hành thực nghiệm nhằm mục đích trả lời cho câu hỏi: Làm thế nào để đưa
KNV này vào trong việc giảng dạy bài toán chọn mẫu?
Phương pháp nghiên cứu thực tiễn: Phương pháp này giúp chúng tôi nhận ra những
quan niệm, sự hiểu biết và cách ứng xử của học sinh đối với bài toán chọn mẫu và
kiểm chứng được giả thuyết đã nêu ra. Từ đó, chúng tôi tiến hành xây dựng tiểu
đồ án để bổ sung một KNV mới bị thiếu vắng trong SGK và cung cấp các kĩ thuật
chọn mẫu cho học sinh.
NGHIÊN CỨU TRI THỨC KHOA HỌC TRONG CÁC GIÁO
TRÌNH ĐẠI HỌC
NGHIÊN CỨU SỰ TỒN TẠI CỦA BÀI TOÁN CHỌN MẪU TRONG CHƯƠNG TRÌNH GIẢNG DẠY THÔNG KÊ Ở VIỆT NAM
NGHIÊN CỨU SỰ TỒN TẠI CỦA BÀI TOÁN CHỌN MẪU TRONG CHƯƠNG TRÌNH GIẢNG DẠY THỐNG KÊ Ở MỸ
XÂY DỰNG THỰC NGHIỆM:
- KIỂM CHỨNG GIẢ THUYẾT - THỰC HIỆN TIỂU ĐỒ ÁN
Chúng tôi tóm tắt phương pháp nghiên cứu của mình như sau:
9
5.2. Cấu trúc của luận văn
Luận văn này bao gồm: Phần mở đầu, 3 chương chính và phần kết luận. Cụ thể:
Phần mở đầu: Chúng tôi dành phần này để giới thiệu về lý do chọn đề tài, tổng
quan các công trình nghiên cứu, mục đích nghiên cứu, khung lý thuyết tham chiếu,
mục tiêu và câu hỏi nghiên cứu, cuối cùng là phương pháp nghiên cứu và cấu trúc
của luận văn.
Chương 1: Một vài cơ sở lý luận liên quan đến chọn mẫu trong thống kê
Trong chương này chúng tôi sẽ tổng kết lại những kết quả nghiên cứu đã được
công bố có nội dung liên quan về chọn mẫu. Cụ thể, chúng tôi quan tâm đến những
bài toán liên quan đến chọn mẫu, các kĩ thuật chọn mẫu, vai trò của việc chọn mẫu.
Thực hiện chương 1 cũng chính là việc trả lời cho câu hỏi Q1 mà chúng tôi đã nêu
ra.
Chương 2: Bài toán chọn mẫu trong sách giáo khoa Toán Việt Nam và Mỹ
Bên cạnh việc phân tích sự tồn tại của bài toán chọn mẫu trong chương trình dạy
học ở Việt Nam - bằng việc phân tích chương trình giảng dạy và SGK toán 10
nâng cao, chúng tôi còn phân tích sự tồn tại của bài toán chọn mẫu trong một
chương trình khác, cụ thể là chương trình dạy học ở Mỹ - bằng việc phân tích giáo
trình Mathematics in Context của tác giả Hold, Rinehart và Winston. Từ việc xem
xét sự tồn tại của bài toán chọn mẫu trong các chương trình khác nhau, chúng tôi
sẽ thấy được mối quan tâm của các thể chế dành cho bài toán chọn mẫu là gì, từ
đó có những so sánh cần thiết phục vụ cho nghiên cứu của mình.
Kết quả nghiên cứu của chương 2 cũng chính là câu trả lời cho câu Q2.
Chương 3: Thực nghiệm
10
Chúng tôi sẽ xây dựng một tình huống dạy học mà ở đó việc chọn mẫu không
phù hợp đặt người học phải kiểm tra tính đúng đắn của kết quả. Thực hiện
thành công việc này đồng nghĩa với việc trả lời cho câu hỏi Q4 - Kiểm chứng
giả thuyết được nêu ra ở chương 2. Đồng thời, chúng tôi xây dựng một tình
huống để bổ sung các tổ chức toán học về chọn mẫu đã bị thiếu vắng trong thể
chế dạy học XSTK bậc phổ thông Việt Nam.
Phần kết luận: Chúng tôi tổng kết lại những kết quả mà luận văn đã đạt được bằng
việc trả lời 4 câu hỏi nghiên cứu đã được nêu ra trong phần mở đầu.
11
Chương 1: Một vài cơ sở lý luận liên quan đến chọn mẫu trong thống kê
Việc thực hiện chương 1 đồng nghĩa với việc chúng tôi đi tìm kiếm câu trả lời cho
câu hỏi:
Q1: Các cơ sở lý thuyết liên quan đến chọn mẫu? Có những bài toán liên quan
nào? Có các kĩ thuật chọn mẫu nào? Vai trò của việc chọn mẫu là gì?
Chúng tôi tìm kiếm câu trả lời cho câu hỏi này bằng việc tham khảo các giáo trình
về XSTK ở các trường đại học và các luận văn đã bảo vệ thành công trước đó. Cụ
thể, chúng tôi đã lựa chọn các tài liệu tham khảo sau:
Lê Thị Hoài Châu (2005), Dạy học xác suất thống kê ở trường trung học phổ
thông, nhà xuất bản đại học Sư Phạm.
Ngô Văn Thứ (2005), Thống kê thực hành, nhà xuất bản Khoa Học và Kĩ Thuật.
Đinh Thị Mạnh (2013), Nghiên cứu về bài toán chọn mẫu ở thống kê lớp 10, luận
văn thạc sĩ, trường Đại học Sư Phạm TPHCM.
Hoàng Ngọc Nhậm (2007), Lý thuyết xác suất và thống kê toán, nhà xuất bản thành
phố Hồ Chí Minh.
1. Vai trò của chọn mẫu trong thống kê
Trong quá trình nghiên cứu về vai trò của mẫu, chúng tôi tìm được luận văn của
tác giả Đinh Thị Mạnh đã trình bày về nội dung này. Chúng tôi sẽ tổng kết lại
những kết quả nghiên cứu của tác giả dựa trên sự chọn lọc của mình như sau:
Khi thống kê chỉ đơn giản là việc thu thập và biểu diễn số liệu, chúng ta không
cần đến khái niệm mẫu hay mẫu số liệu. Tuy nhiên khi cuộc sống xã hội nảy sinh
những vấn đề mới như: Dân số ở các quốc gia ngày càng gia tăng, phạm vi lãnh
thổ được mở rộng thì kích thước tổng thể, quy mô của các cuộc điều tra cũng ngày
12
một lớn; thêm nữa, sự phát triển của nhiều lĩnh vực khoa học kĩ thuật, công nghệ
sản xuất kéo theo sự đa dạng, phong phú của nhiều chủng loại hàng hóa cung cấp
ra thị trường. Vấn đề chất lượng sản phẩm đòi hỏi phải có những công cuộc kiểm
tra nghiêm ngặt, nhưng với những cuộc kiểm nghiệm như vậy các sản phẩm lại vô
tình bị phá hủy. Lúc này, việc thu thập và xử lý mẫu số liệu bắt đầu gặp nhiều khó
khăn và không còn phù hợp. Điều tra toàn bộ bắt đầu bộc lộ nhiều điểm hạn chế
do không phải lúc nào cũng có tính khả thi trong thực tế, chẳng hạn như: Các
trường hợp tổng thể điều tra quá rộng dẫn đến khi điều tra tốn kém nhiều về nhân
lực, các trường hợp không thể xác định được hết các đơn vị của tổng thể, các
trường hợp điều tra dẫn đến phá hủy các đơn vị điều tra…Với những nỗ lực khắc
phục những hạn chế này của điều tra toàn bộ, vào thế kỷ 17 phương pháp điều tra
chọn mẫu ra đời. Mầm mống nảy sinh từ những ý đồ ngoại suy đầu tiên của nhà
kinh tế học người Anh William Petty (1623 – 1687), sau đó được phát triển và
hoàn thiện cơ sở lý luận. Nội dung của phương pháp chọn mẫu đã được nhiều tác
giải trình bày. Theo Hoàng Ngọc Nhậm (2010), Lý thuyết xác suất và thống kê
“Từ tổng thể ta chọn ra n phần tử và tiến hành thu thập thông tin trên chúng, n
phần tử này lập nên một mẫu. Số phần tử của mẫu được gọi là kích thước mẫu.
Thông thường kích thước mẫu nhỏ hơn nhiều so với kích thước của tổng thể nên
việc tổ chức thu thập và xử lý thông tin trên mẫu dễ dàng và nhanh chóng. Kết
quả thu được sau đó sẽ được dùng để suy rộng cho tổng thể nhờ vào các phương
pháp toán học (đặc biệt là lý thuyết xác suất).”
toán:
Trong một giáo trình khác, Ngô Văn Thứ (2005), Thống kê thực hành, nhà xuất
bản Khoa học và Giáo Dục, nội dung cơ bản của chọn mẫu được mô tả:
13
“Giả sử cần nghiên cứu sự vận động của một hiện tượng, người ta có thể mô hình
hóa hiện tượng này nhờ một biến ngẫu nhiên X (một chiều hay nhiều chiều). Với
một mẫu ngẫu nhiên W(X) lập từ biến ngẫu nhiên gốc X, thiết lập các mô hình
nhờ các thống kê – các hàm của thành phần mẫu – thích hợp. Với các thống kê
này có thể tiến hành các ước lượng, kiểm định, dự báo và các phân tích khác đối
với X theo các yêu cầu cho trước.”
Sự ra đời của phương pháp mẫu là một thành tựu lớn trong lịch sử phát triển của
khoa học TK, giúp cho các cuộc điều tra trên tổng thể lớn hay thậm chí không thể
xác định được số lượng điều tra trở nên dễ thực hiện hơn, tiết kiệm được nhân lực
và ít tốn kém hơn. Không những thế, bằng việc áp dụng lý thuyết Xác Suất, chúng
ta còn có thể suy rộng kết quả thu được trên mẫu cho toàn bộ tổng thể với một
mức độ tin cậy và mức độ chính xác có thể chấp nhận được. Chính vì những lợi
ích và ý nghĩa to lớn mà phương pháp chọn mẫu mang lại, ngày nay phương pháp
này càng trở nên phổ biến và được áp dụng rộng rãi. Ngô Văn Thứ (2005), cũng
đã ra các lý do khiến việc sử dụng phương pháp chọn mẫu trở nên phổ biến:
Thứ nhất: Các vấn đề cần nghiên cứu, đặc biệt là trong các lĩnh vực kinh tế xã hội
thường tồn tại ở các tổng thể lớn, động. Khả năng nghiên cứu toàn bộ không hiện
thực, do thời gian và kinh phí không cho phép. Trong rất nhiều trường hợp người
ta cũng không thể biết chính xác kích cỡ của tổng thể.
Thứ hai: Thông tin dựa trên các biểu hiện hay sự hiểu biết của con người về một
vấn đề hay một nhóm nghiên cứu tại một thời điểm hay trong khoảng thời gian là
hữu hạn. Về mặt thông tin người ta thấy rằng lượng tin thực tế không tuyến tính
với số lượng đối tượng cấp tin. Có thể thấy rằng lượng tin tăng thêm khi số quan
sát đã đủ lớn hầu như không đáng kể. Như vậy, không nhất thiết phải khảo sát toàn
bộ tổng thể.
14
Thứ ba: Với những thành tựu của lý thuyết xác suất và thống kê toán, người ta có
đủ các công cụ, các mô hình mà nhờ đó những thông tin từ mẫu có thể suy diễn
cho tổng thể với độ chính xác ước lượng được. Điều đó cho phép chúng ta đặt
trước các yêu cầu về độ chính xác trong các ước lượng làm căn cứ cho việc xác
định độ lớn của mẫu.
Một mẫu sau khi được chọn sẽ là một bộ phận của tổng thể nên ta có thể chọn
được rất nhiều mẫu khác nhau. Vì vậy kết quả thu được sau khi phân tích dựa trên
các mẫu là khác nhau. Hệ quả của sự thay đổi thông tin trên mẫu là những rủi ro,
những sai lầm có thể gặp phải khi đưa ra những kết luận cho tổng thể dựa vào quan
sát mẫu. Hiển nhiên những rủi ro và sai lầm này không thể loại bỏ, nhưng có thể
khắc phục đến một mức nào đó. Điều này đòi hỏi mẫu phải đại diện được cho quần
thể. Vì vậy các nhà TK cần tìm cách xây dựng và phát triển các nguyên tắc cũng
như các phương pháp chọn mẫu nhằm đạt được mục tiêu chọn mẫu đại diện tốt
cho quần thể để có thể suy rộng ra cho toàn bộ.
2. Các phương pháp chọn mẫu
2.1. Một số nguyên tắc cơ bản
Để đảm bảo mẫu được chọn có thể đại diện tốt cho quần thể để có thể suy rộng
cho quần thể với mức rủi ro thấp nhất thì việc chọn mẫu cần phải dựa trên các điều
kiện, tiêu chuẩn sau:
Tính ngẫu nhiên: Tính ngẫu nhiên là một trong các yêu cầu quan trọng nhất, đảm
bảo tính chất không chệch của suy diễn thống kê, cũng như các mô tả thống kê.
Một cách đơn giản, tính chất này đòi hỏi khả năng mỗi cá thể trong tổng thể hay
trong một bộ phận của tổng thể có thể được chọn như nhau. Trong một số phương
15
pháp chọn mẫu cụ thể, tính chất này có thể phụ thuộc rất nhiều vào mục đích,
phạm vi sử dụng số liệu mẫu cho phân tích và dự báo thống kê.
Tính đại diện: Tính đại diện thường được xác định trên cơ sở yêu cầu về mức tin
cậy của các phân tích thống kê như ước lượng, kiểm định… Với những tổng thể
lớn có phân thành những bộ phận khác nhau và phân tích thống kê ở nhiều cấp thì
tính đại diện cần được lưu ý từ cấp thấp nhất.
Tính đồng nhất: Vì mỗi đối tượng cung cấp thông tin là một tác nhân xã hội nên
ngoài những gì làm cho đối tượng này trở thành cá thể thống kê thì còn khá nhiều
thuộc tính riêng. Các thuộc tính riêng nói chung có ảnh hưởng đến đối tượng. Đặc
điểm này đòi hỏi khi chọn mẫu phải chú ý đến tính thuần nhất về môi trường kinh
tế xã hội của cá thể.
Tính phổ biến: Trong nhiều trường hợp người điều tra có cảm giác rằng một số cá
thể thống kê có những tính chất ngoại lệ so với phần đông các cá thể khác. Các cá
thể này có thể thuộc đối tượng chọn mẫu hoặc loại khỏi đối tượng chọn mẫu tùy
thuộc vào tính đồng nhất của chúng với tổng thể. Tuy nhiên, hầu hết các trường
hợp cần có những xử lý riêng biệt cho chúng. Đảm bảo tính phổ biến, nhằm làm
cho phân tích thống kê nhận biết dễ dàng hơn bản chất của tổng thể về một mặt
hay một phương diện đang nghiên cứu.
2.2. Các phương pháp chọn mẫu
Mục đích của tất cả các phương pháp lấy mẫu là đạt được mẫu đại diện cho cả
quần thể nghiên cứu. Khi chọn phương pháp lấy mẫu thì cần tìm hiểu rõ các đặc
tính của quần thể nghiên cứu để xác định cỡ mẫu quan sát đại diện và đánh giá
tương đối chính xác quần thể. Có 2 phương pháp chọn mẫu: (1) chọn mẫu không
xác suất (không chú ý tới độ đồng đều, nghĩa là mỗi cá thể trong tổng thể không
16
có cơ hội được chọn như nhau) và (2) chọn mẫu xác suất (đề cập đến độ đồng đều,
nghĩa là mỗi cá thể trong tổng thể có cơ hội được chọn như nhau).
Chọn mẫu không xác suất
Phương pháp chọn mẫu không xác suất là cách lấy mẫu trong đó các cá thể của
mẫu được chọn không ngẫu nhiên hay không có xác suất lựa chọn giống nhau.
Điều này thể hiện trong cách chọn mẫu như sau:
- Các đơn vị mẫu được tự lựa chọn mà không có phương pháp.
- Các đơn vị mẫu rất dễ dàng đạt được hoặc dễ dàng tiếp cận. Ví dụ: chọn
những hộ trên những con đường dễ đi.
- Các đơn vị mẫu được chọn theo lý thuyết do kinh tế. Ví dụ: trả tiền cho sự
tham dự.
- Các đơn vị mẫu được quan tâm bởi người nghiên cứu trong danh sách điển
hình của quần thể mục tiêu. Ví dụ: người nghiên cứu chỉ quan tâm đến các
nhân vật điển hình trong quần thể nghiên cứu, để so sánh với các nhân vật
khác.
- Các đơn vị mẫu được chọn mà không có sự thiết kế rõ ràng. Ví dụ: chọn 50
người đầu tiên đến buổi sáng.
Phương pháp chọn mẫu không xác suất thường có độ tin cậy thấp. Mức độ chính
xác của cách chọn mẫu không xác suất tùy thuộc vào sự phán đoán, cách nhìn,
kinh nghiệm của người nghiên cứu, sự may mắn hoặc dễ dàng và không có cơ sở
thống kê trong việc chọn mẫu.
Chọn mẫu xác suất
Cơ bản của việc chọn mẫu xác suất là cách lấy mẫu trong đó việc chọn các cá thể
của mẫu có cơ hội như nhau, nếu như có một số cá thể có cơ hội xuất hiện nhiều
17
hơn thì sự lựa chọn không phải là ngẫu nhiên. Để tối ưu hóa mức độ chính xác,
người nghiên cứu thường sử dụng phương pháp lấy mẫu ngẫu nhiên.
Các phương pháp chọn mẫu ngẫu nhiên
- Chọn mẫu ngẫu nhiên đơn giản
Cách đơn giản nhất của việc chọn các cá thể của mẫu trong cách chọn mẫu ngẫu
nhiên là sử dụng xác suất. Việc lựa chọn n các cá thể từ một quần thể sao cho các
cá thể có cơ hội bằng nhau hay một xác suất bằng nhau trong phương pháp này.
Ví dụ : Một trường học có 1000 sinh viên, người nghiên cứu muốn chọn ra 100
sinh viên để nghiên cứu về tính trạng sức khỏe trong số 1000 sinh viên. Theo cách
chọn mẫu đơn giản thì chỉ cần viết tên 1000 sinh viên vào trong mẫu giấy nhỏ, sau
đó bỏ tất cả vào môt cái thùng và rút ngẫu nhiên ra 100 mẫu giấy. Như vậy, mỗi
100
sinh viên có một cơ hội lựa chọn như nhau và xác suất chọn ngẫu nhiên một sinh
100×1000
viên trên dễ dàng được tính bằng công thức = 10%.
Một cách chọn ngẫu nhiên khác là sử dụng bảng số ngẫu nhiên trong sách thống
kê phép thí nghiệm hoặc cách chọn số ngẫu nhiên bằng cách chương trình thống
kê trên máy tính.
- Chọn mẫu phân lớp
Chọn mẫu phân lớp : Chọn mẫu phân lớp được thực hiện khi quần thể mục tiêu
được chia thành các nhóm hay phân lớp. Trong phương pháp lấy mẫu phân lớp,
tổng thể (N) đầu tiên được chia ra thành L lớp của các quần thể phụ N1, N2, … ,
NL, như vậy:
𝑁 = 𝑁1 + 𝑁2 + 𝑁3 … + 𝑁𝐿
Để áp dụng kỹ thuật chọn mẫu phân lớp thì trước tiên người nghiên cứu cần nắm
các thông tin và số liệu nghiên cứu trước đây có liên quan đến cách lấy mẫu có
18
phân lớp. Sau đó, người nghiên cứu xác định cỡ mẫu và chọn ngẫu nhiên các cá
thể trong mỗi lớp.
- Chọn mẫu hệ thống :
Đôi khi các đơn vị ngẫu nhiên không tốt hơn cách chọn mẫu hệ thống. Trong chọn
mẫu hệ thống, cỡ mẫu n được chọn (có phương pháp tính xác suất tương tự) từ
một tổng thể N. Cách lấy mẫu hệ thống là khung mẫu giống như là 1 hàng của các
đơn vị mẫu, và mẫu như là một chuỗi liên tiếp của các điểm số có khoảng cách
bằng nhau theo hàng dọc. Trước tiên lập danh sách các đơn vị của tổng thể chung
theo một trật tự quy ước nào đó, sau đó đánh số thứ tự các đơn vị trong danh sách.
Đầu tiên chọn ngẫu nhiên 1 đơn vị trong danh sách; sau đó cứ cách đều k đơn vị
lại chọn ra 1 đơn vị vào mẫu, cứ như thế cho đến khi chọn đủ số đơn vị của mẫu.
Ví dụ: Dựa vào danh sách bầu cử tại 1 thành phố, ta có danh sách theo thứ tự vần
của tên chủ hộ, bao gồm 240.000 hộ. Ta muốn chọn ra một mẫu có 2000 hộ. Vậy
khoảng cách chọn là: k= 240000/2000 = 120, có nghĩa là cứ cách 120 hộ thì ta
chọn một hộ vào mẫu.
- Chọn mẫu chỉ tiêu :
Trong cách chọn mẫu chỉ tiêu, quần thể nghiên cứu được phân nhóm hoặc phân
lớp như cách chọn mẫu phân lớp. Các đối tượng nghiên cứu trong mỗi nhóm được
lấy mẫu theo tỷ lệ đã biết và sau đó tiến hành phương pháp chọn mẫu không xác
suất. Để thiết lập mẫu chỉ tiêu, người nghiên cứu cần phải biết ít nhất các số liệu,
thông tin trong quần thể mục tiêu để phân chia các chỉ tiêu muốn kiểm soát. Thuận
lợi của việc lấy mẫu chỉ tiêu áp dụng trong một vài nghiên cứu là chi phí thực hiện
nghiên cứu tương đối thấp và dễ thực hiện. Bất lợi của việc lấy mẫu chỉ tiêu là
không đại diện toàn bộ quần thể, do lấy mẫu không xác suất như chọn ưu tiên
phỏng vấn khách du lịch đến trước, chọn nơi có nhiều khách lui tới, khách ở khách
19
sạn, … và vì vậy mức độ tin cậy phụ thuộc vào kinh nghiệm hay sự phán đoán của
người nghiên cứu và sự nhiệt tình của người trả lời phỏng vấn. Để tăng mức độ tin
cậy, người nghiên cứu cần thực hiện cuộc phỏng vấn bước đầu để kiểm tra người
trả lời có rơi vào các chỉ tiêu hay không. Chọn mẫu chỉ tiêu ít được áp dụng trong
các nghiên cứu phát triển, nhưng đôi khi được sử dụng trong một vài nghiên cứu
nhỏ mang các đặc tính quan sát.
- Chọn mẫu không gian
Người nghiên cứu có thể sử dụng cách lấy mẫu này khi hiện tượng, sự vật được
quan sát có sự phân bố mẫu theo không gian (các đối tượng khảo sát trong khung
mẫu có vị trí không gian 2 hoặc 3 chiều). Ví dụ lấy mẫu nước sông, đất ở sườn
đồi, hoặc không khí trong phòng. Cách chọn mẫu như vậy thường gặp trong các
nghiên cứu sinh học, địa chất, địa lý. Lấy mẫu theo sự phân bố này yêu cầu có sự
giống nhau về không gian qua các phương pháp ngẫu nhiên, hệ thống và phân lớp.
Kết quả của một mẫu chọn có thể được biểu diễn như một loạt các điểm trong
trong không gian hai chiều, giống như là bản đồ.
3. Suy rộng kết quả điều tra chọn mẫu
Các công cụ được sử dụng trong suy rộng kết quả từ mẫu cho quần thể :
3.1. Bài toán ước lượng
Điều tra toàn bộ bộc lộ những hạn chế khi tổng thể trở nên quá rộng lớn hoặc khó
xác định chính xác các đơn vị điều tra. Khi đó để tìm hiểu một dấu hiệu nào đó
của tổng thể, người ta căn cứ trên một mẫu nhỏ rồi dùng các phương pháp toán
học để suy rộng kết quả đó cho tổng thể. Bài toán như thế được gọi là bài toán ước
lượng.
20
Khi muốn nghiên cứu về một dấu hiệu 𝑋∗ của một tổng thể bằng cách ước lượng,
người ta mô hình hóa dấu hiệu 𝑋∗ bằng một đại lượng ngẫu nhiên X (X là giá trị
của 𝑋∗đo được trên một phần tử). Bài toán ước lượng theo Hoàng Ngọc Nhậm
Cho đại lượng ngẫu nhiên X có thể đã biết hoặc chưa biết quy luật phân phối xác
suất và chưa biết tham số 𝜃 nào đó của nó. Hãy ước lượng 𝜃 bằng phương pháp mẫu.
(2007), tr.178 được phát biểu như sau:
Giá trị của 𝜃 có thể được ước lượng bằng một trong hai cách:
Ước lượng điểm: Chỉ ra một con số cụ thể làm giá trị ước lượng của 𝜃 (con số này
là giá trị của hàm ước lượng tính được trên một mẫu cụ thể nào đó được chọn ra
từ hệ thống). Để đánh giá chất lượng của ước lượng điểm, người ta đưa ra nhiều
tiêu chuẩn lựa chọn hàm ước lượng, trong đó có thể kể đến một số tiêu chuẩn phổ
biến như ước lượng không chệch, ước lượng hiệu quả, ước lượng vững…
Ước lượng khoảng: Không đưa ra một số cụ thể như ước lượng điểm, nhưng chỉ
ra một khoảng (gọi là khoảng tin cậy) chứa giá trị cần ước lượng. Với phương
pháp này, ta có thể xác định được độ tin cậy cũng như độ chính xác của ước lượng
bằng cách chọn một mẫu có kích thước đảm bảo đạt được độ tin cậy và độ chính
xác cho trước. Tuy nhiên, khi ta nói rằng ước lượng này có độ tin cậy là 1 − 𝛼 thì
cũng đồng nghĩa với khẳng định ước lượng này có độ rủi ro là 𝛼.
3.2. Bài toán kiểm định giả thuyết thống kê
Hàng ngày chúng ta tiếp nhận rất nhiều các thông tin, tuy nhiên không phải thông
tin nào cũng chính xác và đáng tin cậy. Để có thể sàng lọc thông tin, trả lời cho
câu hỏi đúng hay không chúng ta cần thực hiện các kiểm chứng. Khi đó, các nhận
định được đưa ra và cần kiểm chứng được gọi là các giả thuyết; còn việc kiểm tra
xem có thể chấp nhận hay bác bỏ các nhận định đó được gọi là kiểm chứng giả
21
thuyết. Nếu giả thuyết liên quan đến các số đặc trưng của tổng thể hay quy luật
phân phối xác suất của các tham số này thì ta có khái niệm giả thuyết thống kê
(còn được gọi là giả thuyết không và thường được kí hiệu là 𝐻0) và kiểm định khi
đó được gọi là kiểm định giả thuyết thống kê.
Nội dung trong phần này được chúng tôi tổng hợp lại từ kết quả nghiên cứu của
tác giả Lê Thị Hoài Châu đã được công bố trong “Dạy học xác suất – thống kê ở
trường phổ thông” và luận văn thạc sĩ của tác giả Đinh Thị Mạnh (2013):
Bài toán kiểm định giả thuyết TK được phát biểu như sau: Cho biến ngẫu nhiên X
và giả thuyết 𝐻0 về phân phối xác suất của X. 𝐻0 được gọi là giả thuyết không.
Một mệnh đề 𝐻1 đối ngược với 𝐻0 được gọi là đối thuyết. Cần kiểm định xem
𝐻0 đúng hay sai trên cơ sở mẫu lấy được là (𝑥1, 𝑥2, … , 𝑥𝑛 ).
Muốn vậy, người ta lập không gian mẫu (𝑋1, 𝑋2, … , 𝑋𝑛) và trên không gian mẫu
ta xác định một miền W gọi là miền bác bỏ giả thuyết 𝐻0, phần bù của W, kí hiệu 𝑊̅ , được gọi là miền chấp nhận giả thuyết 𝐻0. Nếu điểm (𝑥1, 𝑥2, … , 𝑥𝑛 ) thuộc W thì ta coi như giả thuyết 𝐻0là sai và bác bỏ giả thuyết đó. Nếu điểm (𝑥1, 𝑥2, … , 𝑥𝑛 ) thuộc 𝑊̅ thì ta coi giả thuyết là đúng và chấp nhận nó.
Tương tự như ước lượng, ta không thể khẳng định kết quả của việc kiểm định giả
thuyết là chính xác 100%. Việc kiểm định này chỉ cho kết quả với một độ tin cậy
nào đó và có thể xảy ra sai lầm. Các sai lầm này được phân thành 2 loại:
Sai lầm loại 1: Giả thuyết 𝐻0 đúng nhưng ta lại bác bỏ nó.
Sai lầm loại 2: Chấp nhận giả thuyết 𝐻0 khi giả thuyết 𝐻0 là sai.
Hai loại sai lầm trên đều có thể gây ra những tác hại nghiêm trọng, nhưng nếu ta
cố tìm cách giảm thiểu sai lầm loại này cũng đồng nghĩa làm tăng sai lầm loại còn
lại. Tuy nhiên các nhà TK nhận định rằng sai lầm loại 1 nghiêm trọng hơn sai lầm
22
loại 2. Vì vậy, các kiểm định giả thuyết TK thông dụng đều xác định ngay từ đầu
giá trị 𝛼 để hạn chế sai lầm loại 1.
3.3. Bài toán tính kích thước mẫu
Một trong các nội dung quan trọng của mỗi cuộc điều tra TK là xác định kích
thước mẫu điều tra. Đào Hồng Nam (2014), Dạy học xác suất - thống kê ở trường
Trong chọn mẫu, xác định cỡ mẫu là một trong những việc cần thực hiện đầu
tiên. Cỡ mẫu nhỏ thì mẫu sẽ không phản ánh đầy đủ thông tin của quần thể nghiên
cứu, dẫn đến những kết luận không đáng tin cậy. Ngược lại, cỡ mẫu lớn sẽ làm
hao tốn tài nguyên, kinh phí, thậm chí làm hư hại quần thể. Đối với mỗi bài toán
TK, cách chọn mẫu cũng khác nhau tùy theo mục đích nghiên cứu và tính chất
của biến ngẫu nhiên. Việc tính cỡ mẫu phải dựa vào những thông tin đã biết về
quần thể (qua các công trình đã thực hiện) hoặc phải tiến hành nghiên cứu mô
phỏng để thu thập các thông tin cần thiết.
đại học Y, luận án tiến sĩ khoa học giáo dục, trang 52 tác giả đã viết:
Như vậy, trên cơ sở kích thước mẫu (n), người ta sẽ xác định các cá thể mẫu tùy
theo điều kiện cụ thể của mỗi cuộc điều tra. Chúng tôi quan tâm đến việc xác định
cỡ mẫu với mẫu ngẫu nhiên đơn giản, vì vậy đối với các phương pháp chọn mẫu
khác chúng tôi sẽ không trình bày trong luận văn này.
Nếu X là biến sử dụng làm căn cứ chọn mẫu, ta có:
𝑋̅ =
(𝑁𝛿2)
(𝑁 − 𝑛) 𝑉𝑎𝑟(𝑋̅) = 𝛿2 𝛿2 𝑛 (𝑁 − 1)
((𝑁−1)𝛿2
Từ đó: 𝑛 = 𝑋̅ +𝛿2)
23
Trong công thức trên, phương sai tổng thể chưa biết, trong trường hợp này chúng
ta có thể ước lượng giá trị này qua phương sai mẫu. Có thể ước lượng trội cho n
nhờ công thức sau:
𝑋̅
𝑛 = 𝑁 1 + 𝑡(𝑁 − 1)
𝛿2 𝛿2 là tỷ lệ của phương sai trung bình mẫu với phương sai tổng thể, tỉ lệ t do người nghiên cứu lựa chọn. Công thức này có thể sử dụng trong trường
Trong đó: 𝑡 =
hợp chúng ta quan tâm đến các ước lượng điểm, đặc biệt là ước lượng điểm của
trung bình tổng thể.
3.4. Suy rộng kết quả điều tra chọn mẫu
Sau khi đã thu thập được đầy đủ tài liệu ở các đơn vị của tổng thể mẫu, căn cứ vào
đó để tiến hành tính toán và suy rộng (ước lượng) ra các đặc điểm của tổng thể
chung. Có hai phương pháp suy rộng: suy rộng trực tiếp và suy rộng khoảng.
Suy rộng trực tiếp: Coi các mức độ của mẫu cũng là các mức độ của tổng thể
chung. Chẳng hạn, coi số bình quân mẫu, tỷ lệ của mẫu cũng là số bình quân, tỷ
lệ của tổng thể chung.
Suy rộng khoảng: Các mức độ của tổng thể chung được xác định nhận giá trị trong
một khoảng nào đó với xác suất cho trước.
Tổng kết chương 1
Chọn mẫu là một vấn đề có vai trò quan trọng một nghiên cứu. Sự ra đời của
phương pháp này giúp chúng ta giải quyết được các bài toán TK có số lượng điều
tra quá lớn, hoặc không xác định được hết các đơn bị điều tra hay trong trường
hợp đối tượng điều tra bị phá hủy… Điều tra chọn mẫu là một loại điều tra không
24
toàn bộ trong đó người ta chỉ chọn ra một số đơn vị thuộc đối tượng nghiên cứu
để tiến hành điều tra thực tế. Các đơn vị này sẽ được chọn theo nguyên tắc nhất
định đảm bảo tính đại diện. Kết quả của điều tra chọn mẫu được dùng để suy rộng
cho toàn bộ tổng thể. Do đó để hạn chế những rủi ro và sai lầm thì đòi hỏi mẫu
phải đại diện tốt cho quần thể, tức là mẫu phải có cấu trúc tương tự như quần thể
chứa nó.
Có nhiều phương pháp tổ chức chọn mẫu khác nhau tùy theo đặc điểm của đối
tượng điều tra. Một trong các phương pháp chọn mẫu được sử dụng đó là chọn
mẫu ngẫu nhiên. Để thực hiện tốt các cuộc điều tra chọn mẫu, cần phải tiến hành
theo đúng trình tự nhất định như xác định mục đích nghiên cứu, xác định tổng thể
nghiên cứu, xác định nội dung điều tra, xác định số lượng đơn vị tổng thể mẫu và
phương pháp tổ chức chọn mẫu, thu thập số liệu ở mẫu, suy rộng kết quả mẫu và
rút ra kết luận cho toàn bộ tổng thể.
Hầu hết các cuộc điều tra đều phải tiến hành sau quá trình chọn mẫu. Do vậy nếu
người thực hiện thống kê không có cơ sở lý luận vững chắc về chọn mẫu sẽ dẫn
đến rủi ro và sai lầm cao khi suy rộng cho toàn bộ tổng thể. Bằng việc tìm hiểu vai
trò, nguồn gốc nảy sinh của chọn mẫu cho phép chúng tôi khẳng định tầm quan
trọng và phổ biến của nó trong cuộc sống. Chính vì tầm quan trọng và tính phổ
biến này khiến chúng tôi đặt ra nhu cầu cần thiết phải truyền đạt các kiến thức về
chọn mẫu đến học sinh THPT, khi mà mục tiêu giáo dục được đề ra là giúp học
sinh sử dụng các kiến thức được học để ứng dụng giải quyết các bài toán thực tế.
25
Chương 2: Bài toán chọn mẫu trong sách giáo khoa Toán Việt Nam và Mỹ
Thực hiện chương 2 cũng chính là việc chúng tôi đưa ra câu trả lời cho Q2:
Q2: Bài toán chọn mẫu tồn tại như thế nào trong chương trình thống kê ở Việt
Nam? Nhìn sang chương trình giảng dạy khác (chương trình giảng dạy thống kê
của Mỹ), bài toán chọn mẫu được trình bày ra sao? Có sự khác biệt nào trong việc
lựa chọn của những chương trình này?
Để trả lời cho câu hỏi này, chúng tôi sẽ phân tích chương trình giảng dạy TK trong
thể chế dạy học ở Việt Nam để làm rõ những vấn đề sau: Chọn mẫu xuất hiện
trong chương trình học lớp mấy? Trước khi được đưa vào dạy học thì đối tượng
có được xuất hiện ngầm ẩn hay không? Chọn mẫu dành được sự quan tâm như thế
nào trong toàn bộ chương trình giảng dạy TK ở các cấp học? Đồng thời để làm rõ
hơn sự tồn tại của chọn mẫu trong chương trình dạy học, chúng tôi lựa chọn phân
tích SGK toán 10 nâng cao (S10NC) để tìm hiểu xem đối tượng đã được xuất hiện
như thế nào, có các KNV nào về chọn mẫu?
1. Bài toán chọn mẫu trong dạy học thống kê ở Việt Nam
1.1. Phân tích chương trình
Thống kê được đưa vào giảng dạy xuyên suốt trong các cấp học, từ tiểu học đến
trung học phổ thông. Ở chương trình tiểu học, tới học kì II lớp 3, yếu tố TK mới
chính thức được đưa vào chương trình, học sinh sẽ được giới thiệu và làm quen
với dãy số liệu, bảng số liệu: Thứ tự của dãy số, cách đọc và phân tích số liệu, thực
hành lập bảng số liệu đơn giản, đọc số liệu trong bảng. Tiếp theo, ở chương trình
TK lớp 4 và lớp 5, học sinh được học về cách tìm số trung bình cộng và làm quen
với các dạng biểu đồ: Biểu đồ tranh, biểu đồ cột, biểu đồ quạt. Sự phân phối TK
như vậy hoàn toàn phù hợp với mục tiêu của dạy học thống kê ở tiểu học là cung
26
cấp những hiểu biết ban đầu về thống kê mô tả, rèn luyện một số ứng dụng toán
học vào thực tiễn, hình thành tư duy “thống kê” cho học sinh. Như vậy bài toán
chọn mẫu hoàn toàn chưa được đề cập trong bậc tiểu học.
Ở bậc trung học cơ sở, TK chỉ được đưa vào giảng dạy ở chương trình toán lớp 7.
SGK dành toàn bộ thời lượng quan tâm đến vấn đề thu thập số liệu thống kê (dấu
hiệu, tần số, bảng tần số, mốt, trung bình cộng) và cách biểu diễn số liệu thống kê
(thông qua biểu đồ đoạn thẳng và biểu đồ hình chữ nhật). So với chương trình ở
bậc tiểu học thì lượng kiến thức ở bậc trung học có tăng lên, học sinh làm quen
với các khái niệm mới. Tuy nhiên học sinh chỉ mới dừng lại ở việc vận dụng công
thức để tính toán hoặc nhìn vào bảng số liệu để trả lời những câu hỏi đơn giản.
Muốn thu thập các số liệu về một vấn đề mà mình quan tâm chẳng hạn như màu
sắc mà mỗi bạn trong lớp ưa thích thì em phải làm những việc gì và trình bày kết
quả thu được theo mẫu bảng nào?
(SGK toán lớp 7, tr.22)
Trong phần ôn tập chương III, SGK toán lớp 7, tập hai có xuất hiện câu hỏi:
Muốn thu thập số liệu của một dấu hiệu nào đó (kí hiệu là X) ta cần phân chia
đối tượng thành các phần có thể nghiên cứu, tức là phân thành các đơn vị diều
tra. Đánh số hay đặt tên các đơn vị điều tra. Định ra một thứ tự cho các đơn vị
điều tra, xác định giá trị của dấu hiệu.
Với câu hỏi này, sách hướng dẫn giải bài tập toán 7, có đưa ra gợi ý như sau:
Có thể thấy, việc chọn mẫu đã được xuất hiện ngầm ẩn trong hướng dẫn giải: “Ta
cần phân chia đối tượng thành các phần có thể nghiên cứu, tức là phân thành các
đơn vị điều tra”.
27
Ở bậc trung học phổ thông, TK tiếp tục được giới thiệu trong chương trình toán
lớp 10 bao gồm 3 bài và được dự kiến giảng dạy trong 9 tiết. Yêu cầu và mục đích
của việc đưa TK vào giảng dạy ở chương trình lớp 10 được SGV viết như sau:
Về việc trình bày một mẫu số liệu, yêu cầu học sinh:
- Hiểu và biết cách lập bảng phân bố tần số, bảng phân bố tần suất (nếu
là bảng phân bố tần số - tần suất ghép lớp thì phải cho trước cách chia
lớp).
- Dựa vào bảng phân bố tần số (tần suất) ghép lớp, vẽ được biểu đồ tần
số (tần suất) hình cột; biết cách vẽ đường gấp khúc tần số (tần suất)
và biểu đồ tần suất hình quạt.
Về các số đặc trưng của mẫu số liệu, yêu cầu học sinh:
- Hiểu ý nghĩa và biết cách tính số trung bình, số trung vị, mốt, phương
sai và độ lệch chuẩn của một mẫu số liệu.
- Trong trường hợp mẫu số liệu được cho bởi bảng phân bố tần số ghép
lớp, biết tính xấp xỉ số trung bình, phương sai và độ lệch chuẩn.
Các khái niệm mẫu số liệu, điều tra mẫu lần đầu được đề cập. Tuy nhiên trong
những yêu cầu mà chương đặt ra lại hoàn toàn không có yêu cầu nào đòi hỏi học
sinh phải hiểu vai trò của chọn mẫu hay biết các kĩ thuật về chọn mẫu. Vì đây là
nội dung có liên quan trực tiếp đến đối tượng nghiên cứu nên chúng tôi sẽ phân
tích chi tiết hơn trong phần phân tích SGK toán 10 nâng cao.
1.2. Phân tích SGK
Thống kê ở chương trình toán lớp 10 bao gồm 3 bài, được giảng dạy trong 9 tiết.
Chúng tôi sử dụng “Bảng tóm tắt nội dung các bài học trong chương V” đã được
Đinh Thị Mạnh trình bày trong luận văn tốt nghiệp cao học của mình để đưa ra
28
tổng quan các kiến thức thống kê được xuất hiện trong chương trình toán 10 nâng
cao như sau:
Bảng 2.1: Bảng tóm tắt nội dung các bài học trong chương V
STT Tên bài Nội dung
1 Một vài khái niệm mở 1. Định nghĩa thống kê.
đầu. 2. Các khái niệm: mẫu số liệu, kích thước
mẫu, điều tra toàn bộ, điều tra mẫu.
2 Trình bày một mẫu dữ 1. Bảng phân bố tần số - tần suất.
liệu 2. Bảng tần số - tần suất ghép lớp.
3. Các loại biểu đồ :
- Biểu đồ tần số, tần suất hình cột.
- Đường gấp khúc tần số, tần suất.
- Biểu đồ tần suất hình quạt.
3 Các số đặc trưng của 1. Số trung bình.
mẫu số liệu 2. Số trung vị.
3. Mốt.
4. Phương sai và độ lệch chuẩn.
Dựa vào bảng tóm tắt nội dung trên, có thể nhận thấy khái niệm mẫu, điều tra mẫu
được trực tiếp xuất hiện trong bài 1 – Một vài khái niệm mở đầu. Phần lớn thời
lượng chương trình tập trung vào việc trình bày một mẫu dữ liệu và các số đặc
trưng của mẫu số liệu. Do đó chúng tôi sẽ tập trung phân tích Bài 1 để thấy vấn đề
chọn mẫu được xuất hiện như thế nào ? Đối với Bài 2 và Bài 3, chúng tôi quan
tâm đến việc mẫu và vấn đề chọn mẫu được vận dụng để xây dựng kiến thức mới
29
ra sao, việc xây dựng kiến thức mới như vậy có làm nổi bật được ý nghĩa, vai trò
của chọn mẫu hay không ?
1.2.1. Về lý thuyết
Bài 1 : Một vài khái niệm mở đầu.
SGK dành phần đầu tiên để giới thiệu khái niệm TK và vai trò của TK. Mở đầu
bài học bằng câu hỏi “Thống kê là gì ?”. Sau đó, câu hỏi này đã được SGK đưa ra
câu trả lời như sau :
Thống kê là khoa học về các phương pháp thu thập, tổ chức, trình bày, phân
tích và xử lý số liệu. (SGK Toán đại số lớp 10 nâng cao, trang 159).
Như để giải thích cho việc tại sao cần phải học TK, SGK đã đưa ra nhận xét :
Thống kê giúp ta phân tích các số liệu một cách khách quan và rút ra các tri
thức, thông tin chứa đựng trong các số liệu đó. Trên cơ sở này, chúng ta mới
có thể đưa ra những dự báo và quyết định đúng đắn. Vì thế thống kê cần
thiết cho mọi lực lượng lao động… (SGK Toán đại số lớp 10 nâng cao, trang
159).
SGK đã nêu lên vai trò của TK và một trong các vai trò đó là qua phân tích số liệu
thống kê, chúng ta có thể đưa ra những dự báo và quyết định đúng đắn. Điều mà
chúng tôi băn khoăn là thông qua những tiết học về TK, học sinh có thật sự thấy
được vai trò này hay không ?
Trong mục tiếp theo của bài học SGK giới thiệu về khái niệm mẫu số liệu.
Để học sinh nhớ lại các khái niệm dấu hiệu, đơn vị điều tra, giá trị của dấu hiệu
SGK đưa ra một ví dụ. Sau đó đưa ra “bài giải” dấu hiệu là gì, đơn vị điều tra là
gì mà không yêu cầu thêm bất cứ hoạt động nào :
30
Việc nhắc lại các khái niệm của thống kê lớp 7 nhằm tạo điều kiện thuận lợi cho
việc định nghĩa các khái niệm tiếp theo của SGK.
Một tập con hữu hạn các đơn vị điều tra được gọi là một mẫu. Số phần tử
của một mẫu được gọi là kích thước mẫu. Các giá trị của dấu hiệu thu được
trên mẫu được gọi là một mẫu số liệu (mỗi giá trị như thế còn gọi là một số
liệu mẫu). (SGK toán lớp 10 nâng cao, tr.160)
Mặc dù mẫu được định nghĩa một cách tường minh. Tuy nhiên sự xuất hiện của
mẫu chỉ có ý nghĩa như một tên gọi. Nếu như ở thống kê lớp 7, đề bài cho “Kết
31
quả điều tra về số con của 30 gia đình…”, thì khi khái niệm mẫu xuất hiện đề bài
sẽ được viết dưới dạng “Cho mẫu số liệu sau…”. Như vậy vai trò của mẫu chưa
được SGK đề cập đến, chúng tôi cho rằng, đối với học sinh việc học thêm một
khái niệm mà không có ý nghĩa tồn tại thì sẽ dễ bị lãng quên.
Sau khái niệm mẫu dữ liệu, SGK tiếp tục giới thiệu thêm 2 khái niệm mới là điều
tra toàn bộ và điều tra mẫu:
Nếu thực hiện điều tra trên mọi đơn vị điều tra thì đó là điều tra toàn bộ.
Nếu chỉ điều tra trên một mẫu thì đó là điều tra mẫu. (SGK toán lớp 10 nâng
cao, tr.160)
2 khái niệm này xuất hiện một cách tường minh và dễ hiểu. Tiếp đến SGK đưa ra
mối liên hệ giữa hai loại điều tra trên:
Điều tra toàn bộ đôi khi không khả thi vì số lượng các đơn vị điều tra quá
lớn hoặc vì muốn điều tra thì phải phá hủy đơn vị điều tra. Chúng ta thường
chỉ điều tra mẫu và phân tích xử lý mẫu số liệu thu được. (SGK toán 10
nâng cao, tr.160)
Với cách lựa chọn giới thiệu của SGK, điều tra mẫu được hiểu là sự thay thế của
điều tra toàn bộ khi điều tra toàn bộ không khả thi trong trường hợp số lượng đơn
vị điều tra quá lớn hoặc phải phá hủy đơn vị điều tra. SGK đã làm rõ được ý nghĩa
của điều tra mẫu. Tuy nhiên vấn đề đặt ra là điều tra mẫu như thế nào? SGK đã
không lựa chọn làm rõ bài toán chọn mẫu, các kĩ thuật cũng như vai trò của chọn
mẫu trong việc điều tra mẫu.
Trong 2 bài học tiếp theo của chương TK, SGK quan tâm đến việc làm thế nào để
xử lý số liệu sau khi đã chọn được một mẫu. Vấn đề chọn mẫu được SGK coi như
đã được thực hiện, do đó không có thêm các nội dung nào nói về chọn mẫu. Trong
32
bài 2 – Trình bày một số liệu thống kê, SGK tập trung vào xây dựng các khái niệm
bảng phân bố tần số – tần suất ghép lớp và chú trọng đến việc hình thành kĩ thuật
giúp học sinh có thể vẽ được các biểu đồ tần số, tần suất. Trong bài 3 – Các số đặc
trưng của mẫu số liệu, SGK giới thiệu cho học sinh các tham số thống kê như: Số
trung bình, số trung vị, mốt, phương sai độ lệch chuẩn… Do đây đều không phải
đối tượng nghiên cứu chính của luận văn nên chúng tôi không lựa chọn phân tích
sự xuất hiện của chúng trong SGK. Chúng tôi cho rằng sau khi học xong hai bài
thống kê 2 và 3, học sinh có khả năng xử lý và biểu diễn các số liệu thống kê đơn
giản, đây là cơ sở kiến thức phục vụ cho việc suy rộng kết quả thống kê cho quần
thể.
1.2.2. Các tổ chức toán học
Bài 1 – Một vài khái niệm mở đầu: Sau khi giới thiệu các khái niệm cơ bản, bao
gồm cả mẫu số liệu, thì phần bài tập về nội dung không có sự thay đổi so với với
nội dung kiến thức thống kê lớp 7. Chỉ khác ở sự thay đổi cách đặt câu hỏi: “Có
bao nhiêu giá trị của dấu hiệu?” thành “kích thước của mẫu là bao nhiêu?”
Trong 2 bài tiếp theo xuất hiện các kiểu nhiệm vụ mới. Chúng tôi sẽ sử dụng lại
số liệu thống kê các KNV có trong SGK và SBT đã được tác giả Đinh Thị Mạnh
chỉ ra như sau:
TXD.DHDT: Xác định dấu hiệu điều tra.
TXD.DVDT: Xác định đơn vị điều tra.
TXD.GT: Xác định giá trị khác nhau của mẫu số liệu.
TT.TSU: Tính tần suất của các giá trị.
TLB.TSO: Lập bảng tần số.
33
TLB.TSO – TSU – GL: Lập bảng tần số, tần suất ghép lớp.
TVBD.TSUHC: Vẽ biểu đồ tần suất hình cột.
TVBD.DGKTSO: Vẽ đường gấp khúc tần số.
TVBD.TSUHQ: Vẽ biểu đồ tần suất hình quạt.
TT.STB: Tính số trung bình.
TT. TV: Tính số trung vị.
TT.M: Tính mốt.
TT.PS: Tính phương sai.
TT.DLC: Tính độ lệch chuẩn.
TYNTS: Nếu ý nghĩa của các tham số định tâm.
TXD.PPDT: Xác định phương pháp điều tra.
TSS.TS: So sánh số trung bình với số trung vị của cùng một mẫu số liệu.
TNX.DPT: Đánh giá hai đối tượng dựa vào hai mẫu dữ liệu lần lượt ứng với chúng.
TCTSDD: Chọn lựa tham số đại diện cho mẫu số liệu.
TNB.BD: Nhận xét xu thế phân bố của các số liệu dựa vào biểu đồ tần số hình cột và
đường gấp khúc.
TXD.MSL: Tìm mẫu số liệu thỏa tiêu chuẩn cho trước.
Ta có bảng thống kê các câu hỏi theo từng kiểu nhiệm vụ sau:
34
Bảng 2.2: Thống kê số lượng bài tập theo từng KNV
Kiểu nhiệm vụ Trong SGK toán 10 Trong Tổng
SBT nâng cao
Ví dụ Hoạt Bài
tập động
6 6 TXD.DHDT
2 2 𝑇𝑋𝐷.𝐾𝑇𝑀
2 2 𝑇𝑋𝐷.𝐺𝑇
1 1 𝑇𝑇.𝑇𝑆𝑂
31 4 𝑇𝑇.𝑇𝑆𝑈
1 1 𝑇𝐿𝐵.𝑇𝑆𝑂
6 5 11 𝑇𝐿𝐵.𝑇𝑆𝑂−𝑇𝑆𝑈−𝐺𝐿
4 5 9 𝑇𝑉𝐵𝐷.𝑇𝑆𝑂𝐻𝐶
1 2 1 4 𝑇𝑉𝐵𝐷.𝑇𝑆𝑈𝐻𝐶
3 3 𝑇𝑉𝐵𝐷.𝐷𝐺𝐾𝑇𝑆𝑂
1 1 𝑇𝑉𝐵𝐷.𝐷𝐺𝐾𝑇𝑆𝑈
2 1 3 𝑇𝑉𝐵𝐷.𝑇𝑆𝑈𝐻𝑄
2 14 1 17 34 𝑇𝑇.𝑇𝐵
35
2 7 4 13 𝑇𝑇.𝑇𝑉
2 2 4 𝑇𝑇.𝑀
12 14 2 𝑇𝑇.𝑃𝑆
13 9 24 2 𝑇𝑇.𝐷𝐿𝐶
1 1 𝑇𝑋𝐷.𝑃𝑃𝐷𝑇
1 1 1 3 𝑇𝑁𝑋.𝐷𝑃𝑇
1 1 𝑇𝑁𝑋.𝐵𝐷
1 1 𝑇𝑌𝑁𝑇𝑆
1 1 𝑇𝑆𝑆.𝑇𝑆
1 1 𝑇𝐶𝑇𝑆𝐷𝐷
1 1 𝑇𝑋𝐷.𝑃𝑇
1 1 𝑇𝑋𝐷.𝑀𝑆𝐿
Tổng 5 13 82 52 152
Dựa vào biểu đồ trên có thể thấy SGK chú trọng vào 2 kiểu nhiệm vụ: Tính toán
các tham số đặc trưng của mẫu số liệu và trình bày mẫu số liệu (trình bày theo
bảng và trình bày bằng biểu đồ). Tuy nhiên đây đều không phải mục đích nghiên
cứu chính của chúng tôi. Vì vậy chúng tôi không lựa chọn làm rõ từng KNV trên.
Chúng tôi sẽ phân tích các KNV xuất hiện trong SGK có liên quan đến vấn đề
chọn mẫu dựa trên 3 khía cạnh:
36
- Các bài toán thể hiện vai trò của mẫu.
- Các bài toán thể hiện kĩ thuật chọn mẫu.
- Các bài toán thể hiện việc suy rộng cho quần thể.
a) Các bài toán thể hiện vai trò của việc chọn mẫu
Chúng tôi tìm thấy một KNV thể hiện được vai trò của mẫu TXD.PPDT. KNV này
được thể hiện qua hoạt động H1:
Người điều tra phải kiểm định chất lượng các hộp sữa của một nhà máy chế
biến sữa bằng cách mở các hộp sữa để kiểm tra. Có thể điều tra toàn bộ hay
không?
Hoạt động này được đưa ra sau khi SGK giới thiệu hai phương pháp điều tra: điều
tra toàn bộ và điều tra mẫu. Qua thông tin “mở các hộp sữa để kiểm tra”, học sinh
sẽ nhận thấy rằng trong trường hợp này điều tra toàn bộ là không khả thi do nó sẽ
phá hủy các sản phẩm. Do đó việc chọn ra các sản phẩm để kiểm tra là cần thiết.
Thông qua hoạt động này, học sinh có thể thấy được vai trò của việc chọn mẫu:
thay thế cho điều tra toàn bộ, tiết kiệm thời gian, hạn chế phá hủy sản phẩm ban
đầu.
Tuy nhiên ngoài hoạt động H1, chúng tôi không tìm thấy các KNV thể hiện vai
trò của mẫu trong phần bài tập của SGK và SBT. Điều đó cho thấy sự quan tâm
của SGK dành cho việc thể hiện vai trò của mẫu là rất ít.
b) Các bài toán thể hiện kĩ thuật chọn mẫu
Chúng tôi tìm thấy 1 kiểu nhiệm vụ TXD.MSL: Tìm mẫu số liệu thỏa tiêu chuẩn cho
trước. Bài tập thuộc kiểu nhiệm vụ này như sau:
Trong tất cả các mẫu số liệu có kích thước 5 với trung vị là 12 và số trung
bình là 10. Hãy tìm một mẫu số liệu có biên độ nhỏ nhất (biên độ của mẫu
37
số liệu là hiệu giữa giá trị lớn nhất và giá trị bé nhất của mẫu số liệu). (SBT,
tr.181)
Với yêu cầu này, SBT có đưa ra hướng dẫn như sau:
Mặc dù bài toán yêu cầu tìm một mẫu số liệu, tuy nhiên kích thước mẫu tương đối
nhỏ, làm cho bài toán trở thành tương tự việc tìm một dãy số gồm 5 số thỏa mãn
điều kiện cho trước (Đinh Thị Mạnh (2013), tr 37). Để giải được bài toán, các kiến
thức về TK ít được sử dụng, thay vào đó kĩ thuật đề cao các kiến thức số học và
các suy luận trên bất đẳng thức. Với kĩ thuật được cung cấp, học sinh bị hạn chế
trong cách áp dụng. Điều đó có nghĩa, khi gặp một bài toán yêu cầu xác định kích
thước của một mẫu số liệu có yêu cầu khác thì học sinh sẽ không có phương pháp,
kĩ thuật chung để đưa ra lựa chọn. Như vậy, xét trên tổng thể 152 bài tập, chỉ có
duy nhất một bài liên quan đến vấn đề xác định kích thước của mẫu. Điều này cho
thấy sự quan tâm của SGK dành cho việc xác định kích thước mẫu là chưa nhiều.
c) Các bài toán thể hiện suy rộng cho quần thể
Chúng tôi cho rằng việc suy rộng cho quần thể gắn liền với bài toán thể hiện ý
nghĩa của các tham số thống kê. SGK cung cấp 4 tham số TK cho học sinh: Số
trung bình, số trung vị, phương sai và độ lệch chuẩn. Chúng tôi quan tâm đến việc
các tham số này đã được trình bày đầy đủ nghĩa hay chưa? Với việc trình bày mà
38
SGK lựa chọn sẽ có những ảnh hưởng gì đến học sinh? Học sinh có gặp khó khăn
trong việc đưa ra kết luận cho tổng thể thông qua các tham số này hay không?
Chúng tôi đã tìm kiếm được một phần câu trả lời thông qua việc tham khảo các
luận văn đã bảo vệ thành công trước đó, chúng tôi tổng kết lại những kết quả
nghiên cứu về việc thể hiện ý nghĩa của các tham số TK như sau:
Nguyễn Ngọc Đan (2017), Mô hình hóa trong dạy học các tham số thống kê mô tả
ở trường phổ thông, luận văn thạc sĩ khoa học giáo dục: Đối với ba tham số định
tâm, SGK có nhắc đến ý nghĩa của các tham số này, tuy nhiên vai trò của số trung
vị và mốt chưa thể hiện được ưu thế khi đại diện cho mẫu trong nhiều trường hợp.
Tác giả cũng đưa ra và kiểm chứng thành công giả thuyết: Học sinh không hiểu
được đầy đủ ý nghĩa và phân biệt được các tham số định tâm, do đó không lựa
chọn được tham số phù hợp trong các trường hợp cụ thể.
Phạm Thị Tú Hạnh (2012), Các tham số định tâm trong dạy học lớp 12, luận văn
thạc sĩ giáo dục học: Thể chế chỉ nhắc đến vai trò của số trung vị như một “đại
diện” khi mẫu xuất hiện giá trị chênh lệch lớn hơn so với các giá trị còn lại. Những
ưu thế khác của số trung vị so với số trung bình và mốt hoàn toàn không được đề
cập. Ý nghĩa: “Số trung vị làm tối tiểu hóa tổng các chênh lệch” hoàn toàn bị vắng
mặt trong cách trình bày của SGK. Cách trình bày của SGK hình thành một hợp
đồng Didactic: Học sinh không có trách nhiệm sắp xếp dãy số dưới dạng không
giảm, đây là trách nhiệm thuộc về giáo viên.
Tiếp theo, chúng tôi tìm kiếm các KNV có liên quan đến việc sử dụng ý nghĩa các
tham số thống kê để suy rộng cho quần thể và tìm thấy:
TNX.DPT: Đánh giá hai đối tượng dựa vào hai mẫu dữ liệu.
- Kỹ thuật :
39
Tính phương sai (hoặc tính độ lệch chuẩn) của hai mẫu số liệu đã cho.
Mẫu nào có phương sai hay độ lệch chuẩn nhỏ hơn thì các số liệu trong mẫu đó
đồng đều hơn. Đây là mẫu ta nên chọn.
- Công nghệ: Ý nghĩa phương sai và độ lệch chuẩn.
Kiểu nhiệm vụ này được thể hiện qua bài tập sau đây:
Và SGV đưa ra gợi ý cho bài tập này như sau:
Trong câu b) đòi hỏi sau khi tính toán được các tham số đại diện cho mẫu, học
sinh phải đưa ra được kết luận cho từng mẫu rồi so sánh giữa 2 mẫu số liệu. Ở bài
này mẫu số liệu đã được cho sẵn, không đặt học sinh trước tình huống phải chọn
mẫu mà chỉ yêu cầu tính toán các tham số rồi suy rộng cho quần thể.
40
Tham khảo một tài liệu khác, Vũ Như Thư Hương (2009), Luận án Tiến Sĩ: Tác
giả phân các tổ chức toán học trong dạy học toán ở trung học Việt Nam thành 3 tổ
chức: Một tổ chức thống trị, một tổ chức chưa hoàn thiện và một tổ chức vắng
mặt. Trong đó một tổ chức vắng mặt được tác giả định nghĩa như sau:
Một tổ chức vắng mặt: Đây là một tổ chức có các kiểu nhiệm vụ là: lấy ra
một mẫu dữ liệu bằng cách lặp lại một phép thử ngẫu nhiên, nghiên cứu sự
biến động của quá trình chọn mẫu, tức là hoặc nghiên cứu trên một tần suất
riêng, hoặc nghiên cứu trên một chỉ số đặc trưng như giá trị trung bình,
nghiên cứu việc giảm độ biến động bằng cách tăng kích thước của mẫu số
liệu.
Tuy nhiên, một số khái niệm cần dạy như mẫu dữ liệu, đại diện mẫu dữ liệu
và mẫu dữ liệu đại diện cho tổng thể (riêng khái niệm này được giới thiệu
một cách ngầm ẩn) là những yếu tố thuận lợi cho việc xây dựng tổ chức
chọn mẫu dữ liệu.
Như vậy tác giả cũng đồng ý với việc SGK có điều kiện để tiếp tục xây dựng các
tổ chức toán học liên quan đến chọn mẫu, nhưng SGK đã không đưa ra lựa chọn
như vậy.
2. Bài toán chọn mẫu trong dạy học thống kê ở Mỹ
Sau khi tìm hiểu nội dung chọn mẫu trong SGK toán 10 của Việt Nam, chúng tôi
tiếp tục phân tích bộ SGK Mathmetics in Context của tác giả Holt, Rinehart and
Winson (bao gồm cả SGK dành cho học sinh và SGV), đây là SGK được dùng
cho các trường phổ thông ở Mỹ. Sự phân tích này giúp chúng tôi đưa ra được sự
so sánh, đối chiếu giữa 2 cuốn sách, tìm ra điểm giống nhau, khác nhau và nguyên
nhân của sự khác nhau này.
41
Để tìm thấy sự tương đồng, khác nhau giữa hai cuốn sách, chúng tôi sẽ phân tích
SGK Mỹ dựa trên 3 phương diện như đã dùng để phân tích SGK Việt Nam.
2.1 Về các bài toán thể hiện được vai trò và điều kiện của việc chọn mẫu
Chương trình giảng dạy xác suất thống kê được phân bố như trong bảng sau:
42
Dựa vào bảng trên, ta thấy kiến thức liên quan đến thống kê được đưa vào giảng
dạy từ khối lớp 6 cho đến hết khối lớp 9. Học sinh được làm quen với vấn đề chọn
mẫu ở khối lớp 7/8. Cụ thể, kiến thức này sẽ được giảng dạy trong Section A: Are
people Getting Taller? của cuốn sách Mathmetics in Context - Deading with Data
và được phân bố thời gian giảng dạy trong một buổi học – buổi học thứ 3 của
Section A:
Mục tiêu của buổi học này được SGV nêu ra rất rõ ràng: Học sinh sẽ thảo luận
xem liệu 1024 cặp bố con có đủ điều kiện để làm mẫu dữ liệu tốt hay không? Sau
đó học sinh sẽ trao đổi về việc như thế nào là mẫu đại diện tốt cho quần thể. Từ
những mục tiêu mà SGV Mỹ đưa ra, có thể thấy chương trình giảng dạy rất chú
trọng đến việc học sinh đưa ra nhận xét một dữ liệu có đủ điều kiện để đại diện
được cho mẫu hay không?
Mở đầu bài học, tác giả không trực tiếp đưa ra định nghĩa các khái niệm mà bắt
đầu bài học bằng hoạt động thu thập chiều cao của những đứa con trong một gia
43
đình và so sánh với chiều cao của bố mẹ. Trong đó có hoạt động 2 đáng chú ý như
sau:
Hoạt động này được đưa ra giúp học sinh có thể chọn lựa ra các dãy số liệu dựa
trên tiêu chuẩn đã cho. Hai lý do tồn tại của hoạt động này được SGV giải thích:
Đầu tiên là muốn học sinh học được cách tìm kiếm dữ liệu một cách có tổ chức,
tiếp đến giúp học sinh có kinh nghiệm trong việc xây dựng một mẫu dữ liệu lớn.
Như vậy, vấn đề đầu tiên được SGK quan tâm đến khi nói về vấn đề chọn mẫu đó
là kích thước mẫu phải đủ lớn.
Sau hoạt động 2, SGK tiếp tục yêu cầu học sinh thu thập số liệu theo yêu cầu cho
trước, sau đó đưa ra khái niệm của mẫu số liệu như sau:
44
Đi kèm với khái niệm về mẫu dữ liệu, SGK đưa ra chú ý: Để đưa ra được kết luận
có giá trị đúng đắn cho một quần thể, mẫu được chọn phải đại diện tốt cho quần
thể.
Chú ý này đã làm bật lên tầm quan trọng cũng như điều kiện cần có của vấn đề
chọn mẫu. Đây là điều chúng tôi hoàn toàn không thấy xuất hiện trong SGK toán
ở Việt Nam.
45
2.2 Về các bài toán đề cập đến kĩ thuật chọn mẫu
Chúng tôi tìm thấy bài tập yêu cầu chọn ra một mẫu đại diện tốt cho quần thể và
giải thích tại sao (Câu hỏi 9). Đây là bài toán giúp gợi mở kiến thức, học sinh
không bị gò bó trong khuôn khổ kiến thức nào, các dữ liệu về thống kê, xác suất
hoàn toàn không được đề cập đến. Với bài tập này, SGV có hướng dẫn giải như
sau:
46
Trong phần hướng dẫn dành cho giáo viên, SGV có gợi ý:
Mặc dù kĩ thuật chọn mẫu đã không được xuất hiện một cách tường minh nhưng
thông qua gợi ý trả lời của SGV Mỹ, học sinh bước đầu hình thành quan điểm khi
chọn mẫu ta ưu tiên chọn mẫu dữ liệu gồm tất cả các đối tượng đại diện có trong
quần thể. Phần hướng dẫn trong SGV một tiêu chí chọn mẫu dựa vào tỉ lệ cũng đã
được đưa ra: “compare the ratios of the fish in the large picture with the ratios of
the different fish in the bowls”.
Sau bài toán 9 là một câu hỏi mở giúp học sinh liên tưởng xa hơn về những trường
hợp mà mẫu không đáp ứng được việc đại diện tốt cho quần thể, đây được coi như
là hoạt động thể hiện tính sáng tạo và vận dụng vào thực tế.
Như vậy trong phần dẫn dắt bài học, mặc dù SGK Mỹ chưa đưa ra một kĩ thuật
chọn mẫu tường minh nào nhưng đã nhắc đến 2 chú ý trong quá trình chọn mẫu:
Ưu tiên về tính đại diện của mỗi loại cá thể trong quần thể và tỉ lệ số lượng của
mỗi loại cá thể được chọn trong mẫu tương đồng với tỉ lệ loại cá thể trong quần
thể ban đầu.
Chúng tôi hoàn toàn không thấy 2 chú ý của kĩ thuật chọn mẫu này có cơ hội xuất
hiện trong cách tiếp cận tri thức của SGK Việt Nam.
47
2.3 Về các bài toán đề cập đến suy rộng cho quần thể
Chúng tôi tìm thấy 2 bài toán trên thể hiện rõ nhất vấn đề suy rộng cho quần thể
trong phần giới thiệu lý thuyết của SGK. Bài toán cho trước một mẫu dữ liệu và
đặt học sinh trước nhiệm vụ kiểm tra mẫu đó có đại diện tốt cho quần thể hay
không?
Với bài toán 11, SGV đưa ra hướng dẫn trả lời như sau: Sinh viên đại học năm
1903 có thể không phải là đại diện điển hình cho tất cả người Anh vào thời điểm
đó. Vì nhu cầu dinh dưỡng, chăm sóc sức khỏe của sinh viên có thể tạo ra sự khác
biệt về chiều cao so với các tầng lớp khác trong xã hội.
Với bài toán 12, SGV đưa ra hướng dẫn bằng một lời giải mở như sau:
48
Đây là bài toán có thể có nhiều đáp án. Tuy nhiên, mục đích của bài toán được đưa
ra nhằm muốn người học xem xét, kiểm tra đến các yếu tố có thể ảnh hưởng đến
kết quả khi kết luận cho toàn bộ quần thể. SGV cũng đã đưa ra một số yếu tố có
thể ảnh hưởng đến chiều cao giữa bố mẹ và con cái như: tầng lớp của đối tượng
nghiên cứu, chế độ dinh dưỡng, hoặc những người con được nhận nuôi cũng sẽ
làm ảnh hưởng đến kết quả của cuộc điều tra. Việc xuất hiện của 2 bài tập này
giúp học sinh hiểu được rằng không phải mẫu nào cũng có thể đại diện tốt cho
quần thể. Ngược lại so với SGK VN, khi mà tất cả các mẫu dữ liệu được cho trước
đều đại diện được cho quần thể, học sinh không có nhiệm vụ kiểm tra tính phù
hợp của mẫu dữ liệu.
Kết thúc bài học, SGK đưa ra bảng tóm tắt các kiến thức quan trọng về vấn đề
chọn mẫu và một lần nữa nhấn mạnh về mẫu phải đại diện tốt cho quần thể:
49
Về phần bài tập, các KNV liên quan đến vấn đề chọn mẫu được SGV phân loại rõ
ràng theo mục đích: Các KNV làm rõ vai trò của chọn mẫu (4.), KNV chỉ ra sự
tương đồng khác nhau giữa các mẫu đại diện (5.), KNV liên quan đến việc chọn
ra mẫu đại diện tốt cho quần thể (6.) và được phân bổ như bên dưới:
Tổng kết chương 2
Qua việc phân tích cách trình bày lý thuyết của SGK Toán Việt Nam và tìm hiểu
về các KNV trong SGK và SBT, chúng tôi rút ra được các kết luận sau:
Mặc dù các khái niệm mẫu và mẫu số liệu được giới thiệu nhưng chưa được thể
hiện rõ nghĩa cũng như các vấn đề liên quan đến mẫu hay mẫu số liệu. Điều này
làm cho việc xuất hiện của mẫu chỉ có ý nghĩa làm thuận lợi cho việc “gọi tên” và
chưa được nghiên cứu sâu. Biểu hiện có thể thấy rõ nhất cho nhận xét này là mẫu
50
số liệu không được đề cập đến trong SGK toán 10 cơ bản, và chỉ được để cập đến
trong SGK toán 10 nâng cao. Tuy nhiên sự xuất hiện của khái niệm này trong SGK
toán 10 nâng cao cũng không làm xuất hiện KNV mới có liên quan đến chọn mẫu
hay làm cho các KNV xuất hiện trong SGK toán 10 nâng cao khác với các KNV
xuất hiện trong toán 10 cơ bản.
SGK tập trung vào việc trình bày và tính các tham số đặc trưng của một mẫu dữ
liệu. Do đó, hầu hết các bài tập đều chú trọng đến việc hình thành kĩ thuật vẽ biểu
đồ, tính các tham số đặc trưng, chưa có nhiều sự quan tâm cho vấn đề chọn mẫu:
Vai trò của mẫu, kĩ thuật chọn mẫu, bài toán suy rộng cho quần thể.
Mặc dù SGK có trình bày ý nghĩa của các tham số đặc trưng, điều này cung cấp
công cụ cho việc suy rộng, đưa ra kết luận cho quần thể. Tuy nhiên, các KNV phần
lớn mới chỉ dừng lại ở việc tính toán các tham số đại diện cho quần thể. Các bài
toán mặc dù có gắn với các yếu tố thực tế nhưng có rất ít bài tập sử dụng ý nghĩa
của các tham số để đưa ra kết luận.
Tất cả các bài tập đều được SGK cho trước mẫu số liệu, không đặt học sinh trước
bài toán cần phải chọn mẫu. Học sinh chỉ có nhiệm vụ làm việc trên các số liệu
được cho sẵn, chủ yếu là tính các tham số và vẽ biểu đồ. Các bài toán được xây
dựng mang tính định tính nhiều hơn, để giải bài toán học sinh chỉ cần áp dụng các
kĩ thuật được cung cấp để giải quyết.
Việc lựa chọn cách trình bày như vậy dẫn đến việc học sinh thiếu kĩ năng chọn
mẫu, xử lý mẫu, do đó khi đứng trước một bài toán thực tiễn sẽ gặp nhiều khó
khăn. Điều này làm cho TK trở nên khô khan, thiếu tính ứng dụng khi mà hầu hết
các sự việc trong thực tiễn đều không có một mẫu được cho sẵn, chỉ cần áp dụng
công thức để giải quyết.
51
Việc so sánh về quan hệ của bài toán chọn mẫu thiết lập trong hai chương trình sẽ
giúp chúng tôi hiểu rõ hơn những đặc trưng, những ràng buộc của chương trình,
tìm ra những điều mới, tích cực có thể giúp ích cho công tác giảng dạy và không
nhằm mục đích bàn luận đúng sai hay lấy chương trình này làm khuân mẫu cho
chương trình còn lại. Sau khi phân tích hai bộ SGK Toán Việt Nam và SGK Toán
Mỹ, chúng tôi đã tìm thấy được một số điểm tương đồng như sau: Trong cả hai
chương trình, kĩ thuật chọn mẫu đều không được xuất hiện một cách tường minh.
Điều này chúng tôi lý giải là do lựa chọn của thế chế để bài toán chọn mẫu được
giảng dạy trước khi học phần xác suất. Đây được coi là ràng buộc của thể chế làm
kĩ thuật chọn mẫu chưa được xuất hiện. Cả hai chương trình đều đề cập đến vai
trò của chọn mẫu cũng như bài toán suy rộng cho quần thể. Nhận thấy ràng buộc
giữa hai bộ sách như nhau, cơ hội xuất hiện của tri thức là như nhau, tuy nhiên sự
lựa chọn trình bày giữa hai bộ sách có nhiều điểm khác biệt. Cụ thể:
Bảng 2.3: So sánh sự lựa chọn trình bày chọn mẫu trong chương tình dạy học
ở Việt Nam và Mỹ
Phương diện SGK Mỹ SGK Việt Nam
so sánh
SGK Mỹ đưa ra nhiều hoạt động đa Chọn mẫu chưa được
dạng để dẫn dắt bài học, số lượng các quan tâm nhiều. SGK
câu hỏi phân bố đều cho các mục đích: Việt Nam chú trọng
Giới thiệu vai trò của mẫu, kĩ thuật đến việc tính toán các
chọn mẫu, suy rộng cho quần thể. tham số thống kê, vẽ
biểu đồ. Các bài tập
liên quan đến bài toán
52
chọn mẫu chiếm rất ít
và không có sự phân bố
đều.
Phương diện Xây dựng được 2 chú ý trong quá trình Hoàn toàn không đề
kỹ thuật chọn chọn mẫu: cập đến kĩ thuật chọn
mẫu mẫu do đó KNV chọn - Ưu tiên về tính đại diện của mỗi
- Tỉ lệ số lượng của mỗi loại cá
mẫu bị vắng bóng. loại cá thể trong quần thể.
thể được chọn trong mẫu tương
đồng với tỉ lệ loại cá thể trong
quần thể ban đầu.
Phương diện Tồn tại KNV đặt học sinh trước bài Không tồn tại KNV
suy rộng kết toán mẫu có đại diện tốt cho quần thể kiểm tra mẫu có đại
quả cho quần hay không? Đáp án của bài toán đa diện được cho tổng thể
thể dạng bao gồm cả 2 trường hợp mẫu đại hay không? Mẫu số
diện tốt cho quần thể và không đại diện liệu được SGK cho
được cho quần thể. trước và kết quả của
mẫu đều đúng khi suy
rộng cho tổng thể.
Như đã trình bày ở trên, các bài toán thống kê trong thể chế dạy học ở Việt Nam:
Mẫu số liệu luôn được SGK cho trước và kết quả của mẫu đều đúng khi suy rộng
cho tổng thể. Điều này làm chúng tôi e ngại: Liệu khi gặp những bài toán thực tế
mà mẫu không đại diện tốt cho quần thể, học sinh có đủ “tỉnh táo” để nhận ra sự
53
chưa hợp lý trong kết quả hay không? Từ đó làm chúng tôi nảy sinh giả thuyết
sau: “Học sinh sử dụng kết quả thu được từ mẫu để kết luận cho tổng thể, mà
không quan tâm đến mẫu được chọn có đại diện tốt cho tổng thể hay chưa”
Chúng tôi cho rằng việc có thể lưu lại 2 chú ý về kĩ thuật chọn mẫu cho học sinh
sau khi học xong bài học và đưa ra bài toán suy rộng cho quần thể mà kết quả của
nó có thể đại diện tốt cho quần thể hoặc không, giúp học sinh không bị ngộ nhận
tất cả các mẫu đều đại diện tốt cho quần thể, là những điểm tích cực và hữu ích
cho việc dạy và học, vì vậy chúng tôi mong muốn đưa những điểm tích cực này
vào trong thực nghiệm của mình.
54
Chương 3: Thực nghiệm
1. Đối tượng, thời điểm thực nghiệm
Thực nghiệm được tiến hành trên HS lớp 11 vào đầu năm học. Vào thời điểm này
học sinh đã được học xong chương thống kê ở chương trình toán lớp 10.
2. Mục đích thực nghiệm
Chúng tôi tiến hành thực nghiệm này gồm 3 mục đích:
Thứ nhất: Tạo cơ hội cho học sinh tiếp xúc với KNV: Chọn mẫu đại diện phù hợp,
đây là KNV xuất hiện trong SGK Mỹ nhưng lại bị thiếu vắng trong SGK Việt
Nam.
Thứ hai: Kiểm chứng giả thuyết: “Học sinh sử dụng kết quả thu được từ mẫu để
kết luận cho tổng thể, mà không quan tâm đến mẫu được chọn có đại diện tốt cho
tổng thể hay chưa”
Thứ ba: Giới thiệu kĩ thuật chọn mẫu: Do khuôn khổ có hạn của luận văn, chúng
tôi chỉ lựa chọn một phương pháp chọn mẫu là chọn mẫu phân lớp (theo tổ) để
khắc phục sự thiếu hụt về kỹ thuật trong thể chế dạy học XSTK ở lớp 10, bậc phổ
thông.
3. Nội dung thực nghiệm
Thực nghiệm bao gồm 2 bài toán:
Bài toán 1:
Ở Zedland, các cuộc thăm dò dư luận được tiến hành nhằm tìm hiểu mức độ ủng
hộ đối với Tổng thống trong cuộc bầu cử sắp tới. Bốn nhà xuất bản báo chí đã
55
thực hiện những cuộc thăm dò trên toàn quốc. Kết quả thăm dò của bốn tờ báo
như sau:
Tờ báo thứ nhất: 36,5% (tiến hành thăm dò ngày 6 tháng 1, với mẫu là 500 người
dân ngẫu nhiên có quyền bầu cử)
Tờ báo thứ hai: 41,0% (tiến hành thăm dò ngày 20 tháng 1, với mẫu là 500 người
dân ngẫu nhiên có quyền bầu cử)
Tờ báo thứ ba: 39,0% (tiến hành thăm dò ngày 20 tháng 1, với mẫu là 1000 người
dân ngẫu nhiên có quyền bầu cử)
Tờ báo thứ tư: 44,5% (tiến hành thăm dò ngày 20 tháng 1, với mẫu là 1000 người
đọc báo gọi điện để bầu cử)
Kết quả thăm dò của tờ báo nào có thể là kết quả dự đoán sát nhất với mức độ
ủng hộ dành cho Tổng thống nếu cuộc bầu cử diễn ra vào ngày 25 tháng 1? Hãy
đưa ra hai lý giải để bảo vệ ý kiến của em.
(Tài liệu hướng dẫn các câu hỏi toán học PISA, tr 73)
Bài toán 2:
Đài truyền hình tỉnh A muốn tiến hành một cuộc điều tra sở thích của khán giả tại
địa bàn tỉnh. Cuộc điều tra được tiến hành như sau:
Mục tiêu của cuộc điều tra: Thu thập thông tin về sở thích đối với một số chương
trình cụ thể.
Đối tượng: Các hộ gia đình thuộc khu vực thành thị, những người trả lời phỏng
vấn phải có độ tuổi từ 18 – 55. Cụ thể cuộc điều tra đã khảo sát các đối tượng như
sau:
56
Nhóm tuổi Số lượng người
Đơn vị: người
18 – 25
26 – 35
36 – 45 9
46 – 55 42
56 – 65 60
65+ 131
Tổng 242
Và kết quả của cuộc điều tra thu được như sau:
Phân loại chương trình Số lượng khán giả yêu thích
Đơn vị: người
Chương trình ca nhạc 13
Phim cổ trang 65
Thời sự 110
Phim tình cảm 54
(Mỗi khán giả chỉ được lựa chọn một chương trình yêu thích nhất)
Dựa vào bảng số liệu trên:
1) Em có thể đưa ra những nhận xét gì về nhu cầu, sở thích của khán giả tại
tỉnh A?
57
2) Em sẽ phân bố thời lượng chiếu các chương trình này như thế nào phù hợp
với nhu cầu xem truyền hình tại tỉnh A?
3.1. Dàn dựng kịch bản:
Thực nghiệm được tiến hành trong thời gian 45 phút, bao gồm 4 pha:
Pha 1: (Làm việc cá nhân_10 phút)
Trong pha này giáo viên phát phiếu gồm 2 bài toán, giấy làm bài, giấy nháp
cho học sinh. Học sinh làm việc cá nhân để nghiên cứu và đi tìm lời giải cho
mỗi bài toán. Kết thúc pha này, giáo viên thu lại toàn bộ giấy nháp và giấy làm
bài của học sinh. Phân tích bài làm thu được giúp chúng tôi nhận thấy những
quan điểm, mức độ hiểu biết và cách ứng xử trước bài toán chọn mẫu, từ đó
cho phép chúng tôi khẳng định hoặc bác bỏ giả thuyết đã nêu.
Pha 2: (Làm việc theo nhóm_10 phút)
Giáo viên chia học sinh thành các nhóm tùy thuộc vào số lượng học sinh của
lớp. Mỗi học sinh trong nhóm có nhiệm vụ trao đổi, đưa ra ý kiến của mình.
Sau đó cả nhóm sẽ thống nhất chung một lời giải cho mỗi bài toán. GV sẽ theo
dõi, quan sát và ghi nhận lại diễn biến của cuộc thảo luận để làm cơ sở phân
tích hậu nghiệm.
Pha 3: (Làm việc tập thể_20 phút)
Giáo viên có vai trò điều khiển cho cả lớp nhận xét, tranh luận, đánh giá lời
giải của các nhóm khác đã thu được ở pha 2. Đồng thời đưa ra những câu hỏi
dẫn dắt giúp học sinh tự tìm được lời giải đúng. Kết thúc mỗi bài toán, GV sẽ
cung cấp các kiến thức liên quan trước khi chuyển sang phần tiếp theo.
Pha 4: (Thể chế hóa_5 phút)
58
GV tổng kết lại những kiến thức đã cung cấp ở mỗi bài toán.
Đối với bài toán 1, kiến thức cần được truyền đạt:
Để đảm bảo mẫu được chọn có thể đại diện tốt cho quần thể để có thể suy
rộng cho quần thể với mức sai sót thấp nhất thì việc chọn mẫu cần phải dựa
trên điều kiện, tiêu chuẩn sau:
Tính ngẫu nhiên: Tính ngẫu nhiên là một trong các yêu cầu quan trọng nhất.
Một cách đơn giản, tính chất này đòi hỏi khả năng mỗi cá thể trong tổng thể
hay trong một bộ phận của tổng thể có thể được chọn như nhau. Trong một
số phương pháp chọn mẫu cụ thể, tính chất này có thể phụ thuộc rất nhiều
vào mục đích, phạm vi sử dụng số liệu mẫu cho phân tích và dự báo thống
kê.
Tính đại diện: Với những tổng thể lớn có phân thành những bộ phận khác
nhau và phân tích thống kê ở nhiều cấp thì tính đại diện cần được lưu ý từ
cấp thấp nhất, nghĩa là các cá thể được chọn vào mẫu cần phải đại diện được
cho hầu hết các bộ phận hoặc các cấp có trong tổng thể.
Đối với bài toán 2, kiến thức cần được truyền đạt:
Quá trình chọn mẫu có ảnh hưởng rất lớn đến việc suy kết quả cho toàn bộ
quần thể. Nếu không áp dụng kĩ thuật chọn mẫu đúng đắn thì kết quả thu
được sẽ không thể suy rộng ra cho toàn bộ tổng thể. Đối với những cuộc
khảo sát mà kết quả bị ảnh hưởng nhiều bởi các yếu tố như: độ tuổi, giới
tính…, để chọn được mẫu khảo sát chúng ta sẽ thực hiện như sau:
- Trước tiên phân chia tổng thể thành các tổ theo một tiêu thức có liên
quan đến mục đích nghiên cứu.
59
- Sau đó trong mỗi tổ ta chọn ngẫu nhiên ra các đơn vị điều tra. Số
lượng chọn ra ở mỗi tổ có thể tuân theo tỷ lệ số đơn vị tổ đó chiếm
trong tổng thể.
Việc thực hiện thành công pha 3 và pha 4 đồng nghĩa với việc chúng tôi đã xây
dựng được tiểu đồ án dạy học một số vấn đề về chọn mẫu.
3.2. Phân tích tiên nghiệm
Lời giải đúng được mong chờ:
Tờ báo thứ ba. Thăm dò diễn ra gần ngày bầu cử hơn (1); Cỡ mẫu lớn
hơn (2); Tiến hành trên lựa chọn ngẫu nhiên (3); Chỉ có người có quyền bầu cử
được hỏi (4). Đưa ra ít nhất là hai lý do; thông tin bổ sung (kể cả các thông tin
lạc đề hoặc không chính xác) có thể được bỏ qua.
Tờ báo thứ ba, bởi vì họ đã chọn nhiều người dân ngẫu nhiên có
quyền bầu cử hơn.
Tờ báo số ba, vì nó đã hỏi đến 1000 người ngẫu nhiên, và ngày thực
hiện gần với ngày bầu cử hơn, thì người đi bầu cử có ít thời gian để thay đổi quyết
định của họ hơn.
Tờ báo số ba, vì họ lựa chọn ngẫu nhiên những người có quyền bầu
cử.
Tờ báo số ba bởi vì nó khảo sát nhiều người hơn và gần với ngày bầu
cử hơn.
Tờ báo số ba bởi vì người ta đã chọn ngẫu nhiên 1000 người.
60
- Mục đích:
Xuất phát từ việc mọi bài toán trong SGK luôn có kết quả của mẫu phù hợp khi
suy rộng cho quần thể và không tồn tại KNV yêu cầu học sinh chọn ra mẫu phù
hợp. Bài toán 1 mang tính chất phỏng thực tiễn nhằm đặt người học trước tình
huống lựa chọn kết quả hợp lý từ một mẫu, làm thế nào để biết mẫu có đại diện
tốt cho quần thể hay không? Sau khi thực hiện bài toán 1, học sinh ý thức được
việc tồn tại những tác động có thể ảnh hưởng đến việc suy rộng cho quần thể nên
không phải mọi mẫu đều có thể đại diện tốt cho quần thể. Đồng thời cũng nhấn
mạnh đến các yếu tố kích thước mẫu, tính ngẫu nhiên khi chọn mẫu.
- Chiến lược :
Chiến lược 1 : So sánh giá trị phần trăm.
Học sinh sẽ chọn tờ báo ứng với tỉ lệ phần trăm cao nhất hoặc ứng với mỗi tờ báo
học sinh tính số lượng người ủng hộ sau đó so sánh các kết quả này. Nhóm những
học sinh chọn chiến lược này cho thấy các em chỉ quan tâm đến kết quả mà bỏ qua
các vấn đề của mẫu như kích thước mẫu, sự lựa chọn ngẫu nhiên, hay tính cập
nhật của thông tin… Khi chiến lược 1 được lựa chọn nhiều cũng sẽ cho thấy tiêu
chuẩn tỉ lệ có ảnh hưởng rất lớn trong việc đưa ra kết luận cho tổng thể.
Như đã phân tích, đây là KNV không xuất hiện trong thể chế dạy học của Việt
Nam do đó chúng tôi dự đoán học sinh sẽ dễ mắc phải sai lầm khi không quan tâm
đến kích thước mẫu hay tính ngẫu nhiên mà sẽ sử dụng tỉ lệ phần trăm hay số
lượng người để đưa ra kết luận. Do dó chiến lược 1 được dự đoán sẽ chiếm ưu thế.
Chiến lược 2 : Căn cứ vào các đặc điểm ảnh hưởng đến việc chọn mẫu (Số lượng
người khảo sát, mốc thời gian, tính ngẫu nhiên)
61
Lời giải tương ứng có thể quan sát được ứng với chiến lược này đó là học sinh sẽ
đưa ra những lời giải thích cho lựa chọn của mình như :
- Vì số người đông nhất.
- Vì thời gian khảo sát gần với thời gian bầu cử nhất.
- Vì người phỏng vấn được lựa chọn ngẫu nhiên.
Chúng tôi dự đoán chiến lược này sẽ ít có cơ hội xuất hiện.
Biến :
V1 : Tỉ lệ phần trăm.
V1 : Tỉ lệ phần trăm có sự chêch lệch lớn.
V2 : Tỉ lệ phần trăm có sự chêch lệch không đáng kể.
Chúng tôi chọn biến V1 : Tỉ lệ phần trăm có sự chêch lệch lớn, để tìm hiểu giữa
tiêu chuẩn tỉ số phần trăm và các yếu tố ảnh hướng đến việc chọn mẫu, học sinh
quan tâm đến vấn đề nào hơn ?
- V2 : Số lượng người khảo sát, mốc thời gian khảo sát.
V21 : Số lượng người khảo sát, mốc thời gian chênh lệch lớn.
V22 : Số lượng người khảo sát, mốc thời gian chênh lệch nhỏ.
Chúng tôi chọn biến V21 : Số lượng người khảo sát chênh lệch lớn, số lượng người
khảo sát khác nhau tạo điều kiện cho học sinh quan tâm đến vấn đề kích thước của
mẫu khảo sát, hạn chế chiến lược sai lầm là so sánh giá trị phần trăm, tạo cơ hội
cho chiến lược đúng xuất hiện.
Bài toán 2:
- Mục đích :
62
Kiểm chứng giả thuyết : “Học sinh sử dụng kết quả thu được từ mẫu để kết luận
cho tổng thể, mà không quan tâm đến mẫu được chọn có đại diện tốt cho tổng thể
hay chưa”
Chúng tôi đặt học sinh vào trong hoàn cảnh dựa vào kết quả số lượng người yêu
thích một chương trình để đưa ra sự phân bố thời gian chiếu tương ứng. Chúng ta
biết rằng, sự yêu thích một chương trình nào đó hay không phụ thuộc rất nhiều
vào độ tuổi của đối tượng được khảo sát do nhu cầu ở mỗi độ tuổi là khác nhau.
Ví dụ, thanh niên sẽ thích xem phim tình cảm, nghe ca nhạc nhiều hơn. Người lớn
tuổi thích xem thời sự, phim cổ trang. Vì vậy khi lựa chọn đối tượng khảo sát, số
lượng giữa các nhóm tuổi cần phải đồng đều, không quá tập trung vào một đối
tượng nhóm tuổi. Mặc dù cuộc khảo sát yêu cầu người được hỏi phải có độ tuổi
từ 18 − 55, tuy nhiên trong bài toán lại bỏ trống nhóm tuổi 18 − 35 và tập trung
khảo sát những người thuộc nhóm tuổi từ 55 tuổi trở lên. Điều này dẫn đến kết
quả của cuộc khảo sát chưa phù hợp do đó không thể dùng kết quả này để kết luận
cho toàn bộ tỉnh A. Chúng tôi muốn kiểm tra khi đứng trước tình huống, học sinh
có nhận ra điều này để kiểm tra lại tính hợp lý của kết quả hay không ?
- Chiến lược :
Chiến lược 1 : Chiến lược xử lý mẫu.
Điều có thể quan sát được khi học sinh sử dụng chiến lược này là : Học sinh sẽ
làm việc với các số liệu thu thập được ở bảng 2 (có thể tính tần số, tần suất, tỉ lệ
của từng loại chương trình hoặc dựa vào số lượng người nhiều hay ít) để đưa ra
nhận xét.
Một số câu trả lời dự kiến nhận được từ học sinh :
Chương trình thời sự được yêu thích nhiều nhất (45,45%)
63
Chương trình ca nhạc ít được yêu thích nhất (5,4%)
Thứ tự các chương trình được yêu thích là : Chương trình ca nhạc,
phim tình cảm, phim cổ trang, thời sự.
Sau khi làm việc với bảng số liệu, học sinh sẽ dựa vào số lượng người bình chọn,
tỉ lệ, tần suất, tần số để phân phối lượng thời gian tương ứng với tỉ lệ mà chương
trình đó được yêu thích, chương trình nào nhận được nhiều sự yêu thích sẽ được
dành thời gian chiếu nhiều nhất và ngược lại.
Chiến lược 2 : Bác bỏ mẫu.
Điều có thể quan sát được ở chiến lược này là học sinh không lập tức tính toán hay
đưa ra nhận xét thông qua bảng số liệu 2. Mà thay vào đó là hình thành các câu
hỏi về đối tượng được khảo sát. Ví dụ : Tại sao lại không có người nào thuộc nhóm
tuổi 18 – 25 ? Tại sao lại xuất hiện đối tượng thuộc độ tuổi 55+, mẫu số liệu có đủ
lớn để đưa ra kết quả không… Và do đó cho rằng kết quả của cuộc khảo sát chưa
đủ thông tin chính xác để đưa ra nhận xét hay làm căn cứ để phân bố thời gian
chiếu các chương trình.
Khi phần lớn học sinh lựa chọn chiến lược 1 nghĩa là học sinh không quan tâm
đến quá trình chọn mẫu đã đủ chính xác hay chưa. Mà chỉ chú trọng đến việc xử
lý các kết quả thống kê và đưa ra nhận xét, kết luận. Điều này đồng nghĩa với việc
giả thuyết : “Học sinh sử dụng kết quả thu được từ mẫu để kết luận cho tổng thể,
mà không quan tâm đến mẫu được chọn có đại diện tốt cho tổng thể hay chưa” đã
được kiểm chứng.
Khi chiến lược 2 chiếm ưu thế đồng nghĩa với việc, học sinh có ý thức được sự
ảnh hưởng của việc chọn mẫu lên kết quả thống kê và quan tâm đến việc chọn mẫu
phù hợp cũng như tồn tại nghi ngờ kết quả thống kê.
64
Biến
V1 : Hình thức của câu hỏi.
V1 : Câu hỏi mở, nêu rõ mục đích, yêu cầu và đối tượng khảo sát.
V2 : Câu hỏi yêu cầu tính toán cụ thể, không nêu rõ mục đích và đối tượng
khảo sát.
Chúng tôi lựa chọn biến V1 : Câu hỏi mở, nêu rõ mục đích, yêu cầu và đối tượng
khảo sát.
Thứ nhất, đối với dạng câu hỏi mở, không lựa chọn yêu cầu học sinh tính
toán hay xử lý số liệu từ bảng đã cho nhằm hạn chế việc học sinh sử dụng
chiến lược 1, tạo điều kiện cho chiến lược đúng có cơ hội xuất hiện.
Thứ hai, nhận thấy tất cả các bài tập trong SGK, SBT học sinh không có
điều kiện để tìm hiểu về quá trình chọn mẫu mà chỉ được làm việc với bảng
kết quả. Vì vậy việc lựa chọn cung cấp đầy đủ mục đích, yêu cầu và đối
tượng khác với cách ra đề thường thấy trong SGK nhằm tạo sự chú ý, hướng
học sinh quan tâm đến những vấn đề này, tạo thuận lợi cho chiến lược đúng
được xuất hiện.
3.3. Phân tích hậu nghiệm
Thực nghiệm được tiến hành trên 36 học sinh lớp 11 ở một trường phổ thông tại
Long An. Đây là những em học sinh có lực học trung bình, khá và đã được học
đầy đủ chương thống kê ở chương trình toán 10.
Bài toán 1
Sau đây là kết quả thống kê kết quả dựa trên chiến lược học sinh đã sử dụng ở bài
toán 1 :
65
Bảng 3.1: Kết quả thống kê dựa trên chiến lược của học sinh
S1 S2 Chiến lược khác Tổng
33
33(92%) 2(5,5%) 1(2.5%) 36
36
Đúng như dự đoán ở phân tích tiên nghiệm, có đến (92%) học sinh lựa chọn sử
dụng chiến lược 1 để giải bài toán.
Cụ thể: có 3 học sinh lựa chọn tờ báo thứ nhất với phần trình bày giải thích là do
cuộc bầu cử diễn ra dài nhất. Ở đây có thể lý giải về việc đưa ra lý do này là do
các em hiểu nhầm rằng cuộc bầu cử tính từ ngày 6/1 nên có thời gian bầu cử dài
13
nhất.
36
Có (36%) học sinh lựa chọn tờ báo thứ 2 có kết quả sát nhất. Đa số những học
sinh chọn tờ báo này đều đưa ra những lý do sau:
Tỉ lệ phần trăm cao.
Sát với ngày bầu cử.
66
14
36
Có (39%) học sinh lựa chọn tờ báo thứ 4 có kết quả sát nhất. Tất cả những học
sinh lựa chọn tờ báo này đều có một giải thích chung là do có tỉ lệ phần trăm cao
nhất.
Mặc dù sự lựa chọn bài báo có kết quả sát nhất trong nhóm sử dụng chiến lược S1
là khác nhau. Tuy nhiên những học sinh trong nhóm này đều đưa ra lời giải thích
là do tỉ lệ của tờ báo đó cao. Từ đó cho thấy mặc dù tính cập nhật thông tin, độ lớn
của mẫu khảo sát đã được đề cập đến nhưng tiêu chuẩn tỉ lệ lại được học sinh chú
trọng và đánh giá cao hơn và cũng là yếu tố quyết định để đưa ra kết luận của học
2
sinh.
36
Có (5,5%) học sinh lựa chọn chiến lược S2, chiếm một tỉ lệ rất thấp.
67
Học sinh giải thích sự lựa chọn của mình bằng cách phủ nhận sự hợp lý của những
tờ báo khác: Không chọn tờ báo thứ nhất vì khảo sát cách ngày quá xa, không chọn
tờ báo thứ 2 vì có số người khảo sát chênh lệch quá cao so với 2 tờ báo 3 và 4
(chúng tôi hiểu học sinh đang ngầm ẩn đưa ra lý do mẫu khảo sát ít hơn tờ báo 3,
4) và chọn tờ báo thứ 3 (học sinh có sự nhầm lẫn trong kết luận khi viết thành tờ
báo thứ 4) do những người được khảo sát là những người ngẫu nhiên có quyền
bầu cử còn tờ báo thứ 4 thì không. Như vậy, tiêu chuẩn tỉ lệ không phải là yếu tố
quyết định để đưa ra quyết định đối với học sinh nhóm S2. Thay vào đó học sinh
nhóm này quan tâm hơn với các vấn đề tính ngẫu nhiên, kích thước mẫu và tính
cập nhật của thông tin.
Ngoài ra có 1 học sinh đưa ra lựa chọn đúng là tớ báo thứ 3, bài làm của học sinh
này như sau:
68
Để giải thích cho lựa chọn của mình, học sinh tính số người tương ứng ở mỗi tờ
báo (phần số được ghi bằng bút chì) để chọn ra hai tờ báo có số người bình chọn
cao nhất. Tuy nhiên khi chọn được 2 tờ báo có số người bình chọn cao nhất học
sinh lại không tiếp tục sử dụng tiêu chuẩn tỉ lệ để đánh giá mà lập luận tờ báo thứ
3 là tờ báo sát nhất do kết quả khảo sát của tờ báo thứ 4 không mang tính khách
quan (chúng tôi hiểu học sinh đang ngầm ẩn đề cập đến tính ngẫu nhiên trong việc
chọn mẫu). Do đó chúng tôi xếp bài làm của học sinh này vào nhóm các chiến
lược khác.
Như vậy, với kết quả thu được của bài toán 1 cho phép chúng tôi đưa ra những kết
luận sau:
69
- Khi đứng trước một bài toán chọn mẫu phù hợp, học sinh sẽ chú trọng đến
tiêu chuẩn tỉ lệ để đưa ra kết luận cho quần thể.
- Sự thiếu vắng KNV chọn mẫu phù hợp trong SGK làm cho học sinh gặp
khó khăn hay thậm chí là phán đoán sai lầm khi phải đưa ra sự lựa chọn
mẫu nào phù hợp, mẫu nào không phù hợp. Chúng tôi đã chọn một bài toán
trong tài liệu tập huấn PISA vì đây là cuộc thi áp dụng toán học để giải quyết
các vấn đề thực tiễn, tuy nhiên đa số học sinh đã không thể đưa ra được lời
giải như mong đợi. Sự thiếu vắng KNV chọn mẫu phù hợp khiến học sinh
chưa được xây dựng và trang bị những kĩ năng chọn mẫu để áp dụng vào
thực tiễn, điều này làm mất đi một phần ý nghĩa của thống kê.
Bài toán 2 :
Mặc dù chúng tôi đã cung cấp thông tin đối tượng khảo sát phải có độ tuổi từ 18 −
55 tuy nhiên khi theo dõi quá trình làm bài, 100% học sinh không thắc mắc hay
phản ứng lại với những số liệu mà mình nhận được mà vẫn tiếp tục trả lời những
câu hỏi 1) và 2). Học sinh sử dụng chiến lược S1 để trả lời cho câu hỏi. Nghĩa là,
kết luận được đưa ra dựa vào số lượng người bình chọn nhiều hay ít hoặc dựa vào
tỉ số phần trăm bình chọn ở mỗi chương trình :
70
Câu trả lời nhận được nhiều nhất cho câu hỏi này đó là học sinh sắp xếp các chương
21
trình theo mức độ yêu thích, đứng đầu là thời sự, phim cổ trang, phim tình cảm,
36
chương trình ca nhạc. Có tới (58%) học sinh kết luận bằng câu: “Khán giải tại
tỉnh A”. Điều này cho thấy học sinh đã sử dụng kết quả của cuộc khảo sát để suy
luận cho toàn bộ tỉnh A mà không quan tâm hay nghi ngờ mẫu được lựa chọn có
phù hợp và đại diện tốt cho tỉnh A hay không? Một số câu trả lời nhận được nhiều
nhất như:
71
Bên cạnh đó trong bài làm của một số học sinh thể hiện các em có chú ý đến độ
tuổi 55+ được khảo sát nhưng chưa đưa ra được sự bất hợp lý trong khâu chọn đối
tượng khảo sát.
Các em coi đó là một nguyên nhân dẫn đến tỉnh A thích xem thời sự và phim cổ
trang nhiều hơn. Điều này có nghĩa, khi gặp một bài toán, học sinh sẽ mặc định là
đề luôn đúng sau đó dùng các dữ liệu đề bài để suy ra các hệ quả mà không hoài
nghi về tính hợp lý của đề bài. Do đó khi nhận được các kết quả học sinh quay
ngược lại trả lời cho câu hỏi mà không có bước kiểm tra lại.
Đối với câu hỏi 2), khi được hỏi các em sẽ phân bố thời gian chiếu các chương
trình này như thế nào, đa số học sinh phân bố thời gian chiếu các chương trình dựa
vào sự yêu thích mà chương trình đó được bình chọn. Chương trình nào được bình
chọn nhiều sẽ được ưu tiên chiếu với thời lượng nhiều và ngược lại. Bài làm của
những học sinh này thể hiện các em đã áp dụng kết quả của cuộc khảo sát để phân
bố thời gian chiếu cho toàn bộ tỉnh A.
72
Điều khiến chúng tôi chú ý đó là sự mâu thuẫn trong bài làm của học sinh. Một số
học sinh ở câu hỏi thứ nhất trả lời khán giả ở tỉnh A yêu thích xem thời sự và phim
cổ trang hơn, tuy nhiên khi phân bố thời gian chiếu lại ưu tiên thời lượng chiếu
cho chương trình ca nhạc và phim tình cảm:
73
74
Chúng tôi đã tiến hành phỏng vấn các em này về câu trả lời của mình thì nhận
được lời giải thích là do các em yêu thích ca nhạc và phim tình cảm hơn. Như vậy
càng khẳng định yếu tố độ tuổi có ảnh hưởng rất lớn đối với thể loại chương trình
yêu thích. Bản thân học sinh đã ý thức được với mỗi độ tuổi khác nhau sẽ có sở
thích xem khác nhau. Tuy nhiên lại chưa thấy được sự ảnh hưởng khi lựa chọn các
đối tượng khảo sát như trên đến việc kết luận về sự yêu thích của khán giả cho
toàn bộ tỉnh A. Từ tất cả những ghi nhận được từ bài toán 2 cho phép chúng tôi
kiểm chứng thành công giả thuyết: “Học sinh sử dụng kết quả thu được từ mẫu để
kết luận cho tổng thể, mà không quan tâm đến mẫu được chọn có đại diện tốt cho
tổng thể hay chưa”
Phân tích tiến trình buổi học
Sau khi thu lại toàn bộ bài làm cá nhân của học sinh, GV bắt đầu tiết dạy như kịch
bản đã đưa ra. Trong quá trình dạy, GV sẽ có những tác động, những câu hỏi dẫn
dắt giúp học sinh tiếp thu kiến thức mới. Đây cũng chính là việc thực hiện một
tiểu đồ án dạy học mà chúng tôi muốn xây dựng.
GV chia lớp thành 4 nhóm và yêu cầu mỗi nhóm bắt đầu thảo luận. Kết thúc pha
thảo luận nhóm, chiến lược mà các nhóm sử dụng được thống kê lại như sau:
Bảng 3.2: Thống kê chiến lược ở bài toán 1 của các nhóm
Chiến lược S1 Chiến lược S2
Nhóm 1, nhóm 2, nhóm 4 Nhóm 3
(Tỷ lệ 3/4) (Tỷ lệ 1/4)
75
Mặc dù các nhóm 1, 2, 4 sử dụng chung một chiến lược S1, tuy nhiên đáp án mà
các nhóm đưa ra là khác nhau.
Bảng 3.3: Thống kê lựa chọn tờ báo của các nhóm
Chọn tờ báo thứ thứ 2 Chọn tờ báo thứ 4
Nhóm 4 Nhóm 1, 2
Theo ghi nhận và quan sát được, tờ báo thứ nhất nhanh chóng bị bác bỏ ở tất cả
các nhóm. Cụ thể ở nhóm 2, khi một HS chọn tờ báo thứ nhất và đưa ra lời giải
thích là do thời gian bầu cử diễn ra trong thời gian dài (6/1 – 25/1), các bạn trong
nhóm đã nhanh chóng bác bỏ và giải thích lại rằng cuộc bầu cử chỉ diễn ra trong
ngày 6/1 và tỉ lệ chọn số người khảo sát thấp.
Nhóm 1, 2 chọn đáp án là tờ báo thứ 4. Một số lý do chung được cả 2 nhóm đưa
ra như:
Tỉ lệ phần trăm cao.
Số lượng người khảo sát đông.
Với những lý do mà các nhóm đưa ra cho thấy, tỉ lệ phần trăm là công cụ rất mạnh
được học sinh sử dụng để so sánh rồi kết luận sự phù hợp của mẫu này so với mẫu
khác. HS đã quan tâm đến số lượng người khảo sát, ý thức được số lượng khảo sát
cần lớn, mà chưa chú ý đến đặc trưng của người khảo sát (ngẫu nhiên hay không?
có đại diện tốt hay không?).
Theo quan sát, HS nhóm 1, nhóm 2 có sự phân vân trong việc lựa chọn tờ báo thứ
2 và tờ báo thứ 4:
76
HS 1: Tờ báo thứ 2 có 500 người mà đạt 41%, tờ báo thứ 4 có 1000 người
mà có 44,5%. Hơn có 3,5% thôi hả?
(Một số học sinh đồng tình và bắt đầu phân vân)
HS 2: Đã tính tỉ lệ phần trăm thì đâu quan trọng số người nữa đâu.
Những tranh luận này đều quay quanh vấn đề tỉ lệ phần trăm, chưa có những thảo
luận về các đặc điểm của mẫu người khảo sát. Việc thảo luận của nhóm 4 cho thấy,
nhóm đã chú ý đến yếu tố ngẫu nhiên và tính cập nhật thời gian. Tuy nhiên các em
không cho đây là yếu tố quan trọng và quyết định để đưa ra kết luận đâu là tờ báo
có kết quả khảo sát đúng nhất mà dựa vào tỉ lệ phần trăm:
Tờ báo thứ 4 có kết quả khảo sát đúng nhất. Vì tờ báo khảo sát gần ngày
diễn ra bầu cử, người dân có quyền bầu cử ngẫu nhiên. Tỉ lệ 41% trong 500
chiếm tỉ lệ cao.
Việc sử dụng chiến lược S1 có thể quan sát được rất rõ trong việc thảo luận nhóm
và bài làm ở các nhóm 1, nhóm 2 và nhóm 4.
Nhóm số 3 đã sử dụng chiến lược mà chúng tôi mong đợi. Nhóm 3 đưa ra lựa chọn
tờ báo có kết quả khảo sát đúng nhất bằng cách đưa ra những điểm chưa hợp lý
của những tờ báo còn lại: Không lựa chọn tờ báo thứ nhất vì nó cách xa ngày khảo
sát, không lựa chọn tờ báo thứ 2 vì số lượng người khảo sát ít, tờ báo thứ 4 thì chỉ
có những người bầu cử qua điện thoại.
Sau khi học sinh của nhóm 3 trình bày, một học sinh của nhóm 1 phản đối: “Tờ
báo thứ 4 và tờ báo thứ 3 có cùng ngày khảo sát, cùng số lượng người khảo sát
nhưng tỉ lệ của tờ báo thứ 4 cao hơn nên phải đáng tin cậy hơn”. Một số học sinh
trong nhóm thì thầm: “Nhóm số 3 nên chọn tờ báo thứ 3”. Trong bài làm của nhóm
số 3 có đưa ra một lý do giải thích cho sự lựa chọn của mình là do người bầu cử
77
được lựa chọn ngẫu nhiên. Nhưng việc chưa giải thích được phản đối của nhóm
số 1 và theo quan sát trong quá trình thảo luận, chúng tôi nhận thấy từ “ngẫu nhiên”
được sử dụng do nó có sẵn trong đề bài, học sinh chưa thực sự hiểu và giải thích
được tại sao cần phải lựa chọn ngẫu nhiên, sự khác nhau giữa 1000 người lựa chọn
ngẫu nhiên và 1000 người gọi điện bầu cử là như thế nào? Giáo viên bắt đầu can
thiệp vào quá trình thảo luận:
Như vậy tất cả các nhóm đã thống nhất không chọn tờ báo thứ nhất và thứ
hai và đang phân vân giữa tờ báo thứ ba và tờ báo thứ tư. Có một vấn đề
mới được nảy sinh đó là lựa chọn khảo sát 1000 người ngẫu nhiên hay 1000
người gọi điện phỏng vấn sẽ tốt hơn? Chúng ta xem xét giữa hai nhóm đối
tượng này có đặc điểm gì khác nhau.
Các nhóm thảo luận sôi nổi, sau đây là ý kiến của học sinh gần đúng với mong
chờ của chúng tôi:
1000 người ngẫu nhiên thì có thể đọc báo hoặc không. Còn 1000 người đọc
báo thì chắc chắn họ có đọc báo.
Giáo viên tiếp tục đưa ra những câu hỏi dẫn dắt học sinh xây dựng kiến thức:
GV: Những người đọc báo có nghĩa là họ đã đọc một hoặc nhiều bài báo
viết về vấn đề bầu cử, về đối tượng ứng cử. Như vậy họ có thể đã bị những
nội dung họ đọc chi phối đến lựa chọn của mình. Vậy theo các em chọn
78
đối tượng như thế nào thì kết quả khảo sát sẽ khách quan và công bằng
hơn?
HS: Chọn ngẫu nhiên ạ.
Để nhấn mạnh hơn về sự cần thiết của việc lựa chọn ngẫu nhiên và ảnh hưởng của
nó đến kết quả khảo sát, giáo viên tiếp tục đưa ra một ví dụ:
Để khảo sát chất lượng học môn Toán của học sinh lớp 11A1 và 11A2, nếu
cô chọn 3 bạn học sinh giỏi nhất của lớp 11A1 và 3 bạn học sinh có điểm
tổng kết thấp nhất của lớp 11A2. Như vậy kết quả của cuộc khảo sát có công
bằng và khách quan không?
Cuối cùng giáo viên tiến hành thể chế hóa các kiến thức về chọn mẫu:
Để đảm bảo mẫu được chọn có thể đại diện tốt cho quần thể để có thể suy
rộng cho quần thể với mức sai lầm thấp nhất thì việc chọn mẫu cần phải dựa
trên các điều kiện, tiêu chuẩn sau:
Tính ngẫu nhiên: Tính ngẫu nhiên là một trong các yêu cầu quan trọng nhất,
đảm bảo tính chất không chệch của suy diễn thống kê, cũng như các mô tả
thống kê.
Tính đại diện: Tính đại diện thường được xác định trên cơ sở yêu cầu về
mức tin cậy của các phân tích thống kê như ước lượng, kiểm định…
Như vậy thông qua cuộc thảo luận cho thấy: Bản thân học sinh đã có ý thức về
việc chọn mẫu cần phải có kích thước mẫu lớn, đã chú ý đến sự cập nhật về thông
tin (ngày, tháng), giáo viên đã xây dựng và giải thích về đặc điểm quan trọng nhất
của chọn mẫu cho học sinh đó là tính ngẫu nhiên.
79
Bài toán 2
Sau khi giáo viên hoàn thành thể chế hóa các kiến thức rút ra từ bài toán 1, học
sinh bắt đầu thảo luận nhóm bài toán số 2. Kết quả thảo luận nhóm ở bài số 2
hoàn toàn tương tự như kết quả mà học sinh làm việc cá nhân. Nghĩa là, 100%
các nhóm đều sử dụng bảng số liệu đã cho, tiến hành tính toán, phân tích các
con số sau đó đưa ra kết luận về sự yêu thích, nhu cầu xem truyền hình của
toàn bộ tỉnh A. Câu trả lời nhận được nhiều nhất từ các nhóm là sắp xếp các
chương trình theo thứ tự yêu thích nhất đến các chương trình có độ yêu thích
thấp:
Nhu cầu, sở thích của khán giả tỉnh A về thời sự là nhiều nhất. Bên cạnh đó
thì phim cổ trang và phim tình cảm cũng được ưa thích hơn so với ca nhạc.
Do đó, với câu hỏi phân bố thời lượng chiếu các chương trình này cho phù hợp
với nhu cầu và sự yêu thích của khán giả, hầu hết các nhóm đã phân bố thời
gian dựa vào mức độ mà chương trình đó được yêu thích: Chương trình nào
được yêu thích thì chiếu với thời lượng nhiều, chương trình nào ít được yêu
thích thì chiếu với thời lượng ít.
Ghi nhận từ thảo luận của các nhóm, chúng tôi nhận thấy các học sinh trong
nhóm có sự quan tâm đến nhóm tuổi. Hội thoại sau được lấy từ thảo luận của
nhóm 2:
HS 2.1: Ê sao tui thấy tỉnh này nhiều người lớn tuổi quá vậy?
80
HS 2.2: Ừa, thì tỉnh này có dân số già thôi.
HS 2.3: Tại vì dân số già nên họ mới thích xem thời sự. Bình thường mà.
Một nhận xét khác được ghi chép lại từ một học sinh nhóm 4:
HS 4.1: Khán giả hầu hết là những người thuộc U65.
Thông qua quan sát và ghi nhận được từ sự thảo luận cho chúng tôi thấy: Học sinh
nhận ra số lượng người khảo sát thuộc vào nhóm tuổi 56+ chiếm phần lớn, giữa
các nhóm tuổi khảo sát có sự chênh lệch về số lượng người và cũng đã ý thức được
rằng tuổi tác sẽ ảnh hưởng đến sự yêu thích một thể loại truyền hình “thì dân số
già nên mới thích xem thời sự”. Tuy nhiên với những điều phát hiện trên, học sinh
không cảm thấy nghi ngờ kết quả khảo sát hay nhận ra việc chọn đối tượng khảo
sát như vậy là chưa hợp lý, mà xem đây như những lý do giải thích cho việc tại
sao người dân tỉnh A lại có nhu cầu và yêu thích như ở câu hỏi 1) đã kết luận.
Kết thúc pha thảo luận nhóm ở bài toán thứ 2 cho thấy: Học sinh hoàn toàn không
nghi ngờ về mẫu được chọn. Khi được cho một mẫu số liệu, học sinh ngay lập tức
xử lý mẫu, dùng mẫu số liệu này để đưa ra kết luận và không có sự kiểm tra lại
tính hợp lý của nó. Điều này đồng nghĩa với việc, học sinh chưa ý thức được vai
trò, ảnh hưởng của việc chọn mẫu đến kết quả nghiên cứu. Từ những ghi nhận
được, giáo viên bắt đầu can thiệp nhằm giúp học sinh nhận ra vai trò, tầm quan
trọng của việc chọn mẫu đến kết quả điều tra. Đồng thời giới thiệu một kỹ thuật
chọn mẫu cho học sinh: kỹ thuật chọn mẫu theo tổ.
Nhằm mục đích nhắc lại và nhấn mạnh đến việc độ tuổi có ảnh hưởng rất lớn đến
kết quả khảo sát, giáo viên đưa ra câu hỏi thảo luận:
GV: Lứa tuổi 18 – 20 như các em thích xem chương trình gì? Có giống với
sở thích của ông bà, bố mẹ các em không?
81
HS 1.1: Em thích xem Gameshow, ca nhạc. Còn ông bà em thích xem thời
sự, phim Ấn Độ.
GV: À như vậy với những độ tuổi khác nhau sẽ có sở thích khác nhau, đúng
không?
HS: Dạ.
Sau khi chắc chắn rằng tất cả học sinh đều đồng ý và thừa nhận kết quả của khảo
sát bị ảnh hưởng lớn từ độ tuổi của người được phỏng vấn, giáo viên tiếp tục đưa
ra những câu hỏi dẫn dắt:
GV: Chúng ta thấy người dân tỉnh A được phân thành các nhóm tuổi khác
nhau. Nhìn vào bảng, các em cho cô biết đối tượng chủ yếu được khảo sát
là nhóm tuổi nào?
HS 3.1: Dạ là những người trung niên, từ 56 tuổi trở lên ạ.
GV: Đối tượng khảo sát mà bài toán yêu cầu là nhóm tuổi nào?
HS 3.2: Dạ từ 18 – 55 ạ.
GV: Vậy người đi khảo sát đã thực hiện đúng yêu cầu của bài toán chưa?
Việc tập trung khảo sát nhóm tuổi 55+ có đại diện được hết cho toàn bộ
người dân tỉnh A không?
HS đồng thanh: Dạ không.
GV: Như vậy kết quả khảo sát có chính xác khi kết luận cho toàn bộ tỉnh A
hay không?
HS đồng thanh: Không ạ.
GV: Vì sao?
82
HS 1.2: Vì còn có những người trẻ chưa được hỏi. Nếu được hỏi họ sẽ thích
xem ca nhạc hơn ạ.
GV: Đúng rồi. Như vậy việc lựa chọn mẫu để khảo sát là vô cùng quan
trọng. Chúng ta cần phải lựa chọn mẫu phù hợp, các đối tượng khảo sát
phải đại diện được cho tổng thể thì khi đó từ kết quả của mẫu mới có thể
suy ra kết luận cho tổng thể ban đầu.
Như vậy giáo viên đã thành công trong việc dẫn dắt học sinh nhận ra sự chưa hợp
lý từ mẫu được chọn khảo sát. Đồng thời một trong những đặc điểm của chọn mẫu
là tính đại diện đã được xây dựng. Từ đó giúp học sinh ý thức được tầm quan trọng
và ảnh hưởng của mẫu đến kết quả khảo sát: Nếu chọn mẫu không phù hợp sẽ dẫn
đến kết quả suy rộng cho quần thể bị sai lầm.
Tiếp theo, giáo viên giúp học sinh hình thành kĩ thuật chọn mẫu – kĩ thuật chọn
mẫu theo tổ.
GV: Quay lại bài toán, nếu em là người đi tiến hành điều tra, em sẽ thực
hiện khảo sát như thế nào?
HS 2.2: Phân chia người dân tỉnh A thành các nhóm tuổi khác nhau nhưng
theo đúng yêu cầu từ 18- 55 thôi ạ. Sau đó trong mỗi nhóm tuổi chọn ra
người để khảo sát.
GV: Đúng rồi. Nhưng các em lấy người khảo sát từ mỗi nhóm tuổi ra như
thế nào?
Học sinh suy nghĩ một lúc.
HS 1.3: A, lấy ngẫu nhiên ạ. Mới học ở bài 1.
83
Đến đây học sinh đã tự mình xây dựng được các bước: Phân chia đối tượng khảo
sát thành các tổ, các nhóm theo một tiêu thức và lựa chọn hình thức lấy ngẫu nhiên
ra các đối tượng khảo sát từ các tổ, các nhóm đã chia. Tiếp theo, giáo viên cố gắng
nhấn mạnh về cách lấy ra các đối tượng khảo sát từ các nhóm khảo sát.
GV: Đúng rồi. Một trong các cách lấy đó là chúng ta sẽ lấy ngẫu nhiên các
đối tượng khảo sát từ các nhóm. Nhưng vẫn đề là lấy với số lượng như thế
nào?
HS 2.2: Lấy bằng nhau cho công bằng ạ.
GV: Vậy nếu tỉnh A có rất nhiều người trẻ nhưng lại có rất ít người già thì
sao?
HS: Nếu vậy thì lấy nhiều người trẻ ạ.
GV: Đúng rồi. Như vậy, số lượng người lấy ra từ các nhóm phụ thuộc vào
tỉ lệ số người mà nhóm đó có so với tổng số người của toàn bộ tỉnh A. Vậy
các em sẽ lấy số lượng người khảo sát từ các nhóm tuổi như thế nào?
HS: Nhóm nào có nhiều người thì lấy ra nhiều người khảo sát hơn, nhóm ít
người thì lấy ra ít người hơn ạ.
Thông qua việc xây dựng cách tiến hành khảo sát nhu cầu xem phim tại tỉnh A,
học sinh đã xây dựng được cách lấy mẫu khảo sát bằng kỹ thuật chọn mẫu. Giáo
viên thực hiện bước thể chế hóa của bài toán số 2 về việc xây dựng kĩ thuật chọn
mẫu:
GV: Quá trình chọn mẫu có ảnh hưởng rất lớn đến việc suy ra kết quả cho
toàn bộ tổng thể. Nếu không áp dụng kĩ thuật chọn mẫu đúng đắn thì kết
quả thu được sẽ không thể suy rộng ra cho toàn bộ tổng thể. Đối với những
84
cuộc khảo sát mà kết quả bị ảnh hưởng nhiều bởi các yếu tố như: độ tuổi,
giới tính…, để chọn được mẫu khảo sát chúng ta sẽ thực hiện như sau:
- Trước tiên phân chia tổng thể thành các tổ theo một tiêu thức có liên
quan đến mục đích nghiên cứu.
- Sau đó trong mỗi tổ ta chọn ngẫu nhiên ra các đơn vị điều tra. Số
lượng chọn ra ở mỗi tổ có thể tuân theo tỷ lệ số đơn vị tổ đó chiếm
trong tổng thể.
Kết thúc pha thể chế hóa của bài toán thứ 2, giáo viên đã giới thiệu được kĩ thuật
chọn mẫu theo tổ. Giúp học sinh hiểu biết thêm về một phương pháp chọn mẫu,
để khi đứng trước các vấn đề tương tự học sinh có cơ sở, phương pháp để xử lý
chúng. Ngoài ra, bên cạnh tính ngẫu nhiên đã được đưa ra ở pha thể chế hóa của
bài toán 1, giáo viên đã cung cấp thêm đặc điểm về tính đại diện của chọn mẫu.
Như vậy kết thúc buổi học, giáo viên đã thực hiện đầy đủ những mục đích đã được
nêu ra. Học sinh đã được tiếp thu thêm các kiến thức mới mà SGK không giới
thiệu: Tính ngẫu nhiên và tính đại diện của chọn mẫu, hình thành kĩ thuật chọn
mẫu theo tổ.
85
Tổng kết chương 3
Trong chương 3, chúng tôi đã tiến hành một thực nghiệm gồm 2 bài toán, nhằm
vào ba mục đích như sau:
Thứ nhất: Tạo cơ hội cho học sinh tiếp xúc với KNV: Chọn mẫu đại diện phù hợp,
đây là KNV xuất hiện trong SGK Mỹ nhưng lại bị thiếu vắng trong SGK Việt
Nam.
Thứ hai: Kiểm chứng giả thuyết: “Học sinh sử dụng kết quả thu được từ mẫu để
kết luận cho tổng thể, mà không quan tâm đến mẫu được chọn có đại diện tốt cho
tổng thể hay chưa.”
Thứ ba: Giới thiệu kĩ thuật chọn mẫu: Do khuôn khổ có giới hạn của luận văn,
chúng tôi chỉ lựa chọn một phương pháp chọn mẫu là phương pháp chọn mẫu theo
tổ để bổ sung một kỹ thuật còn thiếu hụt trong SGK Việt Nam.
Kết quả mà chúng tôi đã đạt được sau khi tiến hành thực nghiệm bao gồm:
Thứ nhất: Chúng tôi đã đưa ra một KNV mới không xuất hiện trong SGK
toán VN: Chọn mẫu đại diện phù hợp cho tổng thể. Việc để KNV này xuất hiện
giúp học sinh nhận thức được rằng không phải mọi mẫu đều sẽ đại diện tốt cho
quần thể, cung cấp cho học sinh cách để lựa chọn ra mẫu thích hợp khi đứng trước
2 hay nhiều mẫu khác nhau. Thông qua bài toán đã lựa chọn, chúng tôi cũng đã
làm nổi bật tính ngẫu nhiên và tính đại diện của chọn mẫu.
Thứ hai: Bằng việc lựa chọn mẫu không phù hợp, chúng tôi đã tạo ra tình
huống có kết quả thống kê không chính xác khi suy ra cho tổng thể và nhờ đó kiểm
chứng thành công giả thuyết: “Học sinh sử dụng kết quả thu được từ mẫu để kết
luận cho tổng thể, mà không quan tâm đến mẫu được chọn có đại diện tốt cho tổng
thể hay chưa”
86
Thứ 3: Chúng tôi đã cung cấp cho học sinh một kĩ thuật chọn mẫu mới – kĩ
thuật chọn mẫu theo tổ. Học sinh được học thêm một kiến thức, kĩ thuật mới hoàn
toàn không được đề cập đến trong SGK nhưng lại rất cần thiết khi giải các bài toán
chọn mẫu.
87
Kết luận
Các kết quả nghiên cứu đã được trình bày trong từng chương của luận văn. Sau
đây, chúng tôi xin tổng kết lại nội dung tâm đắc mà chúng tôi đã đạt được:
Chương 1:
Bằng việc tìm tòi, tham khảo từ những nghiên cứu đã được công bố trước đó,
chúng tôi đã chỉ ra tầm quan trọng của vấn đề chọn mẫu, đưa ra cơ sở của các kỹ
thuật chọn mẫu và các bài toán liên quan.
Chương 2:
Chúng tôi tiến hành nghiên cứu sự tồn tại của bài toán chọn mẫu trong sách giáo
khoa Toán Việt Nam và Mỹ.
Qua việc phân tích cách trình bày lý thuyết của SGK Toán Việt Nam và tìm hiểu
về các KNV trong SGK và SBT, chúng tôi nhận thấy: SGK tập trung vào việc
trình bày và tính các tham số đặc trưng của một mẫu dữ liệu. Do đó, hầu hết các
bài tập đều chú trọng đến việc hình thành kĩ thuật vẽ biểu đồ, tính các tham số đặc
trưng, chưa có nhiều sự quan tâm cho vấn đề chọn mẫu: Vai trò của mẫu, kĩ thuật
chọn mẫu, bài toán suy rộng cho quần thể. Tất cả các bài tập đều được SGK cho
trước mẫu số liệu, không đặt học sinh trước bài toán cần phải chọn mẫu.
Thông qua việc tìm hiểu sự tồn tại của bài toán chọn mẫu trong chương trình giảng
dạy xác suất thống kê ở Việt Nam và Mỹ, giúp chúng tôi hiểu rõ hơn về những
đặc trưng, những ràng buộc của thể chế. Từ đó tìm ra những điều mới, điều tích
cực có thể bổ sung, hỗ trợ, giúp ích cho công tác giảng dạy. Điều này đã giúp
chúng tôi hình thành lên những ý tưởng về bài toán thực nghiệm của mình.
Chương 3:
88
Chúng tôi đã tiến hành một thực nghiệm gồm 2 bài toán. Kết thúc thực nghiệm,
chúng tôi đã thu được các kết quả sau:
Thứ nhất: Chúng tôi đã đưa ra một KNV mới không xuất hiện trong SGK
toán VN: Chọn mẫu đại diện phù hợp cho tổng thể. Thông qua bài toán đã lựa
chọn, chúng tôi cũng đã làm nổi bật tính ngẫu nhiên và tính đại diện của chọn
mẫu.
Thứ hai: Kiểm chứng thành công giả thuyết: “Học sinh sử dụng kết quả thu
được từ mẫu để kết luận cho tổng thể, mà không quan tâm đến mẫu được chọn có
đại diện tốt cho tổng thể hay chưa”
Thứ ba: Chúng tôi đã cung cấp cho học sinh một kĩ thuật chọn mẫu mới – kĩ thuật
chọn mẫu theo tổ - một kỹ thuật thiếu vắng trong SGK Việt Nam nhưng lại rất cần
thiết khi giải quyết các bài toán chọn mẫu.
Từ năm học 2021 – 2022, học sinh khối 6 sẽ được học toán theo chương trình và
SGK mới, trong đó có các kiến thức về thống kê và xác suất. Sự đổi mới này chắc
chắn sẽ bao gồm các thay đổi về cách trình bày, sự xuất hiện và tồn tại của kiến
thức nói chung cũng như bài toán chọn mẫu nói riêng trong chương trình mới. Vì
vậy, phạm vi tính hợp thức của các kết quả luận văn – thu được từ việc thực nghiệm
trên chương trình giảng dạy cũ, có thể sẽ thay đổi. Nhưng thay đổi như thế nào,
kết quả nào phù hợp, kết quả nào không còn phù hợp? – đó sẽ là hướng mở cho
các luận văn tiếp theo.
89
TÀI LIỆU THAM KHẢO
Tài liệu Tiếng Việt
Đào Hồng Nam (2014), Dạy học xác suất thống kê ở trường đại học Y, luận án
tiến sĩ, trường Đại học Sư Phạm thành phố Hồ Chí Minh.
Đinh Thị Mạnh (2013), Nghiên cứu về bài toán chọn mẫu ở thông kê lớp 10,
luận văn thạc sĩ giáo dục học, trường Đại học Sư Phạm thành phố Hồ Chí Minh.
Hoàng Ngọc Nhậm (2007), Lý thuyết xác suất và thống kê toán, nhà xuất bản
thành phố Hồ Chí Minh.
Lê Thị Hoài Châu (2005), Dạy học xác suất thống kê ở trường trung học phổ
thông, nhà xuất bản Đại học Sư Phạm.
Lê Thị Hoài Châu (2018), Thuyết nhân học trong didactic toán, NXB Đại học
Sư Phạm Tp.HCM
Ngô Văn Thứ (2005), Thống kê thực hành, nhà xuất bản Khoa Học và Kĩ Thuật.
Nguyễn Ngọc Đan (2017), Mô hình hóa trong dạy học các tham số thống kê mô
tả ở trường phổ thông, luận văn thạc sĩ khoa học giáo dục, trường Đại học Sư
Phạm thành phố Hồ Chí Minh.
Phạm Thị Tú Hạnh (2012), Các tham số định tâm trong dạy học lớp 12, luận
văn thạc sĩ giáo dục học, trường Đại học Sư Phạm thành phố Hồ Chí Minh.
Quách Huỳnh Hạnh (2009), Nghiên cứu giảng dạy thống kê mô tả ở trung học
phổ thông, luận văn thạc sĩ giáo dục học, trường Đại học Sư Phạm thành phố
Hồ Chí Minh.
Trần Văn Hạo (Tổng chủ biên) – Vũ Tuấn (Chủ biên) – Doãn Minh Cường –
Đỗ Mạnh Hùng – Nguyễn Tiến Tài (2007), Đại số lớp 10, NXB Giáo dục.
90
Trần Văn Hạo (Tổng chủ biên) – Vũ Tuấn (Chủ biên) – Doãn Minh Cường –
Đỗ Mạnh Hùng – Nguyễn Tiến Tài (2007), Sách giáo viên Đại số lớp 10, NXB
Giáo dục.
Trần Văn Hạo (Tổng chủ biên) – Vũ Tuấn (Chủ biên) – Doãn Minh Cường –
Đỗ Mạnh Hùng – Nguyễn Tiến Tài (2007), Sách Bài Tập Đại số lớp 10, NXB
Giáo dục.
Vũ Như Thư Hương (2009), Une Etude Didactique Sur l’introduction Dán
l’enseignement mathematiques Vietnamien de notions statistiques dán leurs
liens avec les probabilities, Luận án Tiến Sĩ.
Tài liệu Tiếng Anh
Holtm, Rinehart and Winson (2003), Mathmetics in Context, National Science
Foundation.
Holtm, Rinehart and Winson (2003), Mathmetics in Context, Teacher Guide,
National Science Foundation.