BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC SƯ PHẠM THÀNH PHỐ HỒ CHÍ MINH

Lê Thị Nga

MỘT NGHIÊN CỨU DIDACTIC VỀ BÀI TOÁN

CHỌN MẪU TRONG DẠY HỌC THỐNG KÊ

Ở TRƯỜNG PHỔ THÔNG

LUẬN VĂN THẠC SĨ KHOA HỌC GIÁO DỤC

Thành phố Hồ Chí Minh – 2019

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC SƯ PHẠM THÀNH PHỐ HỒ CHÍ MINH

Lê Thị Nga

MỘT NGHIÊN CỨU DIDACTIC VỀ BÀI TOÁN

CHỌN MẪU TRONG DẠY HỌC THỐNG KÊ

Ở TRƯỜNG PHỔ THÔNG

Chuyên ngành: Lý luận và phương pháp dạy học bộ môn Toán

Mã số: 60 14 01 11

LUẬN VĂN THẠC SĨ KHOA HỌC GIÁO DỤC

NGƯỜI HƯỚNG DẪN KHOA HỌC:

TS. ĐÀO HỒNG NAM

Thành phố Hồ Chí Minh – 2019

LỜI CAM ĐOAN

Tôi xin cam đoan luận văn này là một công trình nghiên cứu khoa học dưới sự hướng

dẫn của TS. Đào Hồng Nam. Tất cả những trích dẫn trong luận văn này đều hoàn toàn

chính xác và trung thực.

LỜI CẢM ƠN

Tôi xin bày tỏ lòng biết ơn sâu sắc đến TS. Đào Hồng Nam. Hơn cả việc hướng

dẫn, đưa ra những góp ý và giúp tôi hoàn thiện luận văn của mình, thầy đã rất kiên

nhân và bao dung với tôi.

Tôi xin cảm ơn các thầy cô khoa Toán trường Đại học Sư Phạm thành phố Hồ Chí

Minh: PGS.TS. Lê Thị Hoài Châu, PGS.TS. Lê Văn Tiến, PGS.TS. Lê Thái Bảo

Thiên Trung, TS. Vũ Như Thư Hương, TS. Nguyễn Thị Nga, TS. Tăng Minh Dũng

vì đã tận tận giảng dạy cho chúng tôi những kiến thức về Didactic toán, cung cấp

những công cụ cần thiết và hiệu quả cho việc nghiên cứu khoa học.

Tôi xin cảm ơn những anh/chị/bạn lớp Phương pháp Toán Khóa 27 đã luôn đồng

hành, động viên, khích lệ tinh thần và chia sẻ những niềm vui, nỗi buồn cùng nhau.

Cuối cùng, gia đình luôn là nguồn động lực to lớn giúp tôi có thể hoàn thành luận

văn cũng như khóa học của mình. Vì vậy, lời cảm ơn to lớn nhất xin được dành

cho bố mẹ của tôi, những người luôn bên cạnh, ủng hộ tinh thần, vật chật để tôi có

thể hoàn thành chương trình cao học.

Lê Thị Nga

MỤC LỤC

1. Đặt vấn đề ................................................................................................................ 1

1.1. Lý do chọn đề tài ................................................................................................ 1

1.2. Tổng quan công trình nghiên cứu ...................................................................... 3

2. Phạm vi lý thuyết tham chiếu .................................................................................. 4

3. Đối tượng và phạm vi nghiên cứu ........................................................................... 6

3.1. Đối tượng nghiên cứu ........................................................................................ 6

3.2. Phạm vi nghiên cứu ............................................................................................ 6

4. Mục tiêu và câu hỏi nghiên cứu .............................................................................. 7

4.1. Mục tiêu nghiên cứu .......................................................................................... 7

4.2. Câu hỏi nghiên cứu ............................................................................................ 7

5. Phương pháp nghiên cứu và cấu trúc của luận văn ................................................. 7

5.1. Phương pháp nghiên cứu ................................................................................... 7

5.2. Cấu trúc của luận văn ......................................................................................... 9

Chương 1: Một vài cơ sở lý luận liên quan đến chọn mẫu trong thống kê ................... 11

1. Vai trò của chọn mẫu trong thống kê ................................................................ 11

2. Các phương pháp chọn mẫu .............................................................................. 14

2.1. Một số nguyên tắc cơ bản ......................................................................... 14

2.2.

Các phương pháp chọn mẫu ...................................................................... 15

3. Suy rộng kết quả điều tra chọn mẫu .................................................................. 19

3.1.

Bài toán ước lượng .................................................................................... 19

3.2.

Bài toán kiểm định giả thuyết thống kê .................................................... 20

3.3.

Bài toán tính kích thước mẫu .................................................................... 22

3.4.

Suy rộng kết quả điều tra chọn mẫu .......................................................... 23

Tổng kết chương 1 ......................................................................................................... 23

Chương 2: Bài toán chọn mẫu trong sách giáo khoa Toán Việt Nam và Mỹ ............... 25

1. Bài toán chọn mẫu trong dạy học thống kê ở Việt Nam ................................... 25

1.1.

Phân tích chương trình .............................................................................. 25

1.2.

Phân tích SGK ........................................................................................... 27

1.2.1. Về lý thuyết ..............................................................................................29

1.2.2. Các tổ chức toán học ................................................................................32

2. Bài toán chọn mẫu trong dạy học thống kê ở Mỹ ............................................. 40

2.1 Về các bài toán thể hiện được vai trò và điều kiện của việc chọn mẫu ........ 41

2.2 Về các bài toán đề cập đến kĩ thuật chọn mẫu ............................................. 45

2.3 Về các bài toán đề cập đến suy rộng cho quần thể ....................................... 47

Tổng kết chương 2 ......................................................................................................... 49

Chương 3: Thực nghiệm ................................................................................................ 54

1. Đối tượng, thời điểm thực nghiệm .................................................................... 54

2. Mục đích thực nghiệm ....................................................................................... 54

3. Nội dung thực nghiệm ....................................................................................... 54

3.1. Dàn dựng kịch bản: ................................................................................... 57

3.2.

Phân tích tiên nghiệm ................................................................................ 59

3.3.

Phân tích hậu nghiệm ................................................................................ 64

Kết luận .......................................................................................................................... 87

TÀI LIỆU THAM KHẢO ............................................................................................. 89

DANH MỤC CÁC TỪ VIẾT TẮT

GV : Giáo viên

HS : Học sinh

SGK : Sách giáo khoa

SBT : Sách bài tập

SGV : Sách giáo viên

S10NC : Sách giáo khoa Đại số lớp 10 nâng cao

KNV : Kiểu nhiệm vụ

XSTK : Xác suất thống kê

TK : Thống kê

DANH MỤC CÁC BẢNG

Bảng 2.1: Bảng tóm tắt nội dung các bài học trong chương V ........................... 28

Bảng 2.2: Thống kê số lượng bài tập theo từng KNV ........................................ 34

Bảng 2.3: So sánh sự lựa chọn trình bày chọn mẫu trong chương tình dạy học ở

Việt Nam và Mỹ .................................................................................................. 51

Bảng 3.1: Kết quả thống kê dựa trên chiến lược của học sinh ............................ 64

Bảng 3.2: Thống kê chiến lược ở bài toán 1 của các nhóm ................................ 73

Bảng 3.3: Thống kê lựa chọn tờ báo của các nhóm ........................................... 74

1

MỞ ĐẦU

1. Đặt vấn đề

1.1. Lý do chọn đề tài

Lý thuyết xác suất thống kê (XSTK) là một ngành khoa học đang giữ vị trí quan

trọng trong các lĩnh vực đời sống. XSTK giúp chúng ta phân tích số liệu một cách

khách quan và rút ra các tri thức thông tin chứa đựng trong số liệu đó, cho phép ta

có một cơ sở khoa học để đưa ra những dự đoán, quyết định trước một sự việc.

Các kiến thức và phương pháp của XSTK đã hỗ trợ hữu hiệu các nhà nghiên cứu

trong các lĩnh vực khoa học khác như vật lý, hóa học, sinh y học, kinh tế học, xã

hội học… Như vậy có thể nói, XSTK là một trong những ngành khoa học có tính

ứng dụng thực tiễn và thường xuyên bắt gặp trong cuộc sống. Nhận thấy tầm quan

trọng cũng như tính ứng dụng rộng rãi này, XSTK đã được đưa vào chương trình

giảng dạy ở rất nhiều nước, trong đó có Việt Nam. Việc đưa XSTK vào chương

trình giảng dạy không nằm ngoài mục tiêu giáo dục của Bộ Giáo Dục và Đào Tạo,

đó là: Đảm bảo cho học sinh có điều kiện phát huy năng lực cá nhân để lựa chọn

hướng phát triển, tiếp tục học chương trình giáo dục đại học, giáo dục nghề nghiệp

hoặc tham gia lao động, xây dựng và bảo vệ Tổ Quốc (Luật Giáo Dục năm 2019,

điều 29)

Chọn mẫu là khâu đầu tiên trong một nghiên cứu thống kê và có vai trò vô cùng

quan trọng, có ảnh hướng lớn đến kết quả nghiên cứu. Trong thực tiễn, chúng ta

gặp rất nhiều những tình huống đòi hỏi việc chọn mẫu cần phù hợp: Điều tra đặc

trưng của dân số, điều tra chất lượng của các sản phẩm... Dù có áp dụng đúng đắn

các kiến thức về xử lý các số liệu nhưng khâu chọn mẫu không đúng cũng sẽ dẫn

đến kết quả sai. Lê Thị Hoài Châu (2012), đã đưa ra nhiệm vụ đầu tiên mà việc

giảng dạy thống kê cần đạt được:

2

Mọi hoạt động thống kê đều diễn ra trên cơ sở mẫu dữ liệu ban đầu, do đó kết quả

của quá trình phụ thuộc hoàn toàn vào nó. Việc chọn mẫu đóng một vai trò quan

trọng vì đằng sau nó là một hệ quả về tính biến động của các kết quả nhận được, là

những nguy cơ có thể xảy ra khi suy rộng kết quả cho toàn thể. Điều này là một tất

yếu nhưng lại không sẵn có trong nhận thức của mỗi người chúng ta. Nếu không ý

thức được chúng ta sẽ dễ dàng bị đánh lừa trước những thông tin sai lệch, dễ đưa ra

những nhận xét chủ quan, phiến diện về hiện tượng. Do đó dạy học thống kê cần thiết

phải làm cho học sinh nhận thức rõ những điều này. Qua đó hình thành thái độ cẩn

trọng, biết cân nhắc khi làm việc với các mẫu dữ liệu, biết nhận thức kết quả thu

được từ mẫu nhận được có hợp lý và phản ánh chính xác hiện tượng cần quan sát

hay không.

Tuy nhiên, tìm hiểu sơ lược chương trình giảng dạy TK, chúng tôi nhận thấy vấn

đề chọn mẫu chỉ được đề cập đến trong một bài giảng ở chương trình toán lớp 10.

Hiểu được tầm quan trọng của việc chọn mẫu cũng như mục tiêu dạy học thống

kê giúp chúng tôi có những câu hỏi đầu tiên trong việc nghiên cứu của mình: Vấn

đề chọn mẫu được SGK trình bày như thế nào? Việc trình bày này đã đáp ứng

được mục tiêu giảng dạy hay chưa? Học sinh có nắm được tầm quan trọng của

việc chọn mẫu? SGK đã cung cấp những kiến thức hay kĩ thuật gì liên quan đến

chọn mẫu giúp học sinh “không dễ bị đánh lừa trước những thông tin sai lệch”?

Đồng thời trong quá trình tìm kiếm tài liệu tham khảo, chúng tôi được tiếp xúc với

luận văn thạc sĩ của tác giả Quách Huỳnh Hạnh. Trong luận văn này, tác giả đã

đưa ra một giả thuyết nghiên cứu: Học sinh không có nhiệm vụ kiểm tra tính hợp

lý của những kết quả tính được khi giải toán thống kê, tuy nhiên trong phạm vi

khuôn khổ của luận văn, tác giả chưa kiểm chứng được điều này. Việc chọn sai

mẫu cũng là một trong các lý do dẫn đến kết quả suy luận thống kê không hợp lý.

Chúng tôi quan tâm đến việc học sinh sẽ ứng xử như thế nào trước một kết quả

3

thu được từ mẫu? Vì vậy, chúng tôi sẽ xây dựng một tình huống dạy học vừa có

thể kiểm chứng được giả thuyết nghiên cứu đặt ra, vừa khắc phục sự khiếm khuyết

về kĩ thuật chọn mẫu trong dạy học thống kê ở trường phổ thông.

Từ tất cả những ghi nhận trên, chúng tôi thực hiện nghiên cứu:

MỘT NGHIÊN CỨU DIDACTIC VỀ BÀI TOÁN CHỌN MẪU TRONG DẠY

HỌC THỐNG KÊ Ở TRƯỜNG PHỔ THÔNG.

Trong luận văn này, bài toán chọn mẫu mà chúng tôi chọn để nghiên cứu bao gồm

các nội dung: Vai trò của chọn mẫu, các phương pháp chọn mẫu, cách suy rộng

kết quả thu được từ mẫu cho tổng thể.

1.2. Tổng quan công trình nghiên cứu

Với những câu hỏi đặt ra chúng tôi tiến hành thu thập tài liệu và tìm thấy những

tài liệu liên quan sau đây:

Đào Hồng Nam (2014), Dạy học xác suất thống kê ở trường đại học Y, luận án

tiến sĩ: Mặc dù bài toán chọn mẫu không phải là đối tượng nghiên cứu chính của

tác giả, nhưng tác giả cũng đã có 2 kết quả nghiên cứu có liên quan đến bài toán

chọn mẫu. Tác giả đồng ý với việc chọn mẫu là quá trình quan trọng trong nghiên

Chọn mẫu là công việc rất quan trọng của một công trình nghiên cứu. Nếu mẫu

chọn không đại diện được cho quần thể thì nghiên cứu trên mẫu không cho phép

đưa ra những dự đoán thỏa đáng cho mẫu.

cứu:

Đồng thời tác giả cũng đã chỉ ra việc không đảm bảo nguyên tắc lấy mẫu là một

trong các nguyên nhân dẫn đến sự sai lầm trong các nghiên cứu.

Lê Thị Hoài Châu (2012), Dạy học xác suất thống kê ở trường phổ thông: Trong

tài liệu này, bên cạnh việc nhấn mạnh đến tầm quan trọng của bài toán chọn mẫu,

4

tác giả đã nêu ra 2 bài toán gắn với chọn mẫu: Bài toán ước lượng và kiểm định

thống kê. Chúng tôi sẽ sử dụng kết quả này để tìm kiếm các cơ sở lý thuyết liên

quan đến bài toán chọn mẫu.

Đinh Thị Mạnh (2012), Vấn đề chọn mẫu trong thống kê lớp 10, luận văn thạc sĩ

giáo dục: Mặc dù cùng chọn một đối tượng nghiên cứu là chọn mẫu trong thống

kê toán 10, tuy nhiên vấn đề mà tác giả Đinh Thị Mạnh tập trung nghiên cứu là

vai trò của mẫu trong TK và quan tâm tới việc trong dạy học TK lớp 10 vai trò của

mẫu được thể hiện ra sao, có những kiểu nhiệm vụ (KNV) nào giúp học sinh nhận

ra vai trò của mẫu. Bên cạnh đó, tác giả đã cố gắng xây dựng một tình huống giúp

học sinh ý thức được về những kết luận suy ra từ mẫu, từ đó thấy được sự cần thiết

của việc chọn mẫu. Tuy nhiên, tác giả chưa đưa ra những sai lầm trong việc chọn

mẫu hay đề xuất những biện pháp, giới thiệu kĩ thuật chọn mẫu giúp học sinh có

thể giải quyết các bài toán liên quan. Đây cũng là những vấn đề mới mà chúng tôi

sẽ cố gắng tìm kiếm câu trả lời trong nghiên cứu của mình.

2. Phạm vi lý thuyết tham chiếu

Để tìm kiếm công cụ cho phép trả lời những câu hỏi trong đề tài nghiên cứu của

mình, chúng tôi đặt nghiên cứu trong khuôn khổ của lý thuyết Didactic toán, cụ

thể chúng tôi sử dụng:

Công cụ lý thuyết của thuyết nhân học: Mối quan hệ thể chế với tri thức, mối quan

hệ của cá nhân với tri thức, tổ chức toán học. Các công cụ này giúp chúng tôi có

thể trả lời cho câu hỏi: Vấn đề chọn mẫu tồn tại như thế nào trong sách giáo khoa

toán 10? Chương trình dạy học thống kê ở Việt Nam ưu tiên đến những kiểu nhiểm

vụ nào? Những ảnh hưởng, tác động đến học sinh từ sự lựa chọn của thể chế là gì?

5

Công cụ lý thuyết của lý thuyết tình huống: Chúng tôi sử dụng các khái niệm biến,

chiến lược, các pha để tiến hành xây dựng một tình huống thực nghiệm nhằm đạt

được mục đích nghiên cứu của mình.

Các lý thuyết trên đã được trình bày trong cuốn giáo trình song ngữ Việt – Pháp

của Bessot và các cộng sự (2009). Trong phần này, chúng tôi chỉ mô tả ngắn ngọn

một số khái niệm cần tham chiếu của các lý thuyết trên.

Quan hệ thể chế:

Quan hệ R (I, O) của một thể chế I đối với tri thức O là tập hợp các tác động giữa

thể chế I đến tri thức O và ngược lại. Mối quan hệ này cho biết O xuất hiện khi

nào, ở đâu, như thế nào, nội dung và ý nghĩa như thế nào.

Quan hệ cá nhân:

Quan hệ R (X, O) của một cá nhân X với đối tượng tri thức O là tập hợp các tác

động qua lại giữa cá nhân X với tri thức O, nghĩa là X hiểu gì, nghĩ gì, hình dung

ra sao về O, có thể sử dụng O và thao tác O thế nào.

Trong thuyết nhân học, ta công nhận một điều: Mỗi hoạt động của con người như

là việc thực hiện một nhiệm vụ t thuộc kiểu nhiệm vụ T, nhờ một kĩ thuật 𝜏, được

giải thích bằng một công nghệ 𝜃, và công nghệ lại được giải thích dựa vào lý

thuyết Φ. Ta gọi bộ (𝑇, 𝜏, 𝜃, Φ) là một tổ chức tri thức.

Nhiệm vụ, kiểu nhiệm vụ:

Là câu trả lời cho câu hỏi dạng “làm thế nào?” Kiểu nhiệm vụ phải liên quan đến

một đối tượng O đã được xác định rõ và được thể chế xây dựng.

Kỹ thuật:

6

Là cách làm, cách giải quyết T. Trong thể chế I, đối với mỗi kiểu nhiệm vụ T, chỉ

tồn tại một 𝜏 hay cùng lắm là một số ít kỹ thuật 𝜏 được I thừa nhận.

Công nghệ: Mọi kỹ thuật đều cần một công nghệ giải thích nó. Trong thể chế I,

việc tồn tại công nghệ là một điều kiện sinh thái chủ yếu cho sự tồn tại kỹ thuật.

Công nghệ có thể khác nhau tùy vào từng thể chế.

Lý thuyết: Là yếu tố giải thích cho công nghệ, hay nói cách khác, lý thuyết là “công

nghệ của công nghệ”.

Nếu một tổ chức tri thức gắn với toán học, nghĩa là các thành phần của nó mang

bản chất toán học, ta gọi là Tổ chức toán học. Như vậy, để phân tích mối quan hệ

thể chế đối với đối tượng tri thức O, ta có thể chỉ ra tất cả các tổ chức tri thức hay

tổ chức toán học liên quan đến O trong I, đồng thời phân loại, đánh giá chúng.

Biến:

Một biến Didactic là một tham số, có thể nhận nhiều giá trị. Sự thay đổi giá trị của

biến didactic sẽ dẫn đến sự thay đổi thứ tự các chiến lược giải của học sinh. Như

vậy, thông qua sự lựa chọn giá trị của biến didactic, nhà nghiên cứu có thể tạo ra

những thích nghi và những điều chỉnh mong muốn, tức là tạo ra việc học tập. Cụ

thể hơn, giá trị của biến phải được chọn sao cho chiến lược cũ trở nên đắt giá, quá

tốn kém, quá phức tạp hoặc thậm chí dẫn đến sai lầm.

3. Đối tượng và phạm vi nghiên cứu

3.1. Đối tượng nghiên cứu

Bài toán chọn mẫu trong thống kê.

3.2. Phạm vi nghiên cứu

Dạy học thống kê ở trường phổ thông.

7

4. Mục tiêu và câu hỏi nghiên cứu

4.1. Mục tiêu nghiên cứu

Nghiên cứu bài toán chọn mẫu trong dạy học thống kê ở trường phổ thông.

4.2. Câu hỏi nghiên cứu

Trong khuôn khổ của phạm vi lý thuyết tham chiếu đã lựa chọn, các câu hỏi tạo

thành mục đích nghiên cứu của chúng tôi được trình bày lại như sau:

Q1: Các cơ sở lý thuyết liên quan đến chọn mẫu? Có những bài toán liên quan

nào? Có các kĩ thuật chọn mẫu nào? Vai trò của việc chọn mẫu là gì?

Q2: Bài toán chọn mẫu tồn tại như thế nào trong chương trình thống kê ở Việt

Nam? Nhìn sang chương trình giảng dạy khác (chương trình giảng dạy thống kê

của Mỹ), bài toán chọn mẫu được trình bày ra sao? Có sự khác biệt nào trong việc

lựa chọn của những chương trình này?

Q3: Làm thế nào để xây dựng một tình huống dạy học có nội dung về chọn mẫu

để khắc phục những thiếu hụt về kỹ thuật chọn mẫu trong dạy học thống kê ở

trường phổ thông?

5. Phương pháp nghiên cứu và cấu trúc của luận văn

5.1. Phương pháp nghiên cứu

Để có thể đạt được mục tiêu nghiên cứu của mình, chúng tôi áp dụng các phương

pháp nghiên cứu sau:

Phương pháp nghiên cứu lý luận: Chúng tôi sử dụng phương pháp nghiên cứu này

để tìm hiểu cơ sở lý thuyết của bài toán chọn mẫu. Trước hết, chúng tôi nghiên

cứu các cơ sở khoa học của chọn mẫu trong các giáo trình toán XSTK ở bậc đại

học. Cụ thể, chúng tôi nghiên cứu về các kiến thức: Vai trò của chọn mẫu trong

8

thống kê, các phương pháp chọn mẫu và các bài toán có liên quan đến chọn mẫu.

Sau đó, chúng tôi nghiên cứu sự tồn tại của bài toán chọn mẫu trong chương trình

giảng dạy xác suất thông kê ở Việt Nam và Mỹ. Từ sự phân tích này, chúng tôi rút

ra những điểm giống và khác nhau trong sự lựa chọn của hai chương trình, tìm ra

các KNV mới xuất hiện trong thể chế dạy học ở Mỹ nhưng lại không xuất hiện

trong thể chế dạy học ở Việt Nam. Cuối cùng dựa trên kết quả thu được, chúng tôi

tiến hành thực nghiệm nhằm mục đích trả lời cho câu hỏi: Làm thế nào để đưa

KNV này vào trong việc giảng dạy bài toán chọn mẫu?

Phương pháp nghiên cứu thực tiễn: Phương pháp này giúp chúng tôi nhận ra những

quan niệm, sự hiểu biết và cách ứng xử của học sinh đối với bài toán chọn mẫu và

kiểm chứng được giả thuyết đã nêu ra. Từ đó, chúng tôi tiến hành xây dựng tiểu

đồ án để bổ sung một KNV mới bị thiếu vắng trong SGK và cung cấp các kĩ thuật

chọn mẫu cho học sinh.

NGHIÊN CỨU TRI THỨC KHOA HỌC TRONG CÁC GIÁO

TRÌNH ĐẠI HỌC

NGHIÊN CỨU SỰ TỒN TẠI CỦA BÀI TOÁN CHỌN MẪU TRONG CHƯƠNG TRÌNH GIẢNG DẠY THÔNG KÊ Ở VIỆT NAM

NGHIÊN CỨU SỰ TỒN TẠI CỦA BÀI TOÁN CHỌN MẪU TRONG CHƯƠNG TRÌNH GIẢNG DẠY THỐNG KÊ Ở MỸ

XÂY DỰNG THỰC NGHIỆM:

- KIỂM CHỨNG GIẢ THUYẾT - THỰC HIỆN TIỂU ĐỒ ÁN

Chúng tôi tóm tắt phương pháp nghiên cứu của mình như sau:

9

5.2. Cấu trúc của luận văn

Luận văn này bao gồm: Phần mở đầu, 3 chương chính và phần kết luận. Cụ thể:

Phần mở đầu: Chúng tôi dành phần này để giới thiệu về lý do chọn đề tài, tổng

quan các công trình nghiên cứu, mục đích nghiên cứu, khung lý thuyết tham chiếu,

mục tiêu và câu hỏi nghiên cứu, cuối cùng là phương pháp nghiên cứu và cấu trúc

của luận văn.

Chương 1: Một vài cơ sở lý luận liên quan đến chọn mẫu trong thống kê

Trong chương này chúng tôi sẽ tổng kết lại những kết quả nghiên cứu đã được

công bố có nội dung liên quan về chọn mẫu. Cụ thể, chúng tôi quan tâm đến những

bài toán liên quan đến chọn mẫu, các kĩ thuật chọn mẫu, vai trò của việc chọn mẫu.

Thực hiện chương 1 cũng chính là việc trả lời cho câu hỏi Q1 mà chúng tôi đã nêu

ra.

Chương 2: Bài toán chọn mẫu trong sách giáo khoa Toán Việt Nam và Mỹ

Bên cạnh việc phân tích sự tồn tại của bài toán chọn mẫu trong chương trình dạy

học ở Việt Nam - bằng việc phân tích chương trình giảng dạy và SGK toán 10

nâng cao, chúng tôi còn phân tích sự tồn tại của bài toán chọn mẫu trong một

chương trình khác, cụ thể là chương trình dạy học ở Mỹ - bằng việc phân tích giáo

trình Mathematics in Context của tác giả Hold, Rinehart và Winston. Từ việc xem

xét sự tồn tại của bài toán chọn mẫu trong các chương trình khác nhau, chúng tôi

sẽ thấy được mối quan tâm của các thể chế dành cho bài toán chọn mẫu là gì, từ

đó có những so sánh cần thiết phục vụ cho nghiên cứu của mình.

Kết quả nghiên cứu của chương 2 cũng chính là câu trả lời cho câu Q2.

Chương 3: Thực nghiệm

10

Chúng tôi sẽ xây dựng một tình huống dạy học mà ở đó việc chọn mẫu không

phù hợp đặt người học phải kiểm tra tính đúng đắn của kết quả. Thực hiện

thành công việc này đồng nghĩa với việc trả lời cho câu hỏi Q4 - Kiểm chứng

giả thuyết được nêu ra ở chương 2. Đồng thời, chúng tôi xây dựng một tình

huống để bổ sung các tổ chức toán học về chọn mẫu đã bị thiếu vắng trong thể

chế dạy học XSTK bậc phổ thông Việt Nam.

Phần kết luận: Chúng tôi tổng kết lại những kết quả mà luận văn đã đạt được bằng

việc trả lời 4 câu hỏi nghiên cứu đã được nêu ra trong phần mở đầu.

11

Chương 1: Một vài cơ sở lý luận liên quan đến chọn mẫu trong thống kê

Việc thực hiện chương 1 đồng nghĩa với việc chúng tôi đi tìm kiếm câu trả lời cho

câu hỏi:

Q1: Các cơ sở lý thuyết liên quan đến chọn mẫu? Có những bài toán liên quan

nào? Có các kĩ thuật chọn mẫu nào? Vai trò của việc chọn mẫu là gì?

Chúng tôi tìm kiếm câu trả lời cho câu hỏi này bằng việc tham khảo các giáo trình

về XSTK ở các trường đại học và các luận văn đã bảo vệ thành công trước đó. Cụ

thể, chúng tôi đã lựa chọn các tài liệu tham khảo sau:

Lê Thị Hoài Châu (2005), Dạy học xác suất thống kê ở trường trung học phổ

thông, nhà xuất bản đại học Sư Phạm.

Ngô Văn Thứ (2005), Thống kê thực hành, nhà xuất bản Khoa Học và Kĩ Thuật.

Đinh Thị Mạnh (2013), Nghiên cứu về bài toán chọn mẫu ở thống kê lớp 10, luận

văn thạc sĩ, trường Đại học Sư Phạm TPHCM.

Hoàng Ngọc Nhậm (2007), Lý thuyết xác suất và thống kê toán, nhà xuất bản thành

phố Hồ Chí Minh.

1. Vai trò của chọn mẫu trong thống kê

Trong quá trình nghiên cứu về vai trò của mẫu, chúng tôi tìm được luận văn của

tác giả Đinh Thị Mạnh đã trình bày về nội dung này. Chúng tôi sẽ tổng kết lại

những kết quả nghiên cứu của tác giả dựa trên sự chọn lọc của mình như sau:

Khi thống kê chỉ đơn giản là việc thu thập và biểu diễn số liệu, chúng ta không

cần đến khái niệm mẫu hay mẫu số liệu. Tuy nhiên khi cuộc sống xã hội nảy sinh

những vấn đề mới như: Dân số ở các quốc gia ngày càng gia tăng, phạm vi lãnh

thổ được mở rộng thì kích thước tổng thể, quy mô của các cuộc điều tra cũng ngày

12

một lớn; thêm nữa, sự phát triển của nhiều lĩnh vực khoa học kĩ thuật, công nghệ

sản xuất kéo theo sự đa dạng, phong phú của nhiều chủng loại hàng hóa cung cấp

ra thị trường. Vấn đề chất lượng sản phẩm đòi hỏi phải có những công cuộc kiểm

tra nghiêm ngặt, nhưng với những cuộc kiểm nghiệm như vậy các sản phẩm lại vô

tình bị phá hủy. Lúc này, việc thu thập và xử lý mẫu số liệu bắt đầu gặp nhiều khó

khăn và không còn phù hợp. Điều tra toàn bộ bắt đầu bộc lộ nhiều điểm hạn chế

do không phải lúc nào cũng có tính khả thi trong thực tế, chẳng hạn như: Các

trường hợp tổng thể điều tra quá rộng dẫn đến khi điều tra tốn kém nhiều về nhân

lực, các trường hợp không thể xác định được hết các đơn vị của tổng thể, các

trường hợp điều tra dẫn đến phá hủy các đơn vị điều tra…Với những nỗ lực khắc

phục những hạn chế này của điều tra toàn bộ, vào thế kỷ 17 phương pháp điều tra

chọn mẫu ra đời. Mầm mống nảy sinh từ những ý đồ ngoại suy đầu tiên của nhà

kinh tế học người Anh William Petty (1623 – 1687), sau đó được phát triển và

hoàn thiện cơ sở lý luận. Nội dung của phương pháp chọn mẫu đã được nhiều tác

giải trình bày. Theo Hoàng Ngọc Nhậm (2010), Lý thuyết xác suất và thống kê

“Từ tổng thể ta chọn ra n phần tử và tiến hành thu thập thông tin trên chúng, n

phần tử này lập nên một mẫu. Số phần tử của mẫu được gọi là kích thước mẫu.

Thông thường kích thước mẫu nhỏ hơn nhiều so với kích thước của tổng thể nên

việc tổ chức thu thập và xử lý thông tin trên mẫu dễ dàng và nhanh chóng. Kết

quả thu được sau đó sẽ được dùng để suy rộng cho tổng thể nhờ vào các phương

pháp toán học (đặc biệt là lý thuyết xác suất).”

toán:

Trong một giáo trình khác, Ngô Văn Thứ (2005), Thống kê thực hành, nhà xuất

bản Khoa học và Giáo Dục, nội dung cơ bản của chọn mẫu được mô tả:

13

“Giả sử cần nghiên cứu sự vận động của một hiện tượng, người ta có thể mô hình

hóa hiện tượng này nhờ một biến ngẫu nhiên X (một chiều hay nhiều chiều). Với

một mẫu ngẫu nhiên W(X) lập từ biến ngẫu nhiên gốc X, thiết lập các mô hình

nhờ các thống kê – các hàm của thành phần mẫu – thích hợp. Với các thống kê

này có thể tiến hành các ước lượng, kiểm định, dự báo và các phân tích khác đối

với X theo các yêu cầu cho trước.”

Sự ra đời của phương pháp mẫu là một thành tựu lớn trong lịch sử phát triển của

khoa học TK, giúp cho các cuộc điều tra trên tổng thể lớn hay thậm chí không thể

xác định được số lượng điều tra trở nên dễ thực hiện hơn, tiết kiệm được nhân lực

và ít tốn kém hơn. Không những thế, bằng việc áp dụng lý thuyết Xác Suất, chúng

ta còn có thể suy rộng kết quả thu được trên mẫu cho toàn bộ tổng thể với một

mức độ tin cậy và mức độ chính xác có thể chấp nhận được. Chính vì những lợi

ích và ý nghĩa to lớn mà phương pháp chọn mẫu mang lại, ngày nay phương pháp

này càng trở nên phổ biến và được áp dụng rộng rãi. Ngô Văn Thứ (2005), cũng

đã ra các lý do khiến việc sử dụng phương pháp chọn mẫu trở nên phổ biến:

Thứ nhất: Các vấn đề cần nghiên cứu, đặc biệt là trong các lĩnh vực kinh tế xã hội

thường tồn tại ở các tổng thể lớn, động. Khả năng nghiên cứu toàn bộ không hiện

thực, do thời gian và kinh phí không cho phép. Trong rất nhiều trường hợp người

ta cũng không thể biết chính xác kích cỡ của tổng thể.

Thứ hai: Thông tin dựa trên các biểu hiện hay sự hiểu biết của con người về một

vấn đề hay một nhóm nghiên cứu tại một thời điểm hay trong khoảng thời gian là

hữu hạn. Về mặt thông tin người ta thấy rằng lượng tin thực tế không tuyến tính

với số lượng đối tượng cấp tin. Có thể thấy rằng lượng tin tăng thêm khi số quan

sát đã đủ lớn hầu như không đáng kể. Như vậy, không nhất thiết phải khảo sát toàn

bộ tổng thể.

14

Thứ ba: Với những thành tựu của lý thuyết xác suất và thống kê toán, người ta có

đủ các công cụ, các mô hình mà nhờ đó những thông tin từ mẫu có thể suy diễn

cho tổng thể với độ chính xác ước lượng được. Điều đó cho phép chúng ta đặt

trước các yêu cầu về độ chính xác trong các ước lượng làm căn cứ cho việc xác

định độ lớn của mẫu.

Một mẫu sau khi được chọn sẽ là một bộ phận của tổng thể nên ta có thể chọn

được rất nhiều mẫu khác nhau. Vì vậy kết quả thu được sau khi phân tích dựa trên

các mẫu là khác nhau. Hệ quả của sự thay đổi thông tin trên mẫu là những rủi ro,

những sai lầm có thể gặp phải khi đưa ra những kết luận cho tổng thể dựa vào quan

sát mẫu. Hiển nhiên những rủi ro và sai lầm này không thể loại bỏ, nhưng có thể

khắc phục đến một mức nào đó. Điều này đòi hỏi mẫu phải đại diện được cho quần

thể. Vì vậy các nhà TK cần tìm cách xây dựng và phát triển các nguyên tắc cũng

như các phương pháp chọn mẫu nhằm đạt được mục tiêu chọn mẫu đại diện tốt

cho quần thể để có thể suy rộng ra cho toàn bộ.

2. Các phương pháp chọn mẫu

2.1. Một số nguyên tắc cơ bản

Để đảm bảo mẫu được chọn có thể đại diện tốt cho quần thể để có thể suy rộng

cho quần thể với mức rủi ro thấp nhất thì việc chọn mẫu cần phải dựa trên các điều

kiện, tiêu chuẩn sau:

Tính ngẫu nhiên: Tính ngẫu nhiên là một trong các yêu cầu quan trọng nhất, đảm

bảo tính chất không chệch của suy diễn thống kê, cũng như các mô tả thống kê.

Một cách đơn giản, tính chất này đòi hỏi khả năng mỗi cá thể trong tổng thể hay

trong một bộ phận của tổng thể có thể được chọn như nhau. Trong một số phương

15

pháp chọn mẫu cụ thể, tính chất này có thể phụ thuộc rất nhiều vào mục đích,

phạm vi sử dụng số liệu mẫu cho phân tích và dự báo thống kê.

Tính đại diện: Tính đại diện thường được xác định trên cơ sở yêu cầu về mức tin

cậy của các phân tích thống kê như ước lượng, kiểm định… Với những tổng thể

lớn có phân thành những bộ phận khác nhau và phân tích thống kê ở nhiều cấp thì

tính đại diện cần được lưu ý từ cấp thấp nhất.

Tính đồng nhất: Vì mỗi đối tượng cung cấp thông tin là một tác nhân xã hội nên

ngoài những gì làm cho đối tượng này trở thành cá thể thống kê thì còn khá nhiều

thuộc tính riêng. Các thuộc tính riêng nói chung có ảnh hưởng đến đối tượng. Đặc

điểm này đòi hỏi khi chọn mẫu phải chú ý đến tính thuần nhất về môi trường kinh

tế xã hội của cá thể.

Tính phổ biến: Trong nhiều trường hợp người điều tra có cảm giác rằng một số cá

thể thống kê có những tính chất ngoại lệ so với phần đông các cá thể khác. Các cá

thể này có thể thuộc đối tượng chọn mẫu hoặc loại khỏi đối tượng chọn mẫu tùy

thuộc vào tính đồng nhất của chúng với tổng thể. Tuy nhiên, hầu hết các trường

hợp cần có những xử lý riêng biệt cho chúng. Đảm bảo tính phổ biến, nhằm làm

cho phân tích thống kê nhận biết dễ dàng hơn bản chất của tổng thể về một mặt

hay một phương diện đang nghiên cứu.

2.2. Các phương pháp chọn mẫu

Mục đích của tất cả các phương pháp lấy mẫu là đạt được mẫu đại diện cho cả

quần thể nghiên cứu. Khi chọn phương pháp lấy mẫu thì cần tìm hiểu rõ các đặc

tính của quần thể nghiên cứu để xác định cỡ mẫu quan sát đại diện và đánh giá

tương đối chính xác quần thể. Có 2 phương pháp chọn mẫu: (1) chọn mẫu không

xác suất (không chú ý tới độ đồng đều, nghĩa là mỗi cá thể trong tổng thể không

16

có cơ hội được chọn như nhau) và (2) chọn mẫu xác suất (đề cập đến độ đồng đều,

nghĩa là mỗi cá thể trong tổng thể có cơ hội được chọn như nhau).

 Chọn mẫu không xác suất

Phương pháp chọn mẫu không xác suất là cách lấy mẫu trong đó các cá thể của

mẫu được chọn không ngẫu nhiên hay không có xác suất lựa chọn giống nhau.

Điều này thể hiện trong cách chọn mẫu như sau:

- Các đơn vị mẫu được tự lựa chọn mà không có phương pháp.

- Các đơn vị mẫu rất dễ dàng đạt được hoặc dễ dàng tiếp cận. Ví dụ: chọn

những hộ trên những con đường dễ đi.

- Các đơn vị mẫu được chọn theo lý thuyết do kinh tế. Ví dụ: trả tiền cho sự

tham dự.

- Các đơn vị mẫu được quan tâm bởi người nghiên cứu trong danh sách điển

hình của quần thể mục tiêu. Ví dụ: người nghiên cứu chỉ quan tâm đến các

nhân vật điển hình trong quần thể nghiên cứu, để so sánh với các nhân vật

khác.

- Các đơn vị mẫu được chọn mà không có sự thiết kế rõ ràng. Ví dụ: chọn 50

người đầu tiên đến buổi sáng.

Phương pháp chọn mẫu không xác suất thường có độ tin cậy thấp. Mức độ chính

xác của cách chọn mẫu không xác suất tùy thuộc vào sự phán đoán, cách nhìn,

kinh nghiệm của người nghiên cứu, sự may mắn hoặc dễ dàng và không có cơ sở

thống kê trong việc chọn mẫu.

 Chọn mẫu xác suất

Cơ bản của việc chọn mẫu xác suất là cách lấy mẫu trong đó việc chọn các cá thể

của mẫu có cơ hội như nhau, nếu như có một số cá thể có cơ hội xuất hiện nhiều

17

hơn thì sự lựa chọn không phải là ngẫu nhiên. Để tối ưu hóa mức độ chính xác,

người nghiên cứu thường sử dụng phương pháp lấy mẫu ngẫu nhiên.

 Các phương pháp chọn mẫu ngẫu nhiên

- Chọn mẫu ngẫu nhiên đơn giản

Cách đơn giản nhất của việc chọn các cá thể của mẫu trong cách chọn mẫu ngẫu

nhiên là sử dụng xác suất. Việc lựa chọn n các cá thể từ một quần thể sao cho các

cá thể có cơ hội bằng nhau hay một xác suất bằng nhau trong phương pháp này.

Ví dụ : Một trường học có 1000 sinh viên, người nghiên cứu muốn chọn ra 100

sinh viên để nghiên cứu về tính trạng sức khỏe trong số 1000 sinh viên. Theo cách

chọn mẫu đơn giản thì chỉ cần viết tên 1000 sinh viên vào trong mẫu giấy nhỏ, sau

đó bỏ tất cả vào môt cái thùng và rút ngẫu nhiên ra 100 mẫu giấy. Như vậy, mỗi

100

sinh viên có một cơ hội lựa chọn như nhau và xác suất chọn ngẫu nhiên một sinh

100×1000

viên trên dễ dàng được tính bằng công thức = 10%.

Một cách chọn ngẫu nhiên khác là sử dụng bảng số ngẫu nhiên trong sách thống

kê phép thí nghiệm hoặc cách chọn số ngẫu nhiên bằng cách chương trình thống

kê trên máy tính.

- Chọn mẫu phân lớp

Chọn mẫu phân lớp : Chọn mẫu phân lớp được thực hiện khi quần thể mục tiêu

được chia thành các nhóm hay phân lớp. Trong phương pháp lấy mẫu phân lớp,

tổng thể (N) đầu tiên được chia ra thành L lớp của các quần thể phụ N1, N2, … ,

NL, như vậy:

𝑁 = 𝑁1 + 𝑁2 + 𝑁3 … + 𝑁𝐿

Để áp dụng kỹ thuật chọn mẫu phân lớp thì trước tiên người nghiên cứu cần nắm

các thông tin và số liệu nghiên cứu trước đây có liên quan đến cách lấy mẫu có

18

phân lớp. Sau đó, người nghiên cứu xác định cỡ mẫu và chọn ngẫu nhiên các cá

thể trong mỗi lớp.

- Chọn mẫu hệ thống :

Đôi khi các đơn vị ngẫu nhiên không tốt hơn cách chọn mẫu hệ thống. Trong chọn

mẫu hệ thống, cỡ mẫu n được chọn (có phương pháp tính xác suất tương tự) từ

một tổng thể N. Cách lấy mẫu hệ thống là khung mẫu giống như là 1 hàng của các

đơn vị mẫu, và mẫu như là một chuỗi liên tiếp của các điểm số có khoảng cách

bằng nhau theo hàng dọc. Trước tiên lập danh sách các đơn vị của tổng thể chung

theo một trật tự quy ước nào đó, sau đó đánh số thứ tự các đơn vị trong danh sách.

Đầu tiên chọn ngẫu nhiên 1 đơn vị trong danh sách; sau đó cứ cách đều k đơn vị

lại chọn ra 1 đơn vị vào mẫu, cứ như thế cho đến khi chọn đủ số đơn vị của mẫu.

Ví dụ: Dựa vào danh sách bầu cử tại 1 thành phố, ta có danh sách theo thứ tự vần

của tên chủ hộ, bao gồm 240.000 hộ. Ta muốn chọn ra một mẫu có 2000 hộ. Vậy

khoảng cách chọn là: k= 240000/2000 = 120, có nghĩa là cứ cách 120 hộ thì ta

chọn một hộ vào mẫu.

- Chọn mẫu chỉ tiêu :

Trong cách chọn mẫu chỉ tiêu, quần thể nghiên cứu được phân nhóm hoặc phân

lớp như cách chọn mẫu phân lớp. Các đối tượng nghiên cứu trong mỗi nhóm được

lấy mẫu theo tỷ lệ đã biết và sau đó tiến hành phương pháp chọn mẫu không xác

suất. Để thiết lập mẫu chỉ tiêu, người nghiên cứu cần phải biết ít nhất các số liệu,

thông tin trong quần thể mục tiêu để phân chia các chỉ tiêu muốn kiểm soát. Thuận

lợi của việc lấy mẫu chỉ tiêu áp dụng trong một vài nghiên cứu là chi phí thực hiện

nghiên cứu tương đối thấp và dễ thực hiện. Bất lợi của việc lấy mẫu chỉ tiêu là

không đại diện toàn bộ quần thể, do lấy mẫu không xác suất như chọn ưu tiên

phỏng vấn khách du lịch đến trước, chọn nơi có nhiều khách lui tới, khách ở khách

19

sạn, … và vì vậy mức độ tin cậy phụ thuộc vào kinh nghiệm hay sự phán đoán của

người nghiên cứu và sự nhiệt tình của người trả lời phỏng vấn. Để tăng mức độ tin

cậy, người nghiên cứu cần thực hiện cuộc phỏng vấn bước đầu để kiểm tra người

trả lời có rơi vào các chỉ tiêu hay không. Chọn mẫu chỉ tiêu ít được áp dụng trong

các nghiên cứu phát triển, nhưng đôi khi được sử dụng trong một vài nghiên cứu

nhỏ mang các đặc tính quan sát.

- Chọn mẫu không gian

Người nghiên cứu có thể sử dụng cách lấy mẫu này khi hiện tượng, sự vật được

quan sát có sự phân bố mẫu theo không gian (các đối tượng khảo sát trong khung

mẫu có vị trí không gian 2 hoặc 3 chiều). Ví dụ lấy mẫu nước sông, đất ở sườn

đồi, hoặc không khí trong phòng. Cách chọn mẫu như vậy thường gặp trong các

nghiên cứu sinh học, địa chất, địa lý. Lấy mẫu theo sự phân bố này yêu cầu có sự

giống nhau về không gian qua các phương pháp ngẫu nhiên, hệ thống và phân lớp.

Kết quả của một mẫu chọn có thể được biểu diễn như một loạt các điểm trong

trong không gian hai chiều, giống như là bản đồ.

3. Suy rộng kết quả điều tra chọn mẫu

Các công cụ được sử dụng trong suy rộng kết quả từ mẫu cho quần thể :

3.1. Bài toán ước lượng

Điều tra toàn bộ bộc lộ những hạn chế khi tổng thể trở nên quá rộng lớn hoặc khó

xác định chính xác các đơn vị điều tra. Khi đó để tìm hiểu một dấu hiệu nào đó

của tổng thể, người ta căn cứ trên một mẫu nhỏ rồi dùng các phương pháp toán

học để suy rộng kết quả đó cho tổng thể. Bài toán như thế được gọi là bài toán ước

lượng.

20

Khi muốn nghiên cứu về một dấu hiệu 𝑋∗ của một tổng thể bằng cách ước lượng,

người ta mô hình hóa dấu hiệu 𝑋∗ bằng một đại lượng ngẫu nhiên X (X là giá trị

của 𝑋∗đo được trên một phần tử). Bài toán ước lượng theo Hoàng Ngọc Nhậm

Cho đại lượng ngẫu nhiên X có thể đã biết hoặc chưa biết quy luật phân phối xác

suất và chưa biết tham số 𝜃 nào đó của nó. Hãy ước lượng 𝜃 bằng phương pháp mẫu.

(2007), tr.178 được phát biểu như sau:

Giá trị của 𝜃 có thể được ước lượng bằng một trong hai cách:

Ước lượng điểm: Chỉ ra một con số cụ thể làm giá trị ước lượng của 𝜃 (con số này

là giá trị của hàm ước lượng tính được trên một mẫu cụ thể nào đó được chọn ra

từ hệ thống). Để đánh giá chất lượng của ước lượng điểm, người ta đưa ra nhiều

tiêu chuẩn lựa chọn hàm ước lượng, trong đó có thể kể đến một số tiêu chuẩn phổ

biến như ước lượng không chệch, ước lượng hiệu quả, ước lượng vững…

Ước lượng khoảng: Không đưa ra một số cụ thể như ước lượng điểm, nhưng chỉ

ra một khoảng (gọi là khoảng tin cậy) chứa giá trị cần ước lượng. Với phương

pháp này, ta có thể xác định được độ tin cậy cũng như độ chính xác của ước lượng

bằng cách chọn một mẫu có kích thước đảm bảo đạt được độ tin cậy và độ chính

xác cho trước. Tuy nhiên, khi ta nói rằng ước lượng này có độ tin cậy là 1 − 𝛼 thì

cũng đồng nghĩa với khẳng định ước lượng này có độ rủi ro là 𝛼.

3.2. Bài toán kiểm định giả thuyết thống kê

Hàng ngày chúng ta tiếp nhận rất nhiều các thông tin, tuy nhiên không phải thông

tin nào cũng chính xác và đáng tin cậy. Để có thể sàng lọc thông tin, trả lời cho

câu hỏi đúng hay không chúng ta cần thực hiện các kiểm chứng. Khi đó, các nhận

định được đưa ra và cần kiểm chứng được gọi là các giả thuyết; còn việc kiểm tra

xem có thể chấp nhận hay bác bỏ các nhận định đó được gọi là kiểm chứng giả

21

thuyết. Nếu giả thuyết liên quan đến các số đặc trưng của tổng thể hay quy luật

phân phối xác suất của các tham số này thì ta có khái niệm giả thuyết thống kê

(còn được gọi là giả thuyết không và thường được kí hiệu là 𝐻0) và kiểm định khi

đó được gọi là kiểm định giả thuyết thống kê.

Nội dung trong phần này được chúng tôi tổng hợp lại từ kết quả nghiên cứu của

tác giả Lê Thị Hoài Châu đã được công bố trong “Dạy học xác suất – thống kê ở

trường phổ thông” và luận văn thạc sĩ của tác giả Đinh Thị Mạnh (2013):

Bài toán kiểm định giả thuyết TK được phát biểu như sau: Cho biến ngẫu nhiên X

và giả thuyết 𝐻0 về phân phối xác suất của X. 𝐻0 được gọi là giả thuyết không.

Một mệnh đề 𝐻1 đối ngược với 𝐻0 được gọi là đối thuyết. Cần kiểm định xem

𝐻0 đúng hay sai trên cơ sở mẫu lấy được là (𝑥1, 𝑥2, … , 𝑥𝑛 ).

Muốn vậy, người ta lập không gian mẫu (𝑋1, 𝑋2, … , 𝑋𝑛) và trên không gian mẫu

ta xác định một miền W gọi là miền bác bỏ giả thuyết 𝐻0, phần bù của W, kí hiệu 𝑊̅ , được gọi là miền chấp nhận giả thuyết 𝐻0. Nếu điểm (𝑥1, 𝑥2, … , 𝑥𝑛 ) thuộc W thì ta coi như giả thuyết 𝐻0là sai và bác bỏ giả thuyết đó. Nếu điểm (𝑥1, 𝑥2, … , 𝑥𝑛 ) thuộc 𝑊̅ thì ta coi giả thuyết là đúng và chấp nhận nó.

Tương tự như ước lượng, ta không thể khẳng định kết quả của việc kiểm định giả

thuyết là chính xác 100%. Việc kiểm định này chỉ cho kết quả với một độ tin cậy

nào đó và có thể xảy ra sai lầm. Các sai lầm này được phân thành 2 loại:

Sai lầm loại 1: Giả thuyết 𝐻0 đúng nhưng ta lại bác bỏ nó.

Sai lầm loại 2: Chấp nhận giả thuyết 𝐻0 khi giả thuyết 𝐻0 là sai.

Hai loại sai lầm trên đều có thể gây ra những tác hại nghiêm trọng, nhưng nếu ta

cố tìm cách giảm thiểu sai lầm loại này cũng đồng nghĩa làm tăng sai lầm loại còn

lại. Tuy nhiên các nhà TK nhận định rằng sai lầm loại 1 nghiêm trọng hơn sai lầm

22

loại 2. Vì vậy, các kiểm định giả thuyết TK thông dụng đều xác định ngay từ đầu

giá trị 𝛼 để hạn chế sai lầm loại 1.

3.3. Bài toán tính kích thước mẫu

Một trong các nội dung quan trọng của mỗi cuộc điều tra TK là xác định kích

thước mẫu điều tra. Đào Hồng Nam (2014), Dạy học xác suất - thống kê ở trường

Trong chọn mẫu, xác định cỡ mẫu là một trong những việc cần thực hiện đầu

tiên. Cỡ mẫu nhỏ thì mẫu sẽ không phản ánh đầy đủ thông tin của quần thể nghiên

cứu, dẫn đến những kết luận không đáng tin cậy. Ngược lại, cỡ mẫu lớn sẽ làm

hao tốn tài nguyên, kinh phí, thậm chí làm hư hại quần thể. Đối với mỗi bài toán

TK, cách chọn mẫu cũng khác nhau tùy theo mục đích nghiên cứu và tính chất

của biến ngẫu nhiên. Việc tính cỡ mẫu phải dựa vào những thông tin đã biết về

quần thể (qua các công trình đã thực hiện) hoặc phải tiến hành nghiên cứu mô

phỏng để thu thập các thông tin cần thiết.

đại học Y, luận án tiến sĩ khoa học giáo dục, trang 52 tác giả đã viết:

Như vậy, trên cơ sở kích thước mẫu (n), người ta sẽ xác định các cá thể mẫu tùy

theo điều kiện cụ thể của mỗi cuộc điều tra. Chúng tôi quan tâm đến việc xác định

cỡ mẫu với mẫu ngẫu nhiên đơn giản, vì vậy đối với các phương pháp chọn mẫu

khác chúng tôi sẽ không trình bày trong luận văn này.

Nếu X là biến sử dụng làm căn cứ chọn mẫu, ta có:

𝑋̅ =

(𝑁𝛿2)

(𝑁 − 𝑛) 𝑉𝑎𝑟(𝑋̅) = 𝛿2 𝛿2 𝑛 (𝑁 − 1)

((𝑁−1)𝛿2

Từ đó: 𝑛 = 𝑋̅ +𝛿2)

23

Trong công thức trên, phương sai tổng thể chưa biết, trong trường hợp này chúng

ta có thể ước lượng giá trị này qua phương sai mẫu. Có thể ước lượng trội cho n

nhờ công thức sau:

𝑋̅

𝑛 = 𝑁 1 + 𝑡(𝑁 − 1)

𝛿2 𝛿2 là tỷ lệ của phương sai trung bình mẫu với phương sai tổng thể, tỉ lệ t do người nghiên cứu lựa chọn. Công thức này có thể sử dụng trong trường

Trong đó: 𝑡 =

hợp chúng ta quan tâm đến các ước lượng điểm, đặc biệt là ước lượng điểm của

trung bình tổng thể.

3.4. Suy rộng kết quả điều tra chọn mẫu

Sau khi đã thu thập được đầy đủ tài liệu ở các đơn vị của tổng thể mẫu, căn cứ vào

đó để tiến hành tính toán và suy rộng (ước lượng) ra các đặc điểm của tổng thể

chung. Có hai phương pháp suy rộng: suy rộng trực tiếp và suy rộng khoảng.

Suy rộng trực tiếp: Coi các mức độ của mẫu cũng là các mức độ của tổng thể

chung. Chẳng hạn, coi số bình quân mẫu, tỷ lệ của mẫu cũng là số bình quân, tỷ

lệ của tổng thể chung.

Suy rộng khoảng: Các mức độ của tổng thể chung được xác định nhận giá trị trong

một khoảng nào đó với xác suất cho trước.

Tổng kết chương 1

Chọn mẫu là một vấn đề có vai trò quan trọng một nghiên cứu. Sự ra đời của

phương pháp này giúp chúng ta giải quyết được các bài toán TK có số lượng điều

tra quá lớn, hoặc không xác định được hết các đơn bị điều tra hay trong trường

hợp đối tượng điều tra bị phá hủy… Điều tra chọn mẫu là một loại điều tra không

24

toàn bộ trong đó người ta chỉ chọn ra một số đơn vị thuộc đối tượng nghiên cứu

để tiến hành điều tra thực tế. Các đơn vị này sẽ được chọn theo nguyên tắc nhất

định đảm bảo tính đại diện. Kết quả của điều tra chọn mẫu được dùng để suy rộng

cho toàn bộ tổng thể. Do đó để hạn chế những rủi ro và sai lầm thì đòi hỏi mẫu

phải đại diện tốt cho quần thể, tức là mẫu phải có cấu trúc tương tự như quần thể

chứa nó.

Có nhiều phương pháp tổ chức chọn mẫu khác nhau tùy theo đặc điểm của đối

tượng điều tra. Một trong các phương pháp chọn mẫu được sử dụng đó là chọn

mẫu ngẫu nhiên. Để thực hiện tốt các cuộc điều tra chọn mẫu, cần phải tiến hành

theo đúng trình tự nhất định như xác định mục đích nghiên cứu, xác định tổng thể

nghiên cứu, xác định nội dung điều tra, xác định số lượng đơn vị tổng thể mẫu và

phương pháp tổ chức chọn mẫu, thu thập số liệu ở mẫu, suy rộng kết quả mẫu và

rút ra kết luận cho toàn bộ tổng thể.

Hầu hết các cuộc điều tra đều phải tiến hành sau quá trình chọn mẫu. Do vậy nếu

người thực hiện thống kê không có cơ sở lý luận vững chắc về chọn mẫu sẽ dẫn

đến rủi ro và sai lầm cao khi suy rộng cho toàn bộ tổng thể. Bằng việc tìm hiểu vai

trò, nguồn gốc nảy sinh của chọn mẫu cho phép chúng tôi khẳng định tầm quan

trọng và phổ biến của nó trong cuộc sống. Chính vì tầm quan trọng và tính phổ

biến này khiến chúng tôi đặt ra nhu cầu cần thiết phải truyền đạt các kiến thức về

chọn mẫu đến học sinh THPT, khi mà mục tiêu giáo dục được đề ra là giúp học

sinh sử dụng các kiến thức được học để ứng dụng giải quyết các bài toán thực tế.

25

Chương 2: Bài toán chọn mẫu trong sách giáo khoa Toán Việt Nam và Mỹ

Thực hiện chương 2 cũng chính là việc chúng tôi đưa ra câu trả lời cho Q2:

Q2: Bài toán chọn mẫu tồn tại như thế nào trong chương trình thống kê ở Việt

Nam? Nhìn sang chương trình giảng dạy khác (chương trình giảng dạy thống kê

của Mỹ), bài toán chọn mẫu được trình bày ra sao? Có sự khác biệt nào trong việc

lựa chọn của những chương trình này?

Để trả lời cho câu hỏi này, chúng tôi sẽ phân tích chương trình giảng dạy TK trong

thể chế dạy học ở Việt Nam để làm rõ những vấn đề sau: Chọn mẫu xuất hiện

trong chương trình học lớp mấy? Trước khi được đưa vào dạy học thì đối tượng

có được xuất hiện ngầm ẩn hay không? Chọn mẫu dành được sự quan tâm như thế

nào trong toàn bộ chương trình giảng dạy TK ở các cấp học? Đồng thời để làm rõ

hơn sự tồn tại của chọn mẫu trong chương trình dạy học, chúng tôi lựa chọn phân

tích SGK toán 10 nâng cao (S10NC) để tìm hiểu xem đối tượng đã được xuất hiện

như thế nào, có các KNV nào về chọn mẫu?

1. Bài toán chọn mẫu trong dạy học thống kê ở Việt Nam

1.1. Phân tích chương trình

Thống kê được đưa vào giảng dạy xuyên suốt trong các cấp học, từ tiểu học đến

trung học phổ thông. Ở chương trình tiểu học, tới học kì II lớp 3, yếu tố TK mới

chính thức được đưa vào chương trình, học sinh sẽ được giới thiệu và làm quen

với dãy số liệu, bảng số liệu: Thứ tự của dãy số, cách đọc và phân tích số liệu, thực

hành lập bảng số liệu đơn giản, đọc số liệu trong bảng. Tiếp theo, ở chương trình

TK lớp 4 và lớp 5, học sinh được học về cách tìm số trung bình cộng và làm quen

với các dạng biểu đồ: Biểu đồ tranh, biểu đồ cột, biểu đồ quạt. Sự phân phối TK

như vậy hoàn toàn phù hợp với mục tiêu của dạy học thống kê ở tiểu học là cung

26

cấp những hiểu biết ban đầu về thống kê mô tả, rèn luyện một số ứng dụng toán

học vào thực tiễn, hình thành tư duy “thống kê” cho học sinh. Như vậy bài toán

chọn mẫu hoàn toàn chưa được đề cập trong bậc tiểu học.

Ở bậc trung học cơ sở, TK chỉ được đưa vào giảng dạy ở chương trình toán lớp 7.

SGK dành toàn bộ thời lượng quan tâm đến vấn đề thu thập số liệu thống kê (dấu

hiệu, tần số, bảng tần số, mốt, trung bình cộng) và cách biểu diễn số liệu thống kê

(thông qua biểu đồ đoạn thẳng và biểu đồ hình chữ nhật). So với chương trình ở

bậc tiểu học thì lượng kiến thức ở bậc trung học có tăng lên, học sinh làm quen

với các khái niệm mới. Tuy nhiên học sinh chỉ mới dừng lại ở việc vận dụng công

thức để tính toán hoặc nhìn vào bảng số liệu để trả lời những câu hỏi đơn giản.

Muốn thu thập các số liệu về một vấn đề mà mình quan tâm chẳng hạn như màu

sắc mà mỗi bạn trong lớp ưa thích thì em phải làm những việc gì và trình bày kết

quả thu được theo mẫu bảng nào?

(SGK toán lớp 7, tr.22)

Trong phần ôn tập chương III, SGK toán lớp 7, tập hai có xuất hiện câu hỏi:

Muốn thu thập số liệu của một dấu hiệu nào đó (kí hiệu là X) ta cần phân chia

đối tượng thành các phần có thể nghiên cứu, tức là phân thành các đơn vị diều

tra. Đánh số hay đặt tên các đơn vị điều tra. Định ra một thứ tự cho các đơn vị

điều tra, xác định giá trị của dấu hiệu.

Với câu hỏi này, sách hướng dẫn giải bài tập toán 7, có đưa ra gợi ý như sau:

Có thể thấy, việc chọn mẫu đã được xuất hiện ngầm ẩn trong hướng dẫn giải: “Ta

cần phân chia đối tượng thành các phần có thể nghiên cứu, tức là phân thành các

đơn vị điều tra”.

27

Ở bậc trung học phổ thông, TK tiếp tục được giới thiệu trong chương trình toán

lớp 10 bao gồm 3 bài và được dự kiến giảng dạy trong 9 tiết. Yêu cầu và mục đích

của việc đưa TK vào giảng dạy ở chương trình lớp 10 được SGV viết như sau:

Về việc trình bày một mẫu số liệu, yêu cầu học sinh:

- Hiểu và biết cách lập bảng phân bố tần số, bảng phân bố tần suất (nếu

là bảng phân bố tần số - tần suất ghép lớp thì phải cho trước cách chia

lớp).

- Dựa vào bảng phân bố tần số (tần suất) ghép lớp, vẽ được biểu đồ tần

số (tần suất) hình cột; biết cách vẽ đường gấp khúc tần số (tần suất)

và biểu đồ tần suất hình quạt.

Về các số đặc trưng của mẫu số liệu, yêu cầu học sinh:

- Hiểu ý nghĩa và biết cách tính số trung bình, số trung vị, mốt, phương

sai và độ lệch chuẩn của một mẫu số liệu.

- Trong trường hợp mẫu số liệu được cho bởi bảng phân bố tần số ghép

lớp, biết tính xấp xỉ số trung bình, phương sai và độ lệch chuẩn.

Các khái niệm mẫu số liệu, điều tra mẫu lần đầu được đề cập. Tuy nhiên trong

những yêu cầu mà chương đặt ra lại hoàn toàn không có yêu cầu nào đòi hỏi học

sinh phải hiểu vai trò của chọn mẫu hay biết các kĩ thuật về chọn mẫu. Vì đây là

nội dung có liên quan trực tiếp đến đối tượng nghiên cứu nên chúng tôi sẽ phân

tích chi tiết hơn trong phần phân tích SGK toán 10 nâng cao.

1.2. Phân tích SGK

Thống kê ở chương trình toán lớp 10 bao gồm 3 bài, được giảng dạy trong 9 tiết.

Chúng tôi sử dụng “Bảng tóm tắt nội dung các bài học trong chương V” đã được

Đinh Thị Mạnh trình bày trong luận văn tốt nghiệp cao học của mình để đưa ra

28

tổng quan các kiến thức thống kê được xuất hiện trong chương trình toán 10 nâng

cao như sau:

Bảng 2.1: Bảng tóm tắt nội dung các bài học trong chương V

STT Tên bài Nội dung

1 Một vài khái niệm mở 1. Định nghĩa thống kê.

đầu. 2. Các khái niệm: mẫu số liệu, kích thước

mẫu, điều tra toàn bộ, điều tra mẫu.

2 Trình bày một mẫu dữ 1. Bảng phân bố tần số - tần suất.

liệu 2. Bảng tần số - tần suất ghép lớp.

3. Các loại biểu đồ :

- Biểu đồ tần số, tần suất hình cột.

- Đường gấp khúc tần số, tần suất.

- Biểu đồ tần suất hình quạt.

3 Các số đặc trưng của 1. Số trung bình.

mẫu số liệu 2. Số trung vị.

3. Mốt.

4. Phương sai và độ lệch chuẩn.

Dựa vào bảng tóm tắt nội dung trên, có thể nhận thấy khái niệm mẫu, điều tra mẫu

được trực tiếp xuất hiện trong bài 1 – Một vài khái niệm mở đầu. Phần lớn thời

lượng chương trình tập trung vào việc trình bày một mẫu dữ liệu và các số đặc

trưng của mẫu số liệu. Do đó chúng tôi sẽ tập trung phân tích Bài 1 để thấy vấn đề

chọn mẫu được xuất hiện như thế nào ? Đối với Bài 2 và Bài 3, chúng tôi quan

tâm đến việc mẫu và vấn đề chọn mẫu được vận dụng để xây dựng kiến thức mới

29

ra sao, việc xây dựng kiến thức mới như vậy có làm nổi bật được ý nghĩa, vai trò

của chọn mẫu hay không ?

1.2.1. Về lý thuyết

Bài 1 : Một vài khái niệm mở đầu.

SGK dành phần đầu tiên để giới thiệu khái niệm TK và vai trò của TK. Mở đầu

bài học bằng câu hỏi “Thống kê là gì ?”. Sau đó, câu hỏi này đã được SGK đưa ra

câu trả lời như sau :

Thống kê là khoa học về các phương pháp thu thập, tổ chức, trình bày, phân

tích và xử lý số liệu. (SGK Toán đại số lớp 10 nâng cao, trang 159).

Như để giải thích cho việc tại sao cần phải học TK, SGK đã đưa ra nhận xét :

Thống kê giúp ta phân tích các số liệu một cách khách quan và rút ra các tri

thức, thông tin chứa đựng trong các số liệu đó. Trên cơ sở này, chúng ta mới

có thể đưa ra những dự báo và quyết định đúng đắn. Vì thế thống kê cần

thiết cho mọi lực lượng lao động… (SGK Toán đại số lớp 10 nâng cao, trang

159).

SGK đã nêu lên vai trò của TK và một trong các vai trò đó là qua phân tích số liệu

thống kê, chúng ta có thể đưa ra những dự báo và quyết định đúng đắn. Điều mà

chúng tôi băn khoăn là thông qua những tiết học về TK, học sinh có thật sự thấy

được vai trò này hay không ?

Trong mục tiếp theo của bài học SGK giới thiệu về khái niệm mẫu số liệu.

Để học sinh nhớ lại các khái niệm dấu hiệu, đơn vị điều tra, giá trị của dấu hiệu

SGK đưa ra một ví dụ. Sau đó đưa ra “bài giải” dấu hiệu là gì, đơn vị điều tra là

gì mà không yêu cầu thêm bất cứ hoạt động nào :

30

Việc nhắc lại các khái niệm của thống kê lớp 7 nhằm tạo điều kiện thuận lợi cho

việc định nghĩa các khái niệm tiếp theo của SGK.

Một tập con hữu hạn các đơn vị điều tra được gọi là một mẫu. Số phần tử

của một mẫu được gọi là kích thước mẫu. Các giá trị của dấu hiệu thu được

trên mẫu được gọi là một mẫu số liệu (mỗi giá trị như thế còn gọi là một số

liệu mẫu). (SGK toán lớp 10 nâng cao, tr.160)

Mặc dù mẫu được định nghĩa một cách tường minh. Tuy nhiên sự xuất hiện của

mẫu chỉ có ý nghĩa như một tên gọi. Nếu như ở thống kê lớp 7, đề bài cho “Kết

31

quả điều tra về số con của 30 gia đình…”, thì khi khái niệm mẫu xuất hiện đề bài

sẽ được viết dưới dạng “Cho mẫu số liệu sau…”. Như vậy vai trò của mẫu chưa

được SGK đề cập đến, chúng tôi cho rằng, đối với học sinh việc học thêm một

khái niệm mà không có ý nghĩa tồn tại thì sẽ dễ bị lãng quên.

Sau khái niệm mẫu dữ liệu, SGK tiếp tục giới thiệu thêm 2 khái niệm mới là điều

tra toàn bộ và điều tra mẫu:

Nếu thực hiện điều tra trên mọi đơn vị điều tra thì đó là điều tra toàn bộ.

Nếu chỉ điều tra trên một mẫu thì đó là điều tra mẫu. (SGK toán lớp 10 nâng

cao, tr.160)

2 khái niệm này xuất hiện một cách tường minh và dễ hiểu. Tiếp đến SGK đưa ra

mối liên hệ giữa hai loại điều tra trên:

Điều tra toàn bộ đôi khi không khả thi vì số lượng các đơn vị điều tra quá

lớn hoặc vì muốn điều tra thì phải phá hủy đơn vị điều tra. Chúng ta thường

chỉ điều tra mẫu và phân tích xử lý mẫu số liệu thu được. (SGK toán 10

nâng cao, tr.160)

Với cách lựa chọn giới thiệu của SGK, điều tra mẫu được hiểu là sự thay thế của

điều tra toàn bộ khi điều tra toàn bộ không khả thi trong trường hợp số lượng đơn

vị điều tra quá lớn hoặc phải phá hủy đơn vị điều tra. SGK đã làm rõ được ý nghĩa

của điều tra mẫu. Tuy nhiên vấn đề đặt ra là điều tra mẫu như thế nào? SGK đã

không lựa chọn làm rõ bài toán chọn mẫu, các kĩ thuật cũng như vai trò của chọn

mẫu trong việc điều tra mẫu.

Trong 2 bài học tiếp theo của chương TK, SGK quan tâm đến việc làm thế nào để

xử lý số liệu sau khi đã chọn được một mẫu. Vấn đề chọn mẫu được SGK coi như

đã được thực hiện, do đó không có thêm các nội dung nào nói về chọn mẫu. Trong

32

bài 2 – Trình bày một số liệu thống kê, SGK tập trung vào xây dựng các khái niệm

bảng phân bố tần số – tần suất ghép lớp và chú trọng đến việc hình thành kĩ thuật

giúp học sinh có thể vẽ được các biểu đồ tần số, tần suất. Trong bài 3 – Các số đặc

trưng của mẫu số liệu, SGK giới thiệu cho học sinh các tham số thống kê như: Số

trung bình, số trung vị, mốt, phương sai độ lệch chuẩn… Do đây đều không phải

đối tượng nghiên cứu chính của luận văn nên chúng tôi không lựa chọn phân tích

sự xuất hiện của chúng trong SGK. Chúng tôi cho rằng sau khi học xong hai bài

thống kê 2 và 3, học sinh có khả năng xử lý và biểu diễn các số liệu thống kê đơn

giản, đây là cơ sở kiến thức phục vụ cho việc suy rộng kết quả thống kê cho quần

thể.

1.2.2. Các tổ chức toán học

Bài 1 – Một vài khái niệm mở đầu: Sau khi giới thiệu các khái niệm cơ bản, bao

gồm cả mẫu số liệu, thì phần bài tập về nội dung không có sự thay đổi so với với

nội dung kiến thức thống kê lớp 7. Chỉ khác ở sự thay đổi cách đặt câu hỏi: “Có

bao nhiêu giá trị của dấu hiệu?” thành “kích thước của mẫu là bao nhiêu?”

Trong 2 bài tiếp theo xuất hiện các kiểu nhiệm vụ mới. Chúng tôi sẽ sử dụng lại

số liệu thống kê các KNV có trong SGK và SBT đã được tác giả Đinh Thị Mạnh

chỉ ra như sau:

TXD.DHDT: Xác định dấu hiệu điều tra.

TXD.DVDT: Xác định đơn vị điều tra.

TXD.GT: Xác định giá trị khác nhau của mẫu số liệu.

TT.TSU: Tính tần suất của các giá trị.

TLB.TSO: Lập bảng tần số.

33

TLB.TSO – TSU – GL: Lập bảng tần số, tần suất ghép lớp.

TVBD.TSUHC: Vẽ biểu đồ tần suất hình cột.

TVBD.DGKTSO: Vẽ đường gấp khúc tần số.

TVBD.TSUHQ: Vẽ biểu đồ tần suất hình quạt.

TT.STB: Tính số trung bình.

TT. TV: Tính số trung vị.

TT.M: Tính mốt.

TT.PS: Tính phương sai.

TT.DLC: Tính độ lệch chuẩn.

TYNTS: Nếu ý nghĩa của các tham số định tâm.

TXD.PPDT: Xác định phương pháp điều tra.

TSS.TS: So sánh số trung bình với số trung vị của cùng một mẫu số liệu.

TNX.DPT: Đánh giá hai đối tượng dựa vào hai mẫu dữ liệu lần lượt ứng với chúng.

TCTSDD: Chọn lựa tham số đại diện cho mẫu số liệu.

TNB.BD: Nhận xét xu thế phân bố của các số liệu dựa vào biểu đồ tần số hình cột và

đường gấp khúc.

TXD.MSL: Tìm mẫu số liệu thỏa tiêu chuẩn cho trước.

Ta có bảng thống kê các câu hỏi theo từng kiểu nhiệm vụ sau:

34

Bảng 2.2: Thống kê số lượng bài tập theo từng KNV

Kiểu nhiệm vụ Trong SGK toán 10 Trong Tổng

SBT nâng cao

Ví dụ Hoạt Bài

tập động

6 6 TXD.DHDT

2 2 𝑇𝑋𝐷.𝐾𝑇𝑀

2 2 𝑇𝑋𝐷.𝐺𝑇

1 1 𝑇𝑇.𝑇𝑆𝑂

31 4 𝑇𝑇.𝑇𝑆𝑈

1 1 𝑇𝐿𝐵.𝑇𝑆𝑂

6 5 11 𝑇𝐿𝐵.𝑇𝑆𝑂−𝑇𝑆𝑈−𝐺𝐿

4 5 9 𝑇𝑉𝐵𝐷.𝑇𝑆𝑂𝐻𝐶

1 2 1 4 𝑇𝑉𝐵𝐷.𝑇𝑆𝑈𝐻𝐶

3 3 𝑇𝑉𝐵𝐷.𝐷𝐺𝐾𝑇𝑆𝑂

1 1 𝑇𝑉𝐵𝐷.𝐷𝐺𝐾𝑇𝑆𝑈

2 1 3 𝑇𝑉𝐵𝐷.𝑇𝑆𝑈𝐻𝑄

2 14 1 17 34 𝑇𝑇.𝑇𝐵

35

2 7 4 13 𝑇𝑇.𝑇𝑉

2 2 4 𝑇𝑇.𝑀

12 14 2 𝑇𝑇.𝑃𝑆

13 9 24 2 𝑇𝑇.𝐷𝐿𝐶

1 1 𝑇𝑋𝐷.𝑃𝑃𝐷𝑇

1 1 1 3 𝑇𝑁𝑋.𝐷𝑃𝑇

1 1 𝑇𝑁𝑋.𝐵𝐷

1 1 𝑇𝑌𝑁𝑇𝑆

1 1 𝑇𝑆𝑆.𝑇𝑆

1 1 𝑇𝐶𝑇𝑆𝐷𝐷

1 1 𝑇𝑋𝐷.𝑃𝑇

1 1 𝑇𝑋𝐷.𝑀𝑆𝐿

Tổng 5 13 82 52 152

Dựa vào biểu đồ trên có thể thấy SGK chú trọng vào 2 kiểu nhiệm vụ: Tính toán

các tham số đặc trưng của mẫu số liệu và trình bày mẫu số liệu (trình bày theo

bảng và trình bày bằng biểu đồ). Tuy nhiên đây đều không phải mục đích nghiên

cứu chính của chúng tôi. Vì vậy chúng tôi không lựa chọn làm rõ từng KNV trên.

Chúng tôi sẽ phân tích các KNV xuất hiện trong SGK có liên quan đến vấn đề

chọn mẫu dựa trên 3 khía cạnh:

36

- Các bài toán thể hiện vai trò của mẫu.

- Các bài toán thể hiện kĩ thuật chọn mẫu.

- Các bài toán thể hiện việc suy rộng cho quần thể.

a) Các bài toán thể hiện vai trò của việc chọn mẫu

Chúng tôi tìm thấy một KNV thể hiện được vai trò của mẫu TXD.PPDT. KNV này

được thể hiện qua hoạt động H1:

Người điều tra phải kiểm định chất lượng các hộp sữa của một nhà máy chế

biến sữa bằng cách mở các hộp sữa để kiểm tra. Có thể điều tra toàn bộ hay

không?

Hoạt động này được đưa ra sau khi SGK giới thiệu hai phương pháp điều tra: điều

tra toàn bộ và điều tra mẫu. Qua thông tin “mở các hộp sữa để kiểm tra”, học sinh

sẽ nhận thấy rằng trong trường hợp này điều tra toàn bộ là không khả thi do nó sẽ

phá hủy các sản phẩm. Do đó việc chọn ra các sản phẩm để kiểm tra là cần thiết.

Thông qua hoạt động này, học sinh có thể thấy được vai trò của việc chọn mẫu:

thay thế cho điều tra toàn bộ, tiết kiệm thời gian, hạn chế phá hủy sản phẩm ban

đầu.

Tuy nhiên ngoài hoạt động H1, chúng tôi không tìm thấy các KNV thể hiện vai

trò của mẫu trong phần bài tập của SGK và SBT. Điều đó cho thấy sự quan tâm

của SGK dành cho việc thể hiện vai trò của mẫu là rất ít.

b) Các bài toán thể hiện kĩ thuật chọn mẫu

Chúng tôi tìm thấy 1 kiểu nhiệm vụ TXD.MSL: Tìm mẫu số liệu thỏa tiêu chuẩn cho

trước. Bài tập thuộc kiểu nhiệm vụ này như sau:

Trong tất cả các mẫu số liệu có kích thước 5 với trung vị là 12 và số trung

bình là 10. Hãy tìm một mẫu số liệu có biên độ nhỏ nhất (biên độ của mẫu

37

số liệu là hiệu giữa giá trị lớn nhất và giá trị bé nhất của mẫu số liệu). (SBT,

tr.181)

Với yêu cầu này, SBT có đưa ra hướng dẫn như sau:

Mặc dù bài toán yêu cầu tìm một mẫu số liệu, tuy nhiên kích thước mẫu tương đối

nhỏ, làm cho bài toán trở thành tương tự việc tìm một dãy số gồm 5 số thỏa mãn

điều kiện cho trước (Đinh Thị Mạnh (2013), tr 37). Để giải được bài toán, các kiến

thức về TK ít được sử dụng, thay vào đó kĩ thuật đề cao các kiến thức số học và

các suy luận trên bất đẳng thức. Với kĩ thuật được cung cấp, học sinh bị hạn chế

trong cách áp dụng. Điều đó có nghĩa, khi gặp một bài toán yêu cầu xác định kích

thước của một mẫu số liệu có yêu cầu khác thì học sinh sẽ không có phương pháp,

kĩ thuật chung để đưa ra lựa chọn. Như vậy, xét trên tổng thể 152 bài tập, chỉ có

duy nhất một bài liên quan đến vấn đề xác định kích thước của mẫu. Điều này cho

thấy sự quan tâm của SGK dành cho việc xác định kích thước mẫu là chưa nhiều.

c) Các bài toán thể hiện suy rộng cho quần thể

Chúng tôi cho rằng việc suy rộng cho quần thể gắn liền với bài toán thể hiện ý

nghĩa của các tham số thống kê. SGK cung cấp 4 tham số TK cho học sinh: Số

trung bình, số trung vị, phương sai và độ lệch chuẩn. Chúng tôi quan tâm đến việc

các tham số này đã được trình bày đầy đủ nghĩa hay chưa? Với việc trình bày mà

38

SGK lựa chọn sẽ có những ảnh hưởng gì đến học sinh? Học sinh có gặp khó khăn

trong việc đưa ra kết luận cho tổng thể thông qua các tham số này hay không?

Chúng tôi đã tìm kiếm được một phần câu trả lời thông qua việc tham khảo các

luận văn đã bảo vệ thành công trước đó, chúng tôi tổng kết lại những kết quả

nghiên cứu về việc thể hiện ý nghĩa của các tham số TK như sau:

Nguyễn Ngọc Đan (2017), Mô hình hóa trong dạy học các tham số thống kê mô tả

ở trường phổ thông, luận văn thạc sĩ khoa học giáo dục: Đối với ba tham số định

tâm, SGK có nhắc đến ý nghĩa của các tham số này, tuy nhiên vai trò của số trung

vị và mốt chưa thể hiện được ưu thế khi đại diện cho mẫu trong nhiều trường hợp.

Tác giả cũng đưa ra và kiểm chứng thành công giả thuyết: Học sinh không hiểu

được đầy đủ ý nghĩa và phân biệt được các tham số định tâm, do đó không lựa

chọn được tham số phù hợp trong các trường hợp cụ thể.

Phạm Thị Tú Hạnh (2012), Các tham số định tâm trong dạy học lớp 12, luận văn

thạc sĩ giáo dục học: Thể chế chỉ nhắc đến vai trò của số trung vị như một “đại

diện” khi mẫu xuất hiện giá trị chênh lệch lớn hơn so với các giá trị còn lại. Những

ưu thế khác của số trung vị so với số trung bình và mốt hoàn toàn không được đề

cập. Ý nghĩa: “Số trung vị làm tối tiểu hóa tổng các chênh lệch” hoàn toàn bị vắng

mặt trong cách trình bày của SGK. Cách trình bày của SGK hình thành một hợp

đồng Didactic: Học sinh không có trách nhiệm sắp xếp dãy số dưới dạng không

giảm, đây là trách nhiệm thuộc về giáo viên.

Tiếp theo, chúng tôi tìm kiếm các KNV có liên quan đến việc sử dụng ý nghĩa các

tham số thống kê để suy rộng cho quần thể và tìm thấy:

TNX.DPT: Đánh giá hai đối tượng dựa vào hai mẫu dữ liệu.

- Kỹ thuật :

39

Tính phương sai (hoặc tính độ lệch chuẩn) của hai mẫu số liệu đã cho.

Mẫu nào có phương sai hay độ lệch chuẩn nhỏ hơn thì các số liệu trong mẫu đó

đồng đều hơn. Đây là mẫu ta nên chọn.

- Công nghệ: Ý nghĩa phương sai và độ lệch chuẩn.

Kiểu nhiệm vụ này được thể hiện qua bài tập sau đây:

Và SGV đưa ra gợi ý cho bài tập này như sau:

Trong câu b) đòi hỏi sau khi tính toán được các tham số đại diện cho mẫu, học

sinh phải đưa ra được kết luận cho từng mẫu rồi so sánh giữa 2 mẫu số liệu. Ở bài

này mẫu số liệu đã được cho sẵn, không đặt học sinh trước tình huống phải chọn

mẫu mà chỉ yêu cầu tính toán các tham số rồi suy rộng cho quần thể.

40

Tham khảo một tài liệu khác, Vũ Như Thư Hương (2009), Luận án Tiến Sĩ: Tác

giả phân các tổ chức toán học trong dạy học toán ở trung học Việt Nam thành 3 tổ

chức: Một tổ chức thống trị, một tổ chức chưa hoàn thiện và một tổ chức vắng

mặt. Trong đó một tổ chức vắng mặt được tác giả định nghĩa như sau:

Một tổ chức vắng mặt: Đây là một tổ chức có các kiểu nhiệm vụ là: lấy ra

một mẫu dữ liệu bằng cách lặp lại một phép thử ngẫu nhiên, nghiên cứu sự

biến động của quá trình chọn mẫu, tức là hoặc nghiên cứu trên một tần suất

riêng, hoặc nghiên cứu trên một chỉ số đặc trưng như giá trị trung bình,

nghiên cứu việc giảm độ biến động bằng cách tăng kích thước của mẫu số

liệu.

Tuy nhiên, một số khái niệm cần dạy như mẫu dữ liệu, đại diện mẫu dữ liệu

và mẫu dữ liệu đại diện cho tổng thể (riêng khái niệm này được giới thiệu

một cách ngầm ẩn) là những yếu tố thuận lợi cho việc xây dựng tổ chức

chọn mẫu dữ liệu.

Như vậy tác giả cũng đồng ý với việc SGK có điều kiện để tiếp tục xây dựng các

tổ chức toán học liên quan đến chọn mẫu, nhưng SGK đã không đưa ra lựa chọn

như vậy.

2. Bài toán chọn mẫu trong dạy học thống kê ở Mỹ

Sau khi tìm hiểu nội dung chọn mẫu trong SGK toán 10 của Việt Nam, chúng tôi

tiếp tục phân tích bộ SGK Mathmetics in Context của tác giả Holt, Rinehart and

Winson (bao gồm cả SGK dành cho học sinh và SGV), đây là SGK được dùng

cho các trường phổ thông ở Mỹ. Sự phân tích này giúp chúng tôi đưa ra được sự

so sánh, đối chiếu giữa 2 cuốn sách, tìm ra điểm giống nhau, khác nhau và nguyên

nhân của sự khác nhau này.

41

Để tìm thấy sự tương đồng, khác nhau giữa hai cuốn sách, chúng tôi sẽ phân tích

SGK Mỹ dựa trên 3 phương diện như đã dùng để phân tích SGK Việt Nam.

2.1 Về các bài toán thể hiện được vai trò và điều kiện của việc chọn mẫu

Chương trình giảng dạy xác suất thống kê được phân bố như trong bảng sau:

42

Dựa vào bảng trên, ta thấy kiến thức liên quan đến thống kê được đưa vào giảng

dạy từ khối lớp 6 cho đến hết khối lớp 9. Học sinh được làm quen với vấn đề chọn

mẫu ở khối lớp 7/8. Cụ thể, kiến thức này sẽ được giảng dạy trong Section A: Are

people Getting Taller? của cuốn sách Mathmetics in Context - Deading with Data

và được phân bố thời gian giảng dạy trong một buổi học – buổi học thứ 3 của

Section A:

Mục tiêu của buổi học này được SGV nêu ra rất rõ ràng: Học sinh sẽ thảo luận

xem liệu 1024 cặp bố con có đủ điều kiện để làm mẫu dữ liệu tốt hay không? Sau

đó học sinh sẽ trao đổi về việc như thế nào là mẫu đại diện tốt cho quần thể. Từ

những mục tiêu mà SGV Mỹ đưa ra, có thể thấy chương trình giảng dạy rất chú

trọng đến việc học sinh đưa ra nhận xét một dữ liệu có đủ điều kiện để đại diện

được cho mẫu hay không?

Mở đầu bài học, tác giả không trực tiếp đưa ra định nghĩa các khái niệm mà bắt

đầu bài học bằng hoạt động thu thập chiều cao của những đứa con trong một gia

43

đình và so sánh với chiều cao của bố mẹ. Trong đó có hoạt động 2 đáng chú ý như

sau:

Hoạt động này được đưa ra giúp học sinh có thể chọn lựa ra các dãy số liệu dựa

trên tiêu chuẩn đã cho. Hai lý do tồn tại của hoạt động này được SGV giải thích:

Đầu tiên là muốn học sinh học được cách tìm kiếm dữ liệu một cách có tổ chức,

tiếp đến giúp học sinh có kinh nghiệm trong việc xây dựng một mẫu dữ liệu lớn.

Như vậy, vấn đề đầu tiên được SGK quan tâm đến khi nói về vấn đề chọn mẫu đó

là kích thước mẫu phải đủ lớn.

Sau hoạt động 2, SGK tiếp tục yêu cầu học sinh thu thập số liệu theo yêu cầu cho

trước, sau đó đưa ra khái niệm của mẫu số liệu như sau:

44

Đi kèm với khái niệm về mẫu dữ liệu, SGK đưa ra chú ý: Để đưa ra được kết luận

có giá trị đúng đắn cho một quần thể, mẫu được chọn phải đại diện tốt cho quần

thể.

Chú ý này đã làm bật lên tầm quan trọng cũng như điều kiện cần có của vấn đề

chọn mẫu. Đây là điều chúng tôi hoàn toàn không thấy xuất hiện trong SGK toán

ở Việt Nam.

45

2.2 Về các bài toán đề cập đến kĩ thuật chọn mẫu

Chúng tôi tìm thấy bài tập yêu cầu chọn ra một mẫu đại diện tốt cho quần thể và

giải thích tại sao (Câu hỏi 9). Đây là bài toán giúp gợi mở kiến thức, học sinh

không bị gò bó trong khuôn khổ kiến thức nào, các dữ liệu về thống kê, xác suất

hoàn toàn không được đề cập đến. Với bài tập này, SGV có hướng dẫn giải như

sau:

46

Trong phần hướng dẫn dành cho giáo viên, SGV có gợi ý:

Mặc dù kĩ thuật chọn mẫu đã không được xuất hiện một cách tường minh nhưng

thông qua gợi ý trả lời của SGV Mỹ, học sinh bước đầu hình thành quan điểm khi

chọn mẫu ta ưu tiên chọn mẫu dữ liệu gồm tất cả các đối tượng đại diện có trong

quần thể. Phần hướng dẫn trong SGV một tiêu chí chọn mẫu dựa vào tỉ lệ cũng đã

được đưa ra: “compare the ratios of the fish in the large picture with the ratios of

the different fish in the bowls”.

Sau bài toán 9 là một câu hỏi mở giúp học sinh liên tưởng xa hơn về những trường

hợp mà mẫu không đáp ứng được việc đại diện tốt cho quần thể, đây được coi như

là hoạt động thể hiện tính sáng tạo và vận dụng vào thực tế.

Như vậy trong phần dẫn dắt bài học, mặc dù SGK Mỹ chưa đưa ra một kĩ thuật

chọn mẫu tường minh nào nhưng đã nhắc đến 2 chú ý trong quá trình chọn mẫu:

Ưu tiên về tính đại diện của mỗi loại cá thể trong quần thể và tỉ lệ số lượng của

mỗi loại cá thể được chọn trong mẫu tương đồng với tỉ lệ loại cá thể trong quần

thể ban đầu.

Chúng tôi hoàn toàn không thấy 2 chú ý của kĩ thuật chọn mẫu này có cơ hội xuất

hiện trong cách tiếp cận tri thức của SGK Việt Nam.

47

2.3 Về các bài toán đề cập đến suy rộng cho quần thể

Chúng tôi tìm thấy 2 bài toán trên thể hiện rõ nhất vấn đề suy rộng cho quần thể

trong phần giới thiệu lý thuyết của SGK. Bài toán cho trước một mẫu dữ liệu và

đặt học sinh trước nhiệm vụ kiểm tra mẫu đó có đại diện tốt cho quần thể hay

không?

Với bài toán 11, SGV đưa ra hướng dẫn trả lời như sau: Sinh viên đại học năm

1903 có thể không phải là đại diện điển hình cho tất cả người Anh vào thời điểm

đó. Vì nhu cầu dinh dưỡng, chăm sóc sức khỏe của sinh viên có thể tạo ra sự khác

biệt về chiều cao so với các tầng lớp khác trong xã hội.

Với bài toán 12, SGV đưa ra hướng dẫn bằng một lời giải mở như sau:

48

Đây là bài toán có thể có nhiều đáp án. Tuy nhiên, mục đích của bài toán được đưa

ra nhằm muốn người học xem xét, kiểm tra đến các yếu tố có thể ảnh hưởng đến

kết quả khi kết luận cho toàn bộ quần thể. SGV cũng đã đưa ra một số yếu tố có

thể ảnh hưởng đến chiều cao giữa bố mẹ và con cái như: tầng lớp của đối tượng

nghiên cứu, chế độ dinh dưỡng, hoặc những người con được nhận nuôi cũng sẽ

làm ảnh hưởng đến kết quả của cuộc điều tra. Việc xuất hiện của 2 bài tập này

giúp học sinh hiểu được rằng không phải mẫu nào cũng có thể đại diện tốt cho

quần thể. Ngược lại so với SGK VN, khi mà tất cả các mẫu dữ liệu được cho trước

đều đại diện được cho quần thể, học sinh không có nhiệm vụ kiểm tra tính phù

hợp của mẫu dữ liệu.

Kết thúc bài học, SGK đưa ra bảng tóm tắt các kiến thức quan trọng về vấn đề

chọn mẫu và một lần nữa nhấn mạnh về mẫu phải đại diện tốt cho quần thể:

49

Về phần bài tập, các KNV liên quan đến vấn đề chọn mẫu được SGV phân loại rõ

ràng theo mục đích: Các KNV làm rõ vai trò của chọn mẫu (4.), KNV chỉ ra sự

tương đồng khác nhau giữa các mẫu đại diện (5.), KNV liên quan đến việc chọn

ra mẫu đại diện tốt cho quần thể (6.) và được phân bổ như bên dưới:

Tổng kết chương 2

Qua việc phân tích cách trình bày lý thuyết của SGK Toán Việt Nam và tìm hiểu

về các KNV trong SGK và SBT, chúng tôi rút ra được các kết luận sau:

Mặc dù các khái niệm mẫu và mẫu số liệu được giới thiệu nhưng chưa được thể

hiện rõ nghĩa cũng như các vấn đề liên quan đến mẫu hay mẫu số liệu. Điều này

làm cho việc xuất hiện của mẫu chỉ có ý nghĩa làm thuận lợi cho việc “gọi tên” và

chưa được nghiên cứu sâu. Biểu hiện có thể thấy rõ nhất cho nhận xét này là mẫu

50

số liệu không được đề cập đến trong SGK toán 10 cơ bản, và chỉ được để cập đến

trong SGK toán 10 nâng cao. Tuy nhiên sự xuất hiện của khái niệm này trong SGK

toán 10 nâng cao cũng không làm xuất hiện KNV mới có liên quan đến chọn mẫu

hay làm cho các KNV xuất hiện trong SGK toán 10 nâng cao khác với các KNV

xuất hiện trong toán 10 cơ bản.

SGK tập trung vào việc trình bày và tính các tham số đặc trưng của một mẫu dữ

liệu. Do đó, hầu hết các bài tập đều chú trọng đến việc hình thành kĩ thuật vẽ biểu

đồ, tính các tham số đặc trưng, chưa có nhiều sự quan tâm cho vấn đề chọn mẫu:

Vai trò của mẫu, kĩ thuật chọn mẫu, bài toán suy rộng cho quần thể.

Mặc dù SGK có trình bày ý nghĩa của các tham số đặc trưng, điều này cung cấp

công cụ cho việc suy rộng, đưa ra kết luận cho quần thể. Tuy nhiên, các KNV phần

lớn mới chỉ dừng lại ở việc tính toán các tham số đại diện cho quần thể. Các bài

toán mặc dù có gắn với các yếu tố thực tế nhưng có rất ít bài tập sử dụng ý nghĩa

của các tham số để đưa ra kết luận.

Tất cả các bài tập đều được SGK cho trước mẫu số liệu, không đặt học sinh trước

bài toán cần phải chọn mẫu. Học sinh chỉ có nhiệm vụ làm việc trên các số liệu

được cho sẵn, chủ yếu là tính các tham số và vẽ biểu đồ. Các bài toán được xây

dựng mang tính định tính nhiều hơn, để giải bài toán học sinh chỉ cần áp dụng các

kĩ thuật được cung cấp để giải quyết.

Việc lựa chọn cách trình bày như vậy dẫn đến việc học sinh thiếu kĩ năng chọn

mẫu, xử lý mẫu, do đó khi đứng trước một bài toán thực tiễn sẽ gặp nhiều khó

khăn. Điều này làm cho TK trở nên khô khan, thiếu tính ứng dụng khi mà hầu hết

các sự việc trong thực tiễn đều không có một mẫu được cho sẵn, chỉ cần áp dụng

công thức để giải quyết.

51

Việc so sánh về quan hệ của bài toán chọn mẫu thiết lập trong hai chương trình sẽ

giúp chúng tôi hiểu rõ hơn những đặc trưng, những ràng buộc của chương trình,

tìm ra những điều mới, tích cực có thể giúp ích cho công tác giảng dạy và không

nhằm mục đích bàn luận đúng sai hay lấy chương trình này làm khuân mẫu cho

chương trình còn lại. Sau khi phân tích hai bộ SGK Toán Việt Nam và SGK Toán

Mỹ, chúng tôi đã tìm thấy được một số điểm tương đồng như sau: Trong cả hai

chương trình, kĩ thuật chọn mẫu đều không được xuất hiện một cách tường minh.

Điều này chúng tôi lý giải là do lựa chọn của thế chế để bài toán chọn mẫu được

giảng dạy trước khi học phần xác suất. Đây được coi là ràng buộc của thể chế làm

kĩ thuật chọn mẫu chưa được xuất hiện. Cả hai chương trình đều đề cập đến vai

trò của chọn mẫu cũng như bài toán suy rộng cho quần thể. Nhận thấy ràng buộc

giữa hai bộ sách như nhau, cơ hội xuất hiện của tri thức là như nhau, tuy nhiên sự

lựa chọn trình bày giữa hai bộ sách có nhiều điểm khác biệt. Cụ thể:

Bảng 2.3: So sánh sự lựa chọn trình bày chọn mẫu trong chương tình dạy học

ở Việt Nam và Mỹ

Phương diện SGK Mỹ SGK Việt Nam

so sánh

SGK Mỹ đưa ra nhiều hoạt động đa Chọn mẫu chưa được

dạng để dẫn dắt bài học, số lượng các quan tâm nhiều. SGK

câu hỏi phân bố đều cho các mục đích: Việt Nam chú trọng

Giới thiệu vai trò của mẫu, kĩ thuật đến việc tính toán các

chọn mẫu, suy rộng cho quần thể. tham số thống kê, vẽ

biểu đồ. Các bài tập

liên quan đến bài toán

52

chọn mẫu chiếm rất ít

và không có sự phân bố

đều.

Phương diện Xây dựng được 2 chú ý trong quá trình Hoàn toàn không đề

kỹ thuật chọn chọn mẫu: cập đến kĩ thuật chọn

mẫu mẫu do đó KNV chọn - Ưu tiên về tính đại diện của mỗi

- Tỉ lệ số lượng của mỗi loại cá

mẫu bị vắng bóng. loại cá thể trong quần thể.

thể được chọn trong mẫu tương

đồng với tỉ lệ loại cá thể trong

quần thể ban đầu.

Phương diện Tồn tại KNV đặt học sinh trước bài Không tồn tại KNV

suy rộng kết toán mẫu có đại diện tốt cho quần thể kiểm tra mẫu có đại

quả cho quần hay không? Đáp án của bài toán đa diện được cho tổng thể

thể dạng bao gồm cả 2 trường hợp mẫu đại hay không? Mẫu số

diện tốt cho quần thể và không đại diện liệu được SGK cho

được cho quần thể. trước và kết quả của

mẫu đều đúng khi suy

rộng cho tổng thể.

Như đã trình bày ở trên, các bài toán thống kê trong thể chế dạy học ở Việt Nam:

Mẫu số liệu luôn được SGK cho trước và kết quả của mẫu đều đúng khi suy rộng

cho tổng thể. Điều này làm chúng tôi e ngại: Liệu khi gặp những bài toán thực tế

mà mẫu không đại diện tốt cho quần thể, học sinh có đủ “tỉnh táo” để nhận ra sự

53

chưa hợp lý trong kết quả hay không? Từ đó làm chúng tôi nảy sinh giả thuyết

sau: “Học sinh sử dụng kết quả thu được từ mẫu để kết luận cho tổng thể, mà

không quan tâm đến mẫu được chọn có đại diện tốt cho tổng thể hay chưa”

Chúng tôi cho rằng việc có thể lưu lại 2 chú ý về kĩ thuật chọn mẫu cho học sinh

sau khi học xong bài học và đưa ra bài toán suy rộng cho quần thể mà kết quả của

nó có thể đại diện tốt cho quần thể hoặc không, giúp học sinh không bị ngộ nhận

tất cả các mẫu đều đại diện tốt cho quần thể, là những điểm tích cực và hữu ích

cho việc dạy và học, vì vậy chúng tôi mong muốn đưa những điểm tích cực này

vào trong thực nghiệm của mình.

54

Chương 3: Thực nghiệm

1. Đối tượng, thời điểm thực nghiệm

Thực nghiệm được tiến hành trên HS lớp 11 vào đầu năm học. Vào thời điểm này

học sinh đã được học xong chương thống kê ở chương trình toán lớp 10.

2. Mục đích thực nghiệm

Chúng tôi tiến hành thực nghiệm này gồm 3 mục đích:

Thứ nhất: Tạo cơ hội cho học sinh tiếp xúc với KNV: Chọn mẫu đại diện phù hợp,

đây là KNV xuất hiện trong SGK Mỹ nhưng lại bị thiếu vắng trong SGK Việt

Nam.

Thứ hai: Kiểm chứng giả thuyết: “Học sinh sử dụng kết quả thu được từ mẫu để

kết luận cho tổng thể, mà không quan tâm đến mẫu được chọn có đại diện tốt cho

tổng thể hay chưa”

Thứ ba: Giới thiệu kĩ thuật chọn mẫu: Do khuôn khổ có hạn của luận văn, chúng

tôi chỉ lựa chọn một phương pháp chọn mẫu là chọn mẫu phân lớp (theo tổ) để

khắc phục sự thiếu hụt về kỹ thuật trong thể chế dạy học XSTK ở lớp 10, bậc phổ

thông.

3. Nội dung thực nghiệm

Thực nghiệm bao gồm 2 bài toán:

Bài toán 1:

Ở Zedland, các cuộc thăm dò dư luận được tiến hành nhằm tìm hiểu mức độ ủng

hộ đối với Tổng thống trong cuộc bầu cử sắp tới. Bốn nhà xuất bản báo chí đã

55

thực hiện những cuộc thăm dò trên toàn quốc. Kết quả thăm dò của bốn tờ báo

như sau:

Tờ báo thứ nhất: 36,5% (tiến hành thăm dò ngày 6 tháng 1, với mẫu là 500 người

dân ngẫu nhiên có quyền bầu cử)

Tờ báo thứ hai: 41,0% (tiến hành thăm dò ngày 20 tháng 1, với mẫu là 500 người

dân ngẫu nhiên có quyền bầu cử)

Tờ báo thứ ba: 39,0% (tiến hành thăm dò ngày 20 tháng 1, với mẫu là 1000 người

dân ngẫu nhiên có quyền bầu cử)

Tờ báo thứ tư: 44,5% (tiến hành thăm dò ngày 20 tháng 1, với mẫu là 1000 người

đọc báo gọi điện để bầu cử)

Kết quả thăm dò của tờ báo nào có thể là kết quả dự đoán sát nhất với mức độ

ủng hộ dành cho Tổng thống nếu cuộc bầu cử diễn ra vào ngày 25 tháng 1? Hãy

đưa ra hai lý giải để bảo vệ ý kiến của em.

(Tài liệu hướng dẫn các câu hỏi toán học PISA, tr 73)

Bài toán 2:

Đài truyền hình tỉnh A muốn tiến hành một cuộc điều tra sở thích của khán giả tại

địa bàn tỉnh. Cuộc điều tra được tiến hành như sau:

Mục tiêu của cuộc điều tra: Thu thập thông tin về sở thích đối với một số chương

trình cụ thể.

Đối tượng: Các hộ gia đình thuộc khu vực thành thị, những người trả lời phỏng

vấn phải có độ tuổi từ 18 – 55. Cụ thể cuộc điều tra đã khảo sát các đối tượng như

sau:

56

Nhóm tuổi Số lượng người

Đơn vị: người

18 – 25

26 – 35

36 – 45 9

46 – 55 42

56 – 65 60

65+ 131

Tổng 242

Và kết quả của cuộc điều tra thu được như sau:

Phân loại chương trình Số lượng khán giả yêu thích

Đơn vị: người

Chương trình ca nhạc 13

Phim cổ trang 65

Thời sự 110

Phim tình cảm 54

(Mỗi khán giả chỉ được lựa chọn một chương trình yêu thích nhất)

Dựa vào bảng số liệu trên:

1) Em có thể đưa ra những nhận xét gì về nhu cầu, sở thích của khán giả tại

tỉnh A?

57

2) Em sẽ phân bố thời lượng chiếu các chương trình này như thế nào phù hợp

với nhu cầu xem truyền hình tại tỉnh A?

3.1. Dàn dựng kịch bản:

Thực nghiệm được tiến hành trong thời gian 45 phút, bao gồm 4 pha:

Pha 1: (Làm việc cá nhân_10 phút)

Trong pha này giáo viên phát phiếu gồm 2 bài toán, giấy làm bài, giấy nháp

cho học sinh. Học sinh làm việc cá nhân để nghiên cứu và đi tìm lời giải cho

mỗi bài toán. Kết thúc pha này, giáo viên thu lại toàn bộ giấy nháp và giấy làm

bài của học sinh. Phân tích bài làm thu được giúp chúng tôi nhận thấy những

quan điểm, mức độ hiểu biết và cách ứng xử trước bài toán chọn mẫu, từ đó

cho phép chúng tôi khẳng định hoặc bác bỏ giả thuyết đã nêu.

Pha 2: (Làm việc theo nhóm_10 phút)

Giáo viên chia học sinh thành các nhóm tùy thuộc vào số lượng học sinh của

lớp. Mỗi học sinh trong nhóm có nhiệm vụ trao đổi, đưa ra ý kiến của mình.

Sau đó cả nhóm sẽ thống nhất chung một lời giải cho mỗi bài toán. GV sẽ theo

dõi, quan sát và ghi nhận lại diễn biến của cuộc thảo luận để làm cơ sở phân

tích hậu nghiệm.

Pha 3: (Làm việc tập thể_20 phút)

Giáo viên có vai trò điều khiển cho cả lớp nhận xét, tranh luận, đánh giá lời

giải của các nhóm khác đã thu được ở pha 2. Đồng thời đưa ra những câu hỏi

dẫn dắt giúp học sinh tự tìm được lời giải đúng. Kết thúc mỗi bài toán, GV sẽ

cung cấp các kiến thức liên quan trước khi chuyển sang phần tiếp theo.

Pha 4: (Thể chế hóa_5 phút)

58

GV tổng kết lại những kiến thức đã cung cấp ở mỗi bài toán.

Đối với bài toán 1, kiến thức cần được truyền đạt:

Để đảm bảo mẫu được chọn có thể đại diện tốt cho quần thể để có thể suy

rộng cho quần thể với mức sai sót thấp nhất thì việc chọn mẫu cần phải dựa

trên điều kiện, tiêu chuẩn sau:

Tính ngẫu nhiên: Tính ngẫu nhiên là một trong các yêu cầu quan trọng nhất.

Một cách đơn giản, tính chất này đòi hỏi khả năng mỗi cá thể trong tổng thể

hay trong một bộ phận của tổng thể có thể được chọn như nhau. Trong một

số phương pháp chọn mẫu cụ thể, tính chất này có thể phụ thuộc rất nhiều

vào mục đích, phạm vi sử dụng số liệu mẫu cho phân tích và dự báo thống

kê.

Tính đại diện: Với những tổng thể lớn có phân thành những bộ phận khác

nhau và phân tích thống kê ở nhiều cấp thì tính đại diện cần được lưu ý từ

cấp thấp nhất, nghĩa là các cá thể được chọn vào mẫu cần phải đại diện được

cho hầu hết các bộ phận hoặc các cấp có trong tổng thể.

Đối với bài toán 2, kiến thức cần được truyền đạt:

Quá trình chọn mẫu có ảnh hưởng rất lớn đến việc suy kết quả cho toàn bộ

quần thể. Nếu không áp dụng kĩ thuật chọn mẫu đúng đắn thì kết quả thu

được sẽ không thể suy rộng ra cho toàn bộ tổng thể. Đối với những cuộc

khảo sát mà kết quả bị ảnh hưởng nhiều bởi các yếu tố như: độ tuổi, giới

tính…, để chọn được mẫu khảo sát chúng ta sẽ thực hiện như sau:

- Trước tiên phân chia tổng thể thành các tổ theo một tiêu thức có liên

quan đến mục đích nghiên cứu.

59

- Sau đó trong mỗi tổ ta chọn ngẫu nhiên ra các đơn vị điều tra. Số

lượng chọn ra ở mỗi tổ có thể tuân theo tỷ lệ số đơn vị tổ đó chiếm

trong tổng thể.

Việc thực hiện thành công pha 3 và pha 4 đồng nghĩa với việc chúng tôi đã xây

dựng được tiểu đồ án dạy học một số vấn đề về chọn mẫu.

3.2. Phân tích tiên nghiệm

Lời giải đúng được mong chờ:

Tờ báo thứ ba. Thăm dò diễn ra gần ngày bầu cử hơn (1); Cỡ mẫu lớn

hơn (2); Tiến hành trên lựa chọn ngẫu nhiên (3); Chỉ có người có quyền bầu cử

được hỏi (4). Đưa ra ít nhất là hai lý do; thông tin bổ sung (kể cả các thông tin

lạc đề hoặc không chính xác) có thể được bỏ qua.

 Tờ báo thứ ba, bởi vì họ đã chọn nhiều người dân ngẫu nhiên có

quyền bầu cử hơn.

 Tờ báo số ba, vì nó đã hỏi đến 1000 người ngẫu nhiên, và ngày thực

hiện gần với ngày bầu cử hơn, thì người đi bầu cử có ít thời gian để thay đổi quyết

định của họ hơn.

 Tờ báo số ba, vì họ lựa chọn ngẫu nhiên những người có quyền bầu

cử.

 Tờ báo số ba bởi vì nó khảo sát nhiều người hơn và gần với ngày bầu

cử hơn.

 Tờ báo số ba bởi vì người ta đã chọn ngẫu nhiên 1000 người.

60

- Mục đích:

Xuất phát từ việc mọi bài toán trong SGK luôn có kết quả của mẫu phù hợp khi

suy rộng cho quần thể và không tồn tại KNV yêu cầu học sinh chọn ra mẫu phù

hợp. Bài toán 1 mang tính chất phỏng thực tiễn nhằm đặt người học trước tình

huống lựa chọn kết quả hợp lý từ một mẫu, làm thế nào để biết mẫu có đại diện

tốt cho quần thể hay không? Sau khi thực hiện bài toán 1, học sinh ý thức được

việc tồn tại những tác động có thể ảnh hưởng đến việc suy rộng cho quần thể nên

không phải mọi mẫu đều có thể đại diện tốt cho quần thể. Đồng thời cũng nhấn

mạnh đến các yếu tố kích thước mẫu, tính ngẫu nhiên khi chọn mẫu.

- Chiến lược :

Chiến lược 1 : So sánh giá trị phần trăm.

Học sinh sẽ chọn tờ báo ứng với tỉ lệ phần trăm cao nhất hoặc ứng với mỗi tờ báo

học sinh tính số lượng người ủng hộ sau đó so sánh các kết quả này. Nhóm những

học sinh chọn chiến lược này cho thấy các em chỉ quan tâm đến kết quả mà bỏ qua

các vấn đề của mẫu như kích thước mẫu, sự lựa chọn ngẫu nhiên, hay tính cập

nhật của thông tin… Khi chiến lược 1 được lựa chọn nhiều cũng sẽ cho thấy tiêu

chuẩn tỉ lệ có ảnh hưởng rất lớn trong việc đưa ra kết luận cho tổng thể.

Như đã phân tích, đây là KNV không xuất hiện trong thể chế dạy học của Việt

Nam do đó chúng tôi dự đoán học sinh sẽ dễ mắc phải sai lầm khi không quan tâm

đến kích thước mẫu hay tính ngẫu nhiên mà sẽ sử dụng tỉ lệ phần trăm hay số

lượng người để đưa ra kết luận. Do dó chiến lược 1 được dự đoán sẽ chiếm ưu thế.

Chiến lược 2 : Căn cứ vào các đặc điểm ảnh hưởng đến việc chọn mẫu (Số lượng

người khảo sát, mốc thời gian, tính ngẫu nhiên)

61

Lời giải tương ứng có thể quan sát được ứng với chiến lược này đó là học sinh sẽ

đưa ra những lời giải thích cho lựa chọn của mình như :

- Vì số người đông nhất.

- Vì thời gian khảo sát gần với thời gian bầu cử nhất.

- Vì người phỏng vấn được lựa chọn ngẫu nhiên.

Chúng tôi dự đoán chiến lược này sẽ ít có cơ hội xuất hiện.

Biến :

V1 : Tỉ lệ phần trăm.

 V1 : Tỉ lệ phần trăm có sự chêch lệch lớn.

 V2 : Tỉ lệ phần trăm có sự chêch lệch không đáng kể.

Chúng tôi chọn biến V1 : Tỉ lệ phần trăm có sự chêch lệch lớn, để tìm hiểu giữa

tiêu chuẩn tỉ số phần trăm và các yếu tố ảnh hướng đến việc chọn mẫu, học sinh

quan tâm đến vấn đề nào hơn ?

- V2 : Số lượng người khảo sát, mốc thời gian khảo sát.

 V21 : Số lượng người khảo sát, mốc thời gian chênh lệch lớn.

 V22 : Số lượng người khảo sát, mốc thời gian chênh lệch nhỏ.

Chúng tôi chọn biến V21 : Số lượng người khảo sát chênh lệch lớn, số lượng người

khảo sát khác nhau tạo điều kiện cho học sinh quan tâm đến vấn đề kích thước của

mẫu khảo sát, hạn chế chiến lược sai lầm là so sánh giá trị phần trăm, tạo cơ hội

cho chiến lược đúng xuất hiện.

Bài toán 2:

- Mục đích :

62

Kiểm chứng giả thuyết : “Học sinh sử dụng kết quả thu được từ mẫu để kết luận

cho tổng thể, mà không quan tâm đến mẫu được chọn có đại diện tốt cho tổng thể

hay chưa”

Chúng tôi đặt học sinh vào trong hoàn cảnh dựa vào kết quả số lượng người yêu

thích một chương trình để đưa ra sự phân bố thời gian chiếu tương ứng. Chúng ta

biết rằng, sự yêu thích một chương trình nào đó hay không phụ thuộc rất nhiều

vào độ tuổi của đối tượng được khảo sát do nhu cầu ở mỗi độ tuổi là khác nhau.

Ví dụ, thanh niên sẽ thích xem phim tình cảm, nghe ca nhạc nhiều hơn. Người lớn

tuổi thích xem thời sự, phim cổ trang. Vì vậy khi lựa chọn đối tượng khảo sát, số

lượng giữa các nhóm tuổi cần phải đồng đều, không quá tập trung vào một đối

tượng nhóm tuổi. Mặc dù cuộc khảo sát yêu cầu người được hỏi phải có độ tuổi

từ 18 − 55, tuy nhiên trong bài toán lại bỏ trống nhóm tuổi 18 − 35 và tập trung

khảo sát những người thuộc nhóm tuổi từ 55 tuổi trở lên. Điều này dẫn đến kết

quả của cuộc khảo sát chưa phù hợp do đó không thể dùng kết quả này để kết luận

cho toàn bộ tỉnh A. Chúng tôi muốn kiểm tra khi đứng trước tình huống, học sinh

có nhận ra điều này để kiểm tra lại tính hợp lý của kết quả hay không ?

- Chiến lược :

Chiến lược 1 : Chiến lược xử lý mẫu.

Điều có thể quan sát được khi học sinh sử dụng chiến lược này là : Học sinh sẽ

làm việc với các số liệu thu thập được ở bảng 2 (có thể tính tần số, tần suất, tỉ lệ

của từng loại chương trình hoặc dựa vào số lượng người nhiều hay ít) để đưa ra

nhận xét.

Một số câu trả lời dự kiến nhận được từ học sinh :

 Chương trình thời sự được yêu thích nhiều nhất (45,45%)

63

 Chương trình ca nhạc ít được yêu thích nhất (5,4%)

 Thứ tự các chương trình được yêu thích là : Chương trình ca nhạc,

phim tình cảm, phim cổ trang, thời sự.

Sau khi làm việc với bảng số liệu, học sinh sẽ dựa vào số lượng người bình chọn,

tỉ lệ, tần suất, tần số để phân phối lượng thời gian tương ứng với tỉ lệ mà chương

trình đó được yêu thích, chương trình nào nhận được nhiều sự yêu thích sẽ được

dành thời gian chiếu nhiều nhất và ngược lại.

Chiến lược 2 : Bác bỏ mẫu.

Điều có thể quan sát được ở chiến lược này là học sinh không lập tức tính toán hay

đưa ra nhận xét thông qua bảng số liệu 2. Mà thay vào đó là hình thành các câu

hỏi về đối tượng được khảo sát. Ví dụ : Tại sao lại không có người nào thuộc nhóm

tuổi 18 – 25 ? Tại sao lại xuất hiện đối tượng thuộc độ tuổi 55+, mẫu số liệu có đủ

lớn để đưa ra kết quả không… Và do đó cho rằng kết quả của cuộc khảo sát chưa

đủ thông tin chính xác để đưa ra nhận xét hay làm căn cứ để phân bố thời gian

chiếu các chương trình.

Khi phần lớn học sinh lựa chọn chiến lược 1 nghĩa là học sinh không quan tâm

đến quá trình chọn mẫu đã đủ chính xác hay chưa. Mà chỉ chú trọng đến việc xử

lý các kết quả thống kê và đưa ra nhận xét, kết luận. Điều này đồng nghĩa với việc

giả thuyết : “Học sinh sử dụng kết quả thu được từ mẫu để kết luận cho tổng thể,

mà không quan tâm đến mẫu được chọn có đại diện tốt cho tổng thể hay chưa” đã

được kiểm chứng.

Khi chiến lược 2 chiếm ưu thế đồng nghĩa với việc, học sinh có ý thức được sự

ảnh hưởng của việc chọn mẫu lên kết quả thống kê và quan tâm đến việc chọn mẫu

phù hợp cũng như tồn tại nghi ngờ kết quả thống kê.

64

 Biến

V1 : Hình thức của câu hỏi.

V1 : Câu hỏi mở, nêu rõ mục đích, yêu cầu và đối tượng khảo sát.

V2 : Câu hỏi yêu cầu tính toán cụ thể, không nêu rõ mục đích và đối tượng

khảo sát.

Chúng tôi lựa chọn biến V1 : Câu hỏi mở, nêu rõ mục đích, yêu cầu và đối tượng

khảo sát.

Thứ nhất, đối với dạng câu hỏi mở, không lựa chọn yêu cầu học sinh tính

toán hay xử lý số liệu từ bảng đã cho nhằm hạn chế việc học sinh sử dụng

chiến lược 1, tạo điều kiện cho chiến lược đúng có cơ hội xuất hiện.

Thứ hai, nhận thấy tất cả các bài tập trong SGK, SBT học sinh không có

điều kiện để tìm hiểu về quá trình chọn mẫu mà chỉ được làm việc với bảng

kết quả. Vì vậy việc lựa chọn cung cấp đầy đủ mục đích, yêu cầu và đối

tượng khác với cách ra đề thường thấy trong SGK nhằm tạo sự chú ý, hướng

học sinh quan tâm đến những vấn đề này, tạo thuận lợi cho chiến lược đúng

được xuất hiện.

3.3. Phân tích hậu nghiệm

Thực nghiệm được tiến hành trên 36 học sinh lớp 11 ở một trường phổ thông tại

Long An. Đây là những em học sinh có lực học trung bình, khá và đã được học

đầy đủ chương thống kê ở chương trình toán 10.

 Bài toán 1

Sau đây là kết quả thống kê kết quả dựa trên chiến lược học sinh đã sử dụng ở bài

toán 1 :

65

Bảng 3.1: Kết quả thống kê dựa trên chiến lược của học sinh

S1 S2 Chiến lược khác Tổng

33

33(92%) 2(5,5%) 1(2.5%) 36

36

Đúng như dự đoán ở phân tích tiên nghiệm, có đến (92%) học sinh lựa chọn sử

dụng chiến lược 1 để giải bài toán.

Cụ thể: có 3 học sinh lựa chọn tờ báo thứ nhất với phần trình bày giải thích là do

cuộc bầu cử diễn ra dài nhất. Ở đây có thể lý giải về việc đưa ra lý do này là do

các em hiểu nhầm rằng cuộc bầu cử tính từ ngày 6/1 nên có thời gian bầu cử dài

13

nhất.

36

Có (36%) học sinh lựa chọn tờ báo thứ 2 có kết quả sát nhất. Đa số những học

sinh chọn tờ báo này đều đưa ra những lý do sau:

 Tỉ lệ phần trăm cao.

 Sát với ngày bầu cử.

66

14

36

Có (39%) học sinh lựa chọn tờ báo thứ 4 có kết quả sát nhất. Tất cả những học

sinh lựa chọn tờ báo này đều có một giải thích chung là do có tỉ lệ phần trăm cao

nhất.

Mặc dù sự lựa chọn bài báo có kết quả sát nhất trong nhóm sử dụng chiến lược S1

là khác nhau. Tuy nhiên những học sinh trong nhóm này đều đưa ra lời giải thích

là do tỉ lệ của tờ báo đó cao. Từ đó cho thấy mặc dù tính cập nhật thông tin, độ lớn

của mẫu khảo sát đã được đề cập đến nhưng tiêu chuẩn tỉ lệ lại được học sinh chú

trọng và đánh giá cao hơn và cũng là yếu tố quyết định để đưa ra kết luận của học

2

sinh.

36

Có (5,5%) học sinh lựa chọn chiến lược S2, chiếm một tỉ lệ rất thấp.

67

Học sinh giải thích sự lựa chọn của mình bằng cách phủ nhận sự hợp lý của những

tờ báo khác: Không chọn tờ báo thứ nhất vì khảo sát cách ngày quá xa, không chọn

tờ báo thứ 2 vì có số người khảo sát chênh lệch quá cao so với 2 tờ báo 3 và 4

(chúng tôi hiểu học sinh đang ngầm ẩn đưa ra lý do mẫu khảo sát ít hơn tờ báo 3,

4) và chọn tờ báo thứ 3 (học sinh có sự nhầm lẫn trong kết luận khi viết thành tờ

báo thứ 4) do những người được khảo sát là những người ngẫu nhiên có quyền

bầu cử còn tờ báo thứ 4 thì không. Như vậy, tiêu chuẩn tỉ lệ không phải là yếu tố

quyết định để đưa ra quyết định đối với học sinh nhóm S2. Thay vào đó học sinh

nhóm này quan tâm hơn với các vấn đề tính ngẫu nhiên, kích thước mẫu và tính

cập nhật của thông tin.

Ngoài ra có 1 học sinh đưa ra lựa chọn đúng là tớ báo thứ 3, bài làm của học sinh

này như sau:

68

Để giải thích cho lựa chọn của mình, học sinh tính số người tương ứng ở mỗi tờ

báo (phần số được ghi bằng bút chì) để chọn ra hai tờ báo có số người bình chọn

cao nhất. Tuy nhiên khi chọn được 2 tờ báo có số người bình chọn cao nhất học

sinh lại không tiếp tục sử dụng tiêu chuẩn tỉ lệ để đánh giá mà lập luận tờ báo thứ

3 là tờ báo sát nhất do kết quả khảo sát của tờ báo thứ 4 không mang tính khách

quan (chúng tôi hiểu học sinh đang ngầm ẩn đề cập đến tính ngẫu nhiên trong việc

chọn mẫu). Do đó chúng tôi xếp bài làm của học sinh này vào nhóm các chiến

lược khác.

Như vậy, với kết quả thu được của bài toán 1 cho phép chúng tôi đưa ra những kết

luận sau:

69

- Khi đứng trước một bài toán chọn mẫu phù hợp, học sinh sẽ chú trọng đến

tiêu chuẩn tỉ lệ để đưa ra kết luận cho quần thể.

- Sự thiếu vắng KNV chọn mẫu phù hợp trong SGK làm cho học sinh gặp

khó khăn hay thậm chí là phán đoán sai lầm khi phải đưa ra sự lựa chọn

mẫu nào phù hợp, mẫu nào không phù hợp. Chúng tôi đã chọn một bài toán

trong tài liệu tập huấn PISA vì đây là cuộc thi áp dụng toán học để giải quyết

các vấn đề thực tiễn, tuy nhiên đa số học sinh đã không thể đưa ra được lời

giải như mong đợi. Sự thiếu vắng KNV chọn mẫu phù hợp khiến học sinh

chưa được xây dựng và trang bị những kĩ năng chọn mẫu để áp dụng vào

thực tiễn, điều này làm mất đi một phần ý nghĩa của thống kê.

 Bài toán 2 :

Mặc dù chúng tôi đã cung cấp thông tin đối tượng khảo sát phải có độ tuổi từ 18 −

55 tuy nhiên khi theo dõi quá trình làm bài, 100% học sinh không thắc mắc hay

phản ứng lại với những số liệu mà mình nhận được mà vẫn tiếp tục trả lời những

câu hỏi 1) và 2). Học sinh sử dụng chiến lược S1 để trả lời cho câu hỏi. Nghĩa là,

kết luận được đưa ra dựa vào số lượng người bình chọn nhiều hay ít hoặc dựa vào

tỉ số phần trăm bình chọn ở mỗi chương trình :

70

Câu trả lời nhận được nhiều nhất cho câu hỏi này đó là học sinh sắp xếp các chương

21

trình theo mức độ yêu thích, đứng đầu là thời sự, phim cổ trang, phim tình cảm,

36

chương trình ca nhạc. Có tới (58%) học sinh kết luận bằng câu: “Khán giải tại

tỉnh A”. Điều này cho thấy học sinh đã sử dụng kết quả của cuộc khảo sát để suy

luận cho toàn bộ tỉnh A mà không quan tâm hay nghi ngờ mẫu được lựa chọn có

phù hợp và đại diện tốt cho tỉnh A hay không? Một số câu trả lời nhận được nhiều

nhất như:

71

Bên cạnh đó trong bài làm của một số học sinh thể hiện các em có chú ý đến độ

tuổi 55+ được khảo sát nhưng chưa đưa ra được sự bất hợp lý trong khâu chọn đối

tượng khảo sát.

Các em coi đó là một nguyên nhân dẫn đến tỉnh A thích xem thời sự và phim cổ

trang nhiều hơn. Điều này có nghĩa, khi gặp một bài toán, học sinh sẽ mặc định là

đề luôn đúng sau đó dùng các dữ liệu đề bài để suy ra các hệ quả mà không hoài

nghi về tính hợp lý của đề bài. Do đó khi nhận được các kết quả học sinh quay

ngược lại trả lời cho câu hỏi mà không có bước kiểm tra lại.

Đối với câu hỏi 2), khi được hỏi các em sẽ phân bố thời gian chiếu các chương

trình này như thế nào, đa số học sinh phân bố thời gian chiếu các chương trình dựa

vào sự yêu thích mà chương trình đó được bình chọn. Chương trình nào được bình

chọn nhiều sẽ được ưu tiên chiếu với thời lượng nhiều và ngược lại. Bài làm của

những học sinh này thể hiện các em đã áp dụng kết quả của cuộc khảo sát để phân

bố thời gian chiếu cho toàn bộ tỉnh A.

72

Điều khiến chúng tôi chú ý đó là sự mâu thuẫn trong bài làm của học sinh. Một số

học sinh ở câu hỏi thứ nhất trả lời khán giả ở tỉnh A yêu thích xem thời sự và phim

cổ trang hơn, tuy nhiên khi phân bố thời gian chiếu lại ưu tiên thời lượng chiếu

cho chương trình ca nhạc và phim tình cảm:

73

74

Chúng tôi đã tiến hành phỏng vấn các em này về câu trả lời của mình thì nhận

được lời giải thích là do các em yêu thích ca nhạc và phim tình cảm hơn. Như vậy

càng khẳng định yếu tố độ tuổi có ảnh hưởng rất lớn đối với thể loại chương trình

yêu thích. Bản thân học sinh đã ý thức được với mỗi độ tuổi khác nhau sẽ có sở

thích xem khác nhau. Tuy nhiên lại chưa thấy được sự ảnh hưởng khi lựa chọn các

đối tượng khảo sát như trên đến việc kết luận về sự yêu thích của khán giả cho

toàn bộ tỉnh A. Từ tất cả những ghi nhận được từ bài toán 2 cho phép chúng tôi

kiểm chứng thành công giả thuyết: “Học sinh sử dụng kết quả thu được từ mẫu để

kết luận cho tổng thể, mà không quan tâm đến mẫu được chọn có đại diện tốt cho

tổng thể hay chưa”

Phân tích tiến trình buổi học

Sau khi thu lại toàn bộ bài làm cá nhân của học sinh, GV bắt đầu tiết dạy như kịch

bản đã đưa ra. Trong quá trình dạy, GV sẽ có những tác động, những câu hỏi dẫn

dắt giúp học sinh tiếp thu kiến thức mới. Đây cũng chính là việc thực hiện một

tiểu đồ án dạy học mà chúng tôi muốn xây dựng.

GV chia lớp thành 4 nhóm và yêu cầu mỗi nhóm bắt đầu thảo luận. Kết thúc pha

thảo luận nhóm, chiến lược mà các nhóm sử dụng được thống kê lại như sau:

Bảng 3.2: Thống kê chiến lược ở bài toán 1 của các nhóm

Chiến lược S1 Chiến lược S2

Nhóm 1, nhóm 2, nhóm 4 Nhóm 3

(Tỷ lệ 3/4) (Tỷ lệ 1/4)

75

Mặc dù các nhóm 1, 2, 4 sử dụng chung một chiến lược S1, tuy nhiên đáp án mà

các nhóm đưa ra là khác nhau.

Bảng 3.3: Thống kê lựa chọn tờ báo của các nhóm

Chọn tờ báo thứ thứ 2 Chọn tờ báo thứ 4

Nhóm 4 Nhóm 1, 2

Theo ghi nhận và quan sát được, tờ báo thứ nhất nhanh chóng bị bác bỏ ở tất cả

các nhóm. Cụ thể ở nhóm 2, khi một HS chọn tờ báo thứ nhất và đưa ra lời giải

thích là do thời gian bầu cử diễn ra trong thời gian dài (6/1 – 25/1), các bạn trong

nhóm đã nhanh chóng bác bỏ và giải thích lại rằng cuộc bầu cử chỉ diễn ra trong

ngày 6/1 và tỉ lệ chọn số người khảo sát thấp.

Nhóm 1, 2 chọn đáp án là tờ báo thứ 4. Một số lý do chung được cả 2 nhóm đưa

ra như:

 Tỉ lệ phần trăm cao.

 Số lượng người khảo sát đông.

Với những lý do mà các nhóm đưa ra cho thấy, tỉ lệ phần trăm là công cụ rất mạnh

được học sinh sử dụng để so sánh rồi kết luận sự phù hợp của mẫu này so với mẫu

khác. HS đã quan tâm đến số lượng người khảo sát, ý thức được số lượng khảo sát

cần lớn, mà chưa chú ý đến đặc trưng của người khảo sát (ngẫu nhiên hay không?

có đại diện tốt hay không?).

Theo quan sát, HS nhóm 1, nhóm 2 có sự phân vân trong việc lựa chọn tờ báo thứ

2 và tờ báo thứ 4:

76

HS 1: Tờ báo thứ 2 có 500 người mà đạt 41%, tờ báo thứ 4 có 1000 người

mà có 44,5%. Hơn có 3,5% thôi hả?

(Một số học sinh đồng tình và bắt đầu phân vân)

HS 2: Đã tính tỉ lệ phần trăm thì đâu quan trọng số người nữa đâu.

Những tranh luận này đều quay quanh vấn đề tỉ lệ phần trăm, chưa có những thảo

luận về các đặc điểm của mẫu người khảo sát. Việc thảo luận của nhóm 4 cho thấy,

nhóm đã chú ý đến yếu tố ngẫu nhiên và tính cập nhật thời gian. Tuy nhiên các em

không cho đây là yếu tố quan trọng và quyết định để đưa ra kết luận đâu là tờ báo

có kết quả khảo sát đúng nhất mà dựa vào tỉ lệ phần trăm:

Tờ báo thứ 4 có kết quả khảo sát đúng nhất. Vì tờ báo khảo sát gần ngày

diễn ra bầu cử, người dân có quyền bầu cử ngẫu nhiên. Tỉ lệ 41% trong 500

chiếm tỉ lệ cao.

Việc sử dụng chiến lược S1 có thể quan sát được rất rõ trong việc thảo luận nhóm

và bài làm ở các nhóm 1, nhóm 2 và nhóm 4.

Nhóm số 3 đã sử dụng chiến lược mà chúng tôi mong đợi. Nhóm 3 đưa ra lựa chọn

tờ báo có kết quả khảo sát đúng nhất bằng cách đưa ra những điểm chưa hợp lý

của những tờ báo còn lại: Không lựa chọn tờ báo thứ nhất vì nó cách xa ngày khảo

sát, không lựa chọn tờ báo thứ 2 vì số lượng người khảo sát ít, tờ báo thứ 4 thì chỉ

có những người bầu cử qua điện thoại.

Sau khi học sinh của nhóm 3 trình bày, một học sinh của nhóm 1 phản đối: “Tờ

báo thứ 4 và tờ báo thứ 3 có cùng ngày khảo sát, cùng số lượng người khảo sát

nhưng tỉ lệ của tờ báo thứ 4 cao hơn nên phải đáng tin cậy hơn”. Một số học sinh

trong nhóm thì thầm: “Nhóm số 3 nên chọn tờ báo thứ 3”. Trong bài làm của nhóm

số 3 có đưa ra một lý do giải thích cho sự lựa chọn của mình là do người bầu cử

77

được lựa chọn ngẫu nhiên. Nhưng việc chưa giải thích được phản đối của nhóm

số 1 và theo quan sát trong quá trình thảo luận, chúng tôi nhận thấy từ “ngẫu nhiên”

được sử dụng do nó có sẵn trong đề bài, học sinh chưa thực sự hiểu và giải thích

được tại sao cần phải lựa chọn ngẫu nhiên, sự khác nhau giữa 1000 người lựa chọn

ngẫu nhiên và 1000 người gọi điện bầu cử là như thế nào? Giáo viên bắt đầu can

thiệp vào quá trình thảo luận:

Như vậy tất cả các nhóm đã thống nhất không chọn tờ báo thứ nhất và thứ

hai và đang phân vân giữa tờ báo thứ ba và tờ báo thứ tư. Có một vấn đề

mới được nảy sinh đó là lựa chọn khảo sát 1000 người ngẫu nhiên hay 1000

người gọi điện phỏng vấn sẽ tốt hơn? Chúng ta xem xét giữa hai nhóm đối

tượng này có đặc điểm gì khác nhau.

Các nhóm thảo luận sôi nổi, sau đây là ý kiến của học sinh gần đúng với mong

chờ của chúng tôi:

1000 người ngẫu nhiên thì có thể đọc báo hoặc không. Còn 1000 người đọc

báo thì chắc chắn họ có đọc báo.

Giáo viên tiếp tục đưa ra những câu hỏi dẫn dắt học sinh xây dựng kiến thức:

GV: Những người đọc báo có nghĩa là họ đã đọc một hoặc nhiều bài báo

viết về vấn đề bầu cử, về đối tượng ứng cử. Như vậy họ có thể đã bị những

nội dung họ đọc chi phối đến lựa chọn của mình. Vậy theo các em chọn

78

đối tượng như thế nào thì kết quả khảo sát sẽ khách quan và công bằng

hơn?

HS: Chọn ngẫu nhiên ạ.

Để nhấn mạnh hơn về sự cần thiết của việc lựa chọn ngẫu nhiên và ảnh hưởng của

nó đến kết quả khảo sát, giáo viên tiếp tục đưa ra một ví dụ:

Để khảo sát chất lượng học môn Toán của học sinh lớp 11A1 và 11A2, nếu

cô chọn 3 bạn học sinh giỏi nhất của lớp 11A1 và 3 bạn học sinh có điểm

tổng kết thấp nhất của lớp 11A2. Như vậy kết quả của cuộc khảo sát có công

bằng và khách quan không?

Cuối cùng giáo viên tiến hành thể chế hóa các kiến thức về chọn mẫu:

Để đảm bảo mẫu được chọn có thể đại diện tốt cho quần thể để có thể suy

rộng cho quần thể với mức sai lầm thấp nhất thì việc chọn mẫu cần phải dựa

trên các điều kiện, tiêu chuẩn sau:

Tính ngẫu nhiên: Tính ngẫu nhiên là một trong các yêu cầu quan trọng nhất,

đảm bảo tính chất không chệch của suy diễn thống kê, cũng như các mô tả

thống kê.

Tính đại diện: Tính đại diện thường được xác định trên cơ sở yêu cầu về

mức tin cậy của các phân tích thống kê như ước lượng, kiểm định…

Như vậy thông qua cuộc thảo luận cho thấy: Bản thân học sinh đã có ý thức về

việc chọn mẫu cần phải có kích thước mẫu lớn, đã chú ý đến sự cập nhật về thông

tin (ngày, tháng), giáo viên đã xây dựng và giải thích về đặc điểm quan trọng nhất

của chọn mẫu cho học sinh đó là tính ngẫu nhiên.

79

Bài toán 2

Sau khi giáo viên hoàn thành thể chế hóa các kiến thức rút ra từ bài toán 1, học

sinh bắt đầu thảo luận nhóm bài toán số 2. Kết quả thảo luận nhóm ở bài số 2

hoàn toàn tương tự như kết quả mà học sinh làm việc cá nhân. Nghĩa là, 100%

các nhóm đều sử dụng bảng số liệu đã cho, tiến hành tính toán, phân tích các

con số sau đó đưa ra kết luận về sự yêu thích, nhu cầu xem truyền hình của

toàn bộ tỉnh A. Câu trả lời nhận được nhiều nhất từ các nhóm là sắp xếp các

chương trình theo thứ tự yêu thích nhất đến các chương trình có độ yêu thích

thấp:

Nhu cầu, sở thích của khán giả tỉnh A về thời sự là nhiều nhất. Bên cạnh đó

thì phim cổ trang và phim tình cảm cũng được ưa thích hơn so với ca nhạc.

Do đó, với câu hỏi phân bố thời lượng chiếu các chương trình này cho phù hợp

với nhu cầu và sự yêu thích của khán giả, hầu hết các nhóm đã phân bố thời

gian dựa vào mức độ mà chương trình đó được yêu thích: Chương trình nào

được yêu thích thì chiếu với thời lượng nhiều, chương trình nào ít được yêu

thích thì chiếu với thời lượng ít.

Ghi nhận từ thảo luận của các nhóm, chúng tôi nhận thấy các học sinh trong

nhóm có sự quan tâm đến nhóm tuổi. Hội thoại sau được lấy từ thảo luận của

nhóm 2:

HS 2.1: Ê sao tui thấy tỉnh này nhiều người lớn tuổi quá vậy?

80

HS 2.2: Ừa, thì tỉnh này có dân số già thôi.

HS 2.3: Tại vì dân số già nên họ mới thích xem thời sự. Bình thường mà.

Một nhận xét khác được ghi chép lại từ một học sinh nhóm 4:

HS 4.1: Khán giả hầu hết là những người thuộc U65.

Thông qua quan sát và ghi nhận được từ sự thảo luận cho chúng tôi thấy: Học sinh

nhận ra số lượng người khảo sát thuộc vào nhóm tuổi 56+ chiếm phần lớn, giữa

các nhóm tuổi khảo sát có sự chênh lệch về số lượng người và cũng đã ý thức được

rằng tuổi tác sẽ ảnh hưởng đến sự yêu thích một thể loại truyền hình “thì dân số

già nên mới thích xem thời sự”. Tuy nhiên với những điều phát hiện trên, học sinh

không cảm thấy nghi ngờ kết quả khảo sát hay nhận ra việc chọn đối tượng khảo

sát như vậy là chưa hợp lý, mà xem đây như những lý do giải thích cho việc tại

sao người dân tỉnh A lại có nhu cầu và yêu thích như ở câu hỏi 1) đã kết luận.

Kết thúc pha thảo luận nhóm ở bài toán thứ 2 cho thấy: Học sinh hoàn toàn không

nghi ngờ về mẫu được chọn. Khi được cho một mẫu số liệu, học sinh ngay lập tức

xử lý mẫu, dùng mẫu số liệu này để đưa ra kết luận và không có sự kiểm tra lại

tính hợp lý của nó. Điều này đồng nghĩa với việc, học sinh chưa ý thức được vai

trò, ảnh hưởng của việc chọn mẫu đến kết quả nghiên cứu. Từ những ghi nhận

được, giáo viên bắt đầu can thiệp nhằm giúp học sinh nhận ra vai trò, tầm quan

trọng của việc chọn mẫu đến kết quả điều tra. Đồng thời giới thiệu một kỹ thuật

chọn mẫu cho học sinh: kỹ thuật chọn mẫu theo tổ.

Nhằm mục đích nhắc lại và nhấn mạnh đến việc độ tuổi có ảnh hưởng rất lớn đến

kết quả khảo sát, giáo viên đưa ra câu hỏi thảo luận:

GV: Lứa tuổi 18 – 20 như các em thích xem chương trình gì? Có giống với

sở thích của ông bà, bố mẹ các em không?

81

HS 1.1: Em thích xem Gameshow, ca nhạc. Còn ông bà em thích xem thời

sự, phim Ấn Độ.

GV: À như vậy với những độ tuổi khác nhau sẽ có sở thích khác nhau, đúng

không?

HS: Dạ.

Sau khi chắc chắn rằng tất cả học sinh đều đồng ý và thừa nhận kết quả của khảo

sát bị ảnh hưởng lớn từ độ tuổi của người được phỏng vấn, giáo viên tiếp tục đưa

ra những câu hỏi dẫn dắt:

GV: Chúng ta thấy người dân tỉnh A được phân thành các nhóm tuổi khác

nhau. Nhìn vào bảng, các em cho cô biết đối tượng chủ yếu được khảo sát

là nhóm tuổi nào?

HS 3.1: Dạ là những người trung niên, từ 56 tuổi trở lên ạ.

GV: Đối tượng khảo sát mà bài toán yêu cầu là nhóm tuổi nào?

HS 3.2: Dạ từ 18 – 55 ạ.

GV: Vậy người đi khảo sát đã thực hiện đúng yêu cầu của bài toán chưa?

Việc tập trung khảo sát nhóm tuổi 55+ có đại diện được hết cho toàn bộ

người dân tỉnh A không?

HS đồng thanh: Dạ không.

GV: Như vậy kết quả khảo sát có chính xác khi kết luận cho toàn bộ tỉnh A

hay không?

HS đồng thanh: Không ạ.

GV: Vì sao?

82

HS 1.2: Vì còn có những người trẻ chưa được hỏi. Nếu được hỏi họ sẽ thích

xem ca nhạc hơn ạ.

GV: Đúng rồi. Như vậy việc lựa chọn mẫu để khảo sát là vô cùng quan

trọng. Chúng ta cần phải lựa chọn mẫu phù hợp, các đối tượng khảo sát

phải đại diện được cho tổng thể thì khi đó từ kết quả của mẫu mới có thể

suy ra kết luận cho tổng thể ban đầu.

Như vậy giáo viên đã thành công trong việc dẫn dắt học sinh nhận ra sự chưa hợp

lý từ mẫu được chọn khảo sát. Đồng thời một trong những đặc điểm của chọn mẫu

là tính đại diện đã được xây dựng. Từ đó giúp học sinh ý thức được tầm quan trọng

và ảnh hưởng của mẫu đến kết quả khảo sát: Nếu chọn mẫu không phù hợp sẽ dẫn

đến kết quả suy rộng cho quần thể bị sai lầm.

Tiếp theo, giáo viên giúp học sinh hình thành kĩ thuật chọn mẫu – kĩ thuật chọn

mẫu theo tổ.

GV: Quay lại bài toán, nếu em là người đi tiến hành điều tra, em sẽ thực

hiện khảo sát như thế nào?

HS 2.2: Phân chia người dân tỉnh A thành các nhóm tuổi khác nhau nhưng

theo đúng yêu cầu từ 18- 55 thôi ạ. Sau đó trong mỗi nhóm tuổi chọn ra

người để khảo sát.

GV: Đúng rồi. Nhưng các em lấy người khảo sát từ mỗi nhóm tuổi ra như

thế nào?

Học sinh suy nghĩ một lúc.

HS 1.3: A, lấy ngẫu nhiên ạ. Mới học ở bài 1.

83

Đến đây học sinh đã tự mình xây dựng được các bước: Phân chia đối tượng khảo

sát thành các tổ, các nhóm theo một tiêu thức và lựa chọn hình thức lấy ngẫu nhiên

ra các đối tượng khảo sát từ các tổ, các nhóm đã chia. Tiếp theo, giáo viên cố gắng

nhấn mạnh về cách lấy ra các đối tượng khảo sát từ các nhóm khảo sát.

GV: Đúng rồi. Một trong các cách lấy đó là chúng ta sẽ lấy ngẫu nhiên các

đối tượng khảo sát từ các nhóm. Nhưng vẫn đề là lấy với số lượng như thế

nào?

HS 2.2: Lấy bằng nhau cho công bằng ạ.

GV: Vậy nếu tỉnh A có rất nhiều người trẻ nhưng lại có rất ít người già thì

sao?

HS: Nếu vậy thì lấy nhiều người trẻ ạ.

GV: Đúng rồi. Như vậy, số lượng người lấy ra từ các nhóm phụ thuộc vào

tỉ lệ số người mà nhóm đó có so với tổng số người của toàn bộ tỉnh A. Vậy

các em sẽ lấy số lượng người khảo sát từ các nhóm tuổi như thế nào?

HS: Nhóm nào có nhiều người thì lấy ra nhiều người khảo sát hơn, nhóm ít

người thì lấy ra ít người hơn ạ.

Thông qua việc xây dựng cách tiến hành khảo sát nhu cầu xem phim tại tỉnh A,

học sinh đã xây dựng được cách lấy mẫu khảo sát bằng kỹ thuật chọn mẫu. Giáo

viên thực hiện bước thể chế hóa của bài toán số 2 về việc xây dựng kĩ thuật chọn

mẫu:

GV: Quá trình chọn mẫu có ảnh hưởng rất lớn đến việc suy ra kết quả cho

toàn bộ tổng thể. Nếu không áp dụng kĩ thuật chọn mẫu đúng đắn thì kết

quả thu được sẽ không thể suy rộng ra cho toàn bộ tổng thể. Đối với những

84

cuộc khảo sát mà kết quả bị ảnh hưởng nhiều bởi các yếu tố như: độ tuổi,

giới tính…, để chọn được mẫu khảo sát chúng ta sẽ thực hiện như sau:

- Trước tiên phân chia tổng thể thành các tổ theo một tiêu thức có liên

quan đến mục đích nghiên cứu.

- Sau đó trong mỗi tổ ta chọn ngẫu nhiên ra các đơn vị điều tra. Số

lượng chọn ra ở mỗi tổ có thể tuân theo tỷ lệ số đơn vị tổ đó chiếm

trong tổng thể.

Kết thúc pha thể chế hóa của bài toán thứ 2, giáo viên đã giới thiệu được kĩ thuật

chọn mẫu theo tổ. Giúp học sinh hiểu biết thêm về một phương pháp chọn mẫu,

để khi đứng trước các vấn đề tương tự học sinh có cơ sở, phương pháp để xử lý

chúng. Ngoài ra, bên cạnh tính ngẫu nhiên đã được đưa ra ở pha thể chế hóa của

bài toán 1, giáo viên đã cung cấp thêm đặc điểm về tính đại diện của chọn mẫu.

Như vậy kết thúc buổi học, giáo viên đã thực hiện đầy đủ những mục đích đã được

nêu ra. Học sinh đã được tiếp thu thêm các kiến thức mới mà SGK không giới

thiệu: Tính ngẫu nhiên và tính đại diện của chọn mẫu, hình thành kĩ thuật chọn

mẫu theo tổ.

85

Tổng kết chương 3

Trong chương 3, chúng tôi đã tiến hành một thực nghiệm gồm 2 bài toán, nhằm

vào ba mục đích như sau:

Thứ nhất: Tạo cơ hội cho học sinh tiếp xúc với KNV: Chọn mẫu đại diện phù hợp,

đây là KNV xuất hiện trong SGK Mỹ nhưng lại bị thiếu vắng trong SGK Việt

Nam.

Thứ hai: Kiểm chứng giả thuyết: “Học sinh sử dụng kết quả thu được từ mẫu để

kết luận cho tổng thể, mà không quan tâm đến mẫu được chọn có đại diện tốt cho

tổng thể hay chưa.”

Thứ ba: Giới thiệu kĩ thuật chọn mẫu: Do khuôn khổ có giới hạn của luận văn,

chúng tôi chỉ lựa chọn một phương pháp chọn mẫu là phương pháp chọn mẫu theo

tổ để bổ sung một kỹ thuật còn thiếu hụt trong SGK Việt Nam.

Kết quả mà chúng tôi đã đạt được sau khi tiến hành thực nghiệm bao gồm:

Thứ nhất: Chúng tôi đã đưa ra một KNV mới không xuất hiện trong SGK

toán VN: Chọn mẫu đại diện phù hợp cho tổng thể. Việc để KNV này xuất hiện

giúp học sinh nhận thức được rằng không phải mọi mẫu đều sẽ đại diện tốt cho

quần thể, cung cấp cho học sinh cách để lựa chọn ra mẫu thích hợp khi đứng trước

2 hay nhiều mẫu khác nhau. Thông qua bài toán đã lựa chọn, chúng tôi cũng đã

làm nổi bật tính ngẫu nhiên và tính đại diện của chọn mẫu.

Thứ hai: Bằng việc lựa chọn mẫu không phù hợp, chúng tôi đã tạo ra tình

huống có kết quả thống kê không chính xác khi suy ra cho tổng thể và nhờ đó kiểm

chứng thành công giả thuyết: “Học sinh sử dụng kết quả thu được từ mẫu để kết

luận cho tổng thể, mà không quan tâm đến mẫu được chọn có đại diện tốt cho tổng

thể hay chưa”

86

Thứ 3: Chúng tôi đã cung cấp cho học sinh một kĩ thuật chọn mẫu mới – kĩ

thuật chọn mẫu theo tổ. Học sinh được học thêm một kiến thức, kĩ thuật mới hoàn

toàn không được đề cập đến trong SGK nhưng lại rất cần thiết khi giải các bài toán

chọn mẫu.

87

Kết luận

Các kết quả nghiên cứu đã được trình bày trong từng chương của luận văn. Sau

đây, chúng tôi xin tổng kết lại nội dung tâm đắc mà chúng tôi đã đạt được:

Chương 1:

Bằng việc tìm tòi, tham khảo từ những nghiên cứu đã được công bố trước đó,

chúng tôi đã chỉ ra tầm quan trọng của vấn đề chọn mẫu, đưa ra cơ sở của các kỹ

thuật chọn mẫu và các bài toán liên quan.

Chương 2:

Chúng tôi tiến hành nghiên cứu sự tồn tại của bài toán chọn mẫu trong sách giáo

khoa Toán Việt Nam và Mỹ.

Qua việc phân tích cách trình bày lý thuyết của SGK Toán Việt Nam và tìm hiểu

về các KNV trong SGK và SBT, chúng tôi nhận thấy: SGK tập trung vào việc

trình bày và tính các tham số đặc trưng của một mẫu dữ liệu. Do đó, hầu hết các

bài tập đều chú trọng đến việc hình thành kĩ thuật vẽ biểu đồ, tính các tham số đặc

trưng, chưa có nhiều sự quan tâm cho vấn đề chọn mẫu: Vai trò của mẫu, kĩ thuật

chọn mẫu, bài toán suy rộng cho quần thể. Tất cả các bài tập đều được SGK cho

trước mẫu số liệu, không đặt học sinh trước bài toán cần phải chọn mẫu.

Thông qua việc tìm hiểu sự tồn tại của bài toán chọn mẫu trong chương trình giảng

dạy xác suất thống kê ở Việt Nam và Mỹ, giúp chúng tôi hiểu rõ hơn về những

đặc trưng, những ràng buộc của thể chế. Từ đó tìm ra những điều mới, điều tích

cực có thể bổ sung, hỗ trợ, giúp ích cho công tác giảng dạy. Điều này đã giúp

chúng tôi hình thành lên những ý tưởng về bài toán thực nghiệm của mình.

Chương 3:

88

Chúng tôi đã tiến hành một thực nghiệm gồm 2 bài toán. Kết thúc thực nghiệm,

chúng tôi đã thu được các kết quả sau:

Thứ nhất: Chúng tôi đã đưa ra một KNV mới không xuất hiện trong SGK

toán VN: Chọn mẫu đại diện phù hợp cho tổng thể. Thông qua bài toán đã lựa

chọn, chúng tôi cũng đã làm nổi bật tính ngẫu nhiên và tính đại diện của chọn

mẫu.

Thứ hai: Kiểm chứng thành công giả thuyết: “Học sinh sử dụng kết quả thu

được từ mẫu để kết luận cho tổng thể, mà không quan tâm đến mẫu được chọn có

đại diện tốt cho tổng thể hay chưa”

Thứ ba: Chúng tôi đã cung cấp cho học sinh một kĩ thuật chọn mẫu mới – kĩ thuật

chọn mẫu theo tổ - một kỹ thuật thiếu vắng trong SGK Việt Nam nhưng lại rất cần

thiết khi giải quyết các bài toán chọn mẫu.

Từ năm học 2021 – 2022, học sinh khối 6 sẽ được học toán theo chương trình và

SGK mới, trong đó có các kiến thức về thống kê và xác suất. Sự đổi mới này chắc

chắn sẽ bao gồm các thay đổi về cách trình bày, sự xuất hiện và tồn tại của kiến

thức nói chung cũng như bài toán chọn mẫu nói riêng trong chương trình mới. Vì

vậy, phạm vi tính hợp thức của các kết quả luận văn – thu được từ việc thực nghiệm

trên chương trình giảng dạy cũ, có thể sẽ thay đổi. Nhưng thay đổi như thế nào,

kết quả nào phù hợp, kết quả nào không còn phù hợp? – đó sẽ là hướng mở cho

các luận văn tiếp theo.

89

TÀI LIỆU THAM KHẢO

Tài liệu Tiếng Việt

Đào Hồng Nam (2014), Dạy học xác suất thống kê ở trường đại học Y, luận án

tiến sĩ, trường Đại học Sư Phạm thành phố Hồ Chí Minh.

Đinh Thị Mạnh (2013), Nghiên cứu về bài toán chọn mẫu ở thông kê lớp 10,

luận văn thạc sĩ giáo dục học, trường Đại học Sư Phạm thành phố Hồ Chí Minh.

Hoàng Ngọc Nhậm (2007), Lý thuyết xác suất và thống kê toán, nhà xuất bản

thành phố Hồ Chí Minh.

Lê Thị Hoài Châu (2005), Dạy học xác suất thống kê ở trường trung học phổ

thông, nhà xuất bản Đại học Sư Phạm.

Lê Thị Hoài Châu (2018), Thuyết nhân học trong didactic toán, NXB Đại học

Sư Phạm Tp.HCM

Ngô Văn Thứ (2005), Thống kê thực hành, nhà xuất bản Khoa Học và Kĩ Thuật.

Nguyễn Ngọc Đan (2017), Mô hình hóa trong dạy học các tham số thống kê mô

tả ở trường phổ thông, luận văn thạc sĩ khoa học giáo dục, trường Đại học Sư

Phạm thành phố Hồ Chí Minh.

Phạm Thị Tú Hạnh (2012), Các tham số định tâm trong dạy học lớp 12, luận

văn thạc sĩ giáo dục học, trường Đại học Sư Phạm thành phố Hồ Chí Minh.

Quách Huỳnh Hạnh (2009), Nghiên cứu giảng dạy thống kê mô tả ở trung học

phổ thông, luận văn thạc sĩ giáo dục học, trường Đại học Sư Phạm thành phố

Hồ Chí Minh.

Trần Văn Hạo (Tổng chủ biên) – Vũ Tuấn (Chủ biên) – Doãn Minh Cường –

Đỗ Mạnh Hùng – Nguyễn Tiến Tài (2007), Đại số lớp 10, NXB Giáo dục.

90

Trần Văn Hạo (Tổng chủ biên) – Vũ Tuấn (Chủ biên) – Doãn Minh Cường –

Đỗ Mạnh Hùng – Nguyễn Tiến Tài (2007), Sách giáo viên Đại số lớp 10, NXB

Giáo dục.

Trần Văn Hạo (Tổng chủ biên) – Vũ Tuấn (Chủ biên) – Doãn Minh Cường –

Đỗ Mạnh Hùng – Nguyễn Tiến Tài (2007), Sách Bài Tập Đại số lớp 10, NXB

Giáo dục.

Vũ Như Thư Hương (2009), Une Etude Didactique Sur l’introduction Dán

l’enseignement mathematiques Vietnamien de notions statistiques dán leurs

liens avec les probabilities, Luận án Tiến Sĩ.

Tài liệu Tiếng Anh

Holtm, Rinehart and Winson (2003), Mathmetics in Context, National Science

Foundation.

Holtm, Rinehart and Winson (2003), Mathmetics in Context, Teacher Guide,

National Science Foundation.