BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC SƯ PHẠM TP. HỒ CHÍ MINH

Nguyễn Thùy Liên

VẤN ĐỀ SO SÁNH CÁC MẪU DỮ LIỆU

THỐNG KÊ: SỰ NỐI KHỚP GIỮA DẠY

HỌC XÁC SUẤT THỐNG KÊ VỚI ĐÀO

TẠO CỬ NHÂN KINH TẾ

LUẬN VĂN THẠC SĨ GIÁO DỤC HỌC

Thành phố Hồ Chí Minh – 2013

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC SƯ PHẠM TP. HỒ CHÍ MINH

Nguyễn Thùy Liên

VẤN ĐỀ SO SÁNH CÁC MẪU DỮ LIỆU

THỐNG KÊ: SỰ NỐI KHỚP GIỮA DẠY

HỌC XÁC SUẤT THỐNG KÊ VỚI ĐÀO

TẠO CỬ NHÂN KINH TẾ

Chuyên ngành: Lý luận và phương pháp dạy học bộ môn Toán

Mã số: 60 14 01 11

LUẬN VĂN THẠC SĨ GIÁO DỤC HỌC

NGƯỜI HƯỚNG DẪN KHOA HỌC:

PGS.TS. LÊ THỊ HOÀI CHÂU

Thành phố Hồ Chí Minh – Năm 2013

LỜI CẢM ƠN

Tôi xin gửi lời cảm ơn chân thành nhất, sâu sắc nhất đến các Thầy, Cô Khoa Toán – Tin, lãnh

đạo và các chuyên viên Phòng Sau đại học Trường Đại học Sư phạm thành phố Hồ Chí Minh đã

giúp tôi hoàn thành chương trình học và luận văn này.

Đặc biệt, tôi xin bày tỏ lòng biết ơn sâu sắc đến PGS. TS Lê Thị Hoài Châu. Luận văn này sẽ

không thể hoàn thành nếu không có sự hướng dẫn tận tình của Cô.

Tôi cũng xin trân trọng cám ơn:

- PGS.TS. Annie Bessot, TS. Alain Birebent đã bỏ công từ Pháp sang Việt Nam để góp ý

hướng nghiên cứu đề tài và giải đáp những thắc mắc trong nghiên cứu Didactic Toán cho chúng

tôi.

- Các thành viên trong lớp Didactic Toán khóa 22 đã giúp đỡ tôi trong suốt khóa học.

- Các thầy cô Khoa Toán – Thống kê, khoa Ngân hàng và các bạn sinh viên K38 trường Đại

học Kinh tế TP.HCM đã giúp đỡ tôi rất nhiều trong vấn đề thực nghiệm của luận văn.

Cuối cùng, tôi muốn gửi lời cám ơn tới bố, mẹ và chồng tôi đã luôn động viên, khích lệ tôi

hoàn thành luận văn này.

Nguyễn Thùy Liên

1

MỤC LỤC

LỜI CẢM ƠN .............................................................................................................. 1

MỤC LỤC .................................................................................................................... 2

DANH MỤC CÁC TỪ VIẾT TẮT ............................................................................ 3

MỞ ĐẦU ....................................................................................................................... 4

1. Những ghi nhận ban đầu và câu hỏi xuất phát ............................................................ 4

2. Khung lý thuyết tham chiếu ........................................................................................... 7

3. Phương pháp nghiên cứu ............................................................................................... 9

CHƯƠNG 1: SO SÁNH CÁC MẪU DỮ LIỆU THỐNG KÊ TRONG HAI GIÁO TRÌNH CHUYÊN NGÀNH .......................................................................... 11

1.1. So sánh các mẫu dữ liệu thống kê ............................................................................ 11

1.2. So sánh các mẫu dữ liệu thống kê trong giáo trình chuyên ngành kinh tế .......... 12

1.2.1. Phân tích giáo trình Phân tích và đầu tư chứng khoán .......................................... 13

1.2.2. Phân tích giáo trình Kinh tế lượng ........................................................................ 21

1.3. Tổng kết chương 1 ..................................................................................................... 29

CHƯƠNG 2: SO SÁNH CÁC MẪU DỮ LIỆU THỐNG KÊ TRONG GIÁO TRÌNH XS – TK ........................................................................................................ 31

2.1. Phân tích GT3 ............................................................................................................ 34

2.1.1. Kỳ vọng, phương sai, độ lệch chuẩn của ĐLNN .................................................. 34

2.1.2. Giá trị trung bình, phương sai của tổng thể và mẫu .............................................. 41

2.1.3. Hàm hồi qui ........................................................................................................... 43

2.1.4. Các tổ chức toán học liên quan đến so sánh các mẫu dữ liệu thống kê ................ 43

2.2. Tổng kết chương 2 ..................................................................................................... 48

CHƯƠNG 3: NGHIÊN CỨU THỰC NGHIỆM .................................................... 51

3.1. Thực nghiệm ............................................................................................................... 51

3.2. Phân tích tiên nghiệm ................................................................................................ 54

3.3. Phân tích hậu nghiệm ................................................................................................ 59

KẾT LUẬN ................................................................................................................ 64

TÀI LIỆU THAM KHẢO ........................................................................................ 66

PHỤ LỤC ................................................................................................................... 68

2

DANH MỤC CÁC TỪ VIẾT TẮT

Từ viết tắt Từ đầy đủ

XS – TK Xác suất – Thống kê

ĐLNN Đại lượng ngẫu nhiên

GT1 Giáo trình Phân tích và đầu tư chứng khoán

GT2 Giáo trình Kinh tế lượng

GT3 Giáo trình Xác suất - Thống kê

3

MỞ ĐẦU

1. Những ghi nhận ban đầu và câu hỏi xuất phát

Xác suất – Thống kê (XS – TK) là một khoa học nghiên cứu các đại lượng ngẫu nhiên

nên đóng vai trò quan trọng trong hầu hết mọi lĩnh vực của thế giới hiện đại, từ khoa học,

công nghệ, đến kinh tế, chính trị,…Khoa học này trang bị cho chúng ta công cụ để tìm ra

qui luật của những hiện tượng liên quan đến một tập hợp đông đảo các đối tượng mà ta chỉ

có thể tiếp cận một bộ phận của nó (gọi là mẫu thống kê). Chính vì vậy mà XS – TK là môn

học bắt buộc đối với sinh viên của tất cả các trường đại học, cao đẳng và hầu hết các trường

đào tạo nghề trên cả nước. Nhiệm vụ của môn học này là cung cấp cho sinh viên những kiến

thức liên quan đến XS – TK cũng như tạo cơ sở cho sinh viên học các bộ môn chuyên

ngành khác.

Tuy nhiên, trong nghiên cứu của nhóm tác giả Lê Thị Hoài Châu - Đào Hồng Nam:

“Một nghiên cứu về dạy học xác suất trong đào tạo ngành Y”, các tác giả đã chỉ ra sự “thiếu

sót” của chương trình dạy XS – TK trong các trường đào tạo ngành Y. Nội dung chính của

nghiên cứu trên bàn về việc dạy toán trong đào tạo ngành Y với nội dung xoay quanh mô

hình ngưỡng P-K, một mô hình cho phép các bác sĩ quyết định xem bệnh nhân không cần

điều trị, hay cần làm xét nghiệm, hay phải điều trị ngay. Qua phân tích những kiểu nhiệm vụ

liên quan đến mô hình ngưỡng được xem xét trong giáo trình XS – TK sử dụng ở trường

“Kỹ thuật toán học cho phép giảm thiểu yếu tố chủ quan trong chẩn bệnh đã không được đưa

vào trong giáo trình. Hệ quả là sinh viên thiếu những kỹ thuật thỏa đáng để chẩn đoán và điều

trị cho bệnh nhân tương lai của họ” (Lê Thị Hoài Châu - Đào Hồng Nam (2013))

Đại học Y-Dược thành phố Hồ Chí Minh, các tác giả nhận thấy:

Như vậy rõ ràng rằng, việc dạy học XS – TK trong trường đào tạo Y chưa thực sự cung cấp

đủ các công cụ toán cho hoạt động nghề nghiệp của các bác sĩ tương lai.

Chính từ những kết quả nghiên cứu của nhóm tác giả Lê Thị Hoài Châu - Đào Hồng Nam,

chúng tôi đặt ra câu hỏi: Liệu trong các trường đào tạo nghề khác, chẳng hạn như trường

đào tạo kinh tế, thì XS – TK có cung cấp đủ kiến thức cho các môn chuyên ngành sử

dụng hay không?

4

Xuất phát từ câu hỏi này, chúng tôi đã tìm hiểu về việc dạy XS – TK trong các trường đào

tạo kinh tế. Đối với các sinh viên ngành kinh tế, XS – TK thực sự là một công cụ nghiên

cứu rất hữu hiệu, giúp xử lý các thông tin kinh tế xã hội nhằm đưa ra các quyết định và dự

báo đúng đắn, hợp lý. Không những vậy, XS – TK còn cung cấp nền tảng khoa học cho sinh

viên học các môn chuyên ngành. Vì vậy, nếu xem xét giáo trình của nhiều môn học chuyên

ngành kinh tế thì chúng ta sẽ thấy phương pháp và công cụ TK đã được vận dụng đan xen

trong một số nội dung của những môn học này.

Chẳng hạn, trong môn Phân tích và đầu tư chứng khoán, mức độ phân tán của lợi nhuận của

một chứng khoán chính là mức độ rủi ro của chứng khoán đó. Việc xem xét mức độ rủi ro

của các chứng khoán có ý nghĩa rất quan trọng, giúp người đầu tư có thể đưa ra quyết định

có lợi nhất. Chính vì vậy, để học tốt môn học này, sinh viên cần phải nắm bắt được khái

niệm về tham số đo độ phân tán của tổng thể và cách so sánh độ phân tán của hai tổng thể

ngay từ khi học môn XS – TK.

Chúng tôi đã tiến hành khảo sát trên 118 sinh viên năm thứ hai Đại học Kinh tế TP.HCM.

Những sinh viên này đã học xong chương trình XS – TK và chuẩn bị thi phân ngành. Câu

hỏi khảo sát của chúng tôi như sau:

Bài 1: Một công ty sử dụng hai công nghệ khác nhau A và B để sản xuất. Nhằm kiểm

tra xem công nghệ nào cho sản lượng ổn định hơn, người ta ghi lại khối lượng sản

phẩm (tấn) sản xuất ra sau mỗi ngày (khi sử dụng từng công nghệ trên) trong 60

ngày. Số liệu thu được như sau:

35 36 37 38 39 40 41 42 43 Sản lượng (tấn) khi sử dụng công nghệ A

1 2 7 6 8 12 14 9 1 Số ngày có cùng sản lượng

26 27 28 29 30 31 32 33 Sản lượng (tấn) khi sử dụng công nghệ B

1 4 16 13 12 5 7 2 Số ngày có cùng sản lượng

5

Theo bạn, sản xuất theo công nghệ nào cho năng suất ổn định hơn? Giải thích cho

kết luận của bạn.

Thực chất, yêu cầu của bài toán chính là so sánh độ phân tán của hai tổng thể: tổng thể sản

lượng (thu được mỗi ngày) khi sử dụng công nghệ A và tổng thể sản lượng (thu được mỗi

ngày) khi sử dụng công nghệ B. Trong bài toán này chúng tôi đã cố ý chọn số liệu sao cho

giá trị năng suất trung bình của công nghệ A lớn hơn năng suất trung bình công nghệ B và

phương sai của công nghệ A lớn hơn phương sai của công nghệ B nhưng hệ số biến động

của công nghệ A lại nhỏ hơn hệ số biến động của công nghệ B. Như vậy, công nghệ A cho

năng suất ổn định hơn.

Tuy nhiên, kết quả khảo sát được thống kê trong bảng 1 khiến chúng tôi rất bất ngờ.

Chiến S1a S1b S1c S1d Không

trả lời lược

Số sinh 72 30 0 5 11

viên

Tỉ lệ 61,02% 25,42% 0% 4,24% 9,32%

Bảng 1. TK câu trả lời cho bài toán 1

Trong bảng 1, S1a là chiến lược giải sử dụng so sánh hai phương sai, cách giải này đưa ra

đáp án sai: “công nghệ B cho năng suất ổn định hơn”. Trong khi đó, chiến lược giải cho đáp

án đúng là S1c và S1b thì có rất ít hoặc không có sinh viên nào sử dụng. Từ kết quả điều tra

ban đầu này, chúng tôi thu hẹp câu hỏi nghiên cứu lại như sau: Môn SX – TK dạy ở Đại học

Kinh tế TP.HCM đã cung cấp đủ kiến thức cho sinh viên để học có thể giải quyết các vấn

đề của thực tiễn hay của chuyên ngành liên quan đến vấn đề so sánh các tham số của hai

hay nhiều tổng thể chưa?

Từ những băn khoăn và nghi vấn trên, chúng tôi quyết định chọn đề tài: Vấn đề so sánh các

mẫu dữ liệu thống kê: Sự nối khớp giữa dạy học XS – TK với đào tạo cử nhân kinh tế.

Trong khuôn khổ một luận văn thạc sỹ, chúng tôi giới hạn phạm vi nghiên cứu trên hai

phương diện. Về phương diện các chuyên ngành kinh tế chúng tôi chọn môn Kinh tế lượng

và môn Phân tích và đầu tư chứng khoán để nghiên cứu. Về phương diện khoa học XS - TK

6

chúng tôi chọn đối tượng tri thức là “so sánh các mẫu dữ liệu TK”. Ở đây, thuật ngữ “ so

sánh các mẫu dữ liệu TK” được chúng tôi dùng theo nghĩa dự đoán về so sánh các tham số

của các tổng thể dựa trên mẫu dữ liệu TK. Những nghiên cứu của chúng tôi chỉ gói gọn

trong phạm vi của thống kê mô tả mà không đi sâu vào thống kê suy diễn.

Trong nghiên cứu của mình, chúng tôi sẽ tìm câu trả lời cho các câu hỏi sau:

Q1: Trong hai giáo trình chuyên ngành kinh tế, so sánh các mẫu dữ liệu thống kê

nhằm giải quyết những vấn đề gì? Phương pháp giải quyết như thế nào? Khái niệm, lý

thuyết toán nào giải thích cho những phương pháp ấy?

Q2: Giáo trình XS – TK chuẩn bị cho sinh viên ra sao để sinh viên có thể giải

quyết tốt những vấn đề liên quan đến so sánh các mẫu dữ liệu TK mà hai giáo trình

chuyên ngành đã đề cập tới?

Q3: Có sự chênh lệch nào giữa những khái niệm, lý thuyết toán cần thiết cho

chuyên ngành và những nội dung được dạy trong XS-TK không? Nếu có thì sự khôngnối

khớp đó ảnh hưởng đến sinh viên như thế nào?

2. Khung lý thuyết tham chiếu

Để tìm câu trả lời cho những câu hỏi trên, chúng tôi sẽ đặt nghiên cứu của mình trong phạm

vi của lý thuyết didactic toán, cụ thể là thuyết nhân học, khái niệm hợp đồng didactic, khái

niệm qui tắc hành động. Sau đây, chúng tôi sẽ chỉ ra sự lựa chọn của mình là hoàn toàn hợp

lý.

2.1. Thuyết nhân học

2.1.1. Quan hệ thể chế đối với một đối tượng tri thức

“Một tri thức không tồn tại “lơ lửng” trong một khoảng rỗng: mỗi tri thức đều xuất hiện ở

một thời điểm nhất định, trong một xã hội nhất định, như là được cắm sâu vào một hoặc nhiều

thể chế.”

Theo Chevallard (1989):

Chevallard đã dùng thuật ngữ quan hệ thể chế I với tri thức O, ký hiệu R(I,O), để chỉ tập

hợp các mối ràng buộc mà thể chế I có với tri thức O. R(I,O) cho biết O xuất hiện ở đâu,

bằng cách nào, tồn tại ra sao, đóng vai trò gì trong I, ….

7

Trong nghiên cứu của chúng tôi, đối tượng O ở đây là tri thức “so sánh các mẫu dữ liệu

thống kê”, còn thể chế I mà chúng tôi quan tâm là thể chế dạy học các môn Kinh tế lượng,

Phân tích và đầu tư chứng khoán và Xác suất –Thống kê. Việc nghiên cứu R(I,O) sẽ giúp

chúng tôi hiểu rõ hơn những mối ràng buộc mà thể chế mang lại cho đối tượng tri thức O.

Như vậy, nghiên cứu R(I,O) sẽ giúp chúng tôi trả lời câu hỏi Q1 và Q2.

2.1.2. Quan hệ cá nhân đối với một đối tượng tri thức

Một đối tượng là một cái gì đó tồn tại ít nhất đối với một cá nhân. Quan hệ cá nhân của một

cá nhân X với một đối tượng tri thức O, ký hiệu R(X, O), là tập hợp những tác động qua lại

mà X có thể có với O. R(X, O) cho biết X nghĩ gì về O, X hiểu như thế nào O, X có thể thao

tác O ra sao.

Như vậy nghiên cứu R(X,O) sẽ giúp chúng tôi trả lời phần nào câu hỏi Q3. Ở đây O vẫn là

đối tượng tri thức “so sánh các mẫu dữ liệu thống kê” còn X là sinh viên.

2.1.3. Praxéologie

Vấn đề đặt ra là làm thế nào để vạch rõ quan hệ thể chế R(I,O) ?

Hoạt động nghiên cứu, dạy và học là một bộ phận của hoạt động xã hội. Do đó, cũng cần

thiết xây dựng một mô hình cho phép mô tả và nghiên cứu thực tế đó. Xuất phát từ quan

điểm này mà Chevallard (1998) đã đưa vào khái niệm praxéologie. Khái niệm chính là “chìa

khóa” giúp chúng ta làm rõ mối quan hệ I thể chế với tri thức O.

Theo Chavallard, mỗi praxéologie là một bộ gồm 4 thành phần [T,τ,θ, Θ ], trong đó : T là

một kiểu nhiệm vụ; τ là kỹ thuật cho phép giải quyết T; θ là công nghệ giải thích cho kỹ

thuật τ; Θ là lí thuyết giải thích cho θ.

Nếu T là một kiểu nhiệm vụ toán học, thì praxéologie được gọi mà một tổ chức toán học và

viết là OM. Trong trường hợp này, khối công nghệ - lí thuyết chỉ bao gồm những tri thức

toán học.

Việc xác định các praxéologie gắn với đối tượng O sẽ cho phép chúng tôi: vạch rõ các quan

hệ thể chế R (I,O), đồng thời tìm ra sự chênh lệch nếu có giữa những praxéologie cần dạy và

được dạy. Từ đó, chúng tôi sẽ tìm được câu trả lời cho Q1, Q2 và một phần Q3.

2.2. Khái niệm qui tắc hành động và hợp đồng dạy học

8

Để làm rõ những qui tắc ứng xử của học sinh đối với đối tượng tri thức “so sánh các mẫu dữ

“Một qui tắc hành động là một mô hình được xây dựng nhằm giải thích và chỉ rõ những kiến

thức mà học sinh đã sử dụng để đưa ra câu trả lời khi thực hiện một nhiệm vụ xác định.”

(Bessot và các tác giả (2009), tr.81)

“Ta nói hợp đồng dạy học là tập hợp những qui tắc phân chia và hạn chế trách nhiệm của mỗi

bên, học sinh và giáo viên, đối với mỗi tri thức toán được giảng dạy.” (Bessot và các tác giả

(2009), tr.81)

liệu thống kê”, chúng tôi sử dụng khái niệm qui tắc hành động và hợp đồng dạy học:

Chính vì khái niệm hợp đồng và khái niệm qui tắc hành động cho phép ta “giải mã” các ứng

xử của sinh viên và tìm ra ý nghĩa thực sự của những hoạt động mà họ tiến hành nên chúng

tôi cho rằng cần thiết phải làm rõ các quy tắc hành động hay quy tắc của hợp đồng (nếu có) liên

quan đến so sánh các mẫu dữ liệu thống kê để trả lời cho những câu hỏi Q3 mà chúng tôi đưa

ra.

3. Phương pháp nghiên cứu

Để tìm câu trả lời thỏa đáng cho những câu hỏi đã đặt ra, chúng tôi xác định phương pháp

nghiên cứu như sau:

- Đối với câu hỏi Q1: Chúng tôi sẽ tham khảo hai giáo trình chuyên ngành được sử dụng

trong các trường đào tạo cử nhân kinh tế nhằm tìm hiểu xem những vấn đề nào làm nảy sinh

nhu cầu so sánh các mẫu dữ liệu thống kê. Đồng thời, chúng tôi cũng chỉ ra các praxéologie

có liên quan đến so sánh các mẫu dữ liệu thống kê, nghiên cứu các kĩ thuật giải quyết cũng

như công nghệ và lý thuyết giải thích cho kĩ thuật đó, trong đó chúng tôi chú ý đến các yếu

tố công nghệ thuộc về toán học. Các praxeologie này sẽ giúp chúng tôi hiểu rõ hơn mối

quan hệ thể chế (thể chế dạy học Phân tích và đầu tư chứng khoán và thể chế dạy học Kinh

tế lượng) với đối tượng tri thức so sánh các mẫu dữ liệu thống kê. Toàn bộ phần nghiên cứu

này sẽ được trình bày trong chương 1 của luận văn.

- Tiếp theo, để trả lời cho câu hỏi Q2, chúng tôi sẽ tiến hành phân tích giáo trình XS – TK

để xem xét những đối tượng toán học liên quan đến các tổ chức toán học tìm được ở Q1

được trình bày như thế nào? Xoay quanh các đối tượng đó, có các praxéologie nào?

9

Từ đó chúng tôi sẽ so sánh những gì nghiên cứu được ở Q1 và Q2 để tìm ra câu trả lời cho

Q3.

10

CHƯƠNG 1: SO SÁNH CÁC MẪU DỮ LIỆU THỐNG KÊ TRONG

HAI GIÁO TRÌNH CHUYÊN NGÀNH

Nội dung chính của chương 1 xoay quanh vấn đề “so sánh các mẫu dữ liệu thống kê” được

trình bày trong hai giáo trình chuyên ngành kinh tế. Những phân tích thể chế dạy học hai

môn chuyên ngành này sẽ giúp chúng tôi trả lời câu hỏi Q1:

Q1: Trong hai giáo trình chuyên ngành kinh tế, so sánh các mẫu dữ liệu thống kê

nhằm giải quyết những vấn đề gì? Phương pháp giải quyết như thế nào? Khái niệm, lý

thuyết toán nào giải thích cho những phương pháp ấy?

1.1. So sánh các mẫu dữ liệu thống kê

“So sánh các mẫu dữ liệu thống kê” là thuật ngữ viết tắt chúng tôi dùng để chỉ việc so sánh

tham số của các tổng thể khác nhau dựa trên những mẫu thu được.

Việc so sánh tham số của các tổng thể giúp người ta đưa ra những đánh giá về những tổng

thể đó và từ đó có thể đưa ra được kế hoạch phù hợp cho công việc của họ.

Chẳng hạn một công ty muốn mở thêm chi nhánh kinh doanh. Công ty này đi khảo sát thị

trường tại hai khu vực A và B về mức thu nhập của người dân. Tại khu vực A họ thu được

mẫu A1, tại khu vực B họ thu được mẫu B1. Từ hai mẫu này họ xem xét, đưa ra đánh giá về

thu nhập bình quân của hai khu vực A và B xem bên nào cao hơn, sau đó kiểm định lại kết

quả. Khi đã có được kết luận với độ tin cậy cao, công ty sẽ đưa ra quyết định phù hợp là mở

chi nhánh tại khu vực A hay B.

Trên thực tế, chúng ta có thể thấy việc sử dụng tham số trung bình của các tổng thể để so

sánh được sử dụng rất phổ biến như: so sánh nhiệt độ trung bình, lượng mưa trung bình giữa

các vùng; so sánh lương trung bình của công nhân giữa các công xưởng; so sánh năng suất

cây trồng giữa các vùng,…Tuy nhiên số trung bình không phải là tham số duy nhất của tổng

thể mà ngoài ra còn có những tham số khác như số trung vị, mốt, phương sai, độ lệch chuẩn,

độ lệch tuyệt đối trung bình,…Các tham số này đều có tác dụng giúp người ta đánh giá tốt

hơn về các tổng thể.

11

1.2. So sánh các mẫu dữ liệu thống kê trong giáo trình chuyên ngành kinh tế

Để trả lời cho câu hỏi Q1, chúng tôi sẽ chọn ra một số giáo trình chuyên ngành hoặc cơ sở

ngành có ứng dụng nhiều công cụ và kiến thức của XS –TK để phân tích. Bởi nếu chọn một

giáo trình hoàn toàn không liên quan gì tới XS – TK để phân tích thì kết quả có được sẽ

không có giá trị. Thông qua tìm hiểu các giáo trình của trường Đại học Kinh tế TP.HCM

cũng như tham khảo ý kiến của một số giảng viên, chúng tôi đã tìm ra một số giáo trình thỏa

mãn yêu cầu. Tuy nhiên do thời gian nghiên cứu có hạn, không cho phép phân tích hết

những giáo trình tìm được nên chúng tôi quyết định chọn ra hai giáo trình sau để phân tích:

- Phân tích và đầu tư chứng khoán

- Giáo trình Kinh tế lượng

“Kinh tế lượng cung cấp các phương pháp phân tích về mặt lượng mối quan hệ giữa các chỉ

tiêu kinh tế cùng với sự tác động qua lại giữa chúng dựa trên cơ sở các số liệu thu thập từ

thực tế nhằm củng cố thêm các giả thiết kinh tế từ đó đưa ra các quyết định đúng đắn hơn”

Chúng tôi xin trích dẫn một số nhận xét về hai bộ môn này:

“Dù rằng thị trường chứng khoán là một đối tượng hết sức phức tạp, diễn biến tăng giảm

của nó rất khó dự báo. Nhưng các nhà kinh tế cùng với các nhà toán học đã cố gắng sử

dụng các công cụ của toán học, đặc biệt là các công cụ của Xác suất – Thống kê để mô hình

hóa thị trường chứng khoán. Việc áp dụng các mô hình đó giúp các nhà đầu tư tối đa hóa

các cơ hội đạt lợi nhuận và tối thiểu hóa các nguy cơ rủi ro” (Đặng Hùng Thắng (2007))

(Hoàng Ngọc Nhậm (2008), tr. 3)

Ý kiến trên cho thấy mối liên hệ mật thiết giữa XS-TK với hai môn chuyên ngành kinh tế.

Do đó, chúng tôi mong đợi sẽ tìm thấy những vấn đề làm nảy sinh nhu cầu so sánh các mẫu

dữ liệu thống kê, trong hai giáo trình được sử dụng trong dạy học hai môn chuyên ngành mà

chúng tôi quan tâm. Đồng thời, chúng tôi sẽ chỉ ra những praxéologie có liên quan nhằm

hiểu rõ hơn mối quan hệ thể chế đối với tri thức so sánh các mẫu dữ liệu thống kê: tri thức

so sánh các mẫu dữ liệu thống kê tồn tại như thế nào, có vai trò gì, chịu những ràng buộc

nào của thể chế? Từ đó, chúng tôi sẽ tìm được những “yếu tố” toán thống kê mà thể chế dạy

học hai môn chuyên ngành đưa ra để giải quyết các vấn đề liên quan đến so sánh các mẫu

dữ liệu thống kê. Đó cũng chính là những “yếu tố” toán cần thiết phải được cung cấp trong

môn học XS – TK.

12

Để trả lời câu hỏi Q1 đã đặt ra, chúng tôi sẽ cố gắng tìm câu trả lời cho các câu hỏi sau:

- So sánh các mẫu dữ liệu thống kê được sử dụng trong những vấn đề nào?

- Có những praxéologie nào liên quan đến so sánh các mẫu dữ liệu TK? Kĩ thuật

giải quyết chúng là gì? Yếu tố công nghệ và lý thuyết nào giải thích cho kĩ thuật

đó?

1.2.1. Phân tích giáo trình Phân tích và đầu tư chứng khoán

Trong phần này chúng tôi sẽ tham khảo tài liệu sau:

[1] Bùi Kim Yến – Thân Thị Thu Thủy (2009), Phân tích và đầu tư chứng khoán, Nxb

Thống kê.

Đây là giáo trình được sử dụng trong trường đại học kinh tế TP.HCM. Để thuận tiện cho

việc trình bày, chúng tôi sẽ ký hiệu giáo trình này là GT1.

Trong giáo trình này, chúng tôi tập trung vào chương II: Mức sinh lời và rủi ro trong đầu

tư chứng khoán. Trong chương này, các vấn đề chính đều xoay quanh việc sử dụng tham số

của đại lượng ngẫu nhiên (ĐLNN) cũng như so sánh các tham số này để tìm câu trả lời cho

những câu hỏi có liên quan đến đầu tư chứng khoán.

Đối với một thị trường đầu tư phức tạp và đầy biến động như thị trường chứng khoán, các

nhà phân tích phải nắm được những kiến thức cơ bản về lợi nhuận và rủi ro. Chương này

cung cấp cho sinh viên các vấn đề xoay quanh mức sinh lời và rủi ro, đưa ra cách tính mức

sinh lời, cách tính và đánh giá độ rủi ro của dự án.

Trong mỗi dự án đầu tư chứng khoán, người ta thường phải dự đoán trước lợi nhuận, tức là

ước lượng xem đầu tư vào dự án đó sẽ mang lại lợi nhuận là bao nhiêu phần trăm trên 1

đồng vốn đầu tư. Khi đó, nhà phân tích sẽ phải tìm ra các mức sinh

1 của mỗi loại chứng khoán - bao gồm lợi nhuận từ cổ tức và chênh lệch giữa giá bán, giá

lời0F

mua chứng khoán, cũng như xác suất của mỗi mức sinh lời để từ đó tính ra mức sinh lời kỳ

1 Mức sinh lời: bao gồm lợi nhuận từ cổ tức và chênh lệch giữa giá bán, giá mua chứng khoán. Còn tỷ lệ lợi tức năm là cách xác định mức sinh lời theo tỷ lệ phần trăm. Nó cho biết lợi nhuận thu được trên mỗi đồng đầu tư.

vọng. Chính mức sinh lời kỳ vọng là lợi nhuận mà người ta dự tính sẽ thu được:

13

“Các dự án đầu tư khác nhau sẽ có mức sinh lời kỳ vọng khác nhau. Chúng khác nhau vì hiệu

quả kinh tế của từng dự án cụ thể, cũng như môi trường đầu tư. Trong tương lai không thể

biết chắc được nền kinh tế sẽ như thế nào, nên các nhà phân tích sẽ tìm ra một xác suất để xảy

ra một tình trạng kinh tế nào đó.

Mức sinh lời kỳ vọng dựa trên xác suất của từng tình trạng kinh doanh.

k

i

= ∑ Pk i

Trong đó: ki: mức sinh lời; pi: xác suất xảy ra” (GT1, tr.58)

“là khả năng mức sinh lời thực tế nhận được trong tương lai có thể khác với dự tính ban đầu.

Độ dao động của lợi suất đầu tư1F

2 càng cao thì rủi ro càng cao” (GT1, tr.49)

Trong khi đó, rủi ro:

“Để đo lường rủi ro trong mức sinh lời của một loại chứng khoán, đó là tính toán mức dao

động trong mức sinh lời bằng cách sử dụng thước đo phương sai (variance) và độ lệch chuẩn

(standard deviation)” (GT1, tr.60)

“Một cách đo lường mức độ rủi ro của các phương án khác nữa, là dùng hệ số biến động.

Hệ số biến động được tính bằng cách lấy độ lệch tiêu chuẩn chia cho lãi suất mong đợi của

phương án đầu tư.

CV =

” (GT1, tr.63)

δ k

Mức độ rủi ro của dự án được đo bằng phương sai, độ lệch chuẩn hoặc hệ số biến động:

+

)

(

D 1

=

([1], tr. 45)

r

− P P 0 1 P 0

Trong đó r là mức sinh lời tính theo %, P0 là giá cổ phiểu đầu năm, P1 là giá cổ phiểu cuối năm, D1 là giá cổ tức trả

trong năm.

2 Lợi suất đầu tư: Là phần trăm (%) chênh lệch giữa thu nhập từ chứng khoán có được sau một khoảng thời gian

(thường là một năm) và khoản vốn đầu tư ban đầu. Lợi suất của chứng khoán bắt nguồn từ hai nguồn thu nhập:

- Lãi định kỳ (cổ tức, trái tức)

- Lãi vốn (chênh lệch giá bán và giá mua)

Các tác giả giải thích việc sử dụng hệ số biến động để đo lường rủi ro như sau:

14

“Hệ số biến động chỉ mức độ rủi ro trên một đơn vị của lợi tức, nó cung cấp sự so sánh

chính xác hơn trong trường hợp lãi suất mong đợi của hai phương án không như nhau.”

(GT1, tr.63)

Phương sai, độ lệch chuẩn và hệ số biến động đều là những tham số mô tả mức độ phân tán

của các giá trị của một đại lượng ngẫu nhiên (tổng thể) quanh kỳ vọng (giá trị trung bình).

Như vậy phương sai, độ lệch chuẩn hay hệ số biến động của các phương án đầu tư chứng

khoán phản ánh mức độ phân tán của những giá trị lợi nhuận quanh lợi nhuận kỳ vọng. Mức

độ phân tán này cho chúng ta biết mức độ chênh lệch có thể có giữa lợi nhuận thực tế với lợi

nhuận mong đợi (lợi nhuận kỳ vọng). Cũng vì vậy mà những tham số này được sử dụng để

đo mức độ rủi ro của các phương án đầu tư chứng khoán.

Để sinh viên hiểu rõ hơn về lợi nhuận và rủi ro, tác giả lấy hai ví dụ minh họa. Đặc biệt, hai

ví dụ này có liên quan đến việc đánh giá rủi ro của các phương án đầu tư chứng khoán. Việc

đánh giá rủi ro thực sự rất cần thiết đối với mỗi nhà đầu tư. Vì vậy, tác giả rất chú trọng tới

vấn đề này trong giáo trình.

Với ví dụ trang 58 của GT1, chúng tôi thấy xuất hiện một vấn đề liên quan đến so sánh các

“Ví dụ: Công ty Bưu Chính Viễn Thông hiện đang sử dụng mạng lưới “điện thoại tiêu

chuẩn”. Công ty đang nghiên cứu một đề án mạng lưới “điện thoại kiểu mới”. Các chuyên

viên tiếp thị của công ty cho rằng việc sử dụng mạng lưới mới sẽ mang lại lợi nhuận cao hơn

trong các thời kỳ cao điểm và trung bình, nhưng trong thời kỳ khó khăn, khách hàng sẽ tiêu

thụ ít hơn và mạng lưới mới dự đoán sẽ không mang lại lợi nhuận. Trước khi quyết định đầu

tư, các nhà nghiên cứu thị trường của công ty cần xác định rủi ro và lợi nhuận của hai phương

án trên.

tham số của hai tổng thể:

Tình trạng kinh tế

Tỷ lệ xảy ra tình trạng kinh tế

Suất lợi nhuận ở mỗi tình trạng kinh tế

Phương án kiểu mới

15

Phát đạt

0,3

100%

Bình thường

0,4

15%

Khó khăn

0,3

-70%

--------

1,0

Tình trạng kinh tế

Suất lợi nhuận ở mỗi tình trạng kinh tế

Tỷ lệ xảy ra tình trạng kinh tế

20%

0,3

Phát đạt

15%

0,4

Bình thường

10%

0,3

Khó khăn

--------

1,0

(GT1, tr.59)

Phương án tiêu chuẩn

Trước khi đưa ra lời giải thì các tác giả nhắc lại công thức tính lợi nhuận kỳ vọng, hay lãi

“Pi là khả năng xảy ra (xác suất) của các tình trạn kinh tế

ki là suất lợi nhuận dự đoán cho từng thời kỳ kinh tế.

Thì k là tỷ lệ lãi suất mong đợi (trung bình).

n

k

Pk i

i

= ∑ ” (GT1, tr.60)

i

= 1

suất mong đợi (lãi suất trung bình):

“Đối với phương án mạng lưới điện thoại mới:

+

+

P k 3 3

P k 2 2

+

+

= k Pk 1 1 = 0,3(100%) 0, 4(15%) 0,3( 70%) = 15%

Đối với phương án mạng lưới điện thoại tiêu chuẩn:

Sau đó, lợi nhuận mong đợi của hai phương án được tính như sau:

16

+

+

=k

20(3.0

15(4.0%)

10(3.0%)

%)

= 15%” (GT1, tr.60)

Chúng ta có thể thấy k của hai phương án tính ra đều bằng nhau nên lợi nhuận mong đợi

của hai phương án là như nhau.

Sau khi tính lợi nhuận kỳ vọng của hai phương án, tác giả nhắc lại cách tính phương sai, độ

“- Tính tỷ suất lãi mong đợi ( k ) […]

- Tính độ lệch giữa lãi suất của từng trường hợp và tỷ suất lãi mong đợi.

- Độ lệch i = ki – k

- Bình phương độ lệch I và nhân với từng xác suất xảy ra từng tình trạng kinh tế. Tính tổng số của chúng. Tổng này là phương sai của dự án (variance) bằng

2δ :

n

2

×

k

Phương sai:

( k

)

i

P i

= ∑

i

=1

- Tìm độ lệch tiêu chuẩn bằng căn bậc hai của

2δ :

n

2

×

δ

Độ lệch tiêu chuẩn:

” (GT1, tr.61)

k

( k

)

i

P i

= ∑

i

=1

lệch chuẩn cho sinh viên:

Với các bước tính độ lệch chuẩn nêu ra ở trên, độ lệch chuẩn của từng dự án được tính dưới

“Mạng lưới điện thoại mới:

ki – k

(ki – k )

(ki – k )2Pi

100 – 15

(85)

(7725)(0,3)=2167,5

15 – 15

0

0.(0,4) = 0

-70 – 15

( - 85)

(7725)(0,3)=2167,5

sai

Phương =4435,0

dạng bảng như sau:

Độ lệch tiêu chuẩn:

**Mạng lưới điện thoại tiêu chuẩn:

ki – k

(ki – k)

(ki – k)2Pi

δ = 65,84%

17

20 – 15

(5)

(25)(0,3) = 7,5

15 – 15

0

0.(0,4) = 0

10 – 15

(25)(0,3)= 7,5

( - 5)

Phương sai

2δ =15,0

δ =

Độ lệch tiêu chuẩn:

” (GT1, tr.62)

3,87%

“Phương án mạng lưới tiêu chuẩn với độ lệch tiêu chuẩn 3,87% nhỏ hơn nhiều so với độ lệch

tiêu chuẩn của phương án đầu tư mới 65,84%. Điều đó dẫn đến khả năng rủi ro của phương án

mạng lưới tiêu chuẩn thấp hơn so với phương án mới, và có thể nói phương án mạng lưới tiêu

chuẩn là rất ít có rủi ro” (GT1, tr.62)

Từ những kết quả tính toán lợi nhuận kỳ vọng và độ lệch chuẩn, tác giả kết luận:

Nhận xét về ví dụ trên:

- Lãi suất mong đợi được tính theo lợi nhuận kỳ vọng. Mức độ rủi ro được tính theo độ

lệch chuẩn.

- Với lãi suất mong đợi bằng nhau, thì để xem phương án nào rủi ro hơn, tác giả so sánh

các độ lệch chuẩn với nhau. Phương án nào có độ lệch chuẩn càng thấp thì độ rủi ro càng

ít và ngược lại. Thực chất bài toán này chính là bài toán so sánh mức độ phân tán của hai

ĐLNN. Khi hai ĐLNN có kỳ vọng bằng nhau thì ĐLNN nào có phương sai (độ lệch

chuẩn) lớn hơn sẽ có độ phân tán các giá trị quanh kỳ vọng lớn hơn.

Trong ví dụ trên, hai phương án đầu tư có lợi nhuận kỳ vọng bằng nhau, tác giả so sánh hai

độ lệch chuẩn để kết luận về độ rủi ro của hai phương án. Vậy đối với hai phương án mà lợi

nhuận kỳ vọng khác nhau thì sao? Trong trường hợp này thì việc so sánh hai độ lệch chuẩn

“Sau đây chúng ta xét đến 2 dự án đầu tư khác A và B, cả 2 có lãi suất mong đợi khác nhau và

độ lệch tiêu chuẩn cũng khác nhau.

không còn phù hợp nữa, người ta phải sử dụng đến hệ số biến động CV:

Phương án A

Phương án B

Tỷ suất lãi mong đợi

45%

20%

Độ lệch tiêu chuẩn

15%

10%

và ta chọn phương án B là hoàn toàn không

Nếu nhìn vào độ lệch tiêu chuẩn

δ δ< A

B chính xác vì tỷ suất lãi mong đợi của phương án A lớn hơn phương án B.

Hợp lý hơn ta tính hệ số biến động (CV)

18

=

0,33

15% 45%

=

0,50

10% 20%

CVA=

Tính trên 1% lãi suất mong đợi, hệ số biến động của phương án B lớn hơn. Điều đó có nghĩa

mặc dù phương án A có độ lệch chuẩn rộng hơn nhưng thực sự phương án B lại mang nhiều

tính rủi ro hơn” (GT1, tr.64)

CVB=

Đối với các dự án có mức sinh lời khác nhau thì người ta phải sử dụng tới hệ số biến động

để đo mức độ rủi ro trên 1 % lãi suất mong đợi. Ví dụ trên thực chất là một bài tập so sánh

độ phân tán của hai đại lượng ngẫu nhiên (hay hai tổng thể) khi giá trị kỳ vọng (trung bình)

khác nhau. Trong trường hợp này, so sánh trực tiếp bằng phương sai hay độ lệch chuẩn sẽ

không mang lại cho chúng ta kết quả chính xác nữa. Chúng ta có thể thấy tác giả đã nhấn

và ta chọn phương án B là hoàn toàn không chính

δ δ< A

“Nếu nhìn vào độ lệch tiêu chuẩn B xác vì tỷ suất lãi mong đợi của phương án A lớn hơn phương án B” (GT1, tr.64)

mạnh:

Như vậy, đối với trường hợp này, để xem xét mức độ chênh lệch các giá trị của mỗi ĐLNN

quanh kỳ vọng ta phải sử dụng tới hệ số biến động CV. Nếu so sánh bằng hai phương sai sẽ

dẫn tới kết quả không chính xác.

Thông qua hai ví dụ trên, tác giả tổng kết lại phương pháp giúp sinh viên so sánh rủi ro của

“Tóm tắt:

Để đo lường mức độ rủi ro của các phương án đầu tư:

- So sánh hai phương án có cùng tỷ suất lãi mong đợi, phương án nào có độ lệch tiêu chuẩn (δ)

lớn hơn, phương án đó mang tính rủi ro cao hơn.

các phương án đầu tư như sau:

nào có hệ số biến động cao hơn, phương án đó nhiều rủi ro hơn.” (GT1, tr.64)

- So sánh hai phương án có tỷ suất lãi mong đợi khác nhau, tính hai hệ số biến động. Phương án

Qua hai ví dụ và phần tóm tắt của giáo trình, một tổ chức toán học liên quan đến so sánh các

mẫu dữ liệu thống kê đã xuất hiện:

19

2F

3: so sánh độ phân tán của hai đại lượng ngẫu nhiên (hay

T

&

SSDLC

CV

Kiểu nhiệm vụ

τ

T

SSDLC&

CV

&

SSDLC

CV

hai tổng thể).

n

k

Kĩ thuật để giải quyết

Pk i

i

= ∑ trong đó:

i

= 1

• B1: Tính mức sinh lời kỳ vọng của mỗi dự án:

n

2

δ

×

k

Pi là khả năng xảy ra (xác suất) của các tình trạng kinh tế ki là suất lợi nhuận dự đoán cho từng thời kỳ kinh tế.

( k

)

i

P i

= ∑

=1

i

• B2: Tính độ lệch chuẩn của mỗi dự án

• B3: Xét các trường hợp:

* Nếu mức sinh lời kỳ vọng của các dự án bằng nhau, so sánh độ lệch chuẩn các dự

án, độ lệch chuẩn của dự án càng cao thì rủi ro càng cao.

δ - Tính hệ số biến động của mỗi dự án: CV= k

* Nếu mức sinh lời kỳ vọng của các dự án khác nhau:

- So sánh các hệ số biến động của các dự án, hệ số biến động càng cao thì rủi ro

θ

SSDLC&

CV

càng cao.

Vậy công nghệ :

- Công thức tính kỳ vọng và độ lệch chuẩn của ĐLNN X (với X là lợi suất hay lãi

suất).

Θ

SSDLC&

CV

- Ý nghĩa của độ lệch chuẩn. - Ý nghĩa của hệ số biến động.

Lý thuyết

- Định nghĩa độ lệch chuẩn. - Định nghĩa hệ số biến động.

hoặc so sánh hệ số biến động CV (khi lợi nhuận kỳ vọng của các dự án khác nhau). Do đó chúng tôi kí hiệu cho kiểu

nhiệm vụ này là TSSDLC&CV

3 Để giải quyết kiểu nhiệm vụ này người ta so sánh hai độ lệch chuẩn (khi lợi nhuận kỳ vọng của các dự án bằng nhau)

20

1.2.2. Phân tích giáo trình Kinh tế lượng

Trong phần phân tích này chúng tôi sử dụng tài liệu sau: Hoàng Ngọc Nhậm (chủ biên)

(2008), Giáo trình kinh tế lượng, Nxb Lao động - Xã hội. Trong phần tiếp theo chúng tôi sẽ

dung ký hiệu GT2 để chỉ tài liệu này.

Kinh tế lượng là một bộ môn cung cấp cho sinh viên phương pháp phân tích về mặt lượng

mối quan hệ giữa các chỉ tiêu kinh tế dựa trên những số liệu thu thập được. Ngoài việc giới

thiệu các mô hình hồi qui cơ bản như hồi qui với hai biến, hồi qui bội, GT2 còn đưa vào một

số môt hình hồi qui khác bao gồm hồi qui với biến giả, đa cộng tuyến,… Trong những mô

hình hồi qui đó, chúng tôi rất chú ý đến mô hình hồi qui với biến giả bởi vì mô hình này cho

phép người ta xem xét mối liên hệ giữa các biến định tính với các biến định lượng. Các biến

định tính thường nhận các giá trị (phạm trù) là có tính chất nào đó hay không có, hoặc các

mức độ khác nhau của một tiêu thức nào đó, chẳng hạn như biến định tính giới tính có 2

phạm trù là nam và nữ,…Trong khi đó, các mô hình hồi qui 2 biến cơ bản hay các mô hình

hồi qui bội chỉ nghiên cứu trên các biến định lượng. Chính vì vậy, người ta phải dùng tới mô

hình hồi qui với biến giả. Mô hình này được xây dựng bằng cách “lượng” hóa các biến định

tính. Chẳng hạn, nếu biến định tính là giới tính nhận hai giá trị (phạm trù) là nam và nữ thì

người ta sẽ thay biến này bằng một biến rời rạc nhận hai giá trị là 0 và 1 với 0 là giới tính

nam, 1 là giới tính nữ. Khi đó, biến định tính đã được thay thế bằng biến định lượng, từ đó

có thể xây dựng được các mô hình giúp chúng ta xem xét mối liên hệ giữa biến định tính với

các biến định lượng. Điều đặc biệt nữa là, mô hình hồi qui với biến giả có thể được ứng

dụng để giải quyết các bài toán liên quan đến so sánh các tham số của hai tổng thể.

“Giả sử một công ty sử dụng 2 công nghệ sản xuất (kí hiệu là công nghệ A và công nghệ B).

Năng suất của mỗi công nghệ là đại lượng ngẫu nhiên phân phối theo qui luật chuẩn có

phương sai bằng nhau nhưng kì vọng toán học khác nhau. Để nghiên cứu về năng suất của

công ty này chúng ta có thể sử dụng mô hình hồi qui:

=

(5.1)

Y i

+ β β 2

1

+ D U i

i

Trong đó : Y là năng suất; D là biến giả, D nhận một trong hai giá trị:0 hoặc 1:

Chúng ta hãy quan sát ví dụ trang 109:

Di = 1 nếu năng suất là của công nghệ A

21

Mô hình (5.1) giống như mô hình hồi qui 2 biến mà chúng ta đã nghiên cứu ở phần trước, chỉ

khác là biến số lượng X được thay bằng biến giả D”

(GT2, tr.109)

Di = 0 nếu năng suất là của công nghệ B

“Dùng mô hình này chúng ta có thể biết được năng suất trung bình của công nghệ A có khác

với năng suất trung bình của công nghệ B hay không” (GT2, tr.110).

GT2 nhấn mạnh rằng:

Điều này được giải thích như sau:

Nếu sử dụng công nghệ sản xuất B thì E(Yi/Di = 0)=

2β β+

1

Nếu sử dụng công nghệ sản xuất A thì E(Yi/Di =1)=

2β trong mô hình:

“ 2β phản ánh mức chênh lệch về năng suất trung bình giữa công nghệ B và công nghệ A”

(GT2, tr.110)

Do đó, ý nghĩa của hệ số

Cách tính các hệ số của mô hình này cũng giống như đối với mô hình hồi qui hai biến mà

“Mô hình (5.1) giống như mô hình hồi qui hai biến mà chúng ta đã nghiên cứu ở phần trước,

chỉ khác là biến số lượng X được thay bằng biến giả D” (GT2, tr.110)

tác giả đã trình bày ở phần trước:

2β mà mô hình hồi qui với biến giả có thể sử dụng để so sánh năng

Nhờ ý nghĩa của hệ số

suất trung bình của hai công nghệ A và B.

Tương tự như vậy, mô hình hồi qui với biến giả cũng được sử dụng để xem xét sự khác

“Trong trường hợp này ta sử dụng 2 biến giả D1 và D2 và mô hình hồi qui sẽ là:

+

(5.2)

Yi =

+ β β 2

1

D 1 i

β 3

+ D U i

2

i

Trong đó:

1iD = 1 nếu năng suất của công nghệ A

1iD = 0 nếu năng suất của công nghệ khác

2iD = 1 nếu năng suất của công nghệ B

nhau giữa năng suất trung bình của 3 công nghệ A, B, C

22

2iD = 0 nếu năng suất của công nghệ khác

Khi

1iD =1 và

2iD = 0 thì (5.2) biểu thị năng suất của công nghệ A

Khi

Khi

1iD = 0 và 1iD = 0 và

2iD = 1 thì (5.2) biểu thị năng suất của công nghệ B 2iD = 0 thì (5.2) biểu thị năng suất của công nghệ C”

(GT2, tr.110)

GT2 cũng giải thích tại sao mô hình trên có thể xem xét sự khác biệt hay chênh lệch giữa

năng suất trung bình của 3 công nghệ:

Nếu sử dụng công nghệ sản xuất A thì năng suất trung bình

1iD =1,

2iD = 0)=

2β β+

1

E(Yi/

Nếu sử dụng công nghệ sản xuất B thì năng suất trung bình

2iD = 1)=

1iD = 0,

3β β+

1

E(Yi/

Nếu sử dụng công nghệ sản xuất C thì năng suất trung bình

1iD = 0,

2iD = 0)=

E(Yi/

“ 2β biểu thị phần chênh lệch của năng suất trung bình giữa công nghệ C và công nghệ A

3β biểu thị phần chênh lệch của năng suất trung bình giữa công nghệ C và công nghệ B”

(GT2, tr.110-111)

Hơn nữa, tác giả nhấn mạnh ý nghĩa của các hệ số trong mô hình hồi qui như sau:

Như vậy, mô hình hồi qui với một biến định tính như trên thể hiện mối liên hệ giữa biến phụ

thuộc Y (là một biến định lượng) và một biến định tính (có nhiều phạm trù). Dựa vào các hệ

số của mô hình hồi quy ta có thể so sánh được các giá trị trung bình của biến định lượng

ứng với từng giá trị của biến định tính.

Ngoài ra, các mô hình hồi qui với 1 biến định lượng và 1 biến định tính, hồi qui với 1 biến

định lượng và hai biến định tính cũng được giáo trình đưa vào, áp dụng trong trường hợp

biến phụ thuộc Y chịu ảnh hưởng bởi cả biến định lượng và biến định tính. Khi đó, mô hình

hồi qui cũng cho biết giá trị trung bình của Y ứng với mỗi phạm trù của biến định tính khác

nhau như thế nào.

23

Ta xét ví dụ trang 115 của GT2: Xem xét thu nhập hàng năm của giáo viên theo thâm niên

và nơi giảng dạy. Biến thâm niên là biến định lượng còn biến nơi giảng dạy là biến định tính

với 3 phạm trù: thành phố, đồng bằng, miền núi.

=

+

+

Mô hình hồi qui được sử dụng:

X

Y i

+ β β 2

1

i

β 3

D 1 i

β 4

+ D U i

2

i

(5.14)

Trong đó:

Y là thu nhập của giáo viên phổ thông trung học (triệu đồng/năm), X là thâm niên giảng dạy

1iD = 1 nếu giáo viên ở thành phố

1iD = 0 nếu giáo viên ở nơi khác

2iD = 1 nếu giáo viên ở đồng bằng

2iD = 0 nếu giáo viên ở nơi khác

của giáo viên (năm)

(người ta đã chọn giáo viên giảng ở miền núi làm phạm trù cơ sở)

=

=

=

(

,

0,

0)

X

D 2

+ β β 2

1

/ E Y X D 1 i

i

i

i

i

Khi đó, thu nhập của giáo viên ở miền núi:

=

=

=

+

(

,

0,

1)

X

/ E Y X D 1 i

i

i

D 2

i

+ β β 2

1

i

β 4

Thu nhập của giáo viên ở đồng bằng:

=

=

=

+

(

,

1,

0)

X

D 2

+ β β 2

1

β 3

E Y X D / 1 i

i

i

i

i

Thu nhập của giáo viên ở thành phố:

Như vậy cũng tương tự như các mô hình hồi qui đã nêu ở trên, mô hình hồi qui trong ví dụ

này cho phép người ta biết được sự chênh lệch giữa thu nhập của giáo viên phổ thông trung

học ở thành phố và đồng bằng so với giáo viên ở miền núi, và hiển nhiên ta có thể so sánh

“Sau khi ước lượng hàm hồi qui (5.14), chúng ta sẽ biết được mức chênh lệch về thu nhập

của giáo viên phổ thông trung học ở thành phố và đồng bằng so với giáo viên công tác ở miền

núi”. (GT2, tr.116)

thu nhập của giáo viên ở cả ba vùng với nhau:

24

Đối với trường hợp biến phụ thuộc Y chịu ảnh hưởng của nhiều biến định tính thì khi đó số

k

)

(

1

in

“n= ∑

i

= 1

Trong đó: n là số biến giả được đưa vào mô hình; k là số biến định tính; ni là số mức độ (số

phạm trù) của biến định tính thứ i” (GT2, tr.116)

biến giả được đưa vào mô hình được tính bằng công thức tổng quát sau:

Để minh họa cho mô hình hồi qui với nhiều biến định tính, tác giả đưa vào ví dụ xét thu

nhập của giáo viên phổ thông dựa vào thâm niên giảng dạy; khu vực giảng dạy (đồng bằng,

thành phố, miền núi) và môn giảng dạy (tự nhiên, xã hội, anh văn).

“Mô hình có dạng:

=

+

+

+

+

X

Y i

+ β β 2

1

i

β 3

D 1 i

β 4

D 2

i

β 5

D 3

i

β 6

+ D U i

4

i

Trong đó:

Y là thu nhập của giáo viên phổ thông trung học (triệu đồng/năm)

X là thâm niên giảng dạy.

D1i = 1 nếu giáo viên giảng dạy ở thành phố

D1i = 0 nếu giáo viên giảng dạy ở nơi khác

D2i = 1 nếu giáo viên giảng dạy ở đồng bằng

D2i = 0 nếu giáo viên giảng dạy ở nơi khác

D3i = 1 nếu giáo viên giảng dạy các môn tự nhiên

D3i = 0 nếu giáo viên giảng dạy các môn thuộc nhóm khác

D4i = 1 nếu giáo viên giảng dạy các môn xã hội

D4i = 0 nếu giáo viên giảng dạy các môn thuộc nhóm khác.” (GT2, tr.117)

Dựa vào công thức trên, ta có số lượng biến giả đưa vào là n = (3-1) + (3-1) = 4

Trong mô hình trên, GT2 đã chọn phạm trù khu vực miền núi và phạm trù môn giảng dạy là

anh văn làm những phạm trù cơ sở.

Mô hình trên cho phép ước lượng thu nhập của giáo viên khi biết thâm niên, khu vực và

môn giảng dạy. Chính vì vậy, dựa vào mô hình hồi qui trên chúng ta có thể so sánh được

mức lương bình quân của một giáo viên có thâm niên Xi ở đồng bằng và thành phố so với

miền núi, dạy môn tự nhiên và xã hội so với môn tiếng Anh.

Qua một vài ví dụ về các mô hình hồi qui với biến giả mà giáo trình giới thiệu cho sinh

viên, chúng ta có thể thấy mô hình hồi quy với biến giả có thể giúp xem xét sự khác nhau

25

giữa năng suất trung bình của các công nghệ sản xuất, xem xét sự khác nhau giữa thu nhập

của giáo viên giữa nhiều khu vực, hay giữa nhiều nhóm chuyên ngành với nhau. Nói một

cách khác, mô hình hồi qui với biến giả cho phép chúng ta so sánh tham số trung bình của

các tổng thể từ những mẫu thu được. Từ đó, chúng tôi đã chỉ ra được một praxéologie -

trong đó các nhiệm vụ đều liên quan đến so sánh tham số trung bình của các tổng thể như

1 SSTBT

sau:

1 SSTBτ

1. Kiểu nhiệm vụ : So sánh trung bình của hai tổng thể A, B

=

Kĩ thuật :

Y i

1

+ D U i

i

E(Y/D) : (Di = 1 ứng với giá trị quan sát thuộc tổng thể A, Di - Tìm hàm hồi qui + β β 2

2β :

= 0 ứng với giá trị quan sát thuộc tổng thể B)

2β khác 0 thì

2β thể hiện sự chênh lệch giữa giá trị trung bình của tổng thể

- Xét hệ số + Nếu

A so với tổng thể B.

2β = 0 thì không có sự chênh lệch giữa giá trị trung bình của hai tổng thể

+ Nếu

1 SSTBθ

A, B.

=

Công nghệ :

+ β β 2

Y i

1

i

2β phản ánh mức chênh lệch về giá trị trung bình của tổng thể A so với tổng thể

E(Y/D) : - Cách lượng hóa biến định tính bằng cách sử dụng biến giả Di. - Mô hình hồi qui với 1 biến định tính có 2 phạm trù : + D U trong đó Di là biến giả i

-

1 SSTBΘ

B

“Hàm hồi qui tổng thể cho biết giá trị trung bình của biến phụ thuộc (Y) sẽ thay đổi như thế

nào khi biến độc lập (X) nhận các giá trị khác nhau” (GT2, tr.18)

Lý thuyết :

26

=

Y i

+ β β 2

1

+ D U i

i

Cụ thể hơn, dựa vào mô hình (trong đó Di là biến giả xác định như trên)

ta tính được giá trị trung bình của hai tổng thể như sau :

Giá trị trung bình của tổng thể A

1 ββ + 2

E(Y/D = 1) =

E(Y/D = 1) =

Giá trị trung bình của tổng thể B

2β phản ánh mức chênh lệch về giá trị trung bình của tổng thể A so với tổng thể B.

Như vậy

1 SSTBT

“Bài 5.1: Để nghiên cứu nhu cầu của một loại hàng, người ta tiến hành khảo sát giá cả và

lượng hàng bán được ở 20 khu vực bán hàng và thu được các số liệu cho ở bảng sau:

Xi

Di

Xi

Di

Yi

Yi

20 19 18 18 17 17 16 16 15 15

1 0 1 0 1 1 0 1 1 1

14 14 13 12 12 15 16 12 10 11

5 6 6 7 7 5 4 7 8 8

0 1 0 1 0 1 0 1 0 1

2 3 3 4 4 3 4 4 5 5

Trong đó: Y là lượng hàng bán được (tấn/tháng)

X là giá bán (ngàn đ/kg)

Di = 0 nếu khu vực bán hàng ở nông thôn

Di = 1 nếu khu vực bán hàng ở thành phố

a) Tìm các hàm hồi qui :

=

(1)

i

X

i

ββ + 1

0

=

i

X

^ Y ^ Y

+ αα 1

0

i

D i

b) Cho biết ý nghĩa của các hệ số hồi qui

α + (2) 2 1;αα ” (GT2, tr.127-128)

2

Ví dụ minh họa cho kiểu nhiệm vụ :

Lời giải bài toán trên, chúng tôi tham khảo trong cuốn Bài tập Kinh tế lượng với sự trợ giúp

“a) Hàm hồi qui tuyến tính mẫu của Y theo X:

của Eviews do tác giả Nguyễn Thị Ngọc Thanh chủ biên.

27

2

2

=

=

=

i

X

R

R

^ Y

;

,0

9484 ;

,0

9455

i

=

t

F

81,330

,22 ( = 88,50 =

p

67241 ) 000,0(

)

,1 534483 ( ) − 19,18 )000,0(

,0(

0000 )

Hàm hồi qui tuyến tính mẫu của Y theo X và D :

2

2

+

=

=

=

i

^ Y

X

R

,0

0973324

,0

9487 ;

,0

9427

;

i

=

532805 ,1 −

R =

t

D i F

81,330

=

p

,22 60562 ) ( 05,45 ,0( 000 )

)68,17 000

( ,0(

)

);32,0( )751,0(

,0(

0000 )

b)

cho biết khi giá bán tăng (hay giảm) 1 ngàn đ/kg thì lượng hàng bán

,1

532805

1 −=α

cho biết: Với giá bán như nhau, lượng hàng bán được trung bình ở thành

097332

,0

được trung bình của mặt hàng này sẽ giảm (hoặc tăng) 1,533 tấn/tháng. 2 =α

phố cao hơn ở nông thôn 0,09733 tấn/tháng.” (Nguyễn Thị Ngọc Thanh (2009), tr.88-89)

2 SSTBT

2 SSTBτ

2. Kiểu nhiệm vụ : So sánh trung bình của ba tổng thể A, B, C

+

: (được tìm thấy thông qua thí dụ tr. 110) Kĩ thuật

+ β β 2

1

D 1 i

β 3

+ D U i

2

i

. - Tìm hàm hồi qui E(Y/D) : Yi =

1iD = 0 nếu giá trị quan sát

1iD = 1 nếu giá trị quan sát thuộc tổng thể A ;

(Trong đó

2iD = 1 nếu giá trị quan sát thuộc tổng thể B ;

2iD = 0 nếu giá

thuộc tổng thể khác ;

2β :

trị quan sát thuộc tổng thể khác)

2β khác 0 thì

2β thể hiện sự chênh lệch giữa giá trị trung bình của tổng thể A

- Xét hệ số + Nếu

so với tổng thể C

2β = 0 thì không có sự chênh lệch giữa giá trị trung bình của hai tổng thể A và

+ Nếu

3β :

C.

3β khác 0 thì

3β thể hiện sự chênh lệch giữa giá trị trung bình của tổng thể B

- Xét hệ số + Nếu

so với tổng thể C

3β = 0 thì không có sự chênh lệch giữa giá trị trung bình của hai tổng thể B và

+ Nếu

C.

28

2 SSTBθ

Công nghệ :

+ β β 2

β 3

1

2

+ D U i

i

và các giá trị p tương ứng với các hệ số. (Trong - Cách lượng hóa biến định tính bằng cách sử dụng biến giả D1i và D2i. - Hàm hồi qui với biến định tính có 3 phạm trù: + D E(Y/D) : Yi = 1 i

1iD ;

2iD là hai biến giả)

2β biểu thị phần chênh lệch giữa giá trị trung bình của tổng thể C và tổng thể A

3β biểu thị phần chênh lệch giữa giá trị trung bình của tổng thể C và tổng thể B

đó

2 SSTBΘ

“Hàm hồi qui tổng thể cho biết giá trị trung bình của biến phụ thuộc (Y) sẽ thay đổi như thế

nào khi biến độc lập (X) nhận các giá trị khác nhau” (GT2, tr.18)

Lý thuyết :

1.3. Tổng kết chương 1

Trong chương 1, chúng tôi đã tìm hiểu, phân tích và làm rõ một số praxéologie có liên quan

đến so sánh tham số của các tổng thể trong GT1 và GT2. Đặc biệt, chúng tôi đã chỉ ra được

những yếu tố toán thống kê trong công nghệ của các praxéologie này. Sau đây là một số kết

quả chính của chương 1:

• Đối với GT1

So sánh tham số của hai tổng thể xuất hiện trong bài toán so sánh rủi ro của hai phương án

đầu tư chứng khoán. Thực chất, đây chính là bài toán so sánh độ phân tán của hai tổng thể.

GT1 đưa ra kĩ thuật so sánh như sau:

- So sánh phương sai hoặc độ lệch chuẩn của hai tổng thể khi hai tổng thể đó có kỳ

vọng (hay trung bình) bằng nhau.

- So sánh hệ số biến động của hai tổng thể khi hai tổng thể đó có kỳ vọng (hay giá trị

trung bình) khác nhau.

Như vậy, để chuẩn bị cho sinh viên học tốt môn Phân tích và đầu tư chứng khoán, môn XS

– TK cần thiết phải cung cấp cho sinh viên các khái niệm, đó là kỳ vọng, phương sai, độ

lệch chuẩn và hệ số biến động. Đặc biệt là các kĩ thuật giúp so sánh độ phân tán của hai tổng

thể.

• Đối với GT2

29

So sánh giá trị trung bình của các tổng thể được giải quyết bằng cách sử dụng mô hình hồi

quy với biến giả. Dựa vào hệ số của các mô hình này, chúng ta có thể đưa ra kết luận về giá

trị trung bình của các tổng thể hơn kém nhau như thế nào.

Như vậy, mô hình hồi qui với biến giả là một khái niệm cần thiết phải đưa vào chương trình

XS –TK để giúp sinh viên có thể học tốt hơn môn Kinh tế lượng.

Vậy, việc tiếp theo chúng tôi cần làm đó là:

- Tìm hiểu xem những khái niệm: kỳ vọng, trung bình, phương sai, độ lệch chuẩn, hệ

số biến động và mô hình hồi quy với biến giả được trình bày trong giáo trình Xác

suất – Thống kê như thế nào? Trong đó có những tổ chức toán học nào liên quan đến

so sánh các mẫu dữ liệu thống kê? Có sự chênh lệch nào giữa những khái niệm, lý

thuyết toán cần thiếtcho chuyên ngành và những nội dung được dạy trong XS-TK

không?

Đây cũng chính là nội dung của câu hỏi Q2 và Q3 mà chúng tôi sẽ tìm câu trả lời thông qua

việc phân tích giáo trình Xác suất – Thống kê của trường Đại học Kinh tế TP.HCM. Những

vấn đề này sẽ được chúng tôi trình bày chi tiết trong chương 2 của luận văn.

30

CHƯƠNG 2: SO SÁNH CÁC MẪU DỮ LIỆU THỐNG KÊ TRONG

GIÁO TRÌNH XS – TK

Nội dung chính của chương 2 xoay quanh các câu hỏi sau:

Q2: Giáo trình XS – TK chuẩn bị cho sinh viên ra sao để sinh viên có thể

giải quyết tốt những vấn đề liên quan đến so sánh các mẫu dữ liệu TK mà hai

giáo trình chuyên ngành đã đề cập tới?

Q3: Có sự chênh lệch nào giữa những khái niệm, lý thuyết toán cần

thiếtcho chuyên ngành và những nội dung được dạy trong XS-TK không? Nếu

có thìsự khôngnối khớp đó ảnh hưởng đến sinh viên như thế nào?

Trên cơ sở phân tích ở chương 1, chúng tôi sẽ tìm hiểu xem vấn đề “so sánh các mẫu dữ

liệu thống kê” được trình bày trong giáo trình XS-TK như thế nào, đặc biệt là chỉ ra các tổ

chức toán học có liên quan đến vấn đề này. Với phân tích ở chương trước, chúng tôi thấy ở

đây cần phải làm rõ sự tồn tại của những tổ chức toán học liên quan đến kỳ vọng, phương

sai, độ lệch chuẩn, hệ số biến động, trung bình và hàm hồi qui với biến giả.

Giáo trình mà chúng tôi phân tích là cuốn giáo trình được sử dụng trong trường Đại học

Kinh tế TP.HCM, do tác giả Trần Gia Tùng viết, có tên là: Giáo trình lý thuyết xác suất &

thống kê toán học, Nxb Đại học Quốc gia TP. Hồ Chí Minh.

Đây là tài liệu được các giảng viên và sinh viên của trường Đại học Kinh tế TP.HCM tham

khảo và sử dụng. Trong luận văn này, chúng tôi sẽ ký hiệu đó là GT3.

Trước khi đi vào chi tiết, chúng tôi xem xét đề cương môn học XS-TK, nhằm làm rõ những

nội dung được đưa vào cũng như những vấn đề được ưu tiên giảng dạy.

Đề cương chi tiết của môn học (do sinh viên cung cấp) :

Ghi Chuẩn bị của Tài liệu đọc Ngày Nội dung giảng dạy

chú sinh viên (chương, (số tiết) (tên chương, phần, phương

phần) (bài tập, …) pháp giảng dạy)

31

Giáo trình lý Ngày Chương 1: Các khái niệm, các

thuyết và xác công thức cơ bản (4 tiết)

suất thống kê. 1-Phép thử, biến cố, không gian

Chương 1: §1, mẫu

§2 2- Định nghĩa xác suất

Chương 1: §3 Giải các bài Ngày Chương I: Các khái niệm, các

tập chương 1 công thức cơ bản (4 tiết)

3-Các công thức tính xác suất

Chương 2 Giải các bài Ngày Chương 2: Đại lượng ngẫu

tập chương 1 nhiên và qui luật phân phối xác (4 tiết)

suất

Giải các bài Ngày Chương 3: Các qui luật phân Chương 3

tập chương 2 phối xác suất thông dụng (4 tiết) Phần §1, §2,

§3 1- Phân phối nhị thức

2- Phân phối Poisson

3- Phân phối siêu bội

Giải các bài Chương 3 Ngày Chương 3: Các qui luật phân

tập chương 3 phối xác suất thong dụng Phần §4, §5 (4 tiết)

4- Phân phối chuẩn 5- Phân phối χ2 6- Phân phối Student

Sửa bài tập chương 1

Chương 2 Giải các bài Ngày Chương 4: Đại lượng ngẫu

tập chương 3 nhiên hai chiều – Hàm của các (4 tiết)

đại lượng ngẫu nhiên.

32

Chương 6 Giải các bài Ngày Chương 6: Lý thuyết mẫu

tập chương 6 (4 tiết) - Sửa các bài tập chương 2 và

chương 3

Chương 7 Giải các bài Ngày Chương 7: Ước lượng các số

tập chương 7 đặc trưng của tổng thể (4 tiết)

- Sửa các bài tập chương 4

Giải các bài Ngày Chương 8: Kiểm định giả thiết Chương 8

tập chương 8 thống kê (4 tiết) Phần §1, §2,

§3 1- Bài toán kiểm định giả thiết thống kê

2- Kiểm định giả thiết về trung bình tổng thể

3- Kiểm định giả thiết về tỷ lệ tổng thể

Giải các bài Chương 8 Ngày Chương 8: Kiểm định giả thiết

tập chương 8 thống kê Phần §4, §5, (4 tiết)

§6, §7, §8, §9 9- Kiểm định giả thiết về qui

luật phân phối xác suất của §10

ĐLNN

10- Kiểm định giả thiết về tính độc lập

Ngày - Sửa các bài tập chương 6, 7, 8

(5 tiết) - Giải đáp thắc mắc

- Hệ thống môn học

Tổng

cộng :

33

45 tiết

Dựa vào đề cương này chúng tôi nhận thấy toàn bộ phần tương quan và hồi qui không được

dạy trong chương trình XS – TK. Điều này tác động đến sinh viên như thế nào, chúng tôi sẽ

phân tích kĩ ở mục dưới đây.

2.1. Phân tích GT3

2.1.1. Kỳ vọng, phương sai, độ lệch chuẩn của ĐLNN

Kỳ vọng

Tùy theo việc ĐLNN là rời rạc hay liên tục, tập giá trị của nó là hữu hạn hay vô hạn đếm

được mà công thức tính kỳ vọng khác nhau. Cụ thể:

X

x1

x2

xn

P

p1

p2

pn

Kỳ vọng của X, ký hiệu là E(X), được xác định như sau:

n

i px

i

E(X) = ∑

i

= 1

+∞

hội tụ tuyệt đối)

i px

i

• Trong trường hợp X(S) vô hạn đếm được (và tổng ∑ =1i

i px

i

+∞ E(X) = ∑ =1i

+∞

hội tụ

xf

)( dxx

• Đại lượng ngấu nhiên liên tục X có hàm mật độ xác suất là f(x) (và ∫

∞−

tuyệt đối)

Kỳ vọng toán của X ký hiệu là E(X), xác định như sau:

+∞

xf

)( dxx

∞−

“• Đại lượng ngẫu nhiên rời rạc X có bảng phân phối xác suất

E(X) = ∫ ” (GT3, tr.46)

Để minh họa cho các định nghĩa trên, GT3 đưa vào hai ví dụ minh họa. Thông qua hai ví dụ

đó, tác giả muốn khẳng định ý nghĩa của kỳ vọng:

34

“Nói chung kỳ vọng cho ta ý niệm về độ lớn trung bình của đại lượng ngẫu nhiên X. Có khi

kỳ vọng còn được gọi là giá trị trung bình của X” (GT3, tr.47)

Đặc biệt, trong ví dụ 3.4, tác giả đưa ra bài toán so sánh kỳ vọng của hai đại lượng ngẫu

“Một công ty cần trang bị một số lượng lớn máy cho khu vực sản suất mới. Có hai loại máy

được xem xét là máy do công ty AP sản xuất và máy do công ty TB sản xuất với số liệu thống

kê như sau:

Mức độ hỏng

2

3

1

Tỷ lệ hỏng (%)

4

2

4

Máy

của

Chi phi sửa chữa

công ty

10,5

15,5

7

(triệu đồng/năm)

AP

Tỷ lệ hỏng (%)

5

3

2

Máy

của

Chi phi sửa chữa

công ty

6,5

9,5

14

(triệu đồng/năm)

TB

Giả sử các yếu tố khác không có sự khác biệt đáng kể và công ty này chỉ quan tâm đến chi phí

sửa chữa hàng năm, hỏi nên chọn mua máy của công ty nào sản xuất?

Giải : Gọi X là chi phí sửa chữa của một máy của công ty AP (triệu đồng/năm). Ta xem X là

đại lượng ngẫu nhiên có bảng phân phối xác suất như sau:

7

10,5

15,5

X

0

0,04

0,04

0,02

P

0,9

Ta có: E(X) = 1,01

Gọi Y là chi phí sửa chữa của một máy của công ty TB (triệu đồng/năm). Ta xem Y là đại

lượng ngẫu nhiên có bảng phân phối xác suất như sau:

Y

0

9,5

14

6,5

P

0,9

0,05

0,03

0,02

Ta có: E(Y) = 1,025

Vì 1,01 < 1,025; ta chọn mua máy của công ty AP.” (GT3, tr.48-49)

nhiên. Ví dụ được nêu như sau:

35

Trong ví dụ trên, người mua chỉ quan tâm tới chi phí sửa chữa hàng năm. Do đó, việc quyết

định mua máy của công ty nào sẽ phụ thuộc vào chi phí kỳ vọng sửa chữa một máy của

công ty đó có thấp hay không. Để giải quyết bài toán này, tác giả cho xác suất để máy chạy

tốt là 0,9 và xác suất để một máy hư là 0,1 (đối với cả hai loại máy của công ty AP và TB)

rồi lập bảng phân phối xác suất của các đại lượng ngẫu nhiên: chi phí sửa chữa một máy của

công ty AP và chi phí sửa một máy của công ty TB. Do chi phí sửa chữa kỳ vọng (hay trung

bình) nhỏ hơn nên máy của công ty AP đã được chọn. Như vậy, việc so sánh giá trị trung

bình của hai ĐLNN giúp người ta có thể đưa ra một quyết định hợp lý.

Ngoài việc giới thiệu ý nghĩa của kỳ vọng cho sinh viên, GT3 cũng nêu một số tính chất

“(a) E(aX + b) = aE(X) + b

(b) E(X+Y) = E(X) + E(Y)

E(X1 + X2 + …. + Xn)= E(X1)+ E(X2) + …+ E(Xn)

(c) Nếu X, Y độc thì E(X.Y) = E(X).E(Y)” (GT3, tr.49)

thông dụng của kỳ vọng (có kèm theo chứng minh) như sau:

Mặc dù các khái niệm và tính chất liên quan đến kỳ vọng của một ĐLNN được đưa vào rất

chi tiết và đầy đủ nhưng những tính chất này không thể giải thích được cho những kĩ thuật

so sánh hai tham số trung bình bằng mô hình hồi qui với biến giả được trình bày trong giáo

trình Kinh tế lượng.

Phương sai và độ lệch chuẩn

“Ta xem các đại lượng ngẫu nhiên rời rạc sau đây

X

- 0,1

0,1

Z

-90

10

P

P

1 10

9 10

1 2

1 2

Y

-10000

10000

P

1 2

1 2

Trước khi nêu ra định nghĩa, tác giả đã đặt ra vấn đề sau :

36

Mặc dù E(X) = E(Y) = E(Z) = 0 nhưng các ĐLNN này rất khác biệt nhau.

Ta cần đưa ra một đặc trưng cho sự khác biệt đó.” (GT3, tr.52)

Từ vấn đề đặt ra, cần thiết phải đưa thêm vào một tham số mới giúp chúng ta chỉ ra sự khác

“Nếu đại lượng ngẫu nhiên X có E(X) = m thì

E(X – m) = E(X) – m = 0” (GT3, tr.52)

nhau của các ĐLNN khi chúng có kỳ vọng như nhau. Mặt khác, tác giả cũng nhận xét rằng :

Do đó, nếu sử dụng đại lượng E(X – m) sẽ không chỉ ra được sự khác biệt giữa các ĐLNN.

“Phương sai của đại lượng ngẫu nhiên X, kỳ hiệu là Var(X), được xác định như sau:

Vì vậy, tham số cần đưa vào là phương sai, có định nghĩa như sau :

Var(X) = E[(X – E(X))2]” (GT3, tr.52)

Một công thức khác để tính phương sai :

“Var(X) = E(X 2) – [E(X)]2” (GT3, tr.52)

“Phương sai cho ta ý niệm về mức độ phân tán các giá trị của X xung quanh giá trị trung bình.

Phương sai càng lớn thì độ phân tán này càng lớn” (GT3, tr.52)

Tác giả cũng đặc biệt nhấn mạnh ý nghĩa của phương sai:

Với định nghĩa về phương sai nếu xem xét lại 3 đại lượng ngẫu nhiên X, Y, Z nêu trong ví

dụ ở trên, ta có :

Var(X) = 0,01 ; Var(Y) = 900 ; Var(Z) = 100000000

Như vậy, Var(Z) > Var(Y) > Var(X) hay độ phân tán của Z lớn nhất, kế tiếp là độ phân tán

của Y và cuối cùng, độ phân tán của X bé nhất.

Sau khi giới thiệu định nghĩa và ý nghĩa của phương sai, tác giả đưa vào 3 ví dụ, trong đó ví

dụ 3.6 và ví dụ 3.7 nhằm minh họa cho sinh viên cách tính phương sai khi biết bảng phân

phối xác suất hoặc biết hàm mật độ xác suất của ĐLNN X. Riêng ví dụ 3.8, ngoài việc tính

toán các kỳ vọng và phương sai của các ĐLNN, tác giả còn yêu cầu sinh viên phải so sánh

“Một nhà đầu tư có 3 dự án. Gọi Xi (i = 1, 2, 3) là lợi nhuận khi thực hiện dự án thứ i, còn giá

trị âm chỉ số tiền bị thua lỗ. Qua nghiên cứu và bằng kinh nghiệm, nhà đầu tư có ước lượng

như sau :

-2

-1

10

-1

4

5

X1

X2

các giá trị tìm được :

37

0,4

0,2

0,4

P

0,3

0,2

0,5

P

-3

-2,5

8

X3

P

0,3

0,2

0,5

Đơn vị tính : Tỷ đồng

Ta tính được :

E(X1) = 3 E(X2) = 3 E(X3) = 2,6

Var(X1) = 32,8 Var(X2) = 7 Var(X3)= 29,19

(Chú ý : Var(X) và E(X) không cùng đơn vị)

Nếu chọn một trong 3 dự án trên, theo bạn nên chọn dự án nào ?”

(GT3, tr.53-54)

Tác giả đưa ra câu hỏi mở đối với sinh viên và không nêu cách giải. Trong ví dụ trên có 3

ĐLNN X1, X2, X3 lần lượt là lợi nhuận khi thực hiện dự án thứ 1, 2, 3. Ta thấy bài toán ví

dụ này chính là một bài toán so sánh lợi nhuận và rủi ro trong đầu tư. Trong 3 dự án thì có 2

dự án cho lợi nhuận kỳ vọng bằng nhau còn dự án thứ 3 cho lợi nhuận kỳ vọng thấp hơn,

đồng thời phương sai của 3 dự án này đều khác nhau. Để quyết định chọn dự án nào thì sinh

viên phải xem xét cả lợi nhuận kỳ vọng và độ phân tán của mỗi dự án. Ở đây, sinh viên

chưa được tiếp cận định nghĩa rủi ro của dự án nên có thể hiểu độ phân tán của mỗi dự án

cho biết mức độ ổn định của lợi nhuận, nếu độ phân tán càng lớn thì khả năng lợi nhuận

nhận được khác với lợi nhuận kỳ vọng càng cao. Trong phần này, giáo trình mới chỉ giới

thiệu khái niệm phương sai và chưa hề nhắc tới hệ số biến động của ĐLNN. Chính vì vậy,

việc so sánh độ phân tán của ba dự án trên có vẻ khó khăn. Tuy nhiên, trong ví dụ này, tác

giả đã cố ý cho đại lượng ngẫu nhiên X3 có kỳ vọng thấp hơn kỳ vọng của hai đại lượng X1

và X2 nhưng có phương sai rất lớn. Trong khi đó, ĐLNN X1 vừa có kì vọng lớn hơn lại có

phương sai nhỏ nhất trong 3 dự án. Nếu sinh viên so sánh từng cặp dự án sẽ thấy ngay kết

quả:

- So sánh dự án 1 và 2 : Lợi nhuận kỳ vọng bằng nhau nhưng Var(X1) > Var(X2) do đó dự

án 2 tối ưu hơn dự án 1.

38

- So sánh dự án 2 và 3: E(X2) > E(X3) và Var(X2) lại nhỏ hơn Var(X3) rất nhiều. Vậy dự án

2 tối ưu hơn dự án 3. (Trong trường hợp này, kết luận độ phân tán của dự án 2 bé hơn độ

phân tán của dự án 3 vẫn đúng do CV(X2) < CV(X3))

Như vậy dự án 2 là tối ưu nhất.

Nếu sinh viên so sánh dự án 1 và dự án 3 : E(X1) > E(X3), Var(X1) > Var(X3), sinh viên sẽ

dễ sai lầm khi cho rằng độ phân tán của dự án 1 lớn hơn dự án 3. Trong khi đó, lợi nhuận

của dự án 1 lại lớn hơn dự án 3 dẫn tới sinh viên khó đưa ra lựa chọn cho trường hợp này.

Như vậy, dường như kỹ thuật so sánh hai tổng thể dựa trên kỳ vọng và phương sai đã không

được xây dựng hoàn chỉnh trong GT3.

“ (a) Nếu X là đại lượng ngẫu nhiên và a, b là hai hằng số thì

Var(aX+b) = a2Var(X)” (GT3, tr.54)

“Nếu hai đại lượng ngẫu nhiên X và Y độc lập (và các phương sai hữu hạn thì

Var(X+Y) = Var(X) + Var(Y) ” (GT3, tr.54)

4 (và các phương sai hữu hạn) thì

“ Nếu các đại lượng ngẫu nhiên X1, X2, …, Xn độc lập3F

Var(X1+ X2+ …+Xn )= Var(X1) +Var(X2)+ …+Var(Xn) ” (GT3, tr.54)

Tiếp theo ví dụ 3.8, tác giả đưa vào các tính chất của phương sai như sau:

“ Độ lệch tiêu chuẩn của đại lượng ngẫu nhiên X :

)

( X

Var

X =σ

Xσ có cùng đơn vị đo với X.” (GT3, tr.55)

Cuối cùng, tác giả định nghĩa độ lệch chuẩn của ĐLNN X theo phương sai như sau :

Sau đó tác giả không đưa vào tính chất của độ lệch chuẩn hay không có ví dụ nào minh họa

cho cách dùng độ lệch chuẩn. Và đặc biệt là hệ số biến động không được giới thiệu trong

chương này. Như vậy, những tính chất và ý nghĩa liên quan đến phương sai và độ lệch

chuẩn nêu trong GT3 chỉ có thể giải thích cho một phần nhỏ kĩ thuật so sánh độ phân tán

của hai tổng thể mà chúng tôi đã chỉ ra trong giáo trình Phân tích và đầu tư chứng khoán. Cụ

thể là trường hợp hai tổng thể có giá trị trung bình bằng nhau, tổng thể nào có phương sai

(độ lệch chuẩn) lớn hơn sẽ có giá trị quan sát phân tán nhiều hơn quanh giá trị trung bình.

Trong trường hợp hai tổng thể có trung bình khác nhau thì GT3 hoàn toàn không đưa vào lý

thuyết để so sánh độ phân tán của hai tổng thể.

4 Chỉ cần giả thiết X1, X2, …, Xn độc lập từng đôi.

39

Bài tập cuối chương

Chương này gồm có 18 bài, trong đó có 17 bài yêu cầu tính toán các tham số của ĐLNN

hoặc tính xác suất của X khi biết hàm phân phối xác suất của X. Chỉ có duy nhất bài 17 có

“Tại một địa phương có 5 mạch nước ngầm khác nhau, trong đó có một mạch nước bị nhiễm

thạch tín. Có 900 giếng nước tại địa phương lấy nước từ 5 mạch nước này nhưng không rõ

nguồn gốc mạch nước ngầm của giếng (mỗi giếng thuộc duy nhất một mạch nước ngầm). Một

đoàn kiểm tra muốn xác định giếng có bị nhiễm chất thạch tín hay không bằng cách xét

nghiệm mẫu nước. Có hai phương pháp được đề nghị:

Cách 1: Xét nghiệm từng mẫu nước riêng biệt.

Cách 2: Ghép chung 9 mẫu nước giếng khác nhau thành 1 nhóm làm 1 xét nghiệm, nếu mẫu

ghép không bị nhiễm thì kết luận cả 9 mẫu không nhiễm và ngược lại nếu mẫu ghép bị nhiễm

thì làm thêm 9 xét nghiệm riêng cho 9 mẫu để xác định giếng nào bị nhiễm.

a) Nếu biết chi phí mỗi lần xét nghiệm là như nhau thì hãy tính xem cách xét nghiệm nào có

lợi hơn.” (GT3, tr.63)

liên quan đến so sánh kỳ vọng của hai ĐLNN:

Các bài tập được đưa vào trong giáo trình để sinh viên luyện tập nên không kèm theo lời

giải. Chúng tôi dự kiến lời giải như sau :

Xác suất để một giếng lấy nước từ mạch nước nhiễm thạch tín là 1/5 = 0,2

Gọi X là số lần xét nghiệm theo cách 1.

Gọi Y là số lần xét nghiệm theo cách 2.

Y1, Y2, …, Y100 là các đại lượng ngẫu nhiên biểu thị số lần xét nghiệm theo nhóm thứ k.

Ta có X = 900 nên E(X) = 900

Y = Y1 + Y2 + … + Y100

Ta thấy Yk (k = 1, 2, …, 100) là các ĐLNN độc lập.

Yk có thể nhận một trong 2 giá trị: 1 và 10. Yk nhận giá trị là 1 khi 9 giếng trong nhóm

không nhiễm thạch tín. Yk nhận giá trị 10 nếu trong nhóm có ít nhất một giếng nhiễm thạch

tín.

Yk có phân phối xác suất giống nhau (Với mọi k = 1, 2, …, 100) P (Yk = 1) = (0,8)9 ; P(Yk = 10) = 1 – (0,8)9

Phân phối xác suất của Yk như sau :

40

1 10 Yk

100

9

9

+

P (0,9)9 1 – (0,8)9

≈ 879,2

)

)

8,0

Vậy E(Y) = E

[ =100 (

]))8,0(1(10 −

kYE (

k

= 1

100 ∑ = 1k

  

 kY = ∑  

Do E(Y) < E(X) nên làm theo cách 2 sẽ có chi phí ít hơn lại nhanh hoàn thành công việc

hơn.

Phần bài tập cuối chương 2 hoàn toàn không xuất hiện dạng bài tập so sánh độ phân tán của

hai tổng thể.

2.1.2. Giá trị trung bình, phương sai của tổng thể và mẫu

Trung bình, phương sai tổng thể

Giả sử tổng thể theo dấu hiệu H được mô tả bằng bảng phân phối tần số:

Giá trị của H x1 x2 … xk

Tần số N1 N2 … Nk

Trong đó x1, x2, …, xk là các giá trị của dấu hiệu H được đo lường trên các phần tử.

Ni là số phần tử của tổng thể có chung giá trị xi

µ

=

+

(

x

++ ...

x 1

2

)Nx

1 N

Khi đó, trung bình của tổng thể được tính bằng công thức :

µ

=

i xN i

k 1 ∑ N 1 = i

Trường hợp có Ni phần tử của tổng thể có chung giá trị xi

2

2 σ

=

) µ

( i xN

i

k 1 ∑ N 1 = i

2σσ =

Phương sai của tổng thể:

Độ lệch chuẩn của tổng thể: (GT3, tr.146-147)

41

Sau khi giới thiệu cách tính trung bình và phương sai tổng thể, GT3 giới thiệu cách mô

hình hóa dấu hiệu H bởi ĐLNN. Nếu chọn ngẫu nhiên một phần tử của tổng thể và gọi X là

giá trị của dấu hiệu H trên phần tử này thì ta sẽ có bảng phân phối xác suất của X:

X x1 x2 … xk

p

i =

N i N

P p1 p2 … pk

µ=

i px

i

n ∑ = 1 i

trong đó:

=

) 2 σµ =

(

2))

Khi đó: E(X) = (chính là trung bình tổng thể)

[ − XEXE (

]

( i xp

i

k ∑ = i 1

Var(X) = (chính là phương sai tổng thể) ” (GT3,

tr.148)

Với cách mô hình hóa này, những phần tiếp theo tác giả đều nói đến tổng thể theo dấu

hiệu H dưới dạng một ĐLNN X.

Trung bình, phương sai mẫu

Với (X1, X2,…, Xn) là mẫu ngẫu nhiên kích thước n được thành lập từ đại lượng ngẫu

n

=

X

iX

1 n

i

= 1

nhiên X, ta có các công thức tính trung bình mẫu và phương sai mẫu như sau:

2

2

2

=

=

Trung bình mẫu: (GT3, tr.157)

S

(

X

X

)

X

(GT3, tr.158) Phương sai mẫu:

( Xn

i

2 i

1 −

1 −

n

1

n

1

n ∑ = 1 i

n ∑ = 1 i

  

 )  

)

( XE=µ

“E( X ) =

và Var( X )=

nên khi n khá lớn X ổn định quanh µ hơn X” (GT3,

2σ n

tr.158)

2σ = Var(X)” (GT3, tr.158)

GT3 cũng chứng minh cho sinh viên thấy được các tính chất:

“E(S2) =

42

“Trong nhiều bài toán thực tế ta không biết

2σ , khi n đủ lớn người ta thường dùng một giá trị

cụ thể s2 thay cho

2σ ” (GT3, tr.159)

Tác giả chú thích:

2

=

S

X

(

)

− i X

1 −

1

n

n ∑ = i 1

Độ lệch chuẩn mẫu được tính bằng căn bậc hai của phương sai:

Như vậy, hệ số biến động của một tổng thể hay của một mẫu cũng không được trình

bày trong chương này.

Các ví dụ và bài tập cuối chương

Toàn bộ chương lý thuyết mẫu gồm 14 ví dụ và 11 bài tập chủ yếu là yêu cầu tính toán các

tham số của tổng thể và mẫu, lập biểu đồ, xây dựng đa giác tần suất, tính xác suất để trung

bình mẫu hoặc phương sai mẫu lớn hơn hay nhỏ hơn một số nào đó. Điều đáng nói là hoàn

toàn không có bài tập nào liên quan đến so sánh các tham số của hai hay nhiều tổng

thể.

2.1.3. Hàm hồi qui

Hàm hồi qui được trình bày ở chương 9 : Giới thiệu lý thuyết tương quan và hồi quy. Tuy

nhiên, theo chương trình học XS – TK của trường Đại học Kinh tế TP.HCM thì phần tương

quan và hồi qui không được dạy. Toàn bộ phần này lại do một môn cơ sở ngành là Kinh tế

lượng giới thiệu tới sinh viên. Điều này khiến cho các sinh viên sau khi học xong XS – TK

hoàn toàn không biết đến các mô hình hồi qui 2 biến, hồi qui bội cũng như xem xét sự phụ

thuộc giữa các dưới dạng một hàm hồi qui.

2.1.4. Các tổ chức toán học liên quan đến so sánh các mẫu dữ liệu thống kê

Thông qua một vài ví dụ và bài tập thuộc chương 2 và chương 6 của GT3, kết hợp với các

bài tập liên quan đến kiểm định sự bằng nhau của hai tham số, chúng tôi tìm thấy các tổ

chức toán học sau có liên quan đến so sánh tham số của các tổng thể.

: So sánh hai trung bình E(X), E(Y) của hai ĐLNN X và Y • Kiểu nhiệm vụ SSTBT

Kĩ thuật SSTBτ :

Trong trường hợp có thể tính trực tiếp E(X), E(Y): so sánh trực tiếp E(X) và E(Y)

43

Trong trường hợp chỉ biết mẫu ngẫu nhiên của X và Y: Kiểm định sự bằng nhau hai

trung bình E(X), E(Y) của hai tổng thể (tương ứng với hai biến ngẫu nhiên X và Y) với

2

1σ , E(Y)=

2 2σ

mức ý nghĩa α.

2µ , Var(Y)=

Với X, Y là hai có E(X) = 1µ ,Var(X) =

B1 : Đặt giả thuyết theo 1 trong 3 cách sau (tùy vào từng mục đích):

H0:

H1:

H0:

H1:

H0:

1µ = 1µ ≠ 1µ = 1µ < 1µ = 1µ >

2µ 2µ 2µ 2µ 2µ 2µ

(GT3, tr.226)

H1:

2

B2 : Xét các trường hợp sau :

2 1σ ,

2σ và X, Y có phân phối chuẩn.

y

Trường hợp biết

x 2 2 σσ 1 2 + n n 1

2

 Tính z = trong đó n1 là kích thước mẫu lấy từ X, n2 là kích thước

mẫu lấy từ Y.

 Thực hiện theo bảng sau:

Giả thuyết Bác bỏ H0 khi

2/αz

H0: |z|>

H1:

1µ = 1µ ≠ 1µ = 1µ <

2µ 2µ 2µ 2µ

H0: z < - αz H1:

1µ = 1µ >

2µ 2µ

H0: z > αz H1:

2

(GT3, tr.227)

2 1σ ,

2σ và n1 ≥ 30, n2 ≥ 30

Trường hợp chưa biết

44

y

+

2 s 2 n

x 2 s 1 n 1

2

(GT3, tr.228)  Tính z =

2

 Thực hiện kiểm định theo bảng giống như trường hợp trước.

2 1σ ,

2σ nhưng có căn cứ để có thể xem là

2 1σ =

2 2σ

y

(GT3, tr.228)

Trường hợp chưa biết

) s 1

( n 1

2 2

+

x ( n 2 −

+ n

− 2

1 n

) 2 s 1 1 + n 1

2

1 n 1

2

 Tính t=

(t có phân phối Student với n1 +n2 – 2 bậc tự do)

αz bằng αt 2

αt và thực hiện kiểm định theo bảng tóm tắt ở trường hợp đầu 2

,  Thay αz ,

tiên.

αt được cho bởi các bảng phụ lục cuối giáo trình) 2

αz , αt 2

, (Các giá trị αz ,

Công nghệ:

- Khái niệm miền bác bỏ và miền chấp nhận.

- Quy luật phân phối xác suất của đại lượng ngẫu nhiên có phân phối chuẩn hoặc phân

phối Student

SSTBT

Trong GT3 có tất cả 2 ví dụ và 2 bài tập liên quan đến kiểu nhiệm vụ . Chúng tôi sẽ

“Trong một công ty sản suất sản phẩm, có ý kiến cho rằng làm việc buổi sáng hiệu quả hơn

buổi chiều. Người quản lý của công ty này quan sát 75 buổi sáng đếm số sản phẩm sản xuất

được trong mỗi buổi và tính được trung bình mẫu x =806 (sản phẩm/buổi) và độ lệch chuẩn

mẫu sx = 185. Người này cũng quan sát 100 buổi chiều và tính được trung bình mẫu y =723

(sản phẩm/buổi) và độ lệch chuẩn mẫu sy = 164. Hãy cho nhận xét với mức ý nghĩa 1%?

Giải

Gọi

Xµ là số sản phẩm sản xuất được trung bình trong buổi sáng

Yµ là số sản phẩm sản xuất được trung bình trong buổi chiều

: trích dẫn ví dụ 5.1 (trang 229, GT3) để minh họa cho kĩ thuật giải quyết SSTBT

45

ở công ty này.

Ta cần kiểm định giả thiết:

H0:

Xµ = Yµ H1:

Xµ > Yµ

Xn = 75 > 30 Yn =100 >30

Mức ý nghĩa

, tra bảng ta được

= 2,326

01,0=α

01,0z

723

Ta tính z =

= 3,082

806 2

2

+

185 75

164 100

Vì z > 2,326 nên ta bác bỏ H0, chấp nhận H1.

Ở công ty này, làm việc buổi sáng hiệu quả hơn buổi chiều” (GT3, tr.229)

: So sánh độ phân tán của các ĐLNN X và Y • Kiểu nhiệm vụ SSPST

Kĩ thuật SSPSτ :

Trong trường hợp tính trực tiếp được Var(X) và Var(Y) : so sánh hai kết quả tìm

được. Nếu Var(X) > Var(Y) thì X phân tán nhiều hơn Y và ngược lại.

Trong trường hợp không tính trực tiếp được Var(X) và Var(Y), chỉ biết hai mẫu

ngẫu nhiên của X và Y : Dùng phương pháp kiểm định.

)

(

,

)

2 YN σµ Y

2 σµ XN , ( X

(Giả sử X~ , Y~ ; (X1,…,Xn) và (Y1,…,Ym) là hai mẫu ngẫu

nhiên độc lập lấy từ X và Y)

 Đặt giả thiết theo một trong 3 cách :

H0:

H1 :

H0:

H1 :

H0:

2 Xσ = ≠2 Xσ 2 Xσ = >2 Xσ 2 Xσ = <2 Xσ

2 Yσ 2 Yσ 2 Yσ 2 Yσ 2 Yσ 2 Yσ

H1 :

2 s X 2 s Y

 Tính giá trị f =

 Thực hiện kiểm định theo bảng :

46

Giả thuyết Bác bỏ H0 khi

2 Xσ =

2 Yσ

− 1

− mn ,1

fα , 2

f > H0:

2 Yσ

≠2 Xσ

− 1

− ,1 mn

f α − , 1 2

H1 : hoặc f <

fα ,

− mn ,1

− 1

2 Xσ =

2 Yσ

f > H0:

2 Yσ

>2 Xσ

H1 :

2 Xσ =

2 Yσ

f α − , 1

− mn ,1

− 1

H0: f <

2 Yσ

<2 Xσ

(GT3, tr.232-233)

H1 :

Công nghệ: Khái niệm miền chấp nhận, miền bác bỏ.

Quy luật phân phối xác suất của hàm Fisher – Snedecor.

“Nghiên cứu phương sai của lượng nguyên liệu NL (đơn vị tính là g) dùng để làm ra một sản

phẩm theo phương pháp A, phương pháp B. Gọi X là lượng nguyên liệu NL dùng để làm ra

một sản phẩm theo phương pháp A; Y là lượng nguyên liệu NL dùng để làm ra một sản phẩm

theo phương pháp B. Lấy mẫu gồm 25 sản phẩm được sản xuất theo phương pháp A và tính

được

(g) ; mẫu khác gồm 16 sản phẩm được sản xuất theo phương pháp B và tính

150

2 =Xs

2

(g). Với mức ý nghĩa

, có thể nói rằng

được

4,86

01,0=α

2 =Ys

Yσ được không ?

>2 Xσ

Giải

Ta cần kiểm định giả thiết H0:

2 Xσ =

2 Yσ

Với đối thiết H1 :

>2 Xσ

2 Yσ

=

=

=

Ta có:

736

,1

f

150 4,86

2 s X 2 s Y

01,0=α

Tra bảng mức phân vị α của phân phối Fisher – Snedecor với bậ tự do ở tử số là 24 và bậc tự

do ở mẫu số là 15, ta được:

Ví dụ minh họa:

47

=3,29

15;24;01,0f

Vì f = 1,736 < 3,29 ; với mức ý nghĩa

ta chưa đủ cơ sở để bác bỏ H0” (GT3, tr.233-

01,0=α

234)

Nhận xét về các tổ chức toán học trên:

SSTBT

có hai kỹ thuật để giải quyết: so sánh trực tiếp (khi tính được các • Kiểu nhiệm vụ

trung bình tổng thể) hoặc gián tiếp bằng kiểm định (khi chỉ biết các mẫu ngẫu nhiên của

hai tổng thể), hoàn toàn không sử dụng tới mô hình hồi qui với biến giả. Rõ ràng công

SSTBτ của GT3 không thể giải thích được cho những kĩ thuật

2

;

1 SSTBτ

SSTBτ ; trong giáo trình Kinh tế lượng.

nghệ để giải quyết cho

có hai kỹ thuật để giải quyết: so sánh trực tiếp hai phương sai hoặc • Kiểu nhiệm vụ SSPST

kiểm định sự bằng nhau của hai phương sai. Giáo trình không so sánh hệ số biến động

để kết luận về độ phân tán của hai tổng thể khi giá trị trung bình không bằng nhau mà

luôn luôn so sánh hai phương sai. Chính vì vậy, GT1 đã phải đưa thêm vào công thức hệ

số biến động nhằm so sánh rủi ro trong trường hợp hai phương án đầu tư chứng khoán

có lợi nhuận kỳ vọng khác nhau.

2.2. Tổng kết chương 2

Trong chương này, chúng tôi đã tiến hành phân tích giáo trình XS - TK. Trong đó, chúng tôi

tập trung vào các đối tượng: kỳ vọng, phương sai, độ lệch chuẩn, hệ số biến động, trung

bình, mô hình hồi qui bởi đây là những lý thuyết toán có liên quan đến so sánh các mẫu dữ

liệu thống kê trong hai giáo trình chuyên ngành mà chúng tôi đã phân tích. Các kết quả

chính của chương 2 như sau:

• GT3 chỉ giới thiệu với sinh viên các khái niệm: kỳ vọng, phương sai, độ lệch chuẩn của

các đại lượng ngẫu nhiên; giá trị trung bình, phương sai, độ lệch chuẩn của tổng thể và

mẫu. Khái niệm hệ số biến động không được đưa vào giáo trình. Thêm vào đó,

trong chương trình dạy XS – TK của Đại học Kinh tế TP.HCM thì mô hình hồi qui

không được dạy. Chính những điều này khiến cho sinh viên sau khi học xong môn XS

– TK bị “hổng” một số kiến thức và thiếu một số kĩ năng trong so sánh các tham số của

hai hay nhiều tổng thể.

48

• Các nhiệm vụ liên quan đến so sánh hai trung bình của hai tổng thể luôn được giải

quyết bằng việc so sánh trực tiếp 2 giá trị trung bình tính được hoặc kiểm định sự bằng

nhau của hai trung bình khi có mẫu ngẫu nhiên của hai tổng thể đó. Các nhiệm vụ này

hoàn toàn không được giải quyết bằng mô hình hồi quy với biến giả. Điều này khiến

cho sinh viên học xong XS – TK hoàn toàn không biết so sánh hai trung bình tổng thể

bằng cách sử dụng mô hình hồi quy.

• Kiểu nhiệm vụ so sánh độ phân tán của hai tổng thể được giải quyết thông qua so sánh

trực tiếp hai phương sai hoặc kiểm định sự bằng nhau của hai phương sai..

Chính sự thiếu sót trong chương trình dạy XS – TK mà các môn chuyên ngành, cụ thể là hai

môn Kinh tế lượng và Phân tích và đầu tư chứng khoán đã phải đưa thêm vào những khái

niệm toán mới để bổ sung thêm cho những kiến thức XS – TK mà sinh viên được học trước

đó, đồng thời để ứng dụng vào chính hai môn chuyên ngành đó. Giáo trình Kinh tế lượng

phải cung cấp cho sinh viên các khái niệm về tương quan, mô hình hồi qui hai biến, mô hình

hồi qui ba biến mà đáng lẽ phải được cung cấp trong XS – TK. Còn giáo trình Phân tích và

đầu tư chứng khoán đã phải đưa thêm vào công thức hệ số biến động CV nhằm ứng dụng

vào so sánh rủi ro của hai phương án đầu tư chứng khoán trong trường hợp hai phương án

này có lợi nhuận kỳ vọng khác nhau.

Như vậy, mô hình hồi qui hai biến cũng như hệ số biến động là hai khái niệm cần thiết cho

các môn chuyên ngành nhưng các khái niệm này đã không được cung cấp trong môn XS –

TK. Chính hai môn chuyên ngành (Kinh tế lượng, Phân tích và đầu tư chứng khoán) đã phải

đưa thêm vào trong chương trình để ứng dụng giải quyết các vấn đề liên quan đến hai

chuyên ngành đó. Vì vậy, chúng tôi đưa ra kết luận là tồn tại sự không nối khớp giữa dạy

học xác suất thống kê với dạy học hai môn chuyên ngành kinh tế (Kinh tế lượng, Phân

tích và đầu tư chứng khoán). Sự không nối khớp này khiến cho sinh viên sau khi học xong

môn XS - TK sẽ thiếu một số kĩ năng so sánh các tham số của hai tổng thể, mà các kĩ năng

này rất cần thiết cho họ khi học hai môn chuyên ngành: Kinh tế lượng; Phân tích và đầu tư

chứng khoán. Sự thiếu sót trên được thể hiện qua hai giả thuyết mà chúng tôi đưa ra sau

đây:

H1: Môn XS – TK đã hình thành ở sinh viên quy tắc hành động: muốn so sánh độ phân

tán của hai mẫu thì phải so sánh hai phương sai (độ lệch chuẩn) của hai mẫu đó.

49

H2: Sinh viên không sử dụng mô hình hồi qui với biến giả khi so sánh trung bình của hai

tổng thể.

50

CHƯƠNG 3: NGHIÊN CỨU THỰC NGHIỆM

Qua quá trình phân tích thể chế dạy học XS – TK và thể chế dạy học các môn chuyên ngành

kinh tế, chúng tôi đưa ra được kết luận:

Mô hình hồi qui hai biến và hệ số biến động là hai khái niệm cần thiết cho một số môn

chuyên ngành nhưng các khái niệm này đã không được cung cấp trong môn XS – TK.

Chính hai môn chuyên ngành (Kinh tế lượng, Phân tích và đầu tư chứng khoán) đã phải đưa

thêm vào trong chương trình để ứng dụng giải quyết các vấn đề liên quan đến hai chuyên

ngành đó. Từ đó, chúng tôi đưa ra kết luận: Tồn tại sự không nối khớp giữa dạy học xác

suất thống kê với dạy học hai môn chuyên ngành kinh tế (Kinh tế lượng, Phân tích và

đầu tư chứng khoán). Sự không nối khớp này khiến cho sinh viên (sau khi học xong XS -

TK) thiếu một số kĩ năng khi so sánh các tham số của hai tổng thể. Chúng tôi đưa ra hai giả

thuyết đối với đối tượng là sinh viên học xong chương trình XS – TK trước khi học hai môn

chuyên ngành (Kinh tế lượng, Phân tích và đầu tư chứng khoán) như sau:

H1: Môn XS – TK đã hình thành ở sinh viên quy tắc hành động: muốn so sánh độ phân

tán của hai mẫu thì phải so sánh hai phương sai (độ lệch chuẩn) của hai mẫu đó.

H2: Sinh viên không sử dụng mô hình hồi qui với biến giả khi so sánh trung bình của hai

tổng thể.

Trong chương 3, chúng tôi sẽ tiến hành thực nghiệm để kiểm chứng hai giả thuyết đã đưa

ra.

3.1. Thực nghiệm

Thực nghiệm mà chúng tôi xây dựng dành cho đối tượng là sinh viên năm hai (đã học xong

môn XS – TK và đang chuẩn bị thi phân ngành) nhằm kiểm chứng hai giả thuyết H1 và H2.

Để kiểm chứng hai giả thuyết này, chúng tôi sẽ tạo ra các tình huống không quen thuộc

khiến sinh viên không thể giải quyết theo những cách thường dùng (được cung cấp trong

chương trình XS – TK).

Với giả thuyết H1, chúng tôi kiểm chứng bằng cách đưa vào một bài toán yêu cầu so sánh

độ phân tán của hai tổng thể nhưng ở đó không thể thông qua so sánh hai phương sai hay

hai độ lệch chuẩn để đưa ra kết luận. Đối chiếu cách dùng hệ số biến động với cách dùng

51

phương sai hoặc độ lệch chuẩn chúng tôi thấy “Var(X) > Var(Y) suy ra độ phân tán của X

lớn hơn của Y” chỉ đúng trong 3 trường hợp và sai trong trường hợp còn lại:

TH1: E(X) = E(Y) Kết luận trên đúng (theo ý nghĩa của phương sai)

)

=

>

=

TH2: E(X) < E(Y) Kết luận trên đúng

CV

X

CV Y

Var ( XE (

X )

Var Y )( YE )(

(Vì: )

>

)

(

)

Var

)( Y

X

( XE

Var

)( YE

)

=

>

=

Kết luận trên đúng TH3: E(X) > E(Y) và

CV

X

CV Y

Var ( ( XE

X )

Var Y )( YE )(

(Vì: )

YE )(

Var

(

X

)

XE (

)

Var

Y )(

)

=

=

Kết luận trên sai TH4: E(X) > E(Y) và

CV

X

CV Y

X )

( Var ( XE

Var Y )( YE )(

) (Vì:

Vì vậy để kiểm chứng H1 chúng tôi chọn bài toán rơi vào trường hợp 4. Nếu đa số sinh viên

vẫn so sánh hai phương sai hoặc hai độ lệch chuẩn để kết luận về độ phân tán của hai tổng

thể thì giả thuyết H1 xem như đã được kiểm chứng.

Câu hỏi thực nghiệm như sau :

Bài 1: Một công ty sử dụng hai công nghệ khác nhau A và B để sản xuất. Nhằm kiểm

tra xem công nghệ nào cho sản lượng ổn định hơn, người ta ghi lại khối lượng sản

phẩm (tấn) sản xuất ra sau mỗi ngày (khi sử dụng từng công nghệ trên) trong 60

ngày. Số liệu thu được như sau:

35 36 37 38 39 40 41 42 43 Sản lượng (tấn) khi sử dụng công nghệ A

1 2 7 6 8 12 14 9 1 Số ngày có cùng sản lượng

Sản lượng (tấn) 26 27 28 29 30 31 32 33

52

khi sử dụng công nghệ B

1 4 16 13 12 5 7 2 Số ngày có cùng sản lượng

Theo bạn, sản xuất theo công nghệ nào cho năng suất ổn định hơn? Giải thích cho

kết luận của bạn.

Đối với giả thuyết H2 chúng tôi kiểm chứng bằng cách chọn một bài toán yêu cầu sinh viên

so sánh các trung bình sao cho nếu làm theo cách so sánh trực tiếp hay kiểm chứng sẽ gặp

nhiều khó khăn. Bài toán này nếu sử dụng mô hình hồi qui với biến giả sẽ cho kết luận hợp

lý nhất.

Câu hỏi thực nghiệm như sau:

Bài 2: Để nghiên cứu nhu cầu của người dân về hai loại mặt hàng A và B tại thành

phố H, người ta tiến hành khảo sát giá bán và lượng hàng A và B bán được tại thành

phố H theo các tháng khác nhau và thu được các số liệu cho ở bảng sau:

Lượng hàng bán được Giá bán (ngàn

(tấn/tháng) đồng/kg) Mặt hàng

B 3 20

A 3 17

A 3 18

A 4 15

A 4 16

B 4 18

A 5 14

B 5 15

B 5 16

B 6 10

53

Theo bạn, với cùng một giá bán thì loại mặt hàng nào bán chạy hơn? Giải thích cho

kết luận của bạn.

3.2. Phân tích tiên nghiệm

Bài 1:

Biến V1a: Cách cho số liệu hai mẫu ngẫu nhiên lấy từ hai đại lượng ngẫu nhiên X, Y

=

>

Biến V1a nhận 4 giá trị:

x

Sy ;

S

2 X

2 Y

<

>

• Số liệu thỏa:

x

Sy ;

S

2 Y

2 X

>

>

>

x

; Sy

;

S

Sy

Sx

2 Y

X

Y

2 X

>

>

S

Sy

Sx

x

Sy ;

;

X

Y

2 Y

2 X

(Trong đó, x là giá trị trung bình của mẫu lấy từ X, y là giá trị trung bình của mẫu

lấy từ Y)

>

>

Nhằm kiểm chứng H1 chúng tôi chọn số liệu của hai mẫu ngẫu nhiên lấy từ hai đại lượng

x

; Sy

S

;

Sy

Sx

2 X

2 Y

X

Y

ngẫu nhiên X, Y thỏa: . Khi đó CVx ≤ CVy, tức là độ phân tán

của X nhỏ hơn Y nhưng nếu dựa vào hai phương sai, sinh viên sẽ kết luận độ phân tán của

X lớn hơn Y dẫn tới sai lầm.

Chiến lược:

=2

• S1a: So sánh hai phương sai tính trên hai mẫu

1S

=2

Phương sai: 3,416

2S

2

>2

Phương sai: 2,64

1S

2S nên độ phân tán của khối lượng sản phẩm theo ngày khi sử dụng công nghệ A

Do

cao hơn khi sử dụng công nghệ B. Vậy sử dụng công nghệ B cho năng suất ổn định hơn.

Chiến lược này không hợp thức và cho câu trả lời sai. Nếu đa số sinh viên sử dụng chiến

lược này thì H1 xem như được kiểm chứng.

=2

• S1b: Kiểm định sự bằng nhau của hai phương sai

1S

=2

Phương sai: 3,416

2S

Phương sai: 2,64

54

2 2 1 σσ = 2

2 2 1 σσ > 2

=

=

(với độ tin cậy 95%) Kiểm định giả thiết H0: với đối thiết H1:

,1

f

294

416 ,3 64,2

2 s 1 2 s 2

Ta có:

05,0=α

Với

Tra bảng mức phân vị α của phân phối Fisher – Snedecor với bậc tự do ở tử số là 59 và bậc

tự do ở mẫu số là 59, ta được :

59;59;05,0f

= 1,54

05,0=α

Vì f = 1,294 < 1,54 ; với mức ý nghĩa ta chưa đủ cơ sở để bác bỏ H0

2 2 1 σσ = 2

Vậy

2 2 1 σσ = 2

Do nên độ phân tán của khối lượng sản phẩm theo ngày khi sử dụng công nghệ A

bằng công nghệ B. Vậy hai công nghệ cho năng suất ổn định như nhau.

Chiến lược này cho câu trả lời hợp lý.

• S1c: So sánh hai hệ số biến động

=1x

=2

Sản lượng bình quân (tấn/ngày) khi sử dụng công nghệ A là: 39,683

1S

,0

0466

Phương sai: 3,416

,3 461 683,39

Hệ số biến động CV1 =

=2x

=2

29,4 Sản lượng bình quân (tấn/ngày) khi sử dụng công nghệ B là:

2S

055,0

Phương sai: 2,64

64,2 4,29

Hệ số biến động CV2 =

Do CV1 < CV2 nên độ phân tán của khối lượng sản phẩm theo ngày khi sử dụng công nghệ

A nhỏ hơn khi sử dụng công nghệ B. Vậy sử dụng công nghệ A cho năng suất ổn định hơn.

Chiến lược này hợp thức và cho câu trả lời hợp lý.

• S1d: Tính hai trung bình và kết luận không so sánh độ phân tán của hai tổng thể được

(do giá trị trung bình khác nhau)

Trong các chiến lược trên thì S1c, S1b cho kết quả hợp lý nhất; S1a cho kết quả chưa hợp lý.

Chúng tôi dự đoán sinh viên sẽ sử dụng nhiều S1a còn S1c, S1b sẽ ít được sử dụng hơn. S1d ít

55

được sinh viên dùng do trong giáo trình cũng đã xuất hiện bài toán ví dụ có so sánh độ phân

tán (xuất hiện không tường minh) của các đại lượng ngẫu nhiên khi kỳ vọng (trung bình)

không bằng nhau. S1c ít được sử dụng do hệ số biến động không được đưa vào trong giáo

59;59;05,0f

không có sẵn ở bảng Fisher – Codener các giá trình. S1b ít được sử dụng bởi giá trị

59;59;05,0f

trị thông dụng. Giá trị sinh viên phải tìm bằng hàm FINV trong Excell.

Bài 2:

Biến V2a: Số biến độc lập của hàm hồi qui

Biến V2b: Số phạm trù của biến giả

Biến V2c: Cách cho số liệu bài toán.

Chúng tôi chọn bài toán gồm 1 biến phụ thuộc là lượng hàng bán được (tấn/tháng) và 2 biến

độc lập, trong đó có 1 biến định lượng là giá bán và 1 biến định tính: mặt hàng có hai phạm

trù là A hoặc B. Chúng tôi đưa thêm 1 biến định lượng vào bài toán nhằm gây khó khăn cho

sinh viên sử dụng phương pháp kiểm định. Ngoài ra với cách chọn giá bán là 6 ngàn/kg chỉ

xuất hiện ở mặt hàng B gây khó khăn cho sinh viên trong việc so sánh từng cặp lượng hàng

trung bình của mặt hàng A và B theo từng giá bán cụ thể. Như vậy, bài toán này bắt buộc

các sinh viên phải sử dụng tới hồi qui với biến giả. Nếu đa số sinh viên không giải quyết

được bài toán hoặc vẫn sử dụng phương pháp kiểm định hay phương pháp so sánh từng cặp

thì chứng tỏ tồn tại giả thuyết H2 mà mà chúng tôi đã đưa ra.

Chiến lược:

• S2a: Ứng với mỗi mức giá, so sánh lượng hàng trung bình của 2 mặt hàng A và B

được bán ra.

Cái có thể quan sát được:

Lượng hàng trung bình của Lượng hàng trung bình

Giá bán (ngàn/kg) mặt hàng A được bán ra của mặt hàng B được bán

(tấn/tháng) ra (tấn/tháng)

17,5 19 3

15,5 17 4

14 15,5 5

56

10 6

Ứng với mỗi giá bán 3, 4, 5 thì lượng hàng trung bình bán ra của mặt hàng B theo

tháng lớn hơn mặt hàng A. Vậy với cùng giá bán thì mặt hàng B bán chạy hơn mặt

hàng A.

+

• S2b: Sử dụng mô hình hồi qui với biến giả (tính các hệ số bằng máy tính cầm tay)

X

Z

+ ββ 2

1

β 3

Xây dựng mô hình hồi qui: Y =

Trong đó: Z = 0 nếu mặt hàng là A ; Z =1 nếu mặt hàng là B

XY ZY XZ X Z Z2 Y Y2 X2

20 3 400 9 1 1 60 20 3

17 3 289 9 0 0 51 0 0

10 6 100 36 1 1 60 10 6

14 5 196 25 0 0 70 0 0

15 4 225 16 0 0 60 0 0

15 5 225 25 1 1 75 15 5

16 4 256 16 0 0 64 0 0

18 4 324 16 1 1 72 18 4

18 3 324 9 0 0 54 0 0

16 5 256 25 1 1 80 16 5

Tổng Tổng Tổng Tổng Tổng Tổng Tổng Tổng Tổng

159 42 5 2595 186 5 646 79 23

∑ 2

i yx∑ = -21,8 ;

ix = 9,6 ; ∑ 2

iz = 2,5;

iy =66,9 ; ∑ 2

i

X =15,9 ; Y = 4,2 ; Z = 0,5 ;

57

i zy∑ = -0,5;

i zx∑ = 2

i

i

(Trong đó xi = Xi - X ; y = Yi - Y ; z = Zi - Z )

675,2

2 −=β

94,13 =β

=

−= Y

X

Z

165,26

β 1

β 2

β 3

Suy ra:

Vậy Y = 26,165 – 2,675X + 1,94Z

94,13 =β

> 0 nên với cùng 1 giá bán thì mặt hàng B bán ra nhiều hơn mặt hàng A là Do

1,94 tấn/tháng

• S2c: Sử dụng mô hình hồi quy với biến giả (ước lượng hàm hồi qui bằng các phần

mềm tính toán SPSS, EVIEW,…)

Nhập các số liệu và cho chạy chương trình. Kết quả thu được hàm hồi qui của Y - lượng

hàng bán ra (tấn/tháng) theo X - giá bán (ngàn đồng/kg) và Z – biến giả (Z = 0 nếu mặt

hàng là A, Z = 1 nếu mặt hàng là B):

Y = 26,165 – 2,675X + 1,94Z (với R2 = 0,857)

Do hệ số 1,94 > 0 nên với cùng 1 giá bán thì mặt hàng B bán ra nhiều hơn mặt hàng A là

1,94 tấn/tháng

• S2d: So sánh trung bình của hai tổng thể

Lượng hàng trung bình của mặt hàng A: 16 (tấn/tháng)

Lượng hàng trung bình của mặt hàng B: 15,6 (tấn/tháng)

Vậy A bán chạy hơn B

Dự đoán về các chiến lược:

Với 4 chiến lược có thể có của sinh viên mà chúng tôi đưa ra, chúng tôi dự đoán chiến

lược S2a sẽ được sử dụng nhiều nhất do thể chế dạy học XS – TK với luôn so sánh hai

giá trị trung bình của hai tổng thể bằng cách tính toán và so sánh trực tiếp hai giá trị

trung bình hoặc kiểm định sự bằng nhau của hai giá trị trung bình. Chiến lược S2b và S2c

sẽ rất ít hoặc không xuất hiện do mô hình hồi qui không được dạy trong chương trình XS

– TK. Chiến lược S2d chỉ xảy ra khi sinh viên không hiểu rõ yêu cầu đề bài.

Trong các chiến lược trên, chiến lược đắt giá và cho kết quả đúng nhất chính là S2b và

S2c. Nếu đa số sinh viên sử dụng S2a và S2d thì giả thuyết H2 xem như được kiểm chứng.

58

3.3. Phân tích hậu nghiệm

Thông qua việc phân tích 118 phiếu thực nghiệm thu được, chúng tôi tổng kết được những

kết quả sau:

Chiến S1a S1b S1c S1d Không

trả lời lược

Số sinh 72 30 0 5 11 Bài 1

viên

Tỉ lệ 61,02% 25,42% 0% 4,24% 9,32%

S2a S2b S2c S2d Không trả Chiến

lời lược

Số sinh 83 0 0 3 32 Bài 2

viên

Tỉ lệ 70,34% 0% 0% 2,54% 27,12%

Từ bảng tóm tắt kết quả thu được chúng tôi có những kết luận sau:

 Đối với bài 1, đa số sinh viên sử dụng chiến lược S1a, một số ít sinh viên làm theo

chiến lược S1b và phần còn lại (rất ít) bỏ trống phiếu hoặc cho rằng không so sánh

được độ phân tán của hai tổng thể khi trung bình không bằng nhau.

Trích dẫn bài làm của sinh viên:

59

60

Điều này khẳng định phần lớn sinh viên luôn so sánh độ phân tán của hai tổng thể dựa trên

việc so sánh hai phương sai mà không quan tâm tới giá trị trung bình của hai tổng thể. Với

kết quả này, giả thuyết H1 mà chúng tôi đưa ra đã được kiểm chứng.

 Đối với bài 2, đa số sinh viên sử dụng chiến lược S2a, một số rất ít chọn S2d, phần

còn lại (khá ít) bỏ trống phiếu.

Trích dẫn bài làm của sinh viên:

61

Như vậy, mặc dù chúng tôi đã cố ý chọn số liệu sao cho cách so sánh từng cặp giá trị trung

bình (của lượng hàng bán được ứng với mỗi giá tiền khác nhau) gặp khó khăn. Tuy nhiên,

sinh viên vẫn sử dụng S2a và kết luận: với cùng giá bán thì mặt hàng B bán chạy hơn mặt

hàng A. Điều này chứng tỏ giả thuyết H2 mà chúng tôi đưa ra là hợp lý.

Những kết quả thu được từ thực nghiệm đã cho phép chúng tôi làm rõ được phần nào quan

hệ cá nhân của sinh viên năm hai Đại học Kinh tế TP.HCM đối với vấn đề so sánh các mẫu

dữ liệu thống kê thông qua việc hợp thức hai giả thuyết:

H1: Môn XS – TK đã hình thành ở sinh viên quy tắc hành động: muốn so sánh độ phân

tán của hai mẫu thì phải so sánh hai phương sai (độ lệch chuẩn) của hai mẫu đó.

H2: Sinh viên không sử dụng mô hình hồi qui với biến giả khi so sánh trung bình của hai

tổng thể.

Sự hiện diện của hai qui tắc này cho thấy quá trình dạy học XS –TK của Đại học kinh tế

TP.HCM vẫn chưa cung cấp đủ kiến thức và kĩ năng cho sinh viên, cụ thể là trong vấn đề so

sánh các mẫu dữ liệu thống kê. Trong khi các kiến thức và kĩ năng đó lại rất cần thiết cho

sinh viên học hai môn chuyên ngành: Kinh tế lượng và Phân tích & đầu tư chứng khoán.

62

Đây chính là sự không nối khớp giữa dạy học XS –TK với dạy học hai môn chuyên ngành

nêu trên.

63

KẾT LUẬN

Nghiên cứu thực hiện trong chương 1, 2, 3 cho phép chúng tôi giải đáp được những câu hỏi

liên quan đến việc dạy học XS – TK ở trường đại học mà chúng tôi đặt ra ở lời mở đầu của

luận văn.

Nghiên cứu về vấn đề so sánh các mẫu dữ liệu thống kê trong các môn Phân tích và

đầu tư chứng khoán và Kinh tế lượng, chúng tôi thấy bài toán so sánh các mẫu dữ liệu thống

kê có tác động đến nhiều vấn đề của ngành kinh tế. Các tổ chức toán học liên quan đến so

sánh các mẫu dữ liệu thống kê có yếu tố công nghệ - lý thuyết toán là: mô hình hàm hồi qui

với biến giả và kỳ vọng, phương sai, độ lệch chuẩn, hệ số biến động.

Phân tích giáo trình XS – TK kết hợp với chương trình dạy học XS – TK ở trường

Đại học Kinh tế TP.HCM, chúng tôi nhận thấy rằng: Thứ nhất, hệ số biến động hoàn toàn

không được đưa vào trong giáo trình, điều đó đồng nghĩa với việc sinh viên thiếu đi một

công cụ để so sánh độ phân tán của hai tổng thể khi có giá trị trung bình khác nhau. Thứ hai,

các mô hình hồi qui không được dạy trong chương trình XS – TK. Điều này khiến cho sinh

viên sau khi học xong môn XS – TK không hề biết xây dựng các hàm mô tả sự phụ thuộc

của các biến với nhau, đặc biệt là không biết sử dụng mô hình hồi qui với biến giả để so

sánh tham sô trung bình của các tổng thể.

Như vậy, hai giáo trình chuyên ngành (Kinh tế lượng, Phân tích và đầu tư chứng

khoán) đã phải bổ sung thêm vào một số khái niệm và công thức liên quan đến hệ số biến

động, mô hình hồi qui hai biến mà đáng lẽ phải được cung cấp ở môn XS – TK. Đây chính

là sự không nối khớp giữa dạy học XS – TK với dạy học Kinh tế lượng và Phân tích và đầu

tư chứng khoán. Sự không nối khớp này đã hình thành ở sinh viên cách ứng xử trước bài

toán so sánh các tham số tổng thể như sau:

H1: Môn XS – TK đã hình thành ở sinh viên quy tắc hành động: muốn so sánh độ phân

tán của hai mẫu thì phải so sánh hai phương sai (độ lệch chuẩn) của hai mẫu đó.

H2: Sinh viên không sử dụng mô hình hồi qui với biến giả khi so sánh trung bình của hai

tổng thể.

Do hạn chế về mặt thời gian nên chúng tôi mới chỉ nghiên cứu sự nối khớp giữa dạy học XS

– TK với dạy học Kinh tế lượng và Phân tích đầu tư chứng khoán. Ngoài hai môn chuyên

64

ngành đó ra còn một số môn chuyên ngành khác mà chúng tôi chưa kịp nghiên cứu. Thêm

vào đó nữa, chúng tôi mới chỉ phân tích trên giáo trình mà chưa đi quan sát giờ dạy của

giảng viên. Đây chính là những hướng mở ra cho các đề tài mới trong tương lai.

65

TÀI LIỆU THAM KHẢO

TIẾNG VIỆT

[1] Lê Thị Hoài Châu – Đào Hồng Nam (2013), Một nghiên cứu về dạy học xác suất trong

đào tạo ngành Y, Báo cáo tại hội thảo Didactic Việt – Pháp 2013.

[2] Tăng Minh Dũng (2009), Dạy học thống kê và vấn đề đào tạo giáo viên, luận văn thạc

sĩ Giáo dục học, Trường Đại học Sư phạm TP.HCM.

[3] Quách Huỳnh Hạnh (2009), Nghiên cứu thực hành giảng dạy thống kê mô tả ở trung học

phổ thông, luận văn thạc sĩ Giáo dục học, Trường Đại học Sư phạm TP.HCM.

[4] Võ Mai Như Hạnh (2012), Sự ngẫu nhiên trong dạy học thống kê ở lớp 10, luận văn thạc

sĩ Giáo dục học, Trường Đại học Sư phạm TP.HCM.

[5] Phạm Thị Tú Hạnh (2012), Các tham số định tâm trong dạy học thống kê ở lớp 10, luận

văn thạc sĩ Giáo dục học, Trường Đại học Sư phạm TP.HCM.

[6] Vũ Như Thư Hương (2005), Khái niệm xác suất trong dạy – học toán ở trung học phổ

thông, luận văn thạc sĩ Giáo dục học, Trường Đại học Sư phạm TP.HCM.

[7] Hoàng Ngọc Nhậm (chủ biên) (2008), Giáo trình kinh tế lượng, Nxb Lao động - Xã hội.

[8] Nguyễn Thị Ngọc Thanh (2012), Bài tập Kinh tế lượng với sự trợ giúp của Eviews,

Trường Đại học Kinh tế TP.HCM.

[9] Đặng Hùng Thắng (2007), Xác suất với thị trường chứng khoán, báo Toán học tuổi trẻ

số 336 (phát hành tháng 12/2007).

[10] Trần Gia Tùng (2009), Giáo trình lý thuyết xác suất và thống kê toán học, Nxb Đại học

Quốc gia TP.Hồ Chí Minh.

[11] Bùi Kim Yến – Thân Thị Thu Thủy (chủ biên) (2009), Phân tích và đầu tư chứng

khoán, Nxb Thống kê.

SONG NGỮ VIỆT-PHÁP

66

[12] Annie Bessot, Claude Comiti, Lê Thị Hoài Châu, Lê Văn Tiến (2009), Những yếu tố cơ

bản của Didactic Toán (Éléments fondamentaux de Didactique des Mathématiques),

Nxb Đại học quốc gia TP.Hồ Chí Minh.

67

PHỤ LỤC

ĐỀ CƯƠNG MÔN KINH TẾ LƯỢNG

Ghi Chuẩn bị Tài liệu đọc Ngày Nội dung giảng dạy

chú của sinh (chương, (Số tiết) (tên chương, phần, phương pháp

viên phần) giảng dạy)

Giáo trình Ngày Khái niệm về Kinh tế lượng

Kinh tế lượng (4 tiết) Chương 1: Mô hình hồi qui hai

– Mở đầu, biên. Các khái niệm cơ bản.

Chương 1

Làm bài tập Chương 2 Ngày Chương 2. Mô hình hồi qui hai

chương 1 biên. Ước lượng và kiểm định giả Từ phần 1 đến (4 tiết)

thiết phần 4.

1- Phương pháp bình phương nhỏ nhất

2- Các giả thiết của phương pháp bình phương nhỏ nhất

3- Phương sai và sai số chuẩn của ước lượng

4- Hệ số xác định và hệ số tương quan.

Làm bài tập Chương 2 Ngày Chương 2. Mô hình hồi qui hai

chương 2 biên. Ước lượng và kiểm định giả Từ phần 5 đến (4 tiết)

thiết Chép phần phần 11

mềm 5- Phân phối xác suất của các ước lượng EViews và 6- Khoảng tin cậy của các hệ các file dữ số hồi qui

68

liệu 7- Kiểm định sự phù hợp của hàm hồi qui.

8- Ứng dụng của phân tích hồi qui, vấn đề dự báo.

Đọc hướng Ngày

dẫn sử dụng (4 tiết) Chương 3. Mở rộng mô hình hồi [1] Chương 3

phần mềm qui hai biến

EViews

Ngày Sử dụng

phần mềm (4 tiết) Chương 4: Mô hình hồi qui bội [1] Chương 4

EViews để

giải các thí

dụ và bài tập

Ngày Sử dụng

phần mềm (4 tiết) Chương 5: Hồi qui với biến giả [1] Chương 5

EViews để

giải các thí

dụ và bài tập

Ngày Thực hành trên phòng máy [2] phần

hướng dẫn sử (4 tiết)

dụng phần

mềm EViews

Giải các bài Ngày Chương 6: Đa cộng tuyến [1] Chương 6

tập chương (4 tiết) Chương 7: Phương sai thay đổi Chương 7 3, 4, 5 Chương 8: Tự tương quan Chương 8

Ngày [1] Chương 9 Giải các bài

69

tập chương (4 tiết) Chương 9: Chọn mô hình và kiểm

6, 7, 8 định việc chọn mô hình

Giải các bài Ngày

tập chương (4 tiết) Thực hành trên phòng máy

9

Ngày - Hệ thống môn học

(5 tiết) - Sửa bài tập

- Giải đáp thắc mắc

Tổng

cộng:

45 tiết

70

PHIẾU THỰC NGHIỆM

71

72

PHIỂU TRẢ LỜI CỦA SINH VIÊN

73

74

75

76

77

78

79

80

81

82

83