BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM TP. HỒ CHÍ MINH
Nguyễn Thùy Liên
VẤN ĐỀ SO SÁNH CÁC MẪU DỮ LIỆU
THỐNG KÊ: SỰ NỐI KHỚP GIỮA DẠY
HỌC XÁC SUẤT THỐNG KÊ VỚI ĐÀO
TẠO CỬ NHÂN KINH TẾ
LUẬN VĂN THẠC SĨ GIÁO DỤC HỌC
Thành phố Hồ Chí Minh – 2013
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM TP. HỒ CHÍ MINH
Nguyễn Thùy Liên
VẤN ĐỀ SO SÁNH CÁC MẪU DỮ LIỆU
THỐNG KÊ: SỰ NỐI KHỚP GIỮA DẠY
HỌC XÁC SUẤT THỐNG KÊ VỚI ĐÀO
TẠO CỬ NHÂN KINH TẾ
Chuyên ngành: Lý luận và phương pháp dạy học bộ môn Toán
Mã số: 60 14 01 11
LUẬN VĂN THẠC SĨ GIÁO DỤC HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS. LÊ THỊ HOÀI CHÂU
Thành phố Hồ Chí Minh – Năm 2013
LỜI CẢM ƠN
Tôi xin gửi lời cảm ơn chân thành nhất, sâu sắc nhất đến các Thầy, Cô Khoa Toán – Tin, lãnh
đạo và các chuyên viên Phòng Sau đại học Trường Đại học Sư phạm thành phố Hồ Chí Minh đã
giúp tôi hoàn thành chương trình học và luận văn này.
Đặc biệt, tôi xin bày tỏ lòng biết ơn sâu sắc đến PGS. TS Lê Thị Hoài Châu. Luận văn này sẽ
không thể hoàn thành nếu không có sự hướng dẫn tận tình của Cô.
Tôi cũng xin trân trọng cám ơn:
- PGS.TS. Annie Bessot, TS. Alain Birebent đã bỏ công từ Pháp sang Việt Nam để góp ý
hướng nghiên cứu đề tài và giải đáp những thắc mắc trong nghiên cứu Didactic Toán cho chúng
tôi.
- Các thành viên trong lớp Didactic Toán khóa 22 đã giúp đỡ tôi trong suốt khóa học.
- Các thầy cô Khoa Toán – Thống kê, khoa Ngân hàng và các bạn sinh viên K38 trường Đại
học Kinh tế TP.HCM đã giúp đỡ tôi rất nhiều trong vấn đề thực nghiệm của luận văn.
Cuối cùng, tôi muốn gửi lời cám ơn tới bố, mẹ và chồng tôi đã luôn động viên, khích lệ tôi
hoàn thành luận văn này.
Nguyễn Thùy Liên
1
MỤC LỤC
LỜI CẢM ƠN .............................................................................................................. 1
MỤC LỤC .................................................................................................................... 2
DANH MỤC CÁC TỪ VIẾT TẮT ............................................................................ 3
MỞ ĐẦU ....................................................................................................................... 4
1. Những ghi nhận ban đầu và câu hỏi xuất phát ............................................................ 4
2. Khung lý thuyết tham chiếu ........................................................................................... 7
3. Phương pháp nghiên cứu ............................................................................................... 9
CHƯƠNG 1: SO SÁNH CÁC MẪU DỮ LIỆU THỐNG KÊ TRONG HAI GIÁO TRÌNH CHUYÊN NGÀNH .......................................................................... 11
1.1. So sánh các mẫu dữ liệu thống kê ............................................................................ 11
1.2. So sánh các mẫu dữ liệu thống kê trong giáo trình chuyên ngành kinh tế .......... 12
1.2.1. Phân tích giáo trình Phân tích và đầu tư chứng khoán .......................................... 13
1.2.2. Phân tích giáo trình Kinh tế lượng ........................................................................ 21
1.3. Tổng kết chương 1 ..................................................................................................... 29
CHƯƠNG 2: SO SÁNH CÁC MẪU DỮ LIỆU THỐNG KÊ TRONG GIÁO TRÌNH XS – TK ........................................................................................................ 31
2.1. Phân tích GT3 ............................................................................................................ 34
2.1.1. Kỳ vọng, phương sai, độ lệch chuẩn của ĐLNN .................................................. 34
2.1.2. Giá trị trung bình, phương sai của tổng thể và mẫu .............................................. 41
2.1.3. Hàm hồi qui ........................................................................................................... 43
2.1.4. Các tổ chức toán học liên quan đến so sánh các mẫu dữ liệu thống kê ................ 43
2.2. Tổng kết chương 2 ..................................................................................................... 48
CHƯƠNG 3: NGHIÊN CỨU THỰC NGHIỆM .................................................... 51
3.1. Thực nghiệm ............................................................................................................... 51
3.2. Phân tích tiên nghiệm ................................................................................................ 54
3.3. Phân tích hậu nghiệm ................................................................................................ 59
KẾT LUẬN ................................................................................................................ 64
TÀI LIỆU THAM KHẢO ........................................................................................ 66
PHỤ LỤC ................................................................................................................... 68
2
DANH MỤC CÁC TỪ VIẾT TẮT
Từ viết tắt Từ đầy đủ
XS – TK Xác suất – Thống kê
ĐLNN Đại lượng ngẫu nhiên
GT1 Giáo trình Phân tích và đầu tư chứng khoán
GT2 Giáo trình Kinh tế lượng
GT3 Giáo trình Xác suất - Thống kê
3
MỞ ĐẦU
1. Những ghi nhận ban đầu và câu hỏi xuất phát
Xác suất – Thống kê (XS – TK) là một khoa học nghiên cứu các đại lượng ngẫu nhiên
nên đóng vai trò quan trọng trong hầu hết mọi lĩnh vực của thế giới hiện đại, từ khoa học,
công nghệ, đến kinh tế, chính trị,…Khoa học này trang bị cho chúng ta công cụ để tìm ra
qui luật của những hiện tượng liên quan đến một tập hợp đông đảo các đối tượng mà ta chỉ
có thể tiếp cận một bộ phận của nó (gọi là mẫu thống kê). Chính vì vậy mà XS – TK là môn
học bắt buộc đối với sinh viên của tất cả các trường đại học, cao đẳng và hầu hết các trường
đào tạo nghề trên cả nước. Nhiệm vụ của môn học này là cung cấp cho sinh viên những kiến
thức liên quan đến XS – TK cũng như tạo cơ sở cho sinh viên học các bộ môn chuyên
ngành khác.
Tuy nhiên, trong nghiên cứu của nhóm tác giả Lê Thị Hoài Châu - Đào Hồng Nam:
“Một nghiên cứu về dạy học xác suất trong đào tạo ngành Y”, các tác giả đã chỉ ra sự “thiếu
sót” của chương trình dạy XS – TK trong các trường đào tạo ngành Y. Nội dung chính của
nghiên cứu trên bàn về việc dạy toán trong đào tạo ngành Y với nội dung xoay quanh mô
hình ngưỡng P-K, một mô hình cho phép các bác sĩ quyết định xem bệnh nhân không cần
điều trị, hay cần làm xét nghiệm, hay phải điều trị ngay. Qua phân tích những kiểu nhiệm vụ
liên quan đến mô hình ngưỡng được xem xét trong giáo trình XS – TK sử dụng ở trường
“Kỹ thuật toán học cho phép giảm thiểu yếu tố chủ quan trong chẩn bệnh đã không được đưa
vào trong giáo trình. Hệ quả là sinh viên thiếu những kỹ thuật thỏa đáng để chẩn đoán và điều
trị cho bệnh nhân tương lai của họ” (Lê Thị Hoài Châu - Đào Hồng Nam (2013))
Đại học Y-Dược thành phố Hồ Chí Minh, các tác giả nhận thấy:
Như vậy rõ ràng rằng, việc dạy học XS – TK trong trường đào tạo Y chưa thực sự cung cấp
đủ các công cụ toán cho hoạt động nghề nghiệp của các bác sĩ tương lai.
Chính từ những kết quả nghiên cứu của nhóm tác giả Lê Thị Hoài Châu - Đào Hồng Nam,
chúng tôi đặt ra câu hỏi: Liệu trong các trường đào tạo nghề khác, chẳng hạn như trường
đào tạo kinh tế, thì XS – TK có cung cấp đủ kiến thức cho các môn chuyên ngành sử
dụng hay không?
4
Xuất phát từ câu hỏi này, chúng tôi đã tìm hiểu về việc dạy XS – TK trong các trường đào
tạo kinh tế. Đối với các sinh viên ngành kinh tế, XS – TK thực sự là một công cụ nghiên
cứu rất hữu hiệu, giúp xử lý các thông tin kinh tế xã hội nhằm đưa ra các quyết định và dự
báo đúng đắn, hợp lý. Không những vậy, XS – TK còn cung cấp nền tảng khoa học cho sinh
viên học các môn chuyên ngành. Vì vậy, nếu xem xét giáo trình của nhiều môn học chuyên
ngành kinh tế thì chúng ta sẽ thấy phương pháp và công cụ TK đã được vận dụng đan xen
trong một số nội dung của những môn học này.
Chẳng hạn, trong môn Phân tích và đầu tư chứng khoán, mức độ phân tán của lợi nhuận của
một chứng khoán chính là mức độ rủi ro của chứng khoán đó. Việc xem xét mức độ rủi ro
của các chứng khoán có ý nghĩa rất quan trọng, giúp người đầu tư có thể đưa ra quyết định
có lợi nhất. Chính vì vậy, để học tốt môn học này, sinh viên cần phải nắm bắt được khái
niệm về tham số đo độ phân tán của tổng thể và cách so sánh độ phân tán của hai tổng thể
ngay từ khi học môn XS – TK.
Chúng tôi đã tiến hành khảo sát trên 118 sinh viên năm thứ hai Đại học Kinh tế TP.HCM.
Những sinh viên này đã học xong chương trình XS – TK và chuẩn bị thi phân ngành. Câu
hỏi khảo sát của chúng tôi như sau:
Bài 1: Một công ty sử dụng hai công nghệ khác nhau A và B để sản xuất. Nhằm kiểm
tra xem công nghệ nào cho sản lượng ổn định hơn, người ta ghi lại khối lượng sản
phẩm (tấn) sản xuất ra sau mỗi ngày (khi sử dụng từng công nghệ trên) trong 60
ngày. Số liệu thu được như sau:
35 36 37 38 39 40 41 42 43 Sản lượng (tấn) khi sử dụng công nghệ A
1 2 7 6 8 12 14 9 1 Số ngày có cùng sản lượng
26 27 28 29 30 31 32 33 Sản lượng (tấn) khi sử dụng công nghệ B
1 4 16 13 12 5 7 2 Số ngày có cùng sản lượng
5
Theo bạn, sản xuất theo công nghệ nào cho năng suất ổn định hơn? Giải thích cho
kết luận của bạn.
Thực chất, yêu cầu của bài toán chính là so sánh độ phân tán của hai tổng thể: tổng thể sản
lượng (thu được mỗi ngày) khi sử dụng công nghệ A và tổng thể sản lượng (thu được mỗi
ngày) khi sử dụng công nghệ B. Trong bài toán này chúng tôi đã cố ý chọn số liệu sao cho
giá trị năng suất trung bình của công nghệ A lớn hơn năng suất trung bình công nghệ B và
phương sai của công nghệ A lớn hơn phương sai của công nghệ B nhưng hệ số biến động
của công nghệ A lại nhỏ hơn hệ số biến động của công nghệ B. Như vậy, công nghệ A cho
năng suất ổn định hơn.
Tuy nhiên, kết quả khảo sát được thống kê trong bảng 1 khiến chúng tôi rất bất ngờ.
Chiến S1a S1b S1c S1d Không
trả lời lược
Số sinh 72 30 0 5 11
viên
Tỉ lệ 61,02% 25,42% 0% 4,24% 9,32%
Bảng 1. TK câu trả lời cho bài toán 1
Trong bảng 1, S1a là chiến lược giải sử dụng so sánh hai phương sai, cách giải này đưa ra
đáp án sai: “công nghệ B cho năng suất ổn định hơn”. Trong khi đó, chiến lược giải cho đáp
án đúng là S1c và S1b thì có rất ít hoặc không có sinh viên nào sử dụng. Từ kết quả điều tra
ban đầu này, chúng tôi thu hẹp câu hỏi nghiên cứu lại như sau: Môn SX – TK dạy ở Đại học
Kinh tế TP.HCM đã cung cấp đủ kiến thức cho sinh viên để học có thể giải quyết các vấn
đề của thực tiễn hay của chuyên ngành liên quan đến vấn đề so sánh các tham số của hai
hay nhiều tổng thể chưa?
Từ những băn khoăn và nghi vấn trên, chúng tôi quyết định chọn đề tài: Vấn đề so sánh các
mẫu dữ liệu thống kê: Sự nối khớp giữa dạy học XS – TK với đào tạo cử nhân kinh tế.
Trong khuôn khổ một luận văn thạc sỹ, chúng tôi giới hạn phạm vi nghiên cứu trên hai
phương diện. Về phương diện các chuyên ngành kinh tế chúng tôi chọn môn Kinh tế lượng
và môn Phân tích và đầu tư chứng khoán để nghiên cứu. Về phương diện khoa học XS - TK
6
chúng tôi chọn đối tượng tri thức là “so sánh các mẫu dữ liệu TK”. Ở đây, thuật ngữ “ so
sánh các mẫu dữ liệu TK” được chúng tôi dùng theo nghĩa dự đoán về so sánh các tham số
của các tổng thể dựa trên mẫu dữ liệu TK. Những nghiên cứu của chúng tôi chỉ gói gọn
trong phạm vi của thống kê mô tả mà không đi sâu vào thống kê suy diễn.
Trong nghiên cứu của mình, chúng tôi sẽ tìm câu trả lời cho các câu hỏi sau:
Q1: Trong hai giáo trình chuyên ngành kinh tế, so sánh các mẫu dữ liệu thống kê
nhằm giải quyết những vấn đề gì? Phương pháp giải quyết như thế nào? Khái niệm, lý
thuyết toán nào giải thích cho những phương pháp ấy?
Q2: Giáo trình XS – TK chuẩn bị cho sinh viên ra sao để sinh viên có thể giải
quyết tốt những vấn đề liên quan đến so sánh các mẫu dữ liệu TK mà hai giáo trình
chuyên ngành đã đề cập tới?
Q3: Có sự chênh lệch nào giữa những khái niệm, lý thuyết toán cần thiết cho
chuyên ngành và những nội dung được dạy trong XS-TK không? Nếu có thì sự khôngnối
khớp đó ảnh hưởng đến sinh viên như thế nào?
2. Khung lý thuyết tham chiếu
Để tìm câu trả lời cho những câu hỏi trên, chúng tôi sẽ đặt nghiên cứu của mình trong phạm
vi của lý thuyết didactic toán, cụ thể là thuyết nhân học, khái niệm hợp đồng didactic, khái
niệm qui tắc hành động. Sau đây, chúng tôi sẽ chỉ ra sự lựa chọn của mình là hoàn toàn hợp
lý.
2.1. Thuyết nhân học
2.1.1. Quan hệ thể chế đối với một đối tượng tri thức
“Một tri thức không tồn tại “lơ lửng” trong một khoảng rỗng: mỗi tri thức đều xuất hiện ở
một thời điểm nhất định, trong một xã hội nhất định, như là được cắm sâu vào một hoặc nhiều
thể chế.”
Theo Chevallard (1989):
Chevallard đã dùng thuật ngữ quan hệ thể chế I với tri thức O, ký hiệu R(I,O), để chỉ tập
hợp các mối ràng buộc mà thể chế I có với tri thức O. R(I,O) cho biết O xuất hiện ở đâu,
bằng cách nào, tồn tại ra sao, đóng vai trò gì trong I, ….
7
Trong nghiên cứu của chúng tôi, đối tượng O ở đây là tri thức “so sánh các mẫu dữ liệu
thống kê”, còn thể chế I mà chúng tôi quan tâm là thể chế dạy học các môn Kinh tế lượng,
Phân tích và đầu tư chứng khoán và Xác suất –Thống kê. Việc nghiên cứu R(I,O) sẽ giúp
chúng tôi hiểu rõ hơn những mối ràng buộc mà thể chế mang lại cho đối tượng tri thức O.
Như vậy, nghiên cứu R(I,O) sẽ giúp chúng tôi trả lời câu hỏi Q1 và Q2.
2.1.2. Quan hệ cá nhân đối với một đối tượng tri thức
Một đối tượng là một cái gì đó tồn tại ít nhất đối với một cá nhân. Quan hệ cá nhân của một
cá nhân X với một đối tượng tri thức O, ký hiệu R(X, O), là tập hợp những tác động qua lại
mà X có thể có với O. R(X, O) cho biết X nghĩ gì về O, X hiểu như thế nào O, X có thể thao
tác O ra sao.
Như vậy nghiên cứu R(X,O) sẽ giúp chúng tôi trả lời phần nào câu hỏi Q3. Ở đây O vẫn là
đối tượng tri thức “so sánh các mẫu dữ liệu thống kê” còn X là sinh viên.
2.1.3. Praxéologie
Vấn đề đặt ra là làm thế nào để vạch rõ quan hệ thể chế R(I,O) ?
Hoạt động nghiên cứu, dạy và học là một bộ phận của hoạt động xã hội. Do đó, cũng cần
thiết xây dựng một mô hình cho phép mô tả và nghiên cứu thực tế đó. Xuất phát từ quan
điểm này mà Chevallard (1998) đã đưa vào khái niệm praxéologie. Khái niệm chính là “chìa
khóa” giúp chúng ta làm rõ mối quan hệ I thể chế với tri thức O.
Theo Chavallard, mỗi praxéologie là một bộ gồm 4 thành phần [T,τ,θ, Θ ], trong đó : T là
một kiểu nhiệm vụ; τ là kỹ thuật cho phép giải quyết T; θ là công nghệ giải thích cho kỹ
thuật τ; Θ là lí thuyết giải thích cho θ.
Nếu T là một kiểu nhiệm vụ toán học, thì praxéologie được gọi mà một tổ chức toán học và
viết là OM. Trong trường hợp này, khối công nghệ - lí thuyết chỉ bao gồm những tri thức
toán học.
Việc xác định các praxéologie gắn với đối tượng O sẽ cho phép chúng tôi: vạch rõ các quan
hệ thể chế R (I,O), đồng thời tìm ra sự chênh lệch nếu có giữa những praxéologie cần dạy và
được dạy. Từ đó, chúng tôi sẽ tìm được câu trả lời cho Q1, Q2 và một phần Q3.
2.2. Khái niệm qui tắc hành động và hợp đồng dạy học
8
Để làm rõ những qui tắc ứng xử của học sinh đối với đối tượng tri thức “so sánh các mẫu dữ
“Một qui tắc hành động là một mô hình được xây dựng nhằm giải thích và chỉ rõ những kiến
thức mà học sinh đã sử dụng để đưa ra câu trả lời khi thực hiện một nhiệm vụ xác định.”
(Bessot và các tác giả (2009), tr.81)
“Ta nói hợp đồng dạy học là tập hợp những qui tắc phân chia và hạn chế trách nhiệm của mỗi
bên, học sinh và giáo viên, đối với mỗi tri thức toán được giảng dạy.” (Bessot và các tác giả
(2009), tr.81)
liệu thống kê”, chúng tôi sử dụng khái niệm qui tắc hành động và hợp đồng dạy học:
Chính vì khái niệm hợp đồng và khái niệm qui tắc hành động cho phép ta “giải mã” các ứng
xử của sinh viên và tìm ra ý nghĩa thực sự của những hoạt động mà họ tiến hành nên chúng
tôi cho rằng cần thiết phải làm rõ các quy tắc hành động hay quy tắc của hợp đồng (nếu có) liên
quan đến so sánh các mẫu dữ liệu thống kê để trả lời cho những câu hỏi Q3 mà chúng tôi đưa
ra.
3. Phương pháp nghiên cứu
Để tìm câu trả lời thỏa đáng cho những câu hỏi đã đặt ra, chúng tôi xác định phương pháp
nghiên cứu như sau:
- Đối với câu hỏi Q1: Chúng tôi sẽ tham khảo hai giáo trình chuyên ngành được sử dụng
trong các trường đào tạo cử nhân kinh tế nhằm tìm hiểu xem những vấn đề nào làm nảy sinh
nhu cầu so sánh các mẫu dữ liệu thống kê. Đồng thời, chúng tôi cũng chỉ ra các praxéologie
có liên quan đến so sánh các mẫu dữ liệu thống kê, nghiên cứu các kĩ thuật giải quyết cũng
như công nghệ và lý thuyết giải thích cho kĩ thuật đó, trong đó chúng tôi chú ý đến các yếu
tố công nghệ thuộc về toán học. Các praxeologie này sẽ giúp chúng tôi hiểu rõ hơn mối
quan hệ thể chế (thể chế dạy học Phân tích và đầu tư chứng khoán và thể chế dạy học Kinh
tế lượng) với đối tượng tri thức so sánh các mẫu dữ liệu thống kê. Toàn bộ phần nghiên cứu
này sẽ được trình bày trong chương 1 của luận văn.
- Tiếp theo, để trả lời cho câu hỏi Q2, chúng tôi sẽ tiến hành phân tích giáo trình XS – TK
để xem xét những đối tượng toán học liên quan đến các tổ chức toán học tìm được ở Q1
được trình bày như thế nào? Xoay quanh các đối tượng đó, có các praxéologie nào?
9
Từ đó chúng tôi sẽ so sánh những gì nghiên cứu được ở Q1 và Q2 để tìm ra câu trả lời cho
Q3.
10
CHƯƠNG 1: SO SÁNH CÁC MẪU DỮ LIỆU THỐNG KÊ TRONG
HAI GIÁO TRÌNH CHUYÊN NGÀNH
Nội dung chính của chương 1 xoay quanh vấn đề “so sánh các mẫu dữ liệu thống kê” được
trình bày trong hai giáo trình chuyên ngành kinh tế. Những phân tích thể chế dạy học hai
môn chuyên ngành này sẽ giúp chúng tôi trả lời câu hỏi Q1:
Q1: Trong hai giáo trình chuyên ngành kinh tế, so sánh các mẫu dữ liệu thống kê
nhằm giải quyết những vấn đề gì? Phương pháp giải quyết như thế nào? Khái niệm, lý
thuyết toán nào giải thích cho những phương pháp ấy?
1.1. So sánh các mẫu dữ liệu thống kê
“So sánh các mẫu dữ liệu thống kê” là thuật ngữ viết tắt chúng tôi dùng để chỉ việc so sánh
tham số của các tổng thể khác nhau dựa trên những mẫu thu được.
Việc so sánh tham số của các tổng thể giúp người ta đưa ra những đánh giá về những tổng
thể đó và từ đó có thể đưa ra được kế hoạch phù hợp cho công việc của họ.
Chẳng hạn một công ty muốn mở thêm chi nhánh kinh doanh. Công ty này đi khảo sát thị
trường tại hai khu vực A và B về mức thu nhập của người dân. Tại khu vực A họ thu được
mẫu A1, tại khu vực B họ thu được mẫu B1. Từ hai mẫu này họ xem xét, đưa ra đánh giá về
thu nhập bình quân của hai khu vực A và B xem bên nào cao hơn, sau đó kiểm định lại kết
quả. Khi đã có được kết luận với độ tin cậy cao, công ty sẽ đưa ra quyết định phù hợp là mở
chi nhánh tại khu vực A hay B.
Trên thực tế, chúng ta có thể thấy việc sử dụng tham số trung bình của các tổng thể để so
sánh được sử dụng rất phổ biến như: so sánh nhiệt độ trung bình, lượng mưa trung bình giữa
các vùng; so sánh lương trung bình của công nhân giữa các công xưởng; so sánh năng suất
cây trồng giữa các vùng,…Tuy nhiên số trung bình không phải là tham số duy nhất của tổng
thể mà ngoài ra còn có những tham số khác như số trung vị, mốt, phương sai, độ lệch chuẩn,
độ lệch tuyệt đối trung bình,…Các tham số này đều có tác dụng giúp người ta đánh giá tốt
hơn về các tổng thể.
11
1.2. So sánh các mẫu dữ liệu thống kê trong giáo trình chuyên ngành kinh tế
Để trả lời cho câu hỏi Q1, chúng tôi sẽ chọn ra một số giáo trình chuyên ngành hoặc cơ sở
ngành có ứng dụng nhiều công cụ và kiến thức của XS –TK để phân tích. Bởi nếu chọn một
giáo trình hoàn toàn không liên quan gì tới XS – TK để phân tích thì kết quả có được sẽ
không có giá trị. Thông qua tìm hiểu các giáo trình của trường Đại học Kinh tế TP.HCM
cũng như tham khảo ý kiến của một số giảng viên, chúng tôi đã tìm ra một số giáo trình thỏa
mãn yêu cầu. Tuy nhiên do thời gian nghiên cứu có hạn, không cho phép phân tích hết
những giáo trình tìm được nên chúng tôi quyết định chọn ra hai giáo trình sau để phân tích:
- Phân tích và đầu tư chứng khoán
- Giáo trình Kinh tế lượng
“Kinh tế lượng cung cấp các phương pháp phân tích về mặt lượng mối quan hệ giữa các chỉ
tiêu kinh tế cùng với sự tác động qua lại giữa chúng dựa trên cơ sở các số liệu thu thập từ
thực tế nhằm củng cố thêm các giả thiết kinh tế từ đó đưa ra các quyết định đúng đắn hơn”
Chúng tôi xin trích dẫn một số nhận xét về hai bộ môn này:
“Dù rằng thị trường chứng khoán là một đối tượng hết sức phức tạp, diễn biến tăng giảm
của nó rất khó dự báo. Nhưng các nhà kinh tế cùng với các nhà toán học đã cố gắng sử
dụng các công cụ của toán học, đặc biệt là các công cụ của Xác suất – Thống kê để mô hình
hóa thị trường chứng khoán. Việc áp dụng các mô hình đó giúp các nhà đầu tư tối đa hóa
các cơ hội đạt lợi nhuận và tối thiểu hóa các nguy cơ rủi ro” (Đặng Hùng Thắng (2007))
(Hoàng Ngọc Nhậm (2008), tr. 3)
Ý kiến trên cho thấy mối liên hệ mật thiết giữa XS-TK với hai môn chuyên ngành kinh tế.
Do đó, chúng tôi mong đợi sẽ tìm thấy những vấn đề làm nảy sinh nhu cầu so sánh các mẫu
dữ liệu thống kê, trong hai giáo trình được sử dụng trong dạy học hai môn chuyên ngành mà
chúng tôi quan tâm. Đồng thời, chúng tôi sẽ chỉ ra những praxéologie có liên quan nhằm
hiểu rõ hơn mối quan hệ thể chế đối với tri thức so sánh các mẫu dữ liệu thống kê: tri thức
so sánh các mẫu dữ liệu thống kê tồn tại như thế nào, có vai trò gì, chịu những ràng buộc
nào của thể chế? Từ đó, chúng tôi sẽ tìm được những “yếu tố” toán thống kê mà thể chế dạy
học hai môn chuyên ngành đưa ra để giải quyết các vấn đề liên quan đến so sánh các mẫu
dữ liệu thống kê. Đó cũng chính là những “yếu tố” toán cần thiết phải được cung cấp trong
môn học XS – TK.
12
Để trả lời câu hỏi Q1 đã đặt ra, chúng tôi sẽ cố gắng tìm câu trả lời cho các câu hỏi sau:
- So sánh các mẫu dữ liệu thống kê được sử dụng trong những vấn đề nào?
- Có những praxéologie nào liên quan đến so sánh các mẫu dữ liệu TK? Kĩ thuật
giải quyết chúng là gì? Yếu tố công nghệ và lý thuyết nào giải thích cho kĩ thuật
đó?
1.2.1. Phân tích giáo trình Phân tích và đầu tư chứng khoán
Trong phần này chúng tôi sẽ tham khảo tài liệu sau:
[1] Bùi Kim Yến – Thân Thị Thu Thủy (2009), Phân tích và đầu tư chứng khoán, Nxb
Thống kê.
Đây là giáo trình được sử dụng trong trường đại học kinh tế TP.HCM. Để thuận tiện cho
việc trình bày, chúng tôi sẽ ký hiệu giáo trình này là GT1.
Trong giáo trình này, chúng tôi tập trung vào chương II: Mức sinh lời và rủi ro trong đầu
tư chứng khoán. Trong chương này, các vấn đề chính đều xoay quanh việc sử dụng tham số
của đại lượng ngẫu nhiên (ĐLNN) cũng như so sánh các tham số này để tìm câu trả lời cho
những câu hỏi có liên quan đến đầu tư chứng khoán.
Đối với một thị trường đầu tư phức tạp và đầy biến động như thị trường chứng khoán, các
nhà phân tích phải nắm được những kiến thức cơ bản về lợi nhuận và rủi ro. Chương này
cung cấp cho sinh viên các vấn đề xoay quanh mức sinh lời và rủi ro, đưa ra cách tính mức
sinh lời, cách tính và đánh giá độ rủi ro của dự án.
Trong mỗi dự án đầu tư chứng khoán, người ta thường phải dự đoán trước lợi nhuận, tức là
ước lượng xem đầu tư vào dự án đó sẽ mang lại lợi nhuận là bao nhiêu phần trăm trên 1
đồng vốn đầu tư. Khi đó, nhà phân tích sẽ phải tìm ra các mức sinh
1 của mỗi loại chứng khoán - bao gồm lợi nhuận từ cổ tức và chênh lệch giữa giá bán, giá
lời0F
mua chứng khoán, cũng như xác suất của mỗi mức sinh lời để từ đó tính ra mức sinh lời kỳ
1 Mức sinh lời: bao gồm lợi nhuận từ cổ tức và chênh lệch giữa giá bán, giá mua chứng khoán. Còn tỷ lệ lợi tức năm là cách xác định mức sinh lời theo tỷ lệ phần trăm. Nó cho biết lợi nhuận thu được trên mỗi đồng đầu tư.
vọng. Chính mức sinh lời kỳ vọng là lợi nhuận mà người ta dự tính sẽ thu được:
13
“Các dự án đầu tư khác nhau sẽ có mức sinh lời kỳ vọng khác nhau. Chúng khác nhau vì hiệu
quả kinh tế của từng dự án cụ thể, cũng như môi trường đầu tư. Trong tương lai không thể
biết chắc được nền kinh tế sẽ như thế nào, nên các nhà phân tích sẽ tìm ra một xác suất để xảy
ra một tình trạng kinh tế nào đó.
Mức sinh lời kỳ vọng dựa trên xác suất của từng tình trạng kinh doanh.
k
i
= ∑ Pk i
Trong đó: ki: mức sinh lời; pi: xác suất xảy ra” (GT1, tr.58)
“là khả năng mức sinh lời thực tế nhận được trong tương lai có thể khác với dự tính ban đầu.
Độ dao động của lợi suất đầu tư1F
2 càng cao thì rủi ro càng cao” (GT1, tr.49)
Trong khi đó, rủi ro:
“Để đo lường rủi ro trong mức sinh lời của một loại chứng khoán, đó là tính toán mức dao
động trong mức sinh lời bằng cách sử dụng thước đo phương sai (variance) và độ lệch chuẩn
(standard deviation)” (GT1, tr.60)
“Một cách đo lường mức độ rủi ro của các phương án khác nữa, là dùng hệ số biến động.
Hệ số biến động được tính bằng cách lấy độ lệch tiêu chuẩn chia cho lãi suất mong đợi của
phương án đầu tư.
CV =
” (GT1, tr.63)
δ k
Mức độ rủi ro của dự án được đo bằng phương sai, độ lệch chuẩn hoặc hệ số biến động:
+
)
(
D 1
=
([1], tr. 45)
r
− P P 0 1 P 0
Trong đó r là mức sinh lời tính theo %, P0 là giá cổ phiểu đầu năm, P1 là giá cổ phiểu cuối năm, D1 là giá cổ tức trả
trong năm.
2 Lợi suất đầu tư: Là phần trăm (%) chênh lệch giữa thu nhập từ chứng khoán có được sau một khoảng thời gian
(thường là một năm) và khoản vốn đầu tư ban đầu. Lợi suất của chứng khoán bắt nguồn từ hai nguồn thu nhập:
- Lãi định kỳ (cổ tức, trái tức)
- Lãi vốn (chênh lệch giá bán và giá mua)
Các tác giả giải thích việc sử dụng hệ số biến động để đo lường rủi ro như sau:
14
“Hệ số biến động chỉ mức độ rủi ro trên một đơn vị của lợi tức, nó cung cấp sự so sánh
chính xác hơn trong trường hợp lãi suất mong đợi của hai phương án không như nhau.”
(GT1, tr.63)
Phương sai, độ lệch chuẩn và hệ số biến động đều là những tham số mô tả mức độ phân tán
của các giá trị của một đại lượng ngẫu nhiên (tổng thể) quanh kỳ vọng (giá trị trung bình).
Như vậy phương sai, độ lệch chuẩn hay hệ số biến động của các phương án đầu tư chứng
khoán phản ánh mức độ phân tán của những giá trị lợi nhuận quanh lợi nhuận kỳ vọng. Mức
độ phân tán này cho chúng ta biết mức độ chênh lệch có thể có giữa lợi nhuận thực tế với lợi
nhuận mong đợi (lợi nhuận kỳ vọng). Cũng vì vậy mà những tham số này được sử dụng để
đo mức độ rủi ro của các phương án đầu tư chứng khoán.
Để sinh viên hiểu rõ hơn về lợi nhuận và rủi ro, tác giả lấy hai ví dụ minh họa. Đặc biệt, hai
ví dụ này có liên quan đến việc đánh giá rủi ro của các phương án đầu tư chứng khoán. Việc
đánh giá rủi ro thực sự rất cần thiết đối với mỗi nhà đầu tư. Vì vậy, tác giả rất chú trọng tới
vấn đề này trong giáo trình.
Với ví dụ trang 58 của GT1, chúng tôi thấy xuất hiện một vấn đề liên quan đến so sánh các
“Ví dụ: Công ty Bưu Chính Viễn Thông hiện đang sử dụng mạng lưới “điện thoại tiêu
chuẩn”. Công ty đang nghiên cứu một đề án mạng lưới “điện thoại kiểu mới”. Các chuyên
viên tiếp thị của công ty cho rằng việc sử dụng mạng lưới mới sẽ mang lại lợi nhuận cao hơn
trong các thời kỳ cao điểm và trung bình, nhưng trong thời kỳ khó khăn, khách hàng sẽ tiêu
thụ ít hơn và mạng lưới mới dự đoán sẽ không mang lại lợi nhuận. Trước khi quyết định đầu
tư, các nhà nghiên cứu thị trường của công ty cần xác định rủi ro và lợi nhuận của hai phương
án trên.
tham số của hai tổng thể:
Tình trạng kinh tế
Tỷ lệ xảy ra tình trạng kinh tế
Suất lợi nhuận ở mỗi tình trạng kinh tế
Phương án kiểu mới
15
Phát đạt
0,3
100%
Bình thường
0,4
15%
Khó khăn
0,3
-70%
--------
1,0
Tình trạng kinh tế
Suất lợi nhuận ở mỗi tình trạng kinh tế
Tỷ lệ xảy ra tình trạng kinh tế
20%
0,3
Phát đạt
15%
0,4
Bình thường
10%
0,3
Khó khăn
--------
1,0
(GT1, tr.59)
Phương án tiêu chuẩn
Trước khi đưa ra lời giải thì các tác giả nhắc lại công thức tính lợi nhuận kỳ vọng, hay lãi
“Pi là khả năng xảy ra (xác suất) của các tình trạn kinh tế
ki là suất lợi nhuận dự đoán cho từng thời kỳ kinh tế.
Thì k là tỷ lệ lãi suất mong đợi (trung bình).
n
k
Pk i
i
= ∑ ” (GT1, tr.60)
i
= 1
suất mong đợi (lãi suất trung bình):
“Đối với phương án mạng lưới điện thoại mới:
+
+
P k 3 3
P k 2 2
+
+
−
= k Pk 1 1 = 0,3(100%) 0, 4(15%) 0,3( 70%) = 15%
Đối với phương án mạng lưới điện thoại tiêu chuẩn:
Sau đó, lợi nhuận mong đợi của hai phương án được tính như sau:
16
+
+
=k
20(3.0
15(4.0%)
10(3.0%)
%)
= 15%” (GT1, tr.60)
Chúng ta có thể thấy k của hai phương án tính ra đều bằng nhau nên lợi nhuận mong đợi
của hai phương án là như nhau.
Sau khi tính lợi nhuận kỳ vọng của hai phương án, tác giả nhắc lại cách tính phương sai, độ
“- Tính tỷ suất lãi mong đợi ( k ) […]
- Tính độ lệch giữa lãi suất của từng trường hợp và tỷ suất lãi mong đợi.
- Độ lệch i = ki – k
- Bình phương độ lệch I và nhân với từng xác suất xảy ra từng tình trạng kinh tế. Tính tổng số của chúng. Tổng này là phương sai của dự án (variance) bằng
2δ :
n
2
−
×
2δ
k
Phương sai:
( k
)
i
P i
= ∑
i
=1
- Tìm độ lệch tiêu chuẩn bằng căn bậc hai của
2δ :
n
2
×
−
δ
Độ lệch tiêu chuẩn:
” (GT1, tr.61)
k
( k
)
i
P i
= ∑
i
=1
lệch chuẩn cho sinh viên:
Với các bước tính độ lệch chuẩn nêu ra ở trên, độ lệch chuẩn của từng dự án được tính dưới
“Mạng lưới điện thoại mới:
ki – k
(ki – k )
(ki – k )2Pi
100 – 15
(85)
(7725)(0,3)=2167,5
15 – 15
0
0.(0,4) = 0
-70 – 15
( - 85)
(7725)(0,3)=2167,5
2δ
sai
Phương =4435,0
dạng bảng như sau:
Độ lệch tiêu chuẩn:
**Mạng lưới điện thoại tiêu chuẩn:
ki – k
(ki – k)
(ki – k)2Pi
δ = 65,84%
17
20 – 15
(5)
(25)(0,3) = 7,5
15 – 15
0
0.(0,4) = 0
10 – 15
(25)(0,3)= 7,5
( - 5)
Phương sai
2δ =15,0
δ =
Độ lệch tiêu chuẩn:
” (GT1, tr.62)
3,87%
“Phương án mạng lưới tiêu chuẩn với độ lệch tiêu chuẩn 3,87% nhỏ hơn nhiều so với độ lệch
tiêu chuẩn của phương án đầu tư mới 65,84%. Điều đó dẫn đến khả năng rủi ro của phương án
mạng lưới tiêu chuẩn thấp hơn so với phương án mới, và có thể nói phương án mạng lưới tiêu
chuẩn là rất ít có rủi ro” (GT1, tr.62)
Từ những kết quả tính toán lợi nhuận kỳ vọng và độ lệch chuẩn, tác giả kết luận:
Nhận xét về ví dụ trên:
- Lãi suất mong đợi được tính theo lợi nhuận kỳ vọng. Mức độ rủi ro được tính theo độ
lệch chuẩn.
- Với lãi suất mong đợi bằng nhau, thì để xem phương án nào rủi ro hơn, tác giả so sánh
các độ lệch chuẩn với nhau. Phương án nào có độ lệch chuẩn càng thấp thì độ rủi ro càng
ít và ngược lại. Thực chất bài toán này chính là bài toán so sánh mức độ phân tán của hai
ĐLNN. Khi hai ĐLNN có kỳ vọng bằng nhau thì ĐLNN nào có phương sai (độ lệch
chuẩn) lớn hơn sẽ có độ phân tán các giá trị quanh kỳ vọng lớn hơn.
Trong ví dụ trên, hai phương án đầu tư có lợi nhuận kỳ vọng bằng nhau, tác giả so sánh hai
độ lệch chuẩn để kết luận về độ rủi ro của hai phương án. Vậy đối với hai phương án mà lợi
nhuận kỳ vọng khác nhau thì sao? Trong trường hợp này thì việc so sánh hai độ lệch chuẩn
“Sau đây chúng ta xét đến 2 dự án đầu tư khác A và B, cả 2 có lãi suất mong đợi khác nhau và
độ lệch tiêu chuẩn cũng khác nhau.
không còn phù hợp nữa, người ta phải sử dụng đến hệ số biến động CV:
Phương án A
Phương án B
Tỷ suất lãi mong đợi
45%
20%
Độ lệch tiêu chuẩn
15%
10%
và ta chọn phương án B là hoàn toàn không
Nếu nhìn vào độ lệch tiêu chuẩn
δ δ< A
B chính xác vì tỷ suất lãi mong đợi của phương án A lớn hơn phương án B.
Hợp lý hơn ta tính hệ số biến động (CV)
18
=
0,33
15% 45%
=
0,50
10% 20%
CVA=
Tính trên 1% lãi suất mong đợi, hệ số biến động của phương án B lớn hơn. Điều đó có nghĩa
mặc dù phương án A có độ lệch chuẩn rộng hơn nhưng thực sự phương án B lại mang nhiều
tính rủi ro hơn” (GT1, tr.64)
CVB=
Đối với các dự án có mức sinh lời khác nhau thì người ta phải sử dụng tới hệ số biến động
để đo mức độ rủi ro trên 1 % lãi suất mong đợi. Ví dụ trên thực chất là một bài tập so sánh
độ phân tán của hai đại lượng ngẫu nhiên (hay hai tổng thể) khi giá trị kỳ vọng (trung bình)
khác nhau. Trong trường hợp này, so sánh trực tiếp bằng phương sai hay độ lệch chuẩn sẽ
không mang lại cho chúng ta kết quả chính xác nữa. Chúng ta có thể thấy tác giả đã nhấn
và ta chọn phương án B là hoàn toàn không chính
δ δ< A
“Nếu nhìn vào độ lệch tiêu chuẩn B xác vì tỷ suất lãi mong đợi của phương án A lớn hơn phương án B” (GT1, tr.64)
mạnh:
Như vậy, đối với trường hợp này, để xem xét mức độ chênh lệch các giá trị của mỗi ĐLNN
quanh kỳ vọng ta phải sử dụng tới hệ số biến động CV. Nếu so sánh bằng hai phương sai sẽ
dẫn tới kết quả không chính xác.
Thông qua hai ví dụ trên, tác giả tổng kết lại phương pháp giúp sinh viên so sánh rủi ro của
“Tóm tắt:
Để đo lường mức độ rủi ro của các phương án đầu tư:
- So sánh hai phương án có cùng tỷ suất lãi mong đợi, phương án nào có độ lệch tiêu chuẩn (δ)
lớn hơn, phương án đó mang tính rủi ro cao hơn.
các phương án đầu tư như sau:
nào có hệ số biến động cao hơn, phương án đó nhiều rủi ro hơn.” (GT1, tr.64)
- So sánh hai phương án có tỷ suất lãi mong đợi khác nhau, tính hai hệ số biến động. Phương án
Qua hai ví dụ và phần tóm tắt của giáo trình, một tổ chức toán học liên quan đến so sánh các
mẫu dữ liệu thống kê đã xuất hiện:
19
2F
3: so sánh độ phân tán của hai đại lượng ngẫu nhiên (hay
T
&
SSDLC
CV
Kiểu nhiệm vụ
τ
T
SSDLC&
CV
&
SSDLC
CV
hai tổng thể).
n
k
Kĩ thuật để giải quyết
Pk i
i
= ∑ trong đó:
i
= 1
• B1: Tính mức sinh lời kỳ vọng của mỗi dự án:
n
2
δ
−
×
k
Pi là khả năng xảy ra (xác suất) của các tình trạng kinh tế ki là suất lợi nhuận dự đoán cho từng thời kỳ kinh tế.
( k
)
i
P i
= ∑
=1
i
• B2: Tính độ lệch chuẩn của mỗi dự án
• B3: Xét các trường hợp:
* Nếu mức sinh lời kỳ vọng của các dự án bằng nhau, so sánh độ lệch chuẩn các dự
án, độ lệch chuẩn của dự án càng cao thì rủi ro càng cao.
δ - Tính hệ số biến động của mỗi dự án: CV= k
* Nếu mức sinh lời kỳ vọng của các dự án khác nhau:
- So sánh các hệ số biến động của các dự án, hệ số biến động càng cao thì rủi ro
θ
SSDLC&
CV
càng cao.
Vậy công nghệ :
- Công thức tính kỳ vọng và độ lệch chuẩn của ĐLNN X (với X là lợi suất hay lãi
suất).
Θ
SSDLC&
CV
- Ý nghĩa của độ lệch chuẩn. - Ý nghĩa của hệ số biến động.
Lý thuyết
- Định nghĩa độ lệch chuẩn. - Định nghĩa hệ số biến động.
hoặc so sánh hệ số biến động CV (khi lợi nhuận kỳ vọng của các dự án khác nhau). Do đó chúng tôi kí hiệu cho kiểu
nhiệm vụ này là TSSDLC&CV
3 Để giải quyết kiểu nhiệm vụ này người ta so sánh hai độ lệch chuẩn (khi lợi nhuận kỳ vọng của các dự án bằng nhau)
20
1.2.2. Phân tích giáo trình Kinh tế lượng
Trong phần phân tích này chúng tôi sử dụng tài liệu sau: Hoàng Ngọc Nhậm (chủ biên)
(2008), Giáo trình kinh tế lượng, Nxb Lao động - Xã hội. Trong phần tiếp theo chúng tôi sẽ
dung ký hiệu GT2 để chỉ tài liệu này.
Kinh tế lượng là một bộ môn cung cấp cho sinh viên phương pháp phân tích về mặt lượng
mối quan hệ giữa các chỉ tiêu kinh tế dựa trên những số liệu thu thập được. Ngoài việc giới
thiệu các mô hình hồi qui cơ bản như hồi qui với hai biến, hồi qui bội, GT2 còn đưa vào một
số môt hình hồi qui khác bao gồm hồi qui với biến giả, đa cộng tuyến,… Trong những mô
hình hồi qui đó, chúng tôi rất chú ý đến mô hình hồi qui với biến giả bởi vì mô hình này cho
phép người ta xem xét mối liên hệ giữa các biến định tính với các biến định lượng. Các biến
định tính thường nhận các giá trị (phạm trù) là có tính chất nào đó hay không có, hoặc các
mức độ khác nhau của một tiêu thức nào đó, chẳng hạn như biến định tính giới tính có 2
phạm trù là nam và nữ,…Trong khi đó, các mô hình hồi qui 2 biến cơ bản hay các mô hình
hồi qui bội chỉ nghiên cứu trên các biến định lượng. Chính vì vậy, người ta phải dùng tới mô
hình hồi qui với biến giả. Mô hình này được xây dựng bằng cách “lượng” hóa các biến định
tính. Chẳng hạn, nếu biến định tính là giới tính nhận hai giá trị (phạm trù) là nam và nữ thì
người ta sẽ thay biến này bằng một biến rời rạc nhận hai giá trị là 0 và 1 với 0 là giới tính
nam, 1 là giới tính nữ. Khi đó, biến định tính đã được thay thế bằng biến định lượng, từ đó
có thể xây dựng được các mô hình giúp chúng ta xem xét mối liên hệ giữa biến định tính với
các biến định lượng. Điều đặc biệt nữa là, mô hình hồi qui với biến giả có thể được ứng
dụng để giải quyết các bài toán liên quan đến so sánh các tham số của hai tổng thể.
“Giả sử một công ty sử dụng 2 công nghệ sản xuất (kí hiệu là công nghệ A và công nghệ B).
Năng suất của mỗi công nghệ là đại lượng ngẫu nhiên phân phối theo qui luật chuẩn có
phương sai bằng nhau nhưng kì vọng toán học khác nhau. Để nghiên cứu về năng suất của
công ty này chúng ta có thể sử dụng mô hình hồi qui:
=
(5.1)
Y i
+ β β 2
1
+ D U i
i
Trong đó : Y là năng suất; D là biến giả, D nhận một trong hai giá trị:0 hoặc 1:
Chúng ta hãy quan sát ví dụ trang 109:
Di = 1 nếu năng suất là của công nghệ A
21
Mô hình (5.1) giống như mô hình hồi qui 2 biến mà chúng ta đã nghiên cứu ở phần trước, chỉ
khác là biến số lượng X được thay bằng biến giả D”
(GT2, tr.109)
Di = 0 nếu năng suất là của công nghệ B
“Dùng mô hình này chúng ta có thể biết được năng suất trung bình của công nghệ A có khác
với năng suất trung bình của công nghệ B hay không” (GT2, tr.110).
GT2 nhấn mạnh rằng:
1β
Điều này được giải thích như sau:
Nếu sử dụng công nghệ sản xuất B thì E(Yi/Di = 0)=
2β β+
1
Nếu sử dụng công nghệ sản xuất A thì E(Yi/Di =1)=
2β trong mô hình:
“ 2β phản ánh mức chênh lệch về năng suất trung bình giữa công nghệ B và công nghệ A”
(GT2, tr.110)
Do đó, ý nghĩa của hệ số
Cách tính các hệ số của mô hình này cũng giống như đối với mô hình hồi qui hai biến mà
“Mô hình (5.1) giống như mô hình hồi qui hai biến mà chúng ta đã nghiên cứu ở phần trước,
chỉ khác là biến số lượng X được thay bằng biến giả D” (GT2, tr.110)
tác giả đã trình bày ở phần trước:
2β mà mô hình hồi qui với biến giả có thể sử dụng để so sánh năng
Nhờ ý nghĩa của hệ số
suất trung bình của hai công nghệ A và B.
Tương tự như vậy, mô hình hồi qui với biến giả cũng được sử dụng để xem xét sự khác
“Trong trường hợp này ta sử dụng 2 biến giả D1 và D2 và mô hình hồi qui sẽ là:
+
(5.2)
Yi =
+ β β 2
1
D 1 i
β 3
+ D U i
2
i
Trong đó:
1iD = 1 nếu năng suất của công nghệ A
1iD = 0 nếu năng suất của công nghệ khác
2iD = 1 nếu năng suất của công nghệ B
nhau giữa năng suất trung bình của 3 công nghệ A, B, C
22
2iD = 0 nếu năng suất của công nghệ khác
Khi
1iD =1 và
2iD = 0 thì (5.2) biểu thị năng suất của công nghệ A
Khi
Khi
1iD = 0 và 1iD = 0 và
2iD = 1 thì (5.2) biểu thị năng suất của công nghệ B 2iD = 0 thì (5.2) biểu thị năng suất của công nghệ C”
(GT2, tr.110)
GT2 cũng giải thích tại sao mô hình trên có thể xem xét sự khác biệt hay chênh lệch giữa
năng suất trung bình của 3 công nghệ:
Nếu sử dụng công nghệ sản xuất A thì năng suất trung bình
1iD =1,
2iD = 0)=
2β β+
1
E(Yi/
Nếu sử dụng công nghệ sản xuất B thì năng suất trung bình
2iD = 1)=
1iD = 0,
3β β+
1
E(Yi/
Nếu sử dụng công nghệ sản xuất C thì năng suất trung bình
1iD = 0,
1β
2iD = 0)=
E(Yi/
“ 2β biểu thị phần chênh lệch của năng suất trung bình giữa công nghệ C và công nghệ A
3β biểu thị phần chênh lệch của năng suất trung bình giữa công nghệ C và công nghệ B”
(GT2, tr.110-111)
Hơn nữa, tác giả nhấn mạnh ý nghĩa của các hệ số trong mô hình hồi qui như sau:
Như vậy, mô hình hồi qui với một biến định tính như trên thể hiện mối liên hệ giữa biến phụ
thuộc Y (là một biến định lượng) và một biến định tính (có nhiều phạm trù). Dựa vào các hệ
số của mô hình hồi quy ta có thể so sánh được các giá trị trung bình của biến định lượng
ứng với từng giá trị của biến định tính.
Ngoài ra, các mô hình hồi qui với 1 biến định lượng và 1 biến định tính, hồi qui với 1 biến
định lượng và hai biến định tính cũng được giáo trình đưa vào, áp dụng trong trường hợp
biến phụ thuộc Y chịu ảnh hưởng bởi cả biến định lượng và biến định tính. Khi đó, mô hình
hồi qui cũng cho biết giá trị trung bình của Y ứng với mỗi phạm trù của biến định tính khác
nhau như thế nào.
23
Ta xét ví dụ trang 115 của GT2: Xem xét thu nhập hàng năm của giáo viên theo thâm niên
và nơi giảng dạy. Biến thâm niên là biến định lượng còn biến nơi giảng dạy là biến định tính
với 3 phạm trù: thành phố, đồng bằng, miền núi.
=
+
+
Mô hình hồi qui được sử dụng:
X
Y i
+ β β 2
1
i
β 3
D 1 i
β 4
+ D U i
2
i
(5.14)
Trong đó:
Y là thu nhập của giáo viên phổ thông trung học (triệu đồng/năm), X là thâm niên giảng dạy
1iD = 1 nếu giáo viên ở thành phố
1iD = 0 nếu giáo viên ở nơi khác
2iD = 1 nếu giáo viên ở đồng bằng
2iD = 0 nếu giáo viên ở nơi khác
của giáo viên (năm)
(người ta đã chọn giáo viên giảng ở miền núi làm phạm trù cơ sở)
=
=
=
(
,
0,
0)
X
D 2
+ β β 2
1
/ E Y X D 1 i
i
i
i
i
Khi đó, thu nhập của giáo viên ở miền núi:
=
=
=
+
(
,
0,
1)
X
/ E Y X D 1 i
i
i
D 2
i
+ β β 2
1
i
β 4
Thu nhập của giáo viên ở đồng bằng:
=
=
=
+
(
,
1,
0)
X
D 2
+ β β 2
1
β 3
E Y X D / 1 i
i
i
i
i
Thu nhập của giáo viên ở thành phố:
Như vậy cũng tương tự như các mô hình hồi qui đã nêu ở trên, mô hình hồi qui trong ví dụ
này cho phép người ta biết được sự chênh lệch giữa thu nhập của giáo viên phổ thông trung
học ở thành phố và đồng bằng so với giáo viên ở miền núi, và hiển nhiên ta có thể so sánh
“Sau khi ước lượng hàm hồi qui (5.14), chúng ta sẽ biết được mức chênh lệch về thu nhập
của giáo viên phổ thông trung học ở thành phố và đồng bằng so với giáo viên công tác ở miền
núi”. (GT2, tr.116)
thu nhập của giáo viên ở cả ba vùng với nhau:
24
Đối với trường hợp biến phụ thuộc Y chịu ảnh hưởng của nhiều biến định tính thì khi đó số
k
−
)
(
1
in
“n= ∑
i
= 1
Trong đó: n là số biến giả được đưa vào mô hình; k là số biến định tính; ni là số mức độ (số
phạm trù) của biến định tính thứ i” (GT2, tr.116)
biến giả được đưa vào mô hình được tính bằng công thức tổng quát sau:
Để minh họa cho mô hình hồi qui với nhiều biến định tính, tác giả đưa vào ví dụ xét thu
nhập của giáo viên phổ thông dựa vào thâm niên giảng dạy; khu vực giảng dạy (đồng bằng,
thành phố, miền núi) và môn giảng dạy (tự nhiên, xã hội, anh văn).
“Mô hình có dạng:
=
+
+
+
+
X
Y i
+ β β 2
1
i
β 3
D 1 i
β 4
D 2
i
β 5
D 3
i
β 6
+ D U i
4
i
Trong đó:
Y là thu nhập của giáo viên phổ thông trung học (triệu đồng/năm)
X là thâm niên giảng dạy.
D1i = 1 nếu giáo viên giảng dạy ở thành phố
D1i = 0 nếu giáo viên giảng dạy ở nơi khác
D2i = 1 nếu giáo viên giảng dạy ở đồng bằng
D2i = 0 nếu giáo viên giảng dạy ở nơi khác
D3i = 1 nếu giáo viên giảng dạy các môn tự nhiên
D3i = 0 nếu giáo viên giảng dạy các môn thuộc nhóm khác
D4i = 1 nếu giáo viên giảng dạy các môn xã hội
D4i = 0 nếu giáo viên giảng dạy các môn thuộc nhóm khác.” (GT2, tr.117)
Dựa vào công thức trên, ta có số lượng biến giả đưa vào là n = (3-1) + (3-1) = 4
Trong mô hình trên, GT2 đã chọn phạm trù khu vực miền núi và phạm trù môn giảng dạy là
anh văn làm những phạm trù cơ sở.
Mô hình trên cho phép ước lượng thu nhập của giáo viên khi biết thâm niên, khu vực và
môn giảng dạy. Chính vì vậy, dựa vào mô hình hồi qui trên chúng ta có thể so sánh được
mức lương bình quân của một giáo viên có thâm niên Xi ở đồng bằng và thành phố so với
miền núi, dạy môn tự nhiên và xã hội so với môn tiếng Anh.
Qua một vài ví dụ về các mô hình hồi qui với biến giả mà giáo trình giới thiệu cho sinh
viên, chúng ta có thể thấy mô hình hồi quy với biến giả có thể giúp xem xét sự khác nhau
25
giữa năng suất trung bình của các công nghệ sản xuất, xem xét sự khác nhau giữa thu nhập
của giáo viên giữa nhiều khu vực, hay giữa nhiều nhóm chuyên ngành với nhau. Nói một
cách khác, mô hình hồi qui với biến giả cho phép chúng ta so sánh tham số trung bình của
các tổng thể từ những mẫu thu được. Từ đó, chúng tôi đã chỉ ra được một praxéologie -
trong đó các nhiệm vụ đều liên quan đến so sánh tham số trung bình của các tổng thể như
1 SSTBT
sau:
1 SSTBτ
1. Kiểu nhiệm vụ : So sánh trung bình của hai tổng thể A, B
=
Kĩ thuật :
Y i
1
+ D U i
i
E(Y/D) : (Di = 1 ứng với giá trị quan sát thuộc tổng thể A, Di - Tìm hàm hồi qui + β β 2
2β :
= 0 ứng với giá trị quan sát thuộc tổng thể B)
2β khác 0 thì
2β thể hiện sự chênh lệch giữa giá trị trung bình của tổng thể
- Xét hệ số + Nếu
A so với tổng thể B.
2β = 0 thì không có sự chênh lệch giữa giá trị trung bình của hai tổng thể
+ Nếu
1 SSTBθ
A, B.
=
Công nghệ :
+ β β 2
Y i
1
i
2β phản ánh mức chênh lệch về giá trị trung bình của tổng thể A so với tổng thể
E(Y/D) : - Cách lượng hóa biến định tính bằng cách sử dụng biến giả Di. - Mô hình hồi qui với 1 biến định tính có 2 phạm trù : + D U trong đó Di là biến giả i
-
1 SSTBΘ
B
“Hàm hồi qui tổng thể cho biết giá trị trung bình của biến phụ thuộc (Y) sẽ thay đổi như thế
nào khi biến độc lập (X) nhận các giá trị khác nhau” (GT2, tr.18)
Lý thuyết :
26
=
Y i
+ β β 2
1
+ D U i
i
Cụ thể hơn, dựa vào mô hình (trong đó Di là biến giả xác định như trên)
ta tính được giá trị trung bình của hai tổng thể như sau :
Giá trị trung bình của tổng thể A
1 ββ + 2
E(Y/D = 1) =
E(Y/D = 1) =
1β
Giá trị trung bình của tổng thể B
2β phản ánh mức chênh lệch về giá trị trung bình của tổng thể A so với tổng thể B.
Như vậy
1 SSTBT
“Bài 5.1: Để nghiên cứu nhu cầu của một loại hàng, người ta tiến hành khảo sát giá cả và
lượng hàng bán được ở 20 khu vực bán hàng và thu được các số liệu cho ở bảng sau:
Xi
Di
Xi
Di
Yi
Yi
20 19 18 18 17 17 16 16 15 15
1 0 1 0 1 1 0 1 1 1
14 14 13 12 12 15 16 12 10 11
5 6 6 7 7 5 4 7 8 8
0 1 0 1 0 1 0 1 0 1
2 3 3 4 4 3 4 4 5 5
Trong đó: Y là lượng hàng bán được (tấn/tháng)
X là giá bán (ngàn đ/kg)
Di = 0 nếu khu vực bán hàng ở nông thôn
Di = 1 nếu khu vực bán hàng ở thành phố
a) Tìm các hàm hồi qui :
=
(1)
i
X
i
ββ + 1
0
=
i
X
^ Y ^ Y
+ αα 1
0
i
D i
b) Cho biết ý nghĩa của các hệ số hồi qui
α + (2) 2 1;αα ” (GT2, tr.127-128)
2
Ví dụ minh họa cho kiểu nhiệm vụ :
Lời giải bài toán trên, chúng tôi tham khảo trong cuốn Bài tập Kinh tế lượng với sự trợ giúp
“a) Hàm hồi qui tuyến tính mẫu của Y theo X:
của Eviews do tác giả Nguyễn Thị Ngọc Thanh chủ biên.
27
2
2
=
=
−
=
i
X
R
R
^ Y
;
,0
9484 ;
,0
9455
i
=
t
F
81,330
,22 ( = 88,50 =
p
67241 ) 000,0(
)
,1 534483 ( ) − 19,18 )000,0(
,0(
0000 )
Hàm hồi qui tuyến tính mẫu của Y theo X và D :
2
2
+
=
=
=
−
i
^ Y
X
R
,0
0973324
,0
9487 ;
,0
9427
;
i
=
532805 ,1 −
R =
t
D i F
81,330
=
p
,22 60562 ) ( 05,45 ,0( 000 )
)68,17 000
( ,0(
)
);32,0( )751,0(
,0(
0000 )
b)
cho biết khi giá bán tăng (hay giảm) 1 ngàn đ/kg thì lượng hàng bán
,1
532805
1 −=α
cho biết: Với giá bán như nhau, lượng hàng bán được trung bình ở thành
097332
,0
được trung bình của mặt hàng này sẽ giảm (hoặc tăng) 1,533 tấn/tháng. 2 =α
phố cao hơn ở nông thôn 0,09733 tấn/tháng.” (Nguyễn Thị Ngọc Thanh (2009), tr.88-89)
2 SSTBT
2 SSTBτ
2. Kiểu nhiệm vụ : So sánh trung bình của ba tổng thể A, B, C
+
: (được tìm thấy thông qua thí dụ tr. 110) Kĩ thuật
+ β β 2
1
D 1 i
β 3
+ D U i
2
i
. - Tìm hàm hồi qui E(Y/D) : Yi =
1iD = 0 nếu giá trị quan sát
1iD = 1 nếu giá trị quan sát thuộc tổng thể A ;
(Trong đó
2iD = 1 nếu giá trị quan sát thuộc tổng thể B ;
2iD = 0 nếu giá
thuộc tổng thể khác ;
2β :
trị quan sát thuộc tổng thể khác)
2β khác 0 thì
2β thể hiện sự chênh lệch giữa giá trị trung bình của tổng thể A
- Xét hệ số + Nếu
so với tổng thể C
2β = 0 thì không có sự chênh lệch giữa giá trị trung bình của hai tổng thể A và
+ Nếu
3β :
C.
3β khác 0 thì
3β thể hiện sự chênh lệch giữa giá trị trung bình của tổng thể B
- Xét hệ số + Nếu
so với tổng thể C
3β = 0 thì không có sự chênh lệch giữa giá trị trung bình của hai tổng thể B và
+ Nếu
C.
28
2 SSTBθ
Công nghệ :
+ β β 2
β 3
1
2
+ D U i
i
và các giá trị p tương ứng với các hệ số. (Trong - Cách lượng hóa biến định tính bằng cách sử dụng biến giả D1i và D2i. - Hàm hồi qui với biến định tính có 3 phạm trù: + D E(Y/D) : Yi = 1 i
1iD ;
2iD là hai biến giả)
2β biểu thị phần chênh lệch giữa giá trị trung bình của tổng thể C và tổng thể A
3β biểu thị phần chênh lệch giữa giá trị trung bình của tổng thể C và tổng thể B
đó
2 SSTBΘ
“Hàm hồi qui tổng thể cho biết giá trị trung bình của biến phụ thuộc (Y) sẽ thay đổi như thế
nào khi biến độc lập (X) nhận các giá trị khác nhau” (GT2, tr.18)
Lý thuyết :
1.3. Tổng kết chương 1
Trong chương 1, chúng tôi đã tìm hiểu, phân tích và làm rõ một số praxéologie có liên quan
đến so sánh tham số của các tổng thể trong GT1 và GT2. Đặc biệt, chúng tôi đã chỉ ra được
những yếu tố toán thống kê trong công nghệ của các praxéologie này. Sau đây là một số kết
quả chính của chương 1:
• Đối với GT1
So sánh tham số của hai tổng thể xuất hiện trong bài toán so sánh rủi ro của hai phương án
đầu tư chứng khoán. Thực chất, đây chính là bài toán so sánh độ phân tán của hai tổng thể.
GT1 đưa ra kĩ thuật so sánh như sau:
- So sánh phương sai hoặc độ lệch chuẩn của hai tổng thể khi hai tổng thể đó có kỳ
vọng (hay trung bình) bằng nhau.
- So sánh hệ số biến động của hai tổng thể khi hai tổng thể đó có kỳ vọng (hay giá trị
trung bình) khác nhau.
Như vậy, để chuẩn bị cho sinh viên học tốt môn Phân tích và đầu tư chứng khoán, môn XS
– TK cần thiết phải cung cấp cho sinh viên các khái niệm, đó là kỳ vọng, phương sai, độ
lệch chuẩn và hệ số biến động. Đặc biệt là các kĩ thuật giúp so sánh độ phân tán của hai tổng
thể.
• Đối với GT2
29
So sánh giá trị trung bình của các tổng thể được giải quyết bằng cách sử dụng mô hình hồi
quy với biến giả. Dựa vào hệ số của các mô hình này, chúng ta có thể đưa ra kết luận về giá
trị trung bình của các tổng thể hơn kém nhau như thế nào.
Như vậy, mô hình hồi qui với biến giả là một khái niệm cần thiết phải đưa vào chương trình
XS –TK để giúp sinh viên có thể học tốt hơn môn Kinh tế lượng.
Vậy, việc tiếp theo chúng tôi cần làm đó là:
- Tìm hiểu xem những khái niệm: kỳ vọng, trung bình, phương sai, độ lệch chuẩn, hệ
số biến động và mô hình hồi quy với biến giả được trình bày trong giáo trình Xác
suất – Thống kê như thế nào? Trong đó có những tổ chức toán học nào liên quan đến
so sánh các mẫu dữ liệu thống kê? Có sự chênh lệch nào giữa những khái niệm, lý
thuyết toán cần thiếtcho chuyên ngành và những nội dung được dạy trong XS-TK
không?
Đây cũng chính là nội dung của câu hỏi Q2 và Q3 mà chúng tôi sẽ tìm câu trả lời thông qua
việc phân tích giáo trình Xác suất – Thống kê của trường Đại học Kinh tế TP.HCM. Những
vấn đề này sẽ được chúng tôi trình bày chi tiết trong chương 2 của luận văn.
30
CHƯƠNG 2: SO SÁNH CÁC MẪU DỮ LIỆU THỐNG KÊ TRONG
GIÁO TRÌNH XS – TK
Nội dung chính của chương 2 xoay quanh các câu hỏi sau:
Q2: Giáo trình XS – TK chuẩn bị cho sinh viên ra sao để sinh viên có thể
giải quyết tốt những vấn đề liên quan đến so sánh các mẫu dữ liệu TK mà hai
giáo trình chuyên ngành đã đề cập tới?
Q3: Có sự chênh lệch nào giữa những khái niệm, lý thuyết toán cần
thiếtcho chuyên ngành và những nội dung được dạy trong XS-TK không? Nếu
có thìsự khôngnối khớp đó ảnh hưởng đến sinh viên như thế nào?
Trên cơ sở phân tích ở chương 1, chúng tôi sẽ tìm hiểu xem vấn đề “so sánh các mẫu dữ
liệu thống kê” được trình bày trong giáo trình XS-TK như thế nào, đặc biệt là chỉ ra các tổ
chức toán học có liên quan đến vấn đề này. Với phân tích ở chương trước, chúng tôi thấy ở
đây cần phải làm rõ sự tồn tại của những tổ chức toán học liên quan đến kỳ vọng, phương
sai, độ lệch chuẩn, hệ số biến động, trung bình và hàm hồi qui với biến giả.
Giáo trình mà chúng tôi phân tích là cuốn giáo trình được sử dụng trong trường Đại học
Kinh tế TP.HCM, do tác giả Trần Gia Tùng viết, có tên là: Giáo trình lý thuyết xác suất &
thống kê toán học, Nxb Đại học Quốc gia TP. Hồ Chí Minh.
Đây là tài liệu được các giảng viên và sinh viên của trường Đại học Kinh tế TP.HCM tham
khảo và sử dụng. Trong luận văn này, chúng tôi sẽ ký hiệu đó là GT3.
Trước khi đi vào chi tiết, chúng tôi xem xét đề cương môn học XS-TK, nhằm làm rõ những
nội dung được đưa vào cũng như những vấn đề được ưu tiên giảng dạy.
Đề cương chi tiết của môn học (do sinh viên cung cấp) :
Ghi Chuẩn bị của Tài liệu đọc Ngày Nội dung giảng dạy
chú sinh viên (chương, (số tiết) (tên chương, phần, phương
phần) (bài tập, …) pháp giảng dạy)
31
Giáo trình lý Ngày Chương 1: Các khái niệm, các
thuyết và xác công thức cơ bản (4 tiết)
suất thống kê. 1-Phép thử, biến cố, không gian
Chương 1: §1, mẫu
§2 2- Định nghĩa xác suất
Chương 1: §3 Giải các bài Ngày Chương I: Các khái niệm, các
tập chương 1 công thức cơ bản (4 tiết)
3-Các công thức tính xác suất
Chương 2 Giải các bài Ngày Chương 2: Đại lượng ngẫu
tập chương 1 nhiên và qui luật phân phối xác (4 tiết)
suất
Giải các bài Ngày Chương 3: Các qui luật phân Chương 3
tập chương 2 phối xác suất thông dụng (4 tiết) Phần §1, §2,
§3 1- Phân phối nhị thức
2- Phân phối Poisson
3- Phân phối siêu bội
Giải các bài Chương 3 Ngày Chương 3: Các qui luật phân
tập chương 3 phối xác suất thong dụng Phần §4, §5 (4 tiết)
4- Phân phối chuẩn 5- Phân phối χ2 6- Phân phối Student
Sửa bài tập chương 1
Chương 2 Giải các bài Ngày Chương 4: Đại lượng ngẫu
tập chương 3 nhiên hai chiều – Hàm của các (4 tiết)
đại lượng ngẫu nhiên.
32
Chương 6 Giải các bài Ngày Chương 6: Lý thuyết mẫu
tập chương 6 (4 tiết) - Sửa các bài tập chương 2 và
chương 3
Chương 7 Giải các bài Ngày Chương 7: Ước lượng các số
tập chương 7 đặc trưng của tổng thể (4 tiết)
- Sửa các bài tập chương 4
Giải các bài Ngày Chương 8: Kiểm định giả thiết Chương 8
tập chương 8 thống kê (4 tiết) Phần §1, §2,
§3 1- Bài toán kiểm định giả thiết thống kê
2- Kiểm định giả thiết về trung bình tổng thể
3- Kiểm định giả thiết về tỷ lệ tổng thể
Giải các bài Chương 8 Ngày Chương 8: Kiểm định giả thiết
tập chương 8 thống kê Phần §4, §5, (4 tiết)
§6, §7, §8, §9 9- Kiểm định giả thiết về qui
luật phân phối xác suất của §10
ĐLNN
10- Kiểm định giả thiết về tính độc lập
Ngày - Sửa các bài tập chương 6, 7, 8
(5 tiết) - Giải đáp thắc mắc
- Hệ thống môn học
Tổng
cộng :
33
45 tiết
Dựa vào đề cương này chúng tôi nhận thấy toàn bộ phần tương quan và hồi qui không được
dạy trong chương trình XS – TK. Điều này tác động đến sinh viên như thế nào, chúng tôi sẽ
phân tích kĩ ở mục dưới đây.
2.1. Phân tích GT3
2.1.1. Kỳ vọng, phương sai, độ lệch chuẩn của ĐLNN
Kỳ vọng
Tùy theo việc ĐLNN là rời rạc hay liên tục, tập giá trị của nó là hữu hạn hay vô hạn đếm
được mà công thức tính kỳ vọng khác nhau. Cụ thể:
X
x1
x2
…
xn
P
…
p1
p2
pn
Kỳ vọng của X, ký hiệu là E(X), được xác định như sau:
n
i px
i
E(X) = ∑
i
= 1
+∞
hội tụ tuyệt đối)
i px
i
• Trong trường hợp X(S) vô hạn đếm được (và tổng ∑ =1i
i px
i
+∞ E(X) = ∑ =1i
+∞
hội tụ
xf
)( dxx
• Đại lượng ngấu nhiên liên tục X có hàm mật độ xác suất là f(x) (và ∫
∞−
tuyệt đối)
Kỳ vọng toán của X ký hiệu là E(X), xác định như sau:
+∞
xf
)( dxx
∞−
“• Đại lượng ngẫu nhiên rời rạc X có bảng phân phối xác suất
E(X) = ∫ ” (GT3, tr.46)
Để minh họa cho các định nghĩa trên, GT3 đưa vào hai ví dụ minh họa. Thông qua hai ví dụ
đó, tác giả muốn khẳng định ý nghĩa của kỳ vọng:
34
“Nói chung kỳ vọng cho ta ý niệm về độ lớn trung bình của đại lượng ngẫu nhiên X. Có khi
kỳ vọng còn được gọi là giá trị trung bình của X” (GT3, tr.47)
Đặc biệt, trong ví dụ 3.4, tác giả đưa ra bài toán so sánh kỳ vọng của hai đại lượng ngẫu
“Một công ty cần trang bị một số lượng lớn máy cho khu vực sản suất mới. Có hai loại máy
được xem xét là máy do công ty AP sản xuất và máy do công ty TB sản xuất với số liệu thống
kê như sau:
Mức độ hỏng
2
3
1
Tỷ lệ hỏng (%)
4
2
4
Máy
của
Chi phi sửa chữa
công ty
10,5
15,5
7
(triệu đồng/năm)
AP
Tỷ lệ hỏng (%)
5
3
2
Máy
của
Chi phi sửa chữa
công ty
6,5
9,5
14
(triệu đồng/năm)
TB
Giả sử các yếu tố khác không có sự khác biệt đáng kể và công ty này chỉ quan tâm đến chi phí
sửa chữa hàng năm, hỏi nên chọn mua máy của công ty nào sản xuất?
Giải : Gọi X là chi phí sửa chữa của một máy của công ty AP (triệu đồng/năm). Ta xem X là
đại lượng ngẫu nhiên có bảng phân phối xác suất như sau:
7
10,5
15,5
X
0
0,04
0,04
0,02
P
0,9
Ta có: E(X) = 1,01
Gọi Y là chi phí sửa chữa của một máy của công ty TB (triệu đồng/năm). Ta xem Y là đại
lượng ngẫu nhiên có bảng phân phối xác suất như sau:
Y
0
9,5
14
6,5
P
0,9
0,05
0,03
0,02
Ta có: E(Y) = 1,025
Vì 1,01 < 1,025; ta chọn mua máy của công ty AP.” (GT3, tr.48-49)
nhiên. Ví dụ được nêu như sau:
35
Trong ví dụ trên, người mua chỉ quan tâm tới chi phí sửa chữa hàng năm. Do đó, việc quyết
định mua máy của công ty nào sẽ phụ thuộc vào chi phí kỳ vọng sửa chữa một máy của
công ty đó có thấp hay không. Để giải quyết bài toán này, tác giả cho xác suất để máy chạy
tốt là 0,9 và xác suất để một máy hư là 0,1 (đối với cả hai loại máy của công ty AP và TB)
rồi lập bảng phân phối xác suất của các đại lượng ngẫu nhiên: chi phí sửa chữa một máy của
công ty AP và chi phí sửa một máy của công ty TB. Do chi phí sửa chữa kỳ vọng (hay trung
bình) nhỏ hơn nên máy của công ty AP đã được chọn. Như vậy, việc so sánh giá trị trung
bình của hai ĐLNN giúp người ta có thể đưa ra một quyết định hợp lý.
Ngoài việc giới thiệu ý nghĩa của kỳ vọng cho sinh viên, GT3 cũng nêu một số tính chất
“(a) E(aX + b) = aE(X) + b
(b) E(X+Y) = E(X) + E(Y)
E(X1 + X2 + …. + Xn)= E(X1)+ E(X2) + …+ E(Xn)
(c) Nếu X, Y độc thì E(X.Y) = E(X).E(Y)” (GT3, tr.49)
thông dụng của kỳ vọng (có kèm theo chứng minh) như sau:
Mặc dù các khái niệm và tính chất liên quan đến kỳ vọng của một ĐLNN được đưa vào rất
chi tiết và đầy đủ nhưng những tính chất này không thể giải thích được cho những kĩ thuật
so sánh hai tham số trung bình bằng mô hình hồi qui với biến giả được trình bày trong giáo
trình Kinh tế lượng.
Phương sai và độ lệch chuẩn
“Ta xem các đại lượng ngẫu nhiên rời rạc sau đây
X
- 0,1
0,1
Z
-90
10
P
P
1 10
9 10
1 2
1 2
Y
-10000
10000
P
1 2
1 2
Trước khi nêu ra định nghĩa, tác giả đã đặt ra vấn đề sau :
36
Mặc dù E(X) = E(Y) = E(Z) = 0 nhưng các ĐLNN này rất khác biệt nhau.
Ta cần đưa ra một đặc trưng cho sự khác biệt đó.” (GT3, tr.52)
Từ vấn đề đặt ra, cần thiết phải đưa thêm vào một tham số mới giúp chúng ta chỉ ra sự khác
“Nếu đại lượng ngẫu nhiên X có E(X) = m thì
E(X – m) = E(X) – m = 0” (GT3, tr.52)
nhau của các ĐLNN khi chúng có kỳ vọng như nhau. Mặt khác, tác giả cũng nhận xét rằng :
Do đó, nếu sử dụng đại lượng E(X – m) sẽ không chỉ ra được sự khác biệt giữa các ĐLNN.
“Phương sai của đại lượng ngẫu nhiên X, kỳ hiệu là Var(X), được xác định như sau:
Vì vậy, tham số cần đưa vào là phương sai, có định nghĩa như sau :
Var(X) = E[(X – E(X))2]” (GT3, tr.52)
Một công thức khác để tính phương sai :
“Var(X) = E(X 2) – [E(X)]2” (GT3, tr.52)
“Phương sai cho ta ý niệm về mức độ phân tán các giá trị của X xung quanh giá trị trung bình.
Phương sai càng lớn thì độ phân tán này càng lớn” (GT3, tr.52)
Tác giả cũng đặc biệt nhấn mạnh ý nghĩa của phương sai:
Với định nghĩa về phương sai nếu xem xét lại 3 đại lượng ngẫu nhiên X, Y, Z nêu trong ví
dụ ở trên, ta có :
Var(X) = 0,01 ; Var(Y) = 900 ; Var(Z) = 100000000
Như vậy, Var(Z) > Var(Y) > Var(X) hay độ phân tán của Z lớn nhất, kế tiếp là độ phân tán
của Y và cuối cùng, độ phân tán của X bé nhất.
Sau khi giới thiệu định nghĩa và ý nghĩa của phương sai, tác giả đưa vào 3 ví dụ, trong đó ví
dụ 3.6 và ví dụ 3.7 nhằm minh họa cho sinh viên cách tính phương sai khi biết bảng phân
phối xác suất hoặc biết hàm mật độ xác suất của ĐLNN X. Riêng ví dụ 3.8, ngoài việc tính
toán các kỳ vọng và phương sai của các ĐLNN, tác giả còn yêu cầu sinh viên phải so sánh
“Một nhà đầu tư có 3 dự án. Gọi Xi (i = 1, 2, 3) là lợi nhuận khi thực hiện dự án thứ i, còn giá
trị âm chỉ số tiền bị thua lỗ. Qua nghiên cứu và bằng kinh nghiệm, nhà đầu tư có ước lượng
như sau :
-2
-1
10
-1
4
5
X1
X2
các giá trị tìm được :
37
0,4
0,2
0,4
P
0,3
0,2
0,5
P
-3
-2,5
8
X3
P
0,3
0,2
0,5
Đơn vị tính : Tỷ đồng
Ta tính được :
E(X1) = 3 E(X2) = 3 E(X3) = 2,6
Var(X1) = 32,8 Var(X2) = 7 Var(X3)= 29,19
(Chú ý : Var(X) và E(X) không cùng đơn vị)
Nếu chọn một trong 3 dự án trên, theo bạn nên chọn dự án nào ?”
(GT3, tr.53-54)
Tác giả đưa ra câu hỏi mở đối với sinh viên và không nêu cách giải. Trong ví dụ trên có 3
ĐLNN X1, X2, X3 lần lượt là lợi nhuận khi thực hiện dự án thứ 1, 2, 3. Ta thấy bài toán ví
dụ này chính là một bài toán so sánh lợi nhuận và rủi ro trong đầu tư. Trong 3 dự án thì có 2
dự án cho lợi nhuận kỳ vọng bằng nhau còn dự án thứ 3 cho lợi nhuận kỳ vọng thấp hơn,
đồng thời phương sai của 3 dự án này đều khác nhau. Để quyết định chọn dự án nào thì sinh
viên phải xem xét cả lợi nhuận kỳ vọng và độ phân tán của mỗi dự án. Ở đây, sinh viên
chưa được tiếp cận định nghĩa rủi ro của dự án nên có thể hiểu độ phân tán của mỗi dự án
cho biết mức độ ổn định của lợi nhuận, nếu độ phân tán càng lớn thì khả năng lợi nhuận
nhận được khác với lợi nhuận kỳ vọng càng cao. Trong phần này, giáo trình mới chỉ giới
thiệu khái niệm phương sai và chưa hề nhắc tới hệ số biến động của ĐLNN. Chính vì vậy,
việc so sánh độ phân tán của ba dự án trên có vẻ khó khăn. Tuy nhiên, trong ví dụ này, tác
giả đã cố ý cho đại lượng ngẫu nhiên X3 có kỳ vọng thấp hơn kỳ vọng của hai đại lượng X1
và X2 nhưng có phương sai rất lớn. Trong khi đó, ĐLNN X1 vừa có kì vọng lớn hơn lại có
phương sai nhỏ nhất trong 3 dự án. Nếu sinh viên so sánh từng cặp dự án sẽ thấy ngay kết
quả:
- So sánh dự án 1 và 2 : Lợi nhuận kỳ vọng bằng nhau nhưng Var(X1) > Var(X2) do đó dự
án 2 tối ưu hơn dự án 1.
38
- So sánh dự án 2 và 3: E(X2) > E(X3) và Var(X2) lại nhỏ hơn Var(X3) rất nhiều. Vậy dự án
2 tối ưu hơn dự án 3. (Trong trường hợp này, kết luận độ phân tán của dự án 2 bé hơn độ
phân tán của dự án 3 vẫn đúng do CV(X2) < CV(X3))
Như vậy dự án 2 là tối ưu nhất.
Nếu sinh viên so sánh dự án 1 và dự án 3 : E(X1) > E(X3), Var(X1) > Var(X3), sinh viên sẽ
dễ sai lầm khi cho rằng độ phân tán của dự án 1 lớn hơn dự án 3. Trong khi đó, lợi nhuận
của dự án 1 lại lớn hơn dự án 3 dẫn tới sinh viên khó đưa ra lựa chọn cho trường hợp này.
Như vậy, dường như kỹ thuật so sánh hai tổng thể dựa trên kỳ vọng và phương sai đã không
được xây dựng hoàn chỉnh trong GT3.
“ (a) Nếu X là đại lượng ngẫu nhiên và a, b là hai hằng số thì
Var(aX+b) = a2Var(X)” (GT3, tr.54)
“Nếu hai đại lượng ngẫu nhiên X và Y độc lập (và các phương sai hữu hạn thì
Var(X+Y) = Var(X) + Var(Y) ” (GT3, tr.54)
4 (và các phương sai hữu hạn) thì
“ Nếu các đại lượng ngẫu nhiên X1, X2, …, Xn độc lập3F
Var(X1+ X2+ …+Xn )= Var(X1) +Var(X2)+ …+Var(Xn) ” (GT3, tr.54)
Tiếp theo ví dụ 3.8, tác giả đưa vào các tính chất của phương sai như sau:
“ Độ lệch tiêu chuẩn của đại lượng ngẫu nhiên X :
)
( X
Var
X =σ
Xσ có cùng đơn vị đo với X.” (GT3, tr.55)
Cuối cùng, tác giả định nghĩa độ lệch chuẩn của ĐLNN X theo phương sai như sau :
Sau đó tác giả không đưa vào tính chất của độ lệch chuẩn hay không có ví dụ nào minh họa
cho cách dùng độ lệch chuẩn. Và đặc biệt là hệ số biến động không được giới thiệu trong
chương này. Như vậy, những tính chất và ý nghĩa liên quan đến phương sai và độ lệch
chuẩn nêu trong GT3 chỉ có thể giải thích cho một phần nhỏ kĩ thuật so sánh độ phân tán
của hai tổng thể mà chúng tôi đã chỉ ra trong giáo trình Phân tích và đầu tư chứng khoán. Cụ
thể là trường hợp hai tổng thể có giá trị trung bình bằng nhau, tổng thể nào có phương sai
(độ lệch chuẩn) lớn hơn sẽ có giá trị quan sát phân tán nhiều hơn quanh giá trị trung bình.
Trong trường hợp hai tổng thể có trung bình khác nhau thì GT3 hoàn toàn không đưa vào lý
thuyết để so sánh độ phân tán của hai tổng thể.
4 Chỉ cần giả thiết X1, X2, …, Xn độc lập từng đôi.
39
Bài tập cuối chương
Chương này gồm có 18 bài, trong đó có 17 bài yêu cầu tính toán các tham số của ĐLNN
hoặc tính xác suất của X khi biết hàm phân phối xác suất của X. Chỉ có duy nhất bài 17 có
“Tại một địa phương có 5 mạch nước ngầm khác nhau, trong đó có một mạch nước bị nhiễm
thạch tín. Có 900 giếng nước tại địa phương lấy nước từ 5 mạch nước này nhưng không rõ
nguồn gốc mạch nước ngầm của giếng (mỗi giếng thuộc duy nhất một mạch nước ngầm). Một
đoàn kiểm tra muốn xác định giếng có bị nhiễm chất thạch tín hay không bằng cách xét
nghiệm mẫu nước. Có hai phương pháp được đề nghị:
Cách 1: Xét nghiệm từng mẫu nước riêng biệt.
Cách 2: Ghép chung 9 mẫu nước giếng khác nhau thành 1 nhóm làm 1 xét nghiệm, nếu mẫu
ghép không bị nhiễm thì kết luận cả 9 mẫu không nhiễm và ngược lại nếu mẫu ghép bị nhiễm
thì làm thêm 9 xét nghiệm riêng cho 9 mẫu để xác định giếng nào bị nhiễm.
a) Nếu biết chi phí mỗi lần xét nghiệm là như nhau thì hãy tính xem cách xét nghiệm nào có
lợi hơn.” (GT3, tr.63)
liên quan đến so sánh kỳ vọng của hai ĐLNN:
Các bài tập được đưa vào trong giáo trình để sinh viên luyện tập nên không kèm theo lời
giải. Chúng tôi dự kiến lời giải như sau :
Xác suất để một giếng lấy nước từ mạch nước nhiễm thạch tín là 1/5 = 0,2
Gọi X là số lần xét nghiệm theo cách 1.
Gọi Y là số lần xét nghiệm theo cách 2.
Y1, Y2, …, Y100 là các đại lượng ngẫu nhiên biểu thị số lần xét nghiệm theo nhóm thứ k.
Ta có X = 900 nên E(X) = 900
Y = Y1 + Y2 + … + Y100
Ta thấy Yk (k = 1, 2, …, 100) là các ĐLNN độc lập.
Yk có thể nhận một trong 2 giá trị: 1 và 10. Yk nhận giá trị là 1 khi 9 giếng trong nhóm
không nhiễm thạch tín. Yk nhận giá trị 10 nếu trong nhóm có ít nhất một giếng nhiễm thạch
tín.
Yk có phân phối xác suất giống nhau (Với mọi k = 1, 2, …, 100) P (Yk = 1) = (0,8)9 ; P(Yk = 10) = 1 – (0,8)9
Phân phối xác suất của Yk như sau :
40
1 10 Yk
100
9
9
+
P (0,9)9 1 – (0,8)9
≈ 879,2
)
)
8,0
Vậy E(Y) = E
[ =100 (
]))8,0(1(10 −
kYE (
k
= 1
100 ∑ = 1k
kY = ∑
Do E(Y) < E(X) nên làm theo cách 2 sẽ có chi phí ít hơn lại nhanh hoàn thành công việc
hơn.
Phần bài tập cuối chương 2 hoàn toàn không xuất hiện dạng bài tập so sánh độ phân tán của
hai tổng thể.
2.1.2. Giá trị trung bình, phương sai của tổng thể và mẫu
Trung bình, phương sai tổng thể
Giả sử tổng thể theo dấu hiệu H được mô tả bằng bảng phân phối tần số:
Giá trị của H x1 x2 … xk
Tần số N1 N2 … Nk
Trong đó x1, x2, …, xk là các giá trị của dấu hiệu H được đo lường trên các phần tử.
Ni là số phần tử của tổng thể có chung giá trị xi
µ
=
+
(
x
++ ...
x 1
2
)Nx
1 N
Khi đó, trung bình của tổng thể được tính bằng công thức :
µ
=
i xN i
k 1 ∑ N 1 = i
Trường hợp có Ni phần tử của tổng thể có chung giá trị xi
2
2 σ
=
−
) µ
( i xN
i
k 1 ∑ N 1 = i
2σσ =
Phương sai của tổng thể:
Độ lệch chuẩn của tổng thể: (GT3, tr.146-147)
41
Sau khi giới thiệu cách tính trung bình và phương sai tổng thể, GT3 giới thiệu cách mô
hình hóa dấu hiệu H bởi ĐLNN. Nếu chọn ngẫu nhiên một phần tử của tổng thể và gọi X là
giá trị của dấu hiệu H trên phần tử này thì ta sẽ có bảng phân phối xác suất của X:
X x1 x2 … xk
p
i =
N i N
P p1 p2 … pk
µ=
i px
i
n ∑ = 1 i
trong đó:
=
−
) 2 σµ =
(
2))
Khi đó: E(X) = (chính là trung bình tổng thể)
[ − XEXE (
]
( i xp
i
k ∑ = i 1
Var(X) = (chính là phương sai tổng thể) ” (GT3,
tr.148)
Với cách mô hình hóa này, những phần tiếp theo tác giả đều nói đến tổng thể theo dấu
hiệu H dưới dạng một ĐLNN X.
Trung bình, phương sai mẫu
Với (X1, X2,…, Xn) là mẫu ngẫu nhiên kích thước n được thành lập từ đại lượng ngẫu
n
=
X
iX
∑
1 n
i
= 1
nhiên X, ta có các công thức tính trung bình mẫu và phương sai mẫu như sau:
2
2
2
=
−
=
−
Trung bình mẫu: (GT3, tr.157)
S
(
X
X
)
X
(GT3, tr.158) Phương sai mẫu:
( Xn
i
2 i
1 −
1 −
n
1
n
1
n ∑ = 1 i
n ∑ = 1 i
)
)
( XE=µ
“E( X ) =
và Var( X )=
nên khi n khá lớn X ổn định quanh µ hơn X” (GT3,
2σ n
tr.158)
2σ = Var(X)” (GT3, tr.158)
GT3 cũng chứng minh cho sinh viên thấy được các tính chất:
“E(S2) =
42
“Trong nhiều bài toán thực tế ta không biết
2σ , khi n đủ lớn người ta thường dùng một giá trị
cụ thể s2 thay cho
2σ ” (GT3, tr.159)
Tác giả chú thích:
2
=
S
X
(
)
− i X
1 −
1
n
n ∑ = i 1
Độ lệch chuẩn mẫu được tính bằng căn bậc hai của phương sai:
Như vậy, hệ số biến động của một tổng thể hay của một mẫu cũng không được trình
bày trong chương này.
Các ví dụ và bài tập cuối chương
Toàn bộ chương lý thuyết mẫu gồm 14 ví dụ và 11 bài tập chủ yếu là yêu cầu tính toán các
tham số của tổng thể và mẫu, lập biểu đồ, xây dựng đa giác tần suất, tính xác suất để trung
bình mẫu hoặc phương sai mẫu lớn hơn hay nhỏ hơn một số nào đó. Điều đáng nói là hoàn
toàn không có bài tập nào liên quan đến so sánh các tham số của hai hay nhiều tổng
thể.
2.1.3. Hàm hồi qui
Hàm hồi qui được trình bày ở chương 9 : Giới thiệu lý thuyết tương quan và hồi quy. Tuy
nhiên, theo chương trình học XS – TK của trường Đại học Kinh tế TP.HCM thì phần tương
quan và hồi qui không được dạy. Toàn bộ phần này lại do một môn cơ sở ngành là Kinh tế
lượng giới thiệu tới sinh viên. Điều này khiến cho các sinh viên sau khi học xong XS – TK
hoàn toàn không biết đến các mô hình hồi qui 2 biến, hồi qui bội cũng như xem xét sự phụ
thuộc giữa các dưới dạng một hàm hồi qui.
2.1.4. Các tổ chức toán học liên quan đến so sánh các mẫu dữ liệu thống kê
Thông qua một vài ví dụ và bài tập thuộc chương 2 và chương 6 của GT3, kết hợp với các
bài tập liên quan đến kiểm định sự bằng nhau của hai tham số, chúng tôi tìm thấy các tổ
chức toán học sau có liên quan đến so sánh tham số của các tổng thể.
: So sánh hai trung bình E(X), E(Y) của hai ĐLNN X và Y • Kiểu nhiệm vụ SSTBT
Kĩ thuật SSTBτ :
Trong trường hợp có thể tính trực tiếp E(X), E(Y): so sánh trực tiếp E(X) và E(Y)
43
Trong trường hợp chỉ biết mẫu ngẫu nhiên của X và Y: Kiểm định sự bằng nhau hai
trung bình E(X), E(Y) của hai tổng thể (tương ứng với hai biến ngẫu nhiên X và Y) với
2
1σ , E(Y)=
2 2σ
mức ý nghĩa α.
2µ , Var(Y)=
Với X, Y là hai có E(X) = 1µ ,Var(X) =
B1 : Đặt giả thuyết theo 1 trong 3 cách sau (tùy vào từng mục đích):
H0:
H1:
H0:
H1:
H0:
1µ = 1µ ≠ 1µ = 1µ < 1µ = 1µ >
2µ 2µ 2µ 2µ 2µ 2µ
(GT3, tr.226)
H1:
2
B2 : Xét các trường hợp sau :
2 1σ ,
2σ và X, Y có phân phối chuẩn.
−
y
Trường hợp biết
x 2 2 σσ 1 2 + n n 1
2
Tính z = trong đó n1 là kích thước mẫu lấy từ X, n2 là kích thước
mẫu lấy từ Y.
Thực hiện theo bảng sau:
Giả thuyết Bác bỏ H0 khi
2/αz
H0: |z|>
H1:
1µ = 1µ ≠ 1µ = 1µ <
2µ 2µ 2µ 2µ
H0: z < - αz H1:
1µ = 1µ >
2µ 2µ
H0: z > αz H1:
2
(GT3, tr.227)
2 1σ ,
2σ và n1 ≥ 30, n2 ≥ 30
Trường hợp chưa biết
44
−
y
+
2 s 2 n
x 2 s 1 n 1
2
(GT3, tr.228) Tính z =
2
Thực hiện kiểm định theo bảng giống như trường hợp trước.
2 1σ ,
2σ nhưng có căn cứ để có thể xem là
2 1σ =
2 2σ
−
y
(GT3, tr.228)
Trường hợp chưa biết
−
) s 1
( n 1
2 2
+
x ( n 2 −
+ n
− 2
1 n
) 2 s 1 1 + n 1
2
1 n 1
2
Tính t=
(t có phân phối Student với n1 +n2 – 2 bậc tự do)
αz bằng αt 2
αt và thực hiện kiểm định theo bảng tóm tắt ở trường hợp đầu 2
, Thay αz ,
tiên.
αt được cho bởi các bảng phụ lục cuối giáo trình) 2
αz , αt 2
, (Các giá trị αz ,
Công nghệ:
- Khái niệm miền bác bỏ và miền chấp nhận.
- Quy luật phân phối xác suất của đại lượng ngẫu nhiên có phân phối chuẩn hoặc phân
phối Student
SSTBT
Trong GT3 có tất cả 2 ví dụ và 2 bài tập liên quan đến kiểu nhiệm vụ . Chúng tôi sẽ
“Trong một công ty sản suất sản phẩm, có ý kiến cho rằng làm việc buổi sáng hiệu quả hơn
buổi chiều. Người quản lý của công ty này quan sát 75 buổi sáng đếm số sản phẩm sản xuất
được trong mỗi buổi và tính được trung bình mẫu x =806 (sản phẩm/buổi) và độ lệch chuẩn
mẫu sx = 185. Người này cũng quan sát 100 buổi chiều và tính được trung bình mẫu y =723
(sản phẩm/buổi) và độ lệch chuẩn mẫu sy = 164. Hãy cho nhận xét với mức ý nghĩa 1%?
Giải
Gọi
Xµ là số sản phẩm sản xuất được trung bình trong buổi sáng
Yµ là số sản phẩm sản xuất được trung bình trong buổi chiều
: trích dẫn ví dụ 5.1 (trang 229, GT3) để minh họa cho kĩ thuật giải quyết SSTBT
45
ở công ty này.
Ta cần kiểm định giả thiết:
H0:
Xµ = Yµ H1:
Xµ > Yµ
Xn = 75 > 30 Yn =100 >30
Mức ý nghĩa
, tra bảng ta được
= 2,326
01,0=α
01,0z
−
723
Ta tính z =
= 3,082
806 2
2
+
185 75
164 100
Vì z > 2,326 nên ta bác bỏ H0, chấp nhận H1.
Ở công ty này, làm việc buổi sáng hiệu quả hơn buổi chiều” (GT3, tr.229)
: So sánh độ phân tán của các ĐLNN X và Y • Kiểu nhiệm vụ SSPST
Kĩ thuật SSPSτ :
Trong trường hợp tính trực tiếp được Var(X) và Var(Y) : so sánh hai kết quả tìm
được. Nếu Var(X) > Var(Y) thì X phân tán nhiều hơn Y và ngược lại.
Trong trường hợp không tính trực tiếp được Var(X) và Var(Y), chỉ biết hai mẫu
ngẫu nhiên của X và Y : Dùng phương pháp kiểm định.
)
(
,
)
2 YN σµ Y
2 σµ XN , ( X
(Giả sử X~ , Y~ ; (X1,…,Xn) và (Y1,…,Ym) là hai mẫu ngẫu
nhiên độc lập lấy từ X và Y)
Đặt giả thiết theo một trong 3 cách :
H0:
H1 :
H0:
H1 :
H0:
2 Xσ = ≠2 Xσ 2 Xσ = >2 Xσ 2 Xσ = <2 Xσ
2 Yσ 2 Yσ 2 Yσ 2 Yσ 2 Yσ 2 Yσ
H1 :
2 s X 2 s Y
Tính giá trị f =
Thực hiện kiểm định theo bảng :
46
Giả thuyết Bác bỏ H0 khi
2 Xσ =
2 Yσ
− 1
− mn ,1
fα , 2
f > H0:
2 Yσ
≠2 Xσ
− 1
− ,1 mn
f α − , 1 2
H1 : hoặc f <
fα ,
− mn ,1
− 1
2 Xσ =
2 Yσ
f > H0:
2 Yσ
>2 Xσ
H1 :
2 Xσ =
2 Yσ
f α − , 1
− mn ,1
− 1
H0: f <
2 Yσ
<2 Xσ
(GT3, tr.232-233)
H1 :
Công nghệ: Khái niệm miền chấp nhận, miền bác bỏ.
Quy luật phân phối xác suất của hàm Fisher – Snedecor.
“Nghiên cứu phương sai của lượng nguyên liệu NL (đơn vị tính là g) dùng để làm ra một sản
phẩm theo phương pháp A, phương pháp B. Gọi X là lượng nguyên liệu NL dùng để làm ra
một sản phẩm theo phương pháp A; Y là lượng nguyên liệu NL dùng để làm ra một sản phẩm
theo phương pháp B. Lấy mẫu gồm 25 sản phẩm được sản xuất theo phương pháp A và tính
được
(g) ; mẫu khác gồm 16 sản phẩm được sản xuất theo phương pháp B và tính
150
2 =Xs
2
(g). Với mức ý nghĩa
, có thể nói rằng
được
4,86
01,0=α
2 =Ys
Yσ được không ?
>2 Xσ
Giải
Ta cần kiểm định giả thiết H0:
2 Xσ =
2 Yσ
Với đối thiết H1 :
>2 Xσ
2 Yσ
=
=
=
Ta có:
736
,1
f
150 4,86
2 s X 2 s Y
01,0=α
Tra bảng mức phân vị α của phân phối Fisher – Snedecor với bậ tự do ở tử số là 24 và bậc tự
do ở mẫu số là 15, ta được:
Ví dụ minh họa:
47
=3,29
15;24;01,0f
Vì f = 1,736 < 3,29 ; với mức ý nghĩa
ta chưa đủ cơ sở để bác bỏ H0” (GT3, tr.233-
01,0=α
234)
Nhận xét về các tổ chức toán học trên:
SSTBT
có hai kỹ thuật để giải quyết: so sánh trực tiếp (khi tính được các • Kiểu nhiệm vụ
trung bình tổng thể) hoặc gián tiếp bằng kiểm định (khi chỉ biết các mẫu ngẫu nhiên của
hai tổng thể), hoàn toàn không sử dụng tới mô hình hồi qui với biến giả. Rõ ràng công
SSTBτ của GT3 không thể giải thích được cho những kĩ thuật
2
;
1 SSTBτ
SSTBτ ; trong giáo trình Kinh tế lượng.
nghệ để giải quyết cho
có hai kỹ thuật để giải quyết: so sánh trực tiếp hai phương sai hoặc • Kiểu nhiệm vụ SSPST
kiểm định sự bằng nhau của hai phương sai. Giáo trình không so sánh hệ số biến động
để kết luận về độ phân tán của hai tổng thể khi giá trị trung bình không bằng nhau mà
luôn luôn so sánh hai phương sai. Chính vì vậy, GT1 đã phải đưa thêm vào công thức hệ
số biến động nhằm so sánh rủi ro trong trường hợp hai phương án đầu tư chứng khoán
có lợi nhuận kỳ vọng khác nhau.
2.2. Tổng kết chương 2
Trong chương này, chúng tôi đã tiến hành phân tích giáo trình XS - TK. Trong đó, chúng tôi
tập trung vào các đối tượng: kỳ vọng, phương sai, độ lệch chuẩn, hệ số biến động, trung
bình, mô hình hồi qui bởi đây là những lý thuyết toán có liên quan đến so sánh các mẫu dữ
liệu thống kê trong hai giáo trình chuyên ngành mà chúng tôi đã phân tích. Các kết quả
chính của chương 2 như sau:
• GT3 chỉ giới thiệu với sinh viên các khái niệm: kỳ vọng, phương sai, độ lệch chuẩn của
các đại lượng ngẫu nhiên; giá trị trung bình, phương sai, độ lệch chuẩn của tổng thể và
mẫu. Khái niệm hệ số biến động không được đưa vào giáo trình. Thêm vào đó,
trong chương trình dạy XS – TK của Đại học Kinh tế TP.HCM thì mô hình hồi qui
không được dạy. Chính những điều này khiến cho sinh viên sau khi học xong môn XS
– TK bị “hổng” một số kiến thức và thiếu một số kĩ năng trong so sánh các tham số của
hai hay nhiều tổng thể.
48
• Các nhiệm vụ liên quan đến so sánh hai trung bình của hai tổng thể luôn được giải
quyết bằng việc so sánh trực tiếp 2 giá trị trung bình tính được hoặc kiểm định sự bằng
nhau của hai trung bình khi có mẫu ngẫu nhiên của hai tổng thể đó. Các nhiệm vụ này
hoàn toàn không được giải quyết bằng mô hình hồi quy với biến giả. Điều này khiến
cho sinh viên học xong XS – TK hoàn toàn không biết so sánh hai trung bình tổng thể
bằng cách sử dụng mô hình hồi quy.
• Kiểu nhiệm vụ so sánh độ phân tán của hai tổng thể được giải quyết thông qua so sánh
trực tiếp hai phương sai hoặc kiểm định sự bằng nhau của hai phương sai..
Chính sự thiếu sót trong chương trình dạy XS – TK mà các môn chuyên ngành, cụ thể là hai
môn Kinh tế lượng và Phân tích và đầu tư chứng khoán đã phải đưa thêm vào những khái
niệm toán mới để bổ sung thêm cho những kiến thức XS – TK mà sinh viên được học trước
đó, đồng thời để ứng dụng vào chính hai môn chuyên ngành đó. Giáo trình Kinh tế lượng
phải cung cấp cho sinh viên các khái niệm về tương quan, mô hình hồi qui hai biến, mô hình
hồi qui ba biến mà đáng lẽ phải được cung cấp trong XS – TK. Còn giáo trình Phân tích và
đầu tư chứng khoán đã phải đưa thêm vào công thức hệ số biến động CV nhằm ứng dụng
vào so sánh rủi ro của hai phương án đầu tư chứng khoán trong trường hợp hai phương án
này có lợi nhuận kỳ vọng khác nhau.
Như vậy, mô hình hồi qui hai biến cũng như hệ số biến động là hai khái niệm cần thiết cho
các môn chuyên ngành nhưng các khái niệm này đã không được cung cấp trong môn XS –
TK. Chính hai môn chuyên ngành (Kinh tế lượng, Phân tích và đầu tư chứng khoán) đã phải
đưa thêm vào trong chương trình để ứng dụng giải quyết các vấn đề liên quan đến hai
chuyên ngành đó. Vì vậy, chúng tôi đưa ra kết luận là tồn tại sự không nối khớp giữa dạy
học xác suất thống kê với dạy học hai môn chuyên ngành kinh tế (Kinh tế lượng, Phân
tích và đầu tư chứng khoán). Sự không nối khớp này khiến cho sinh viên sau khi học xong
môn XS - TK sẽ thiếu một số kĩ năng so sánh các tham số của hai tổng thể, mà các kĩ năng
này rất cần thiết cho họ khi học hai môn chuyên ngành: Kinh tế lượng; Phân tích và đầu tư
chứng khoán. Sự thiếu sót trên được thể hiện qua hai giả thuyết mà chúng tôi đưa ra sau
đây:
H1: Môn XS – TK đã hình thành ở sinh viên quy tắc hành động: muốn so sánh độ phân
tán của hai mẫu thì phải so sánh hai phương sai (độ lệch chuẩn) của hai mẫu đó.
49
H2: Sinh viên không sử dụng mô hình hồi qui với biến giả khi so sánh trung bình của hai
tổng thể.
50
CHƯƠNG 3: NGHIÊN CỨU THỰC NGHIỆM
Qua quá trình phân tích thể chế dạy học XS – TK và thể chế dạy học các môn chuyên ngành
kinh tế, chúng tôi đưa ra được kết luận:
Mô hình hồi qui hai biến và hệ số biến động là hai khái niệm cần thiết cho một số môn
chuyên ngành nhưng các khái niệm này đã không được cung cấp trong môn XS – TK.
Chính hai môn chuyên ngành (Kinh tế lượng, Phân tích và đầu tư chứng khoán) đã phải đưa
thêm vào trong chương trình để ứng dụng giải quyết các vấn đề liên quan đến hai chuyên
ngành đó. Từ đó, chúng tôi đưa ra kết luận: Tồn tại sự không nối khớp giữa dạy học xác
suất thống kê với dạy học hai môn chuyên ngành kinh tế (Kinh tế lượng, Phân tích và
đầu tư chứng khoán). Sự không nối khớp này khiến cho sinh viên (sau khi học xong XS -
TK) thiếu một số kĩ năng khi so sánh các tham số của hai tổng thể. Chúng tôi đưa ra hai giả
thuyết đối với đối tượng là sinh viên học xong chương trình XS – TK trước khi học hai môn
chuyên ngành (Kinh tế lượng, Phân tích và đầu tư chứng khoán) như sau:
H1: Môn XS – TK đã hình thành ở sinh viên quy tắc hành động: muốn so sánh độ phân
tán của hai mẫu thì phải so sánh hai phương sai (độ lệch chuẩn) của hai mẫu đó.
H2: Sinh viên không sử dụng mô hình hồi qui với biến giả khi so sánh trung bình của hai
tổng thể.
Trong chương 3, chúng tôi sẽ tiến hành thực nghiệm để kiểm chứng hai giả thuyết đã đưa
ra.
3.1. Thực nghiệm
Thực nghiệm mà chúng tôi xây dựng dành cho đối tượng là sinh viên năm hai (đã học xong
môn XS – TK và đang chuẩn bị thi phân ngành) nhằm kiểm chứng hai giả thuyết H1 và H2.
Để kiểm chứng hai giả thuyết này, chúng tôi sẽ tạo ra các tình huống không quen thuộc
khiến sinh viên không thể giải quyết theo những cách thường dùng (được cung cấp trong
chương trình XS – TK).
Với giả thuyết H1, chúng tôi kiểm chứng bằng cách đưa vào một bài toán yêu cầu so sánh
độ phân tán của hai tổng thể nhưng ở đó không thể thông qua so sánh hai phương sai hay
hai độ lệch chuẩn để đưa ra kết luận. Đối chiếu cách dùng hệ số biến động với cách dùng
51
phương sai hoặc độ lệch chuẩn chúng tôi thấy “Var(X) > Var(Y) suy ra độ phân tán của X
lớn hơn của Y” chỉ đúng trong 3 trường hợp và sai trong trường hợp còn lại:
TH1: E(X) = E(Y) Kết luận trên đúng (theo ý nghĩa của phương sai)
)
=
>
=
TH2: E(X) < E(Y) Kết luận trên đúng
CV
X
CV Y
Var ( XE (
X )
Var Y )( YE )(
(Vì: )
>
)
(
)
Var
)( Y
X
( XE
Var
)( YE
)
=
>
=
Kết luận trên đúng TH3: E(X) > E(Y) và
CV
X
CV Y
Var ( ( XE
X )
Var Y )( YE )(
(Vì: )
≤
YE )(
Var
(
X
)
XE (
)
Var
Y )(
)
=
≤
=
Kết luận trên sai TH4: E(X) > E(Y) và
CV
X
CV Y
X )
( Var ( XE
Var Y )( YE )(
) (Vì:
Vì vậy để kiểm chứng H1 chúng tôi chọn bài toán rơi vào trường hợp 4. Nếu đa số sinh viên
vẫn so sánh hai phương sai hoặc hai độ lệch chuẩn để kết luận về độ phân tán của hai tổng
thể thì giả thuyết H1 xem như đã được kiểm chứng.
Câu hỏi thực nghiệm như sau :
Bài 1: Một công ty sử dụng hai công nghệ khác nhau A và B để sản xuất. Nhằm kiểm
tra xem công nghệ nào cho sản lượng ổn định hơn, người ta ghi lại khối lượng sản
phẩm (tấn) sản xuất ra sau mỗi ngày (khi sử dụng từng công nghệ trên) trong 60
ngày. Số liệu thu được như sau:
35 36 37 38 39 40 41 42 43 Sản lượng (tấn) khi sử dụng công nghệ A
1 2 7 6 8 12 14 9 1 Số ngày có cùng sản lượng
Sản lượng (tấn) 26 27 28 29 30 31 32 33
52
khi sử dụng công nghệ B
1 4 16 13 12 5 7 2 Số ngày có cùng sản lượng
Theo bạn, sản xuất theo công nghệ nào cho năng suất ổn định hơn? Giải thích cho
kết luận của bạn.
Đối với giả thuyết H2 chúng tôi kiểm chứng bằng cách chọn một bài toán yêu cầu sinh viên
so sánh các trung bình sao cho nếu làm theo cách so sánh trực tiếp hay kiểm chứng sẽ gặp
nhiều khó khăn. Bài toán này nếu sử dụng mô hình hồi qui với biến giả sẽ cho kết luận hợp
lý nhất.
Câu hỏi thực nghiệm như sau:
Bài 2: Để nghiên cứu nhu cầu của người dân về hai loại mặt hàng A và B tại thành
phố H, người ta tiến hành khảo sát giá bán và lượng hàng A và B bán được tại thành
phố H theo các tháng khác nhau và thu được các số liệu cho ở bảng sau:
Lượng hàng bán được Giá bán (ngàn
(tấn/tháng) đồng/kg) Mặt hàng
B 3 20
A 3 17
A 3 18
A 4 15
A 4 16
B 4 18
A 5 14
B 5 15
B 5 16
B 6 10
53
Theo bạn, với cùng một giá bán thì loại mặt hàng nào bán chạy hơn? Giải thích cho
kết luận của bạn.
3.2. Phân tích tiên nghiệm
Bài 1:
Biến V1a: Cách cho số liệu hai mẫu ngẫu nhiên lấy từ hai đại lượng ngẫu nhiên X, Y
=
>
Biến V1a nhận 4 giá trị:
x
Sy ;
S
2 X
2 Y
<
>
• Số liệu thỏa:
x
Sy ;
S
2 Y
2 X
>
>
>
•
x
; Sy
;
S
Sy
Sx
2 Y
X
Y
2 X
>
>
≤
•
S
Sy
Sx
x
Sy ;
;
X
Y
2 Y
2 X
•
(Trong đó, x là giá trị trung bình của mẫu lấy từ X, y là giá trị trung bình của mẫu
lấy từ Y)
>
>
≤
Nhằm kiểm chứng H1 chúng tôi chọn số liệu của hai mẫu ngẫu nhiên lấy từ hai đại lượng
x
; Sy
S
;
Sy
Sx
2 X
2 Y
X
Y
ngẫu nhiên X, Y thỏa: . Khi đó CVx ≤ CVy, tức là độ phân tán
của X nhỏ hơn Y nhưng nếu dựa vào hai phương sai, sinh viên sẽ kết luận độ phân tán của
X lớn hơn Y dẫn tới sai lầm.
Chiến lược:
=2
• S1a: So sánh hai phương sai tính trên hai mẫu
1S
=2
Phương sai: 3,416
2S
2
>2
Phương sai: 2,64
1S
2S nên độ phân tán của khối lượng sản phẩm theo ngày khi sử dụng công nghệ A
Do
cao hơn khi sử dụng công nghệ B. Vậy sử dụng công nghệ B cho năng suất ổn định hơn.
Chiến lược này không hợp thức và cho câu trả lời sai. Nếu đa số sinh viên sử dụng chiến
lược này thì H1 xem như được kiểm chứng.
=2
• S1b: Kiểm định sự bằng nhau của hai phương sai
1S
=2
Phương sai: 3,416
2S
Phương sai: 2,64
54
2 2 1 σσ = 2
2 2 1 σσ > 2
=
≈
=
(với độ tin cậy 95%) Kiểm định giả thiết H0: với đối thiết H1:
,1
f
294
416 ,3 64,2
2 s 1 2 s 2
Ta có:
05,0=α
Với
Tra bảng mức phân vị α của phân phối Fisher – Snedecor với bậc tự do ở tử số là 59 và bậc
tự do ở mẫu số là 59, ta được :
59;59;05,0f
= 1,54
05,0=α
Vì f = 1,294 < 1,54 ; với mức ý nghĩa ta chưa đủ cơ sở để bác bỏ H0
2 2 1 σσ = 2
Vậy
2 2 1 σσ = 2
Do nên độ phân tán của khối lượng sản phẩm theo ngày khi sử dụng công nghệ A
bằng công nghệ B. Vậy hai công nghệ cho năng suất ổn định như nhau.
Chiến lược này cho câu trả lời hợp lý.
• S1c: So sánh hai hệ số biến động
=1x
=2
Sản lượng bình quân (tấn/ngày) khi sử dụng công nghệ A là: 39,683
1S
≈
,0
0466
Phương sai: 3,416
,3 461 683,39
Hệ số biến động CV1 =
=2x
=2
29,4 Sản lượng bình quân (tấn/ngày) khi sử dụng công nghệ B là:
2S
≈
055,0
Phương sai: 2,64
64,2 4,29
Hệ số biến động CV2 =
Do CV1 < CV2 nên độ phân tán của khối lượng sản phẩm theo ngày khi sử dụng công nghệ
A nhỏ hơn khi sử dụng công nghệ B. Vậy sử dụng công nghệ A cho năng suất ổn định hơn.
Chiến lược này hợp thức và cho câu trả lời hợp lý.
• S1d: Tính hai trung bình và kết luận không so sánh độ phân tán của hai tổng thể được
(do giá trị trung bình khác nhau)
Trong các chiến lược trên thì S1c, S1b cho kết quả hợp lý nhất; S1a cho kết quả chưa hợp lý.
Chúng tôi dự đoán sinh viên sẽ sử dụng nhiều S1a còn S1c, S1b sẽ ít được sử dụng hơn. S1d ít
55
được sinh viên dùng do trong giáo trình cũng đã xuất hiện bài toán ví dụ có so sánh độ phân
tán (xuất hiện không tường minh) của các đại lượng ngẫu nhiên khi kỳ vọng (trung bình)
không bằng nhau. S1c ít được sử dụng do hệ số biến động không được đưa vào trong giáo
59;59;05,0f
không có sẵn ở bảng Fisher – Codener các giá trình. S1b ít được sử dụng bởi giá trị
59;59;05,0f
trị thông dụng. Giá trị sinh viên phải tìm bằng hàm FINV trong Excell.
Bài 2:
Biến V2a: Số biến độc lập của hàm hồi qui
Biến V2b: Số phạm trù của biến giả
Biến V2c: Cách cho số liệu bài toán.
Chúng tôi chọn bài toán gồm 1 biến phụ thuộc là lượng hàng bán được (tấn/tháng) và 2 biến
độc lập, trong đó có 1 biến định lượng là giá bán và 1 biến định tính: mặt hàng có hai phạm
trù là A hoặc B. Chúng tôi đưa thêm 1 biến định lượng vào bài toán nhằm gây khó khăn cho
sinh viên sử dụng phương pháp kiểm định. Ngoài ra với cách chọn giá bán là 6 ngàn/kg chỉ
xuất hiện ở mặt hàng B gây khó khăn cho sinh viên trong việc so sánh từng cặp lượng hàng
trung bình của mặt hàng A và B theo từng giá bán cụ thể. Như vậy, bài toán này bắt buộc
các sinh viên phải sử dụng tới hồi qui với biến giả. Nếu đa số sinh viên không giải quyết
được bài toán hoặc vẫn sử dụng phương pháp kiểm định hay phương pháp so sánh từng cặp
thì chứng tỏ tồn tại giả thuyết H2 mà mà chúng tôi đã đưa ra.
Chiến lược:
• S2a: Ứng với mỗi mức giá, so sánh lượng hàng trung bình của 2 mặt hàng A và B
được bán ra.
Cái có thể quan sát được:
Lượng hàng trung bình của Lượng hàng trung bình
Giá bán (ngàn/kg) mặt hàng A được bán ra của mặt hàng B được bán
(tấn/tháng) ra (tấn/tháng)
17,5 19 3
15,5 17 4
14 15,5 5
56
10 6
Ứng với mỗi giá bán 3, 4, 5 thì lượng hàng trung bình bán ra của mặt hàng B theo
tháng lớn hơn mặt hàng A. Vậy với cùng giá bán thì mặt hàng B bán chạy hơn mặt
hàng A.
+
• S2b: Sử dụng mô hình hồi qui với biến giả (tính các hệ số bằng máy tính cầm tay)
X
Z
+ ββ 2
1
β 3
Xây dựng mô hình hồi qui: Y =
Trong đó: Z = 0 nếu mặt hàng là A ; Z =1 nếu mặt hàng là B
XY ZY XZ X Z Z2 Y Y2 X2
20 3 400 9 1 1 60 20 3
17 3 289 9 0 0 51 0 0
10 6 100 36 1 1 60 10 6
14 5 196 25 0 0 70 0 0
15 4 225 16 0 0 60 0 0
15 5 225 25 1 1 75 15 5
16 4 256 16 0 0 64 0 0
18 4 324 16 1 1 72 18 4
18 3 324 9 0 0 54 0 0
16 5 256 25 1 1 80 16 5
Tổng Tổng Tổng Tổng Tổng Tổng Tổng Tổng Tổng
159 42 5 2595 186 5 646 79 23
∑ 2
i yx∑ = -21,8 ;
ix = 9,6 ; ∑ 2
iz = 2,5;
iy =66,9 ; ∑ 2
i
X =15,9 ; Y = 4,2 ; Z = 0,5 ;
57
i zy∑ = -0,5;
i zx∑ = 2
i
i
(Trong đó xi = Xi - X ; y = Yi - Y ; z = Zi - Z )
675,2
2 −=β
94,13 =β
−
=
−= Y
X
Z
165,26
β 1
β 2
β 3
Suy ra:
Vậy Y = 26,165 – 2,675X + 1,94Z
94,13 =β
> 0 nên với cùng 1 giá bán thì mặt hàng B bán ra nhiều hơn mặt hàng A là Do
1,94 tấn/tháng
• S2c: Sử dụng mô hình hồi quy với biến giả (ước lượng hàm hồi qui bằng các phần
mềm tính toán SPSS, EVIEW,…)
Nhập các số liệu và cho chạy chương trình. Kết quả thu được hàm hồi qui của Y - lượng
hàng bán ra (tấn/tháng) theo X - giá bán (ngàn đồng/kg) và Z – biến giả (Z = 0 nếu mặt
hàng là A, Z = 1 nếu mặt hàng là B):
Y = 26,165 – 2,675X + 1,94Z (với R2 = 0,857)
Do hệ số 1,94 > 0 nên với cùng 1 giá bán thì mặt hàng B bán ra nhiều hơn mặt hàng A là
1,94 tấn/tháng
• S2d: So sánh trung bình của hai tổng thể
Lượng hàng trung bình của mặt hàng A: 16 (tấn/tháng)
Lượng hàng trung bình của mặt hàng B: 15,6 (tấn/tháng)
Vậy A bán chạy hơn B
Dự đoán về các chiến lược:
Với 4 chiến lược có thể có của sinh viên mà chúng tôi đưa ra, chúng tôi dự đoán chiến
lược S2a sẽ được sử dụng nhiều nhất do thể chế dạy học XS – TK với luôn so sánh hai
giá trị trung bình của hai tổng thể bằng cách tính toán và so sánh trực tiếp hai giá trị
trung bình hoặc kiểm định sự bằng nhau của hai giá trị trung bình. Chiến lược S2b và S2c
sẽ rất ít hoặc không xuất hiện do mô hình hồi qui không được dạy trong chương trình XS
– TK. Chiến lược S2d chỉ xảy ra khi sinh viên không hiểu rõ yêu cầu đề bài.
Trong các chiến lược trên, chiến lược đắt giá và cho kết quả đúng nhất chính là S2b và
S2c. Nếu đa số sinh viên sử dụng S2a và S2d thì giả thuyết H2 xem như được kiểm chứng.
58
3.3. Phân tích hậu nghiệm
Thông qua việc phân tích 118 phiếu thực nghiệm thu được, chúng tôi tổng kết được những
kết quả sau:
Chiến S1a S1b S1c S1d Không
trả lời lược
Số sinh 72 30 0 5 11 Bài 1
viên
Tỉ lệ 61,02% 25,42% 0% 4,24% 9,32%
S2a S2b S2c S2d Không trả Chiến
lời lược
Số sinh 83 0 0 3 32 Bài 2
viên
Tỉ lệ 70,34% 0% 0% 2,54% 27,12%
Từ bảng tóm tắt kết quả thu được chúng tôi có những kết luận sau:
Đối với bài 1, đa số sinh viên sử dụng chiến lược S1a, một số ít sinh viên làm theo
chiến lược S1b và phần còn lại (rất ít) bỏ trống phiếu hoặc cho rằng không so sánh
được độ phân tán của hai tổng thể khi trung bình không bằng nhau.
Trích dẫn bài làm của sinh viên:
59
60
Điều này khẳng định phần lớn sinh viên luôn so sánh độ phân tán của hai tổng thể dựa trên
việc so sánh hai phương sai mà không quan tâm tới giá trị trung bình của hai tổng thể. Với
kết quả này, giả thuyết H1 mà chúng tôi đưa ra đã được kiểm chứng.
Đối với bài 2, đa số sinh viên sử dụng chiến lược S2a, một số rất ít chọn S2d, phần
còn lại (khá ít) bỏ trống phiếu.
Trích dẫn bài làm của sinh viên:
61
Như vậy, mặc dù chúng tôi đã cố ý chọn số liệu sao cho cách so sánh từng cặp giá trị trung
bình (của lượng hàng bán được ứng với mỗi giá tiền khác nhau) gặp khó khăn. Tuy nhiên,
sinh viên vẫn sử dụng S2a và kết luận: với cùng giá bán thì mặt hàng B bán chạy hơn mặt
hàng A. Điều này chứng tỏ giả thuyết H2 mà chúng tôi đưa ra là hợp lý.
Những kết quả thu được từ thực nghiệm đã cho phép chúng tôi làm rõ được phần nào quan
hệ cá nhân của sinh viên năm hai Đại học Kinh tế TP.HCM đối với vấn đề so sánh các mẫu
dữ liệu thống kê thông qua việc hợp thức hai giả thuyết:
H1: Môn XS – TK đã hình thành ở sinh viên quy tắc hành động: muốn so sánh độ phân
tán của hai mẫu thì phải so sánh hai phương sai (độ lệch chuẩn) của hai mẫu đó.
H2: Sinh viên không sử dụng mô hình hồi qui với biến giả khi so sánh trung bình của hai
tổng thể.
Sự hiện diện của hai qui tắc này cho thấy quá trình dạy học XS –TK của Đại học kinh tế
TP.HCM vẫn chưa cung cấp đủ kiến thức và kĩ năng cho sinh viên, cụ thể là trong vấn đề so
sánh các mẫu dữ liệu thống kê. Trong khi các kiến thức và kĩ năng đó lại rất cần thiết cho
sinh viên học hai môn chuyên ngành: Kinh tế lượng và Phân tích & đầu tư chứng khoán.
62
Đây chính là sự không nối khớp giữa dạy học XS –TK với dạy học hai môn chuyên ngành
nêu trên.
63
KẾT LUẬN
Nghiên cứu thực hiện trong chương 1, 2, 3 cho phép chúng tôi giải đáp được những câu hỏi
liên quan đến việc dạy học XS – TK ở trường đại học mà chúng tôi đặt ra ở lời mở đầu của
luận văn.
Nghiên cứu về vấn đề so sánh các mẫu dữ liệu thống kê trong các môn Phân tích và
đầu tư chứng khoán và Kinh tế lượng, chúng tôi thấy bài toán so sánh các mẫu dữ liệu thống
kê có tác động đến nhiều vấn đề của ngành kinh tế. Các tổ chức toán học liên quan đến so
sánh các mẫu dữ liệu thống kê có yếu tố công nghệ - lý thuyết toán là: mô hình hàm hồi qui
với biến giả và kỳ vọng, phương sai, độ lệch chuẩn, hệ số biến động.
Phân tích giáo trình XS – TK kết hợp với chương trình dạy học XS – TK ở trường
Đại học Kinh tế TP.HCM, chúng tôi nhận thấy rằng: Thứ nhất, hệ số biến động hoàn toàn
không được đưa vào trong giáo trình, điều đó đồng nghĩa với việc sinh viên thiếu đi một
công cụ để so sánh độ phân tán của hai tổng thể khi có giá trị trung bình khác nhau. Thứ hai,
các mô hình hồi qui không được dạy trong chương trình XS – TK. Điều này khiến cho sinh
viên sau khi học xong môn XS – TK không hề biết xây dựng các hàm mô tả sự phụ thuộc
của các biến với nhau, đặc biệt là không biết sử dụng mô hình hồi qui với biến giả để so
sánh tham sô trung bình của các tổng thể.
Như vậy, hai giáo trình chuyên ngành (Kinh tế lượng, Phân tích và đầu tư chứng
khoán) đã phải bổ sung thêm vào một số khái niệm và công thức liên quan đến hệ số biến
động, mô hình hồi qui hai biến mà đáng lẽ phải được cung cấp ở môn XS – TK. Đây chính
là sự không nối khớp giữa dạy học XS – TK với dạy học Kinh tế lượng và Phân tích và đầu
tư chứng khoán. Sự không nối khớp này đã hình thành ở sinh viên cách ứng xử trước bài
toán so sánh các tham số tổng thể như sau:
H1: Môn XS – TK đã hình thành ở sinh viên quy tắc hành động: muốn so sánh độ phân
tán của hai mẫu thì phải so sánh hai phương sai (độ lệch chuẩn) của hai mẫu đó.
H2: Sinh viên không sử dụng mô hình hồi qui với biến giả khi so sánh trung bình của hai
tổng thể.
Do hạn chế về mặt thời gian nên chúng tôi mới chỉ nghiên cứu sự nối khớp giữa dạy học XS
– TK với dạy học Kinh tế lượng và Phân tích đầu tư chứng khoán. Ngoài hai môn chuyên
64
ngành đó ra còn một số môn chuyên ngành khác mà chúng tôi chưa kịp nghiên cứu. Thêm
vào đó nữa, chúng tôi mới chỉ phân tích trên giáo trình mà chưa đi quan sát giờ dạy của
giảng viên. Đây chính là những hướng mở ra cho các đề tài mới trong tương lai.
65
TÀI LIỆU THAM KHẢO
TIẾNG VIỆT
[1] Lê Thị Hoài Châu – Đào Hồng Nam (2013), Một nghiên cứu về dạy học xác suất trong
đào tạo ngành Y, Báo cáo tại hội thảo Didactic Việt – Pháp 2013.
[2] Tăng Minh Dũng (2009), Dạy học thống kê và vấn đề đào tạo giáo viên, luận văn thạc
sĩ Giáo dục học, Trường Đại học Sư phạm TP.HCM.
[3] Quách Huỳnh Hạnh (2009), Nghiên cứu thực hành giảng dạy thống kê mô tả ở trung học
phổ thông, luận văn thạc sĩ Giáo dục học, Trường Đại học Sư phạm TP.HCM.
[4] Võ Mai Như Hạnh (2012), Sự ngẫu nhiên trong dạy học thống kê ở lớp 10, luận văn thạc
sĩ Giáo dục học, Trường Đại học Sư phạm TP.HCM.
[5] Phạm Thị Tú Hạnh (2012), Các tham số định tâm trong dạy học thống kê ở lớp 10, luận
văn thạc sĩ Giáo dục học, Trường Đại học Sư phạm TP.HCM.
[6] Vũ Như Thư Hương (2005), Khái niệm xác suất trong dạy – học toán ở trung học phổ
thông, luận văn thạc sĩ Giáo dục học, Trường Đại học Sư phạm TP.HCM.
[7] Hoàng Ngọc Nhậm (chủ biên) (2008), Giáo trình kinh tế lượng, Nxb Lao động - Xã hội.
[8] Nguyễn Thị Ngọc Thanh (2012), Bài tập Kinh tế lượng với sự trợ giúp của Eviews,
Trường Đại học Kinh tế TP.HCM.
[9] Đặng Hùng Thắng (2007), Xác suất với thị trường chứng khoán, báo Toán học tuổi trẻ
số 336 (phát hành tháng 12/2007).
[10] Trần Gia Tùng (2009), Giáo trình lý thuyết xác suất và thống kê toán học, Nxb Đại học
Quốc gia TP.Hồ Chí Minh.
[11] Bùi Kim Yến – Thân Thị Thu Thủy (chủ biên) (2009), Phân tích và đầu tư chứng
khoán, Nxb Thống kê.
SONG NGỮ VIỆT-PHÁP
66
[12] Annie Bessot, Claude Comiti, Lê Thị Hoài Châu, Lê Văn Tiến (2009), Những yếu tố cơ
bản của Didactic Toán (Éléments fondamentaux de Didactique des Mathématiques),
Nxb Đại học quốc gia TP.Hồ Chí Minh.
67
PHỤ LỤC
ĐỀ CƯƠNG MÔN KINH TẾ LƯỢNG
Ghi Chuẩn bị Tài liệu đọc Ngày Nội dung giảng dạy
chú của sinh (chương, (Số tiết) (tên chương, phần, phương pháp
viên phần) giảng dạy)
Giáo trình Ngày Khái niệm về Kinh tế lượng
Kinh tế lượng (4 tiết) Chương 1: Mô hình hồi qui hai
– Mở đầu, biên. Các khái niệm cơ bản.
Chương 1
Làm bài tập Chương 2 Ngày Chương 2. Mô hình hồi qui hai
chương 1 biên. Ước lượng và kiểm định giả Từ phần 1 đến (4 tiết)
thiết phần 4.
1- Phương pháp bình phương nhỏ nhất
2- Các giả thiết của phương pháp bình phương nhỏ nhất
3- Phương sai và sai số chuẩn của ước lượng
4- Hệ số xác định và hệ số tương quan.
Làm bài tập Chương 2 Ngày Chương 2. Mô hình hồi qui hai
chương 2 biên. Ước lượng và kiểm định giả Từ phần 5 đến (4 tiết)
thiết Chép phần phần 11
mềm 5- Phân phối xác suất của các ước lượng EViews và 6- Khoảng tin cậy của các hệ các file dữ số hồi qui
68
liệu 7- Kiểm định sự phù hợp của hàm hồi qui.
8- Ứng dụng của phân tích hồi qui, vấn đề dự báo.
Đọc hướng Ngày
dẫn sử dụng (4 tiết) Chương 3. Mở rộng mô hình hồi [1] Chương 3
phần mềm qui hai biến
EViews
Ngày Sử dụng
phần mềm (4 tiết) Chương 4: Mô hình hồi qui bội [1] Chương 4
EViews để
giải các thí
dụ và bài tập
Ngày Sử dụng
phần mềm (4 tiết) Chương 5: Hồi qui với biến giả [1] Chương 5
EViews để
giải các thí
dụ và bài tập
Ngày Thực hành trên phòng máy [2] phần
hướng dẫn sử (4 tiết)
dụng phần
mềm EViews
Giải các bài Ngày Chương 6: Đa cộng tuyến [1] Chương 6
tập chương (4 tiết) Chương 7: Phương sai thay đổi Chương 7 3, 4, 5 Chương 8: Tự tương quan Chương 8
Ngày [1] Chương 9 Giải các bài
69
tập chương (4 tiết) Chương 9: Chọn mô hình và kiểm
6, 7, 8 định việc chọn mô hình
Giải các bài Ngày
tập chương (4 tiết) Thực hành trên phòng máy
9
Ngày - Hệ thống môn học
(5 tiết) - Sửa bài tập
- Giải đáp thắc mắc
Tổng
cộng:
45 tiết
70
PHIẾU THỰC NGHIỆM
71
72
PHIỂU TRẢ LỜI CỦA SINH VIÊN
73
74
75
76
77
78
79
80
81
82
83