ƯƠ
CH
NG 1
Ề Ơ Ả
Ữ
Ấ
NH NG V N Đ C B N
Ự
Ố
Ủ
C A TH NG KÊ TH C HÀNH
ọ
ươ
ố 1.1. Khoa h c th ng kê và các ph
ọ ng pháp toán h c
ề ơ ả ủ
ự
ữ
ấ
ố
1.2. Nh ng v n đ c b n c a th ng kê th c hành
ự
ọ
ọ
ươ
1.3. Mô hình hoá toán h c và l a ch n ph
ng pháp
phân tích
ƯƠ
CH
NG 2
ƯƠ
Ẫ
Ế
Ề
PH
NG PHÁP M U VÀ LÝ THUY T ĐI U
c v ph
Ẫ Ọ TRA CH N M U ẫ ng pháp m u ề
ẫ
ọ
ẫ ẫ
ơ ượ ề ươ 2.1. S l ữ ề ơ ả ủ ấ 2.2. Nh ng v n đ c b n c a đi u tra ch n m u ươ ọ ng pháp ch n m u 2.3. Các ph ọ ươ ng pháp ch n m u khác 2.4.Các ph ỏ ế ả c v lý thuy t b ng h i 2.5. S l ươ Tóm t
ơ ượ ề ắ ng
t ch
Nội dung và kỹ năng
- Cơ sở nào để có thể sử dụng các số liệu quan sát về một đại lượng
biến đổi để suy đoán về các đặc trưng của đại lượng đó.
- Các đặc trưng mẫu của các biến trong tổng thể hữu hạn khác gì với trường hợp tổng thể vô hạn. Khi thực hành việc ước lượng, kiểm định giả thuyết có thể hiệu chỉnh như thế nào?
- Đối với mẫu phân cấp việc ước lượng các đặc trưng có thể tiến hành như thế nào? ý nghĩa của ước lượng theo tỷ lệ bộ phận tối ưu là gì?
- Các phương pháp chọn mẫu đòi hỏi tuân theo nguyên tắc nào? tại
sao?
- Các cách lấy mẫu khác nhau được sử dụng trong các trường hợp
khác nhau như thế nào?
- Làm thế nào để tính toán được các kích thước mẫu, kích thước
mẫu bộ phận và cơ cấu của mẫu khi đã xác định mẫu toàn bộ?
- Một số cách xác định kích thước mẫu thông dụng - Bảng hỏi và phân loại bảng hỏi. Những nguyên tắc cơ bản thiết lập
bảng hỏi
- Các loại câu hỏi và thang đo các biến tương ứng.
ƯƠ
Ố
Ả
CH
NG 3. TH NG KÊ MÔ T
ả ố
ế
ớ
3.1. Mô t
th ng kê v i 1 bi n
ả
ả ồ ả ố
nhóm ể ồ ạ
ờ đ ng th i và mô t ồ ị th ng kê nh các bi u đ và đ th ẫ
ố ệ
ụ ụ
ơ ượ ề c v SPSS và STATA ả ố th ng kê ả ố th ng kê
ắ
3.2. Mô t ờ 3.3. Mô t ể 3.4. Ki m tra, đánh giá và làm s ch s li u m u Ph l c 1: S l ớ 1. Stata v i mô t ớ 2. SPSS v i mô t ươ ng t ch Tóm t
₋ Với các đặc trưng thống kê từ mẫu có thể tiến hành các phân tích sơ bộ để phát hiện tình trạng của biến. Kết hợp mô tả các đặc trưng trong nghiên cứu thống kê.
₋ Mô tả thống kê cho phép kiểm tra tính chất của dữ liệu cũng như các
quan hệ của các biến thể hiện qua dữ liệu quan sát được.
₋ Kỹ thuật sử dụng các mô tả phân nhóm trong phân tích thống kê bao
hàm cả việc mô tả gộp và chi tiết có thể được hỗ trợ bởi các phần mềm chuyên dụng.
₋ Lựa chọn công cụ mô tả phù hợp nhất là các dạng biểu đồ sẽ làm cho
hiệu quả mô tả tốt hơn.
₋ Mô tả thống kê với các đặc trưng hiệu chỉnh. ₋ Chuẩn hóa số liệu có thể thực hiện thông qua phân tích biểu đồ phổ. ₋ Các kỹ thuật làm sạch dữ liệu ₋ Đánh giá độ tin cậy của dữ liệu là công việc không thể thiếu khi xử lý,
phân tích các dữ liệu mẫu.
₋ Nội dung chính của đánh giá dữ liệu ₋ Sử dụng đường cong ROC lựa chọn biến tính hiệu dự đoán và ngưỡng
tín hiệu tốt nhất.
ƯƠ
CH
NG 4
ƯƠ
PHÂN TÍCH PH
ươ
4.1. Mô hình phân tích ph 4.2. Phân tích ph
NG SAI ố ươ ng sai, nhân t ố ệ ộ ng sai m t nhân t
phân tích ả hi u qu xác
đ nhị
ươ
ố ệ
ẫ
4.3. Phân tích ph
ộ ng sai m t nhân t
ả hi u qu ng u
nhiên
ươ
ố ệ
ả
4.4. Phân tích ph
ng sai hai nhân t
hi u qu xác
đ nhị
ớ
ươ
ng sai
ươ
ắ
4.5. SPSS và STATA v i Phân tích ph Tóm t
t ch
ng
Nội dung và kỹ năng ₋ Mô hình phân tích phương sai cố điển như một cách tiếp cận giải
quyết bài toán so sánh các trung bình.
₋ Nhận biết nhân tố tác động cố định và ngẫu nhiên ₋ Cơ sở lý thuyết giải quyết các bài toán phân tích thống kê có thể
qui về mô hình phân tích phương sai
₋ Phân tích nguồn sai số giữa giá trị các biệt với giá trị chung bình
chung
₋ Vấn đề so sánh cặp trong phân tích phương sai và sử dụng trong
phân tích thống kê
₋ Phân tích phương sai khi phương sai các nhóm không đồng nhất. ₋ Giải thích kỹ thuật phân tích phương sai trong phân tích sự phù
hợp của hàm hồi qui.
₋ Phân tích phương sai nhiều nhân tố áp dụng cho so sánh hồi qui ₋ Những kỹ năng cơ bản thực hiện phân tích phương sai trên
SPSS và Stata. Phân tích kết quả trên output của các phần mềm SPSS và Stata.
ƯƠ CH NG 5
Ị Ố KI M Đ NH PHI THAM S
ể Ể ươ ị 5.1. Ki m đ nh khi bình ph ng
ụ ể ạ ố ị 5.2. Các ki m đ nh d ng phân ph i thông d ng
ơ ở ươ ể ạ ị 5.3. Các ki m đ nh trên c s t ng quan h ng
ớ ị ố ể 5.4. Stata v i các ki m đ nh phi tham s
ớ ị ố ể 5.5. SPSS v i ki m đ nh phi tham s
ắ ươ Tóm t t ch ng
ộ
ệ
ị
ị
ị ẫ
́
ợ ủ
ể
ế ậ ớ
ị ụ ể
ệ
ố
ng.
ơ ̉ N i dung c ban ₋ Phân bi ố ể ố ể t ki m đ nh phi tham s và ki m đ nh giá tr các tham s ế ủ c a các bi n ng u nhiên. ́ ổ ự ́
́
̣ ̣ ̉ ̉ ̣
̀ ̃
̀
́
̀
́
₋ Ly thuyê t t ng quát ti p c n ki m đ nh s phù h p c a các ự ươ ị phân ph i th c nghi m v i công c ki m đ nh Khi bình ph ̀ Cu ng môt sô biê n dang cua kiêm đinh na y ́ ơ
ể
ấ
̣
₋ Ky năng s dung các ki m đ nh d u va l p ca c ba i toa n s ử ị
̣ ̉ ̣
ử dung kiêm đinh dâ u.́
́
́
́
́
̣ ̉ ̉ ̣ ̣
Cách th c s d ng các k thu t này trên SPSS.
ử ụ
ạ
₋ Môt sô tiêu chuân kiêm đinh ca c qui luât phân phô i xa c suâ t. ́ ỹ ậ ứ ử ụ ₋ Cách hình thành các h s t ệ ệ ố ươ ng quan h ng và s d ng các h ể
́
ư
̉ ̣ ̣ ̣
ị ng quan hang va ng dung. ́
́ ̃
ố s này trong t ng bài toán ki m đ nh ̀ ươ ể
ử
ị
̣ ̉
ừ ₋ Ca c kiêm đinh t ₋ Ky năng s dung ca c tiêu chuân ki m đ nh trên Stata và SPSS.
ƯƠ CH NG 6
Ồ ƯƠ PHÂN TÍCH H I QUI VÀ T NG QUAN
ồ 6.1. Mô hình h i qui
ươ 6.2. Phân tích t ng quan
ồ ươ ớ 6.3. Phân tích h i qui và t ng quan v i SPSS và Stata
ắ ươ Tóm t t ch ng
₋ Khái niệm quan hệ phụ thuộc tương quan, hàm hồi qui thực nghiệm ₋ Mô hình hồi qui tổng thể, hệ số hồi qui, sai số ngẫu nhiên, dạng tuyến
tính của mô hình hồi qui
₋ Dò tìm quan hệ phụ thuộc tương quan phi tuyến ₋ Phân tích hồi qui và dự báo ₋ Hồi qui đơn và hồi qui bội sự khác nhau trong phân tích, dự báo ₋ Các hệ số tương quan tuyến tính trong mô hình hồi qui ₋ Hồi qui với biến định tính, vấn đề phân tích kết quả ước lượng ₋ Hồi qui biến định tính với biến kiểm soát (định tính) ₋ Ứng dụng hồi qui Logistics trong phân lớp, xếp hạng cá thể ₋ Hồi qui logit nhiều mức, cách tính toán và phân tích kết quả ₋ Hồi qui Probit, cách tính toán và dự báo xác suất trên cơ sở kết quả hồi
qui cụ thể.
₋ Hồi qui thứ bậc và phân tích ₋ Các kiểm định đối với hồi qui thứ bậc. ₋ Kỹ năng ước lượng hồi qui và phân tích trên stata và spss.
₋ Hệ số tương quan tuyến tính, hệ số tương quan tuyến tính
mẫu và kiểm định, ước lượng đối với hệ số tương quan
tuyến tính
₋ Hệ số tương quan tuyến tính riêng phần, kiểm định và ước
lượng
₋ Ý nghĩa của các kết quả kiểm định sự bằng nhau của hệ số
tương quan tuyến tính và hệ số tương quan tuyến tính riêng
phần. Phân tích cụ thể các trường hợp kết luận từ kiểm
định để đánh giá vai trò của biến điều kiện đối với quan hệ
của hai biến nghiên cứu
ƯƠ CH NG 7
Ố ƯƠ Ầ PHÂN TÍCH NHÂN T PH NG PHÁP THÀNH PH N CHÍNH
ơ ả ng c b n
ả ưở ắ ố ệ
ạ ế , tóm t ế t s li u ế
ườ ươ ừ ệ ộ ng sai
ầ ợ ử ụ ng h p s d ng đ đo t ả ậ ầ ế
ma tr n hi p ph ph n chính ế gi
ọ ố ầ ộ
ồ
ầ ớ
ươ ắ 7.1. Bài toán phân tích nhân tố 7.2. Bài toán cà các ý t 7.3. Mô t 7.4. T o bi n và phép chi u trong không gian tuy n tính 7.5. Phân tích thành ph n chính 7.6. Tr 7.7. Phân tích k t qu phân tích thành ẳ ỷ ệ ả i thích trên các siêu ph ng chi u 7.8. T l ẩ 7.9. Tiêu chu n ch n s thành ph n chính cho m t phân tích ầ 7.10. Mô hình h i qui thành ph n chính 7.11. Stata và SPSS v i phân tích thành ph n chính Tóm t t ch ng
Các nội dung và kỹ năng chính
• Chương này chỉ tập trung trình bày phân tích thành phần chính. • Mô tả dữ liệu cho bài toán phân tích thành phần chính bằng ngôn ngữ ma trận là cơ sở cho việc thiết lập mô hình phân tích thành phần chính qua phép chiếu trong không gian tuyến tính
• Bài toán phân tích thành phần chính có mục đích rút gọn số liệu và trực
giao hóa các thông tin về các cá thể trong tổng thể.
• Việc lựa chọn ma trận phân tích (ma trận tương quan hay ma trận hiệp phương sai) sẽ ảnh hưởng đến cách sử dụng kết quả phân tích thành phần chính.
• Các tiêu chuẩn khác nhau để đánh giá sự phù hợp của số liệu phân tích • Các đặc trưng phản ảnh quan hệ của đám mây số liệu ban đầu và ảnh của nó. Các đặc trưng này thành hai nhóm: nhóm các đặc trưng đánh giá vai trò của các biến ban đầu và nhóm các đặc trưng phản ánh của các thành phần chính.
• Chỉnh sửa mô hình, lựa chọn biến cũng như định danh các biến mới . • SPSS có thể xem là một trong các phần mềm tiện dụng. • Sử dụng kết quả phân tích cho các dự báo nhờ phân tích bổ sung với
các cá thể cũng như các biến.
• Hồi qui thành phần chính
ƯƠ CH NG 8
Ố ƯƠ Ứ
ả ế NG NG ố ệ
ả ươ ố ớ ng
ể ồ
ắ ố ớ ng ng cho phân tích chính t c đ i v i hai
ụ ị bi n đ nh tính
ng ng trên SPSS ng ng trên Stata
PHÂN TÍCH NHÂN T T ộ 8.1. B ng ti p liên và các đ đo đ i v i đám mây s li u 8.2. Kho ng cách Khi bình ph ầ ế 8.3. Phân tích thành ph n chính trong các không gian chi u ờ ễ 8.4. Bi u di n đ ng th i ươ ứ 8.5. Áp d ng phân tích t ế 8.6. Phân tích t 8.7. Phân tích t ươ ắ Tóm t ươ ứ ươ ứ ng t ch
Nội dung chính
Phân tích tương ứng các dấu hiệu của hai biến định tính trên tập hợp
các cá thể
Phân tích tương ứng giữa tập hợp chỉ số trên hai biến định tính. • Tiếp cận qua phân tích nhân tố́. Đối với hai dấu hiệu nhị phân: một mở rộng của bài toán kiểm định sự độc lập của hai biến định tính. Sự khác biệt: ngoài kiểm định sự độc lập mô hình cho phép tìm kiếm sự tương ứng của các dấu hiệu trên hai biến.
• Cần mô hình hóa với sự trợ giúp của các ma trận cấu trúc tần số
dòng, tần số cột. Nhờ các mô tả này qui bài toán về phân tích nhân tố cho các dấu hiệu (cá thể) dòng và các dấu hiệu (cá thể cột). • Ưu điểm chính của cách tiếp cận này là số chiều của không gian chiếu phụ thuộc vào số dấu hiệu của biến có ít dấu hiệu hơn.
• Việc ứng dụng mô hình này cho hai biến biểu hiện như hai tập chỉ số
là một mở rộng của Phân tích tương quan chính tắc.
ƯƠ CH NG 9
Ố ƯƠ Ứ Ế Ề PHÂN TÍCH NHÂN T T NG NG NHI U BI N
ứ ả 9.1. Cách th c mô t ố ệ và mã hoá s li u
ươ ứ ề 9.2. Phân tích t ế ng ng nhi u bi n
ươ ứ ế ề 9.3. Phân tích t ng ng nhi u bi n trên SPSS
Nội dung chính
• Mô hình hóa và mã hóa dữ liệu để có thể thiết lập các ma
trận thông tin mô hình hóa.
• Xây dựng các công thức để có thể chuyển bài toán thành
các bài toán phân tích nhân tố đã xét trong chương 7.
• Phân tích lời giải để có thể tìm kiếm các tọa độ của các cá
thể. Các biến trên các không gian chiếu.
• Cách thức sử dụng phần mềm hỗ trợ bài toán cũng như
mô tả kết quả thuận lợi cho phân tích.
ƯƠ CH NG 10
ƯƠ Ắ PHÂN TÍCH T NG QUAN CHÍNH T C
ươ ế 10.1. Phân tích t ắ ớ ng quan chính t c v i hai nhóm bi n
ắ ớ ế 10.1.1. Bài toán phân tích chính t c v i hai nhóm bi n
ả ờ ả ủ 10.1.2. Mô t ậ ma tr n và l i gi i c a bài toán
ả ọ ờ ả ủ 10.1.3. Gi i thích hình h c l i gi i c a bài toán
ấ ả ế ặ 10.1.4. Tìm t ắ t c các c p bi n chính t c
ể ị 10.1.5. Các ki m đ nh
ả ọ ế ả 10.1.6. Mô t ắ hình h c k t qu phân tích chính t c
ắ 10.1.7. Phân tích chính t c trên SPSS và Stata
ươ ắ ổ 10.2. Phân tích t ng quan chính t c t ng quát
ắ ươ Tóm t t ch ng
Nội dung chính
₋ Với 2 tập biến: độc lập với nhau ? hoặc ngược lại: xác định tầm quan trọng của các mối quan hệ có thể tồn tại giữa hai tập biến này .
₋ Tính toán được một tập hợp các trọng số cho mỗi tập hợp các biến phụ thuộc và độc lập để các cặp tổ hợp tuyến tính của mỗi bộ được tương quan tối đa.
₋ Giải thích bản chất của mối quan hệ tồn tại giữa các bộ biến phụ
thuộc và độc lập, thường bằng cách đo sự đóng góp tương đối của mỗi biến đến các hàm chính tắc đã được được chiết xuất. ₋ Mô tả, kiểm định các quan hệ của mỗi biến (độc lập hoặc phụ
thuộc) đối với mỗi biến chính tắc tương ứng.
₋ Xác định số cặp biến chính tắc có hệ số tương quan khác 0 có ý
nghĩa thống kê.
₋ Xác nhận các quan hệ tuyến tính của các nhóm biến trong các mô
hình thống kê đa biến có liên quan.
₋ Mở rộng phân tích tương quan chính tắc đối với nhiều cặp nhóm
biến (Kỹ năng trên SPSS).
ƯƠ CH NG 11
ƯƠ Ớ CÁC PH NG PHÁP PHÂN L P
ộ ố ơ ở ệ 11.1. M t s khái ni m c s
ươ 11.2. Các ph ớ ng pháp phân l p
ớ ứ ậ 11.3. Phân l p theo th b c
ố ớ ế ớ 11.4. Phân l p đ i v i các bi n
ớ 11.5. Bài toán phân l p trên SPSS và Stata
ắ ươ Tóm t t ch ng
Nội dung chính
₋ Các khái niệm cơ bản được sử dụng trong các bài toán
phân lớp.
₋ Các phương pháp phân lớp dựa trên cơ sở các chỉ số quan hệ hay các chỉ số khác biệt (khoảng cách), tính chất của các chỉ số này đối với các biến nhị phân.
₋ Các phương pháp tính khoảng cách của các lớp ₋ Bài toán phân lớp tối ưu đối với các biến nhị phân ₋ Cơ sở lý thuyết chung của phương pháp kiểu đám mây di
động, sự khác nhau của hai phương pháp cụ thể. ₋ Chọn số lớp nhờ mức sai lầm loại 1 của kiểm định F ₋
Tư tưởng chung của phân lớp theo thứ bậc và các khái niệm, định nghĩa có liên quan. ₋ Chọn số lớp trong phân lớp thứ bậc ₋ Tiêu chuẩn quán tính và phương pháp Ward. Thuật toán. ₋ Phân lớp các cá thể; phân lớp các biến cùng các ứng dụng. ₋ Sử dụng SPSS giải quyết bài toán phân lớp và phân tích kết
quả.
ƯƠ CH NG 12
PHÂN TÍCH KHÁC BI TỆ
ộ ệ ạ ụ ể ủ 12.1. M t minh ho c th c a phân tích khác bi t
ươ 12.2. Các ph ọ ng pháp hình h c
ươ 12.3. Các ph ấ ng pháp xác su t
ệ ớ 12.4. Phân tích khác bi t v i SPSS và Stata
ắ ươ Tóm t t ch ng
Nội dung chính
₋ Mô hình phân tích khác biệt và các khái niệm chính. ₋ Một số độ đo và các ma trận cấu thành mô hình. ₋ Các kiểm định có liên quan đến sự phù hợp của phân tích khác biệt
với một mẫu quan sát
₋ Cách vận dụng một mô hình phân tích khác biệt để có thể mô hình
hóa các bài toán thống kê phù hợp.
₋ Vận dụng các phương pháp phân tích khác biệt khác nhau, đặc biệt là
₋
trường hợp k=2. Trường hợp sử dụng mô hình tham số và phi tham số, mô hình xác suất Bayes
₋ Ứng dụng phân tích khác biệt với k-2 cho một số bài toán kinh tế-xã
hội
₋ Phân tích khác biệt với k>2 (trường hợp tổng quát) ₋ Cấu trúc mô hình và cách tính toán các ma trận tương quan, hiệp
phương sai các nhóm và phương sai gộp
₋ Các tiêu chuẩn chọn biến phân tích ₋ Sử dụng được các phần mềm chuyên dụng SPSS, Stata để giải các
bài toán và phân tích được kết quả.
ầ
ề
ữ ệ
ự
ạ
ỗ ợ ả Ph n m m, d li u h tr gi ng d y và th c hành • Phần mềm: EXCEL, STATA, SPSS • Dữ liệu:
Tên t pệ ngươ
STT 1 hhexp98n Dùng cho ch 2; 3; 4; 5; 6; 7; 8; 11; 12
D ngạ Sav, dta sav sav sav sav sav dta sav sav sav sav sav 3; 4; 5; 6; 7; 8; 9; 10; 11; 12 3 3; 6; 7; 11 3; 6 3 3 3 3 3; 4; 10; 12 3 4; 6 2 3 4 5 6 7 8 9 10 11 12 GSS93 VLHS2002 World95 Employee data AGF VLHS2006_2a autoacidents hivassay bankloan Tv_servey Car
Hhexp20043 Grocery_1monht
13 14 15 Workpro 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 sav sav sav GDP_nganh06_12 Xls sav binary dta mlogit sav DN_vonNN sav Haiphong1 sav SolieuDN sav Dn2011 sav DHS97 sav SVTN sav didanHN1 sav hhexp2004 sav Census1 sav Dn2010 sav HCMdis sav thidu11 4 4 4 4 6 6 6 6 6 7 7; 11 8; 12 11 11 11 11 12 12