BÀI 1 BÀI 1
KI N TH C M Đ U Ứ KI N TH C M Đ U Ứ
Ở Ầ Ở Ầ
Ế Ế
GI GI
I THI U TH NG KÊ I THI U TH NG KÊ
Ớ Ớ
Ố Ố
Ệ Ệ
ề ề
ề ề
ế ế ệ ệ ứ ứ
ề ề
ố ệ ố ệ ế ế ữh u ích ữ h u ích ậ ậ
c quan tâm. c quan tâm. ệ ệ ố ệ ố ệ ề ượ ề ượ
ệ ệ
ậ ậ
ố ố
ử ử ề ề
ụ ụ ẩ ẩ ệ ệ ậ ậ ế ế ộ ộ
Trong xã h i ngày nay, nhi u quy t đ nh v chính ề ộ ế ị Trong xã h i ngày nay, nhi u quy t đ nh v chính ế ị ộ ề c phát tri n đ u d a trên c s s sách, chi n l ơ ở ố ự ể ế ượ c phát tri n đ u d a trên c s s sách, chi n l ơ ở ố ự ể ế ượ li u.ệli u.ệ H u h t các ngành khoa h c nghiên c u, công nghi p ọ ầ H u h t các ngành khoa h c nghiên c u, công nghi p ầ ọ th c nghi m đ u sinh ra s li u. Vi c phân tích ệ ự th c nghi m đ u sinh ra s li u. Vi c phân tích ệ ự ” là nh ng s li u này và rút ra các k t lu n “ ữ ” là nh ng s li u này và rút ra các k t lu n “ ữ v n đ đ ấ v n đ đ ấ Ho t đ ng th ng kê liên quan đ n vi c nghiên c u ố ứ ế ạ ộ Ho t đ ng th ng kê liên quan đ n vi c nghiên c u ố ứ ế ạ ộ ch c, phân tích và rút ra k t lu n t v thu th p, t ậ ừ ế ứ ổ ề v thu th p, t ch c, phân tích và rút ra k t lu n t ậ ừ ế ứ ổ ề ““bi n s bi n s ng pháp th ng kê giúp ta s li u. Các ph ế ố ươ ố ệ s li u. Các ph ng pháp th ng kê giúp ta ươ ố ệ ế ố ứ ””.. li u thành tri th c ệ li u thành tri th c ứ ệ M t s v n đ áp d ng th ng kê: x lý tín hi u, lý ố ộ ố ấ M t s v n đ áp d ng th ng kê: x lý tín hi u, lý ố ộ ố ấ thuy t thông tin, ch n đoán lâm sàng, đ tin c y h ệ thuy t thông tin, ch n đoán lâm sàng, đ tin c y h ệ th ng, phân tích s ng sót. th ng, phân tích s ng sót. ố ố ố ố
Đ I T Đ I T
NG NG
Ố ƯỢ Ố ƯỢ
ng mang thông tin, liên quan ng mang thông tin, liên quan
ố ượ ố ượ ng l y ra t ấ ng l y ra t ấ t ng th . ể t ng th . ể ừ ổ ừ ổ
c trên các đ i t c trên các đ i t ậ ượ ậ ượ ng c a ủ ng c a ủ ố ượ ố ượ
ể ể ổ ổ
ể ể ế ế ẫ ẫ ậ ậ
T ng th population)) ể ( (population T ng th ổ ể ổ - T p h p các đ i t ố ượ ợ ậ - T p h p các đ i t ố ượ ợ ậ đ n nghiên c u. ứ ế đ n nghiên c u. ứ ế M u ẫM u ẫ ((sample sample)) M t nhóm đ i t - - M t nhóm đ i t ộ ộ S li u ố ệ ( (datadata)) S li u ố ệ - Thông tin thu th p đ - Thông tin thu th p đ m u.ẫm u.ẫ Phân tích s li u data analysis)) ố ệ ( (data analysis Phân tích s li u ố ệ ng pháp th ng kê đ phân tích, t ng - Dùng các ph ố ươ ng pháp th ng kê đ phân tích, t ng - Dùng các ph ố ươ h p trên s li u m u đ rút ra các k t lu n cho các ố ệ ợ h p trên s li u m u đ rút ra các k t lu n cho các ợ ố ệ v n đ nghiên c u. ấ v n đ nghiên c u. ấ
ứ ứ ề ề
C S C A PHÂN TÍCH S LI U C S C A PHÂN TÍCH S LI U
Ơ Ở Ủ Ơ Ở Ủ
Ố Ệ Ố Ệ
ồ ố ủ ố ệ ồ ố ủ ố ệ
đâu: đi u tra, đo đ c, tính toán đâu: đi u tra, đo đ c, tính toán ố ệ ố ệ c t ượ ừ c t ượ ừ ề ề ạ ạ
Ngu n g c c a s li u Ngu n g c c a s li u - S li u có đ - S li u có đ …… - M c đ chính xác c a s li u. - M c đ chính xác c a s li u.
ủ ố ệ ủ ố ệ ứ ộ ứ ộ
Ki n th c v s li u ứ ề ố ệ Ki n th c v s li u ế ứ ề ố ệ ế N m các ki n th c chuyên ngành liên quan đ n s - - N m các ki n th c chuyên ngành liên quan đ n s ế ố ứ ế ắ ứ ế ắ ế ố li u. Hi u rõ các v n đ phân tích trên s li u. ề ấ ệ li u. Hi u rõ các v n đ phân tích trên s li u. ề ấ ệ
ố ệ ố ệ ể ể
ứ ề ố ứ ề ố
ng pháp phân tích th ng kê. ng pháp phân tích th ng kê.
Ki n th c v th ng kê Ki n th c v th ng kê - N m các mô hình, ph ươ - N m các mô hình, ph ươ
ế ế ắ ắ ố ố
QUY TRÌNH PHÂN TÍCH S LI U QUY TRÌNH PHÂN TÍCH S LI U
Ố Ệ Ố Ệ
Đ T BÀI TOÁN
Ặ
CH N THI T K
Ọ
Ế
Ế
PHÂN TÍCH THĂM DÒ
CH N MÔ HÌNH
Ọ
PHÂN TÍCH S LI U
Ố Ệ
PHÂN TÍCH K T QU
Ế
Ả
TRÌNH BÀY K T QU
Ế
Ả
S LI U – THÀNH PH N S LI U S LI U – THÀNH PH N S LI U
Ầ Ố Ệ Ầ Ố Ệ
Ố Ệ Ố Ệ
ủ ủ ư ư ng nào đó c a đ i ố ng nào đó c a đ i ố
ổ ổ
ề ề ệ ệ ặ ặ ở ở
c c a bi n s trên m i đ i ố ố c c a bi n s trên m i đ i ố ố ượ ượ ủ ủ ế ế ỗ ỗ
Bi n s variable)) ế ố ((variable Bi n s ế ố - Th hi n đ c tr ng, đ i l ạ ượ ặ ệ ể - Th hi n đ c tr ng, đ i l ạ ượ ệ ể ặ ng nghiên c u trong t ng th . t ể ứ ượ ng nghiên c u trong t ng th . t ứ ể ượ i tính, ngh nghi p, cân n ng, s thích … - Ví d : gi ớ ụ - Ví d : gi i tính, ngh nghi p, cân n ng, s thích … ớ ụ Quan sát Quan sát ((case case)) - Giá tr thu th p đ ậ ị - Giá tr thu th p đ ậ ị ẫ ng c a m u. t ủ ượ ng c a m u. t ủ ẫ ượ T p giá tr c a bi n s T p giá tr c a bi n s ị ủ ậ ị ủ ậ - T p giá tr có kh năng xu t hi n c a bi n s . ế ố ị ậ - T p giá tr có kh năng xu t hi n c a bi n s . ị ậ ế ố
ế ố ế ố ả ả ệ ủ ệ ủ ấ ấ
S LI U – CÁC LO I BI N S LI U – CÁC LO I BI N
Ố Ệ Ố Ệ
Ạ Ạ
Ế Ế
ế ế
ạ ạ ế ế
ặ ặ
ế ế
ể ắ ể ắ ế ế ỉ ỉ
h n kém. h n kém. ế ế
Bi n đ nh l scale)) ượ ((scale ng Bi n đ nh l ị ng ượ ị - Giá tr nh n là các s đo (đo đ c, đ m, quan sát) ố ậ ị - Giá tr nh n là các s đo (đo đ c, đ m, quan sát) ố ậ ị - Ví d : cân n ng, thu nh p, s sinh viên … ậ ố ụ - Ví d : cân n ng, thu nh p, s sinh viên … ậ ố ụ Bi n đ nh tính có th t ordinal)) ứ ự ((ordinal Bi n đ nh tính có th t ị ứ ự ị - Giá tr nh n ch tính ch t, đ c đi m có th s p x p ể ặ ấ ậ ị - Giá tr nh n ch tính ch t, đ c đi m có th s p x p ặ ể ấ ậ ị , bi u th m c đ quan tr ng. theo th t ọ ị ứ ộ ể ứ ự , bi u th m c đ quan tr ng. theo th t ọ ị ứ ộ ể ứ ự Ví d : m c đ hài lòng, trình đ h c v n … - - Ví d : m c đ hài lòng, trình đ h c v n … ộ ọ ấ ứ ộ ụ ộ ọ ấ ứ ộ ụ Bi n đ nh tính không có th t Bi n đ nh tính không có th t (nomial) ứ ự (nomial) ế ị ứ ự ế ị - Giá tr nh n c a bi n không có th t ứ ự ơ ậ ủ ị - Giá tr nh n c a bi n không có th t ứ ự ơ ậ ủ ị i tính, quê quán, tôn giáo … - Ví d : gi ớ ụ - Ví d : gi i tính, quê quán, tôn giáo … ớ ụ
S LI U – CÁC LO I BI N S LI U – CÁC LO I BI N
Ố Ệ Ố Ệ
Ạ Ạ
Ế Ế
ụ ụ
ế ế ộ ộ
ả ọ ậ ả ọ ậ ươ ươ ế ế ạ ạ
Bi n đ c l p - ph thu c Bi n đ c l p - ph thu c ndependent - dependent)) ộ (i(independent - dependent ế ộ ậ ế ộ ậ ộ ” trong mô hình. nguyên nhân - k t quế - Các bi n ch “ ả” trong mô hình. ỉ nguyên nhân - k t quế ế - Các bi n ch “ ả ỉ ế ng đ n bi n ph thu c. Giá tr bi n đ c l p nh h ụ ế ưở ộ ậ ả ị ế ng đ n bi n ph thu c. Giá tr bi n đ c l p nh h ụ ế ưở ộ ậ ả ị ế - Ví d : chi u cao >> cân n ng; qu ng cáo >> doanh ả ặ ề ụ - Ví d : chi u cao >> cân n ng; qu ng cáo >> doanh ả ặ ề ụ ng pháp d y >> k t qu h c t p i tính, ph thu; gi ớ ng pháp d y >> k t qu h c t p thu; gi i tính, ph ớ ……
, nhóm , nhóm factor, group)) ((factor, group ế ế ố ố
hay nhóm hay nhóm ố ố
ả ọ ậ ả ọ ậ ộ ế ộ ế ố ố ậ ậ
ụ ụ i tính … i tính …
Bi n nhân t Bi n nhân t - Bi n chia các quan sát thành các nhân t ế - Bi n chia các quan sát thành các nhân t ế đ phân tích th ng kê. ể đ phân tích th ng kê. ể Ví d : Thu nh p << trình đ ; k t qu h c t p << - - Ví d : Thu nh p << trình đ ; k t qu h c t p << ớgi ớ gi
S LI U – CHÚ Ý S LI U – CHÚ Ý
Ố Ệ Ố Ệ
đ nh l ị ế đ nh l ị ế ị ị
ng pháp x lý ng pháp x lý Vi c xác đ nh lo i bi n Vi c xác đ nh lo i bi n ng, đ nh tính có th ị ứ ượ ạ ệ ng, đ nh tính có th ị ệ ượ ứ ạ có ý nghĩa quan và đ nh tính không có th t t ứ ự có ý nghĩa quan ự ị t và đ nh tính không có th t ứ ự ự ị , và trong vi c ệ mã hóa s li u tr ng đ i v i khâu ố ệ , và trong vi c ệ ố ớ ọ mã hóa s li u tr ng đ i v i khâu ố ệ ọ ố ớ s li u thích h p. ph ch n ọch n ọ ph ố ệ ử s li u thích h p. ươ ố ệ ử ươ ợ ợ
ủ ủ
S phân bi đ nh tính – đ nh l t các lo i bi n S phân bi ng, ị ế đ nh tính – đ nh l ạ ệ ự ượ ị t các lo i bi n ng, ị ế ệ ự ạ ượ ị , tùy thu c ộ ng đ i t có tính t đ c l p – ph thu c ố , tùy thu c ộ ươ ộ có tính ụ ộ ậ ng đ i đ c l p – ph thu c ố ươ ộ ụ ộ ậ vào vào m c đích i nghiên c a bài toán và ý đ c a ng ụm c đích ườ ồ ủ ụ i nghiên c a bài toán và ý đ c a ng ườ ồ ủ c u.ức u.ứ
MÃ HÓA S LI U – NGUYÊN T C MÃ HÓA S LI U – NGUYÊN T C
Ố Ệ Ố Ệ
Ắ Ắ
(code, recode) ố ệ (code, recode) ố ệ ế ế ố ố
Mã hóa s li u Mã hóa s li u - Chuy n các giá tr c a bi n sang d ng s . Có th ể ạ ể - Chuy n các giá tr c a bi n sang d ng s . Có th ể ể ạ c ho c sau khi nh p li u. th c hi n tr ệ c ho c sau khi nh p li u. th c hi n tr ệ
ị ủ ị ủ ặ ặ ướ ướ ự ự ệ ệ ậ ậ
Nguyên t c mã hóa Nguyên t c mã hóa ắ ắ
đ ữ ượ đ ữ ượ
ị ấ ị ấ ễ ễ ẫ ẫ
ễ ễ ệ ệ ậ ậ
c thông tin s li u không b th t thoát. - Gi ố ệ c thông tin s li u không b th t thoát. - Gi ố ệ - Tránh nh m l n, phát hi n các sai sót d dàng. ệ ầ - Tránh nh m l n, phát hi n các sai sót d dàng. ệ ầ t b nh ng r m rà, d nh p li u. - L ườ ượ ỏ ữ t b nh ng r m rà, d nh p li u. - L ườ ượ ỏ ữ - Phù h p v i yêu c u x lý bài toán. ầ ử ợ - Phù h p v i yêu c u x lý bài toán. ầ ử ợ ớ ớ
MÃ HÓA S LI U – K THU T MÃ HÓA S LI U – K THU T
Ố Ệ Ố Ệ
Ậ Ậ
Ỹ Ỹ
Bi nế
Thu nh pậ
Đi m thi
ể
Giá trị 1.500.000 2.300.000 7 5
Gi
i tính
ớ
S d ng ĐTDĐ
ử ụ
M c đ hài lòng d ch v
ứ
ộ
ị
ụ
ngườ
Trình đ H c v n ộ ọ
ấ
Nam Nữ Có Không Hài lòng Bình th Không hài lòng THPT Trung c pấ CĐ ĐH
Mã hóa 1.5 2.3 7 5 1 2 1 0 1 0 -1 1 2 3 4
MÃ HÓA S LI U – K THU T MÃ HÓA S LI U – K THU T
Ố Ệ Ố Ệ
Ậ Ậ
Ỹ Ỹ
ế ế
ế ế (multiple reponse) ọ (multiple reponse) ọ ị ề ị ề ộ ầ ộ ầ ậ ậ
c c ướ ướ ụ ụ ệ ệ ạ ạ
Bi n nhi u l a ch n Bi n nhi u l a ch n ề ự ề ự - Bi n có th nh n nhi u giá tr trong m t l n quan ể - Bi n có th nh n nhi u giá tr trong m t l n quan ể sát.sát. - Ví d : B n đã t ng u ng qua các nhãn hi u n ố ừ - Ví d : B n đã t ng u ng qua các nhãn hi u n ố ừ ng t có gaz nào trong các nhãn hi u sau: ng t có gaz nào trong các nhãn hi u sau:
ệ ệ ọ ọ
ạ
ậ
T o 5 bi n nh n ế giá tr 0-1 (có, không)
ị
Coca-Cola Coca-Cola Pepsi Pepsi Sprite Sprite 7-Up 7-Up Fanta Fanta
PH N M M TH NG KÊ PH N M M TH NG KÊ
Ố Ố
Ầ Ầ
Ề Ề
ộ ố ầ ộ ố ầ
M t s ph n m m M t s ph n m m ề ề - SPSS, STATA, Minitab, Excel … - SPSS, STATA, Minitab, Excel … - SAS, R … - SAS, R … - Epi Info, Eview … - Epi Info, Eview …
u đi m SPSS Ư ểu đi m SPSS Ư ể
ậ ậ ệ ệ ệ ệ
ễ ả ễ ả ng output có th dùng cho các ng ng output có th dùng cho các ng ứ ứ ể ể
ng pháp th ng kê phân tích chuyên sâu. ng pháp th ng kê phân tích chuyên sâu. - Giao di n đ n gi n, thu n ti n, d dùng. ơ - Giao di n đ n gi n, thu n ti n, d dùng. ơ - Nhi u đ i t ố ượ ề - Nhi u đ i t ố ượ ề ụd ng khác. ụ d ng khác. - Nhi u ph ề - Nhi u ph ề ươ ươ ố ố
GIAO DI N SPSS Ệ GIAO DI N SPSS Ệ
Ma tr n s li u Ma tr n s li u
ố ệ ố ệ
ậ ậ
Khai báo bi nế Khai báo bi nế
KHAI BÁO BI NẾ KHAI BÁO BI NẾ
ữ ệ ữ ệ
ế ế
ữ ệ ữ ệ
Name: Tên bi nế : Tên bi nế Name : Ki u d li u TypeType: Ki u d li u ữ ệ ể ữ ệ ể WidthWidth: Đ r ng d li u : Đ r ng d li u ộ ộ ộ ộ : S th p phân d li u Decimals: S th p phân d li u ố ậ Decimals ố ậ : Nhãn bi nế Label: Nhãn bi nế Label
: Mã hóa d li u Values: Mã hóa d li u ữ ệ Values ữ ệ : Giá tr khuy t Missing: Giá tr khuy t ế ị Missing ế ị : Đ r ng c t bi n Columns: Đ r ng c t bi n ộ ộ ộ Columns ộ ộ ộ d li u : Canh l AlignAlign: Canh l ề ữ ệ d li u ề ữ ệ : Lo i bi n Measure: Lo i bi n ế ạ Measure ế ạ
TH C HÀNH: NH P S LI U TH C HÀNH: NH P S LI U
Ậ Ố Ệ Ậ Ố Ệ
Ự Ự
ổ ủ ổ ủ
ấ ấ
ứ ứ
ệ ự ệ ự
ọ ọ
_____ _____ _____ _____ _____ _____
t m c đ quan tr ng các y u t t m c đ quan tr ng các y u t
sau trong vi c sau trong vi c
1. Tu i c a anh (ch ) ……….................... 1. Tu i c a anh (ch ) ……….................... ị ị 2. Đánh giá m c đ quan tr ng nh t, nhì, ba trong vi c l a 2. Đánh giá m c đ quan tr ng nh t, nhì, ba trong vi c l a ọ ộ ộ ọ ch n mua máy di đ ng ộ ch n mua máy di đ ng ộ ng b t sóng Ch t l ắ ấ ượ ng b t sóng Ch t l ấ ượ ắ Ki u dáng th i trang ờ ể Ki u dáng th i trang ờ ể Ngu n g c xu t x ấ ứ ố Ngu n g c xu t x ấ ứ ố ộ ộ
ế ố ế ố
ứ ứ
ệ ệ
ọ ọ
ồ ồ 3. Cho bi 3. Cho bi ế ế l a ch n mua máy di đ ng ự l a ch n mua máy di đ ng ự
ộ ộ
ọ ọ
ngườ ngườ
Quan tr ngọ Quan tr ngọ 11 11 11
Bình th Bình th 22 22 22
Không quan tr ngọ Không quan tr ngọ 33 33 33
Y u tế ố Y u tế ố ng b t sóng Ch t l ắ ấ ượ ng b t sóng Ch t l ấ ượ ắ Ki u dáng th i trang ờ ể Ki u dáng th i trang ờ ể Ngu n g c xu t x ấ ứ ố Ngu n g c xu t x ấ ứ ố
ồ ồ
TH C HÀNH: NH P S LI U TH C HÀNH: NH P S LI U
Ậ Ố Ệ Ậ Ố Ệ
Ự Ự
t đ n siêu th Thu n Thành t t đ n siêu th Thu n Thành t
ậ ậ
ị ị
ừ ừ
nh ng ữ nh ng ữ
ế ế
ươ ươ
ế ế
ng trình khuy n mãi ng trình khuy n mãi r iờ ơ r iờ ơ
i thân i thân
ạ ạ
4. Anh/Ch bi 4. Anh/Ch bi ị ế ị ế ng ti n thông tin nào? ph ệ ng ti n thông tin nào? ph ệ Ti viTi vi Báo, internet Báo, internet Các ch Các ch ươ ươ Banner, poster, t Banner, poster, t B n bè, ng B n bè, ng ườ ườ ầ ầ
ầ ầ
ị ị
D i 3 l n D i 3 l n ầ ướ ầ ướ ộ ỏ ứ ộ ỏ ứ
Hoàn toàn không th a ỏ Hoàn toàn không th a ỏ
ỏ ỏ
5. Trung bình 1 tu n anh/ch đi siêu th bao nhiêu l n? 5. Trung bình 1 tu n anh/ch đi siêu th bao nhiêu l n? ị ị Trên 5 l nầ 3 đ n 5 l n Trên 5 l nầ 3 đ n 5 l n ầ ế ầ ế 6. M c đ th a mãn c a anh/ch v các d ch v c a siêu 6. M c đ th a mãn c a anh/ch v các d ch v c a siêu ụ ủ ị ị ề ủ ụ ủ ị ị ề ủ th ?ị th ?ị Hoàn toàn th a mãn Hoàn toàn th a mãn mãnmãn
11
22
33
44
55
BÀI T PẬ BÀI T PẬ
ỹ ỹ
ự Ketquathitotnghiep.sav Ketquathitotnghiep.sav
t nghi p t nghi p ệ ệ
là t ng đi m các môn thi. tongdiem là t ng đi m các môn thi. ể ể xeploai là x p lo i đi m thi t là x p lo i đi m thi t ố ạ ố ạ i, khá, trung bình, y u …) i, khá, trung bình, y u …)
Xem và th c hành các k năng Xem và th c hành các k năng ự ự - Data\Select Cases … - Data\Select Cases … - Transform\Compute … - Transform\Compute … - Transform\Recode … - Transform\Recode … Th c hành file ựTh c hành file truong, bi n ế, bi n ế loplop - Tái mã hóa bi n ế truong - Tái mã hóa bi n ế - T o bi n ạ ổ ế tongdiem - T o bi n ạ ổ ế - T o bi n ế ế xeploai ạ - T o bi n ế ế ạ c a h c sinh (gi ủ ọ c a h c sinh (gi ủ ọ
ỏ ỏ ể ể ế ế