BÀI 1 BÀI 1

KI N TH C M Đ U Ứ KI N TH C M Đ U Ứ

Ở Ầ Ở Ầ

Ế Ế

GI GI

I THI U TH NG KÊ I THI U TH NG KÊ

Ớ Ớ

Ố Ố

Ệ Ệ

ề ề

ề ề

ế ế ệ ệ ứ ứ

ề ề

ố ệ ố ệ ế ế ữh u ích ữ h u ích ậ ậ

c quan tâm. c quan tâm. ệ ệ ố ệ ố ệ ề ượ ề ượ

ệ ệ

ậ ậ

ố ố

ử ử ề ề

ụ ụ ẩ ẩ ệ ệ ậ ậ ế ế ộ ộ

Trong xã h i ngày nay, nhi u quy t đ nh v chính ề ộ ế ị  Trong xã h i ngày nay, nhi u quy t đ nh v chính ế ị ộ ề c phát tri n đ u d a trên c s s sách, chi n l ơ ở ố ự ể ế ượ c phát tri n đ u d a trên c s s sách, chi n l ơ ở ố ự ể ế ượ li u.ệli u.ệ H u h t các ngành khoa h c nghiên c u, công nghi p ọ ầ  H u h t các ngành khoa h c nghiên c u, công nghi p ầ ọ th c nghi m đ u sinh ra s li u. Vi c phân tích ệ ự th c nghi m đ u sinh ra s li u. Vi c phân tích ệ ự ” là nh ng s li u này và rút ra các k t lu n “ ữ ” là nh ng s li u này và rút ra các k t lu n “ ữ v n đ đ ấ v n đ đ ấ Ho t đ ng th ng kê liên quan đ n vi c nghiên c u ố ứ ế ạ ộ  Ho t đ ng th ng kê liên quan đ n vi c nghiên c u ố ứ ế ạ ộ ch c, phân tích và rút ra k t lu n t v thu th p, t ậ ừ ế ứ ổ ề v thu th p, t ch c, phân tích và rút ra k t lu n t ậ ừ ế ứ ổ ề ““bi n s bi n s ng pháp th ng kê giúp ta s li u. Các ph ế ố ươ ố ệ s li u. Các ph ng pháp th ng kê giúp ta ươ ố ệ ế ố ứ ””.. li u thành tri th c ệ li u thành tri th c ứ ệ M t s v n đ áp d ng th ng kê: x lý tín hi u, lý ố ộ ố ấ  M t s v n đ áp d ng th ng kê: x lý tín hi u, lý ố ộ ố ấ thuy t thông tin, ch n đoán lâm sàng, đ tin c y h ệ thuy t thông tin, ch n đoán lâm sàng, đ tin c y h ệ th ng, phân tích s ng sót. th ng, phân tích s ng sót. ố ố ố ố

Đ I T Đ I T

NG NG

Ố ƯỢ Ố ƯỢ

ng mang thông tin, liên quan ng mang thông tin, liên quan

ố ượ ố ượ ng l y ra t ấ ng l y ra t ấ t ng th . ể t ng th . ể ừ ổ ừ ổ

c trên các đ i t c trên các đ i t ậ ượ ậ ượ ng c a ủ ng c a ủ ố ượ ố ượ

ể ể ổ ổ

ể ể ế ế ẫ ẫ ậ ậ

 T ng th population)) ể ( (population T ng th ổ ể ổ - T p h p các đ i t ố ượ ợ ậ - T p h p các đ i t ố ượ ợ ậ đ n nghiên c u. ứ ế đ n nghiên c u. ứ ế  M u ẫM u ẫ ((sample sample)) M t nhóm đ i t - - M t nhóm đ i t ộ ộ  S li u ố ệ ( (datadata)) S li u ố ệ - Thông tin thu th p đ - Thông tin thu th p đ m u.ẫm u.ẫ  Phân tích s li u data analysis)) ố ệ ( (data analysis Phân tích s li u ố ệ ng pháp th ng kê đ phân tích, t ng - Dùng các ph ố ươ ng pháp th ng kê đ phân tích, t ng - Dùng các ph ố ươ h p trên s li u m u đ rút ra các k t lu n cho các ố ệ ợ h p trên s li u m u đ rút ra các k t lu n cho các ợ ố ệ v n đ nghiên c u. ấ v n đ nghiên c u. ấ

ứ ứ ề ề

C S C A PHÂN TÍCH S LI U C S C A PHÂN TÍCH S LI U

Ơ Ở Ủ Ơ Ở Ủ

Ố Ệ Ố Ệ

ồ ố ủ ố ệ ồ ố ủ ố ệ

đâu: đi u tra, đo đ c, tính toán đâu: đi u tra, đo đ c, tính toán ố ệ ố ệ c t ượ ừ c t ượ ừ ề ề ạ ạ

 Ngu n g c c a s li u Ngu n g c c a s li u - S li u có đ - S li u có đ …… - M c đ chính xác c a s li u. - M c đ chính xác c a s li u.

ủ ố ệ ủ ố ệ ứ ộ ứ ộ

 Ki n th c v s li u ứ ề ố ệ Ki n th c v s li u ế ứ ề ố ệ ế N m các ki n th c chuyên ngành liên quan đ n s - - N m các ki n th c chuyên ngành liên quan đ n s ế ố ứ ế ắ ứ ế ắ ế ố li u. Hi u rõ các v n đ phân tích trên s li u. ề ấ ệ li u. Hi u rõ các v n đ phân tích trên s li u. ề ấ ệ

ố ệ ố ệ ể ể

ứ ề ố ứ ề ố

ng pháp phân tích th ng kê. ng pháp phân tích th ng kê.

 Ki n th c v th ng kê Ki n th c v th ng kê - N m các mô hình, ph ươ - N m các mô hình, ph ươ

ế ế ắ ắ ố ố

QUY TRÌNH PHÂN TÍCH S LI U QUY TRÌNH PHÂN TÍCH S LI U

Ố Ệ Ố Ệ

Đ T BÀI TOÁN

CH N THI T K

PHÂN TÍCH THĂM DÒ

CH N MÔ HÌNH

PHÂN TÍCH S LI U

Ố Ệ

PHÂN TÍCH K T QU

TRÌNH BÀY K T QU

S LI U – THÀNH PH N S LI U S LI U – THÀNH PH N S LI U

Ầ Ố Ệ Ầ Ố Ệ

Ố Ệ Ố Ệ

ủ ủ ư ư ng nào đó c a đ i ố ng nào đó c a đ i ố

ổ ổ

ề ề ệ ệ ặ ặ ở ở

c c a bi n s trên m i đ i ố ố c c a bi n s trên m i đ i ố ố ượ ượ ủ ủ ế ế ỗ ỗ

 Bi n s variable)) ế ố ((variable Bi n s ế ố - Th hi n đ c tr ng, đ i l ạ ượ ặ ệ ể - Th hi n đ c tr ng, đ i l ạ ượ ệ ể ặ ng nghiên c u trong t ng th . t ể ứ ượ ng nghiên c u trong t ng th . t ứ ể ượ i tính, ngh nghi p, cân n ng, s thích … - Ví d : gi ớ ụ - Ví d : gi i tính, ngh nghi p, cân n ng, s thích … ớ ụ  Quan sát Quan sát ((case case)) - Giá tr thu th p đ ậ ị - Giá tr thu th p đ ậ ị ẫ ng c a m u. t ủ ượ ng c a m u. t ủ ẫ ượ  T p giá tr c a bi n s T p giá tr c a bi n s ị ủ ậ ị ủ ậ - T p giá tr có kh năng xu t hi n c a bi n s . ế ố ị ậ - T p giá tr có kh năng xu t hi n c a bi n s . ị ậ ế ố

ế ố ế ố ả ả ệ ủ ệ ủ ấ ấ

S LI U – CÁC LO I BI N S LI U – CÁC LO I BI N

Ố Ệ Ố Ệ

Ạ Ạ

Ế Ế

ế ế

ạ ạ ế ế

ặ ặ

ế ế

ể ắ ể ắ ế ế ỉ ỉ

h n kém. h n kém. ế ế

 Bi n đ nh l scale)) ượ ((scale ng Bi n đ nh l ị ng ượ ị - Giá tr nh n là các s đo (đo đ c, đ m, quan sát) ố ậ ị - Giá tr nh n là các s đo (đo đ c, đ m, quan sát) ố ậ ị - Ví d : cân n ng, thu nh p, s sinh viên … ậ ố ụ - Ví d : cân n ng, thu nh p, s sinh viên … ậ ố ụ  Bi n đ nh tính có th t ordinal)) ứ ự ((ordinal Bi n đ nh tính có th t ị ứ ự ị - Giá tr nh n ch tính ch t, đ c đi m có th s p x p ể ặ ấ ậ ị - Giá tr nh n ch tính ch t, đ c đi m có th s p x p ặ ể ấ ậ ị , bi u th m c đ quan tr ng. theo th t ọ ị ứ ộ ể ứ ự , bi u th m c đ quan tr ng. theo th t ọ ị ứ ộ ể ứ ự Ví d : m c đ hài lòng, trình đ h c v n … - - Ví d : m c đ hài lòng, trình đ h c v n … ộ ọ ấ ứ ộ ụ ộ ọ ấ ứ ộ ụ  Bi n đ nh tính không có th t Bi n đ nh tính không có th t (nomial) ứ ự (nomial) ế ị ứ ự ế ị - Giá tr nh n c a bi n không có th t ứ ự ơ ậ ủ ị - Giá tr nh n c a bi n không có th t ứ ự ơ ậ ủ ị i tính, quê quán, tôn giáo … - Ví d : gi ớ ụ - Ví d : gi i tính, quê quán, tôn giáo … ớ ụ

S LI U – CÁC LO I BI N S LI U – CÁC LO I BI N

Ố Ệ Ố Ệ

Ạ Ạ

Ế Ế

ụ ụ

ế ế ộ ộ

ả ọ ậ ả ọ ậ ươ ươ ế ế ạ ạ

 Bi n đ c l p - ph thu c Bi n đ c l p - ph thu c ndependent - dependent)) ộ (i(independent - dependent ế ộ ậ ế ộ ậ ộ ” trong mô hình. nguyên nhân - k t quế - Các bi n ch “ ả” trong mô hình. ỉ nguyên nhân - k t quế ế - Các bi n ch “ ả ỉ ế ng đ n bi n ph thu c. Giá tr bi n đ c l p nh h ụ ế ưở ộ ậ ả ị ế ng đ n bi n ph thu c. Giá tr bi n đ c l p nh h ụ ế ưở ộ ậ ả ị ế - Ví d : chi u cao >> cân n ng; qu ng cáo >> doanh ả ặ ề ụ - Ví d : chi u cao >> cân n ng; qu ng cáo >> doanh ả ặ ề ụ ng pháp d y >> k t qu h c t p i tính, ph thu; gi ớ ng pháp d y >> k t qu h c t p thu; gi i tính, ph ớ ……

, nhóm , nhóm factor, group)) ((factor, group ế ế ố ố

hay nhóm hay nhóm ố ố

ả ọ ậ ả ọ ậ ộ ế ộ ế ố ố ậ ậ

ụ ụ i tính … i tính …

 Bi n nhân t Bi n nhân t - Bi n chia các quan sát thành các nhân t ế - Bi n chia các quan sát thành các nhân t ế đ phân tích th ng kê. ể đ phân tích th ng kê. ể Ví d : Thu nh p << trình đ ; k t qu h c t p << - - Ví d : Thu nh p << trình đ ; k t qu h c t p << ớgi ớ gi

S LI U – CHÚ Ý S LI U – CHÚ Ý

Ố Ệ Ố Ệ

đ nh l ị ế đ nh l ị ế ị ị

ng pháp x lý ng pháp x lý  Vi c xác đ nh lo i bi n Vi c xác đ nh lo i bi n ng, đ nh tính có th ị ứ ượ ạ ệ ng, đ nh tính có th ị ệ ượ ứ ạ có ý nghĩa quan và đ nh tính không có th t t ứ ự có ý nghĩa quan ự ị t và đ nh tính không có th t ứ ự ự ị , và trong vi c ệ mã hóa s li u tr ng đ i v i khâu ố ệ , và trong vi c ệ ố ớ ọ mã hóa s li u tr ng đ i v i khâu ố ệ ọ ố ớ s li u thích h p. ph ch n ọch n ọ ph ố ệ ử s li u thích h p. ươ ố ệ ử ươ ợ ợ

ủ ủ

 S phân bi đ nh tính – đ nh l t các lo i bi n S phân bi ng, ị ế đ nh tính – đ nh l ạ ệ ự ượ ị t các lo i bi n ng, ị ế ệ ự ạ ượ ị , tùy thu c ộ ng đ i t có tính t đ c l p – ph thu c ố , tùy thu c ộ ươ ộ có tính ụ ộ ậ ng đ i đ c l p – ph thu c ố ươ ộ ụ ộ ậ vào vào m c đích i nghiên c a bài toán và ý đ c a ng ụm c đích ườ ồ ủ ụ i nghiên c a bài toán và ý đ c a ng ườ ồ ủ c u.ức u.ứ

MÃ HÓA S LI U – NGUYÊN T C MÃ HÓA S LI U – NGUYÊN T C

Ố Ệ Ố Ệ

Ắ Ắ

(code, recode) ố ệ (code, recode) ố ệ ế ế ố ố

 Mã hóa s li u Mã hóa s li u - Chuy n các giá tr c a bi n sang d ng s . Có th ể ạ ể - Chuy n các giá tr c a bi n sang d ng s . Có th ể ể ạ c ho c sau khi nh p li u. th c hi n tr ệ c ho c sau khi nh p li u. th c hi n tr ệ

ị ủ ị ủ ặ ặ ướ ướ ự ự ệ ệ ậ ậ

 Nguyên t c mã hóa Nguyên t c mã hóa ắ ắ

đ ữ ượ đ ữ ượ

ị ấ ị ấ ễ ễ ẫ ẫ

ễ ễ ệ ệ ậ ậ

c thông tin s li u không b th t thoát. - Gi ố ệ c thông tin s li u không b th t thoát. - Gi ố ệ - Tránh nh m l n, phát hi n các sai sót d dàng. ệ ầ - Tránh nh m l n, phát hi n các sai sót d dàng. ệ ầ t b nh ng r m rà, d nh p li u. - L ườ ượ ỏ ữ t b nh ng r m rà, d nh p li u. - L ườ ượ ỏ ữ - Phù h p v i yêu c u x lý bài toán. ầ ử ợ - Phù h p v i yêu c u x lý bài toán. ầ ử ợ ớ ớ

MÃ HÓA S LI U – K THU T MÃ HÓA S LI U – K THU T

Ố Ệ Ố Ệ

Ậ Ậ

Ỹ Ỹ

Bi nế

Thu nh pậ

Đi m thi

Giá trị 1.500.000 2.300.000 7 5

Gi

i tính

S d ng ĐTDĐ

ử ụ

M c đ hài lòng d ch v

ngườ

Trình đ H c v n ộ ọ

Nam Nữ Có Không Hài lòng Bình th Không hài lòng THPT Trung c pấ CĐ ĐH

Mã hóa 1.5 2.3 7 5 1 2 1 0 1 0 -1 1 2 3 4

MÃ HÓA S LI U – K THU T MÃ HÓA S LI U – K THU T

Ố Ệ Ố Ệ

Ậ Ậ

Ỹ Ỹ

ế ế

ế ế (multiple reponse) ọ (multiple reponse) ọ ị ề ị ề ộ ầ ộ ầ ậ ậ

c c ướ ướ ụ ụ ệ ệ ạ ạ

 Bi n nhi u l a ch n Bi n nhi u l a ch n ề ự ề ự - Bi n có th nh n nhi u giá tr trong m t l n quan ể - Bi n có th nh n nhi u giá tr trong m t l n quan ể sát.sát. - Ví d : B n đã t ng u ng qua các nhãn hi u n ố ừ - Ví d : B n đã t ng u ng qua các nhãn hi u n ố ừ ng t có gaz nào trong các nhãn hi u sau: ng t có gaz nào trong các nhãn hi u sau:

ệ ệ ọ ọ

T o 5 bi n nh n ế giá tr 0-1 (có, không)

Coca-Cola  Coca-Cola  Pepsi Pepsi  Sprite Sprite  7-Up 7-Up  Fanta Fanta

PH N M M TH NG KÊ PH N M M TH NG KÊ

Ố Ố

Ầ Ầ

Ề Ề

ộ ố ầ ộ ố ầ

 M t s ph n m m M t s ph n m m ề ề - SPSS, STATA, Minitab, Excel … - SPSS, STATA, Minitab, Excel … - SAS, R … - SAS, R … - Epi Info, Eview … - Epi Info, Eview …

 u đi m SPSS Ư ểu đi m SPSS Ư ể

ậ ậ ệ ệ ệ ệ

ễ ả ễ ả ng output có th dùng cho các ng ng output có th dùng cho các ng ứ ứ ể ể

ng pháp th ng kê phân tích chuyên sâu. ng pháp th ng kê phân tích chuyên sâu. - Giao di n đ n gi n, thu n ti n, d dùng. ơ - Giao di n đ n gi n, thu n ti n, d dùng. ơ - Nhi u đ i t ố ượ ề - Nhi u đ i t ố ượ ề ụd ng khác. ụ d ng khác. - Nhi u ph ề - Nhi u ph ề ươ ươ ố ố

GIAO DI N SPSS Ệ GIAO DI N SPSS Ệ

Ma tr n s li u Ma tr n s li u

ố ệ ố ệ

ậ ậ

Khai báo bi nế Khai báo bi nế

KHAI BÁO BI NẾ KHAI BÁO BI NẾ

ữ ệ ữ ệ

ế ế

ữ ệ ữ ệ

Name: Tên bi nế : Tên bi nế Name : Ki u d li u TypeType: Ki u d li u ữ ệ ể ữ ệ ể WidthWidth: Đ r ng d li u : Đ r ng d li u ộ ộ ộ ộ : S th p phân d li u Decimals: S th p phân d li u ố ậ Decimals ố ậ : Nhãn bi nế Label: Nhãn bi nế Label

: Mã hóa d li u Values: Mã hóa d li u ữ ệ Values ữ ệ : Giá tr khuy t Missing: Giá tr khuy t ế ị Missing ế ị : Đ r ng c t bi n Columns: Đ r ng c t bi n ộ ộ ộ Columns ộ ộ ộ d li u : Canh l AlignAlign: Canh l ề ữ ệ d li u ề ữ ệ : Lo i bi n Measure: Lo i bi n ế ạ Measure ế ạ

TH C HÀNH: NH P S LI U TH C HÀNH: NH P S LI U

Ậ Ố Ệ Ậ Ố Ệ

Ự Ự

ổ ủ ổ ủ

ấ ấ

ứ ứ

ệ ự ệ ự

ọ ọ

_____ _____ _____ _____ _____ _____

t m c đ quan tr ng các y u t t m c đ quan tr ng các y u t

sau trong vi c sau trong vi c

 1. Tu i c a anh (ch ) ……….................... 1. Tu i c a anh (ch ) ……….................... ị ị  2. Đánh giá m c đ quan tr ng nh t, nhì, ba trong vi c l a 2. Đánh giá m c đ quan tr ng nh t, nhì, ba trong vi c l a ọ ộ ộ ọ ch n mua máy di đ ng ộ ch n mua máy di đ ng ộ ng b t sóng Ch t l ắ ấ ượ ng b t sóng Ch t l ấ ượ ắ Ki u dáng th i trang ờ ể Ki u dáng th i trang ờ ể Ngu n g c xu t x ấ ứ ố Ngu n g c xu t x ấ ứ ố ộ ộ

ế ố ế ố

ứ ứ

ệ ệ

ọ ọ

ồ ồ  3. Cho bi 3. Cho bi ế ế l a ch n mua máy di đ ng ự l a ch n mua máy di đ ng ự

ộ ộ

ọ ọ

ngườ ngườ

Quan tr ngọ Quan tr ngọ 11 11 11

Bình th Bình th 22 22 22

Không quan tr ngọ Không quan tr ngọ 33 33 33

Y u tế ố Y u tế ố ng b t sóng Ch t l ắ ấ ượ ng b t sóng Ch t l ấ ượ ắ Ki u dáng th i trang ờ ể Ki u dáng th i trang ờ ể Ngu n g c xu t x ấ ứ ố Ngu n g c xu t x ấ ứ ố

ồ ồ

TH C HÀNH: NH P S LI U TH C HÀNH: NH P S LI U

Ậ Ố Ệ Ậ Ố Ệ

Ự Ự

t đ n siêu th Thu n Thành t t đ n siêu th Thu n Thành t

ậ ậ

ị ị

ừ ừ

nh ng ữ nh ng ữ

ế ế

ươ ươ

ế ế

ng trình khuy n mãi ng trình khuy n mãi r iờ ơ r iờ ơ

i thân i thân

ạ ạ

 4. Anh/Ch bi 4. Anh/Ch bi ị ế ị ế ng ti n thông tin nào? ph ệ ng ti n thông tin nào? ph ệ  Ti viTi vi  Báo, internet Báo, internet  Các ch Các ch ươ ươ  Banner, poster, t Banner, poster, t  B n bè, ng B n bè, ng ườ ườ ầ ầ

ầ ầ

ị ị

 D i 3 l n D i 3 l n ầ ướ ầ ướ ộ ỏ ứ ộ ỏ ứ

Hoàn toàn không th a ỏ Hoàn toàn không th a ỏ

ỏ ỏ

 5. Trung bình 1 tu n anh/ch đi siêu th bao nhiêu l n? 5. Trung bình 1 tu n anh/ch đi siêu th bao nhiêu l n? ị ị  Trên 5 l nầ  3 đ n 5 l n Trên 5 l nầ 3 đ n 5 l n ầ ế ầ ế  6. M c đ th a mãn c a anh/ch v các d ch v c a siêu 6. M c đ th a mãn c a anh/ch v các d ch v c a siêu ụ ủ ị ị ề ủ ụ ủ ị ị ề ủ th ?ị th ?ị Hoàn toàn th a mãn Hoàn toàn th a mãn mãnmãn

11

22

33

44

55

BÀI T PẬ BÀI T PẬ

ỹ ỹ

ự Ketquathitotnghiep.sav Ketquathitotnghiep.sav

t nghi p t nghi p ệ ệ

là t ng đi m các môn thi. tongdiem là t ng đi m các môn thi. ể ể xeploai là x p lo i đi m thi t là x p lo i đi m thi t ố ạ ố ạ i, khá, trung bình, y u …) i, khá, trung bình, y u …)

 Xem và th c hành các k năng Xem và th c hành các k năng ự ự - Data\Select Cases … - Data\Select Cases … - Transform\Compute … - Transform\Compute … - Transform\Recode … - Transform\Recode …  Th c hành file ựTh c hành file truong, bi n ế, bi n ế loplop - Tái mã hóa bi n ế truong - Tái mã hóa bi n ế - T o bi n ạ ổ ế tongdiem - T o bi n ạ ổ ế - T o bi n ế ế xeploai ạ - T o bi n ế ế ạ c a h c sinh (gi ủ ọ c a h c sinh (gi ủ ọ

ỏ ỏ ể ể ế ế