Phân tích dữ liệu bằng SPSS - Phần 3

Chia sẻ: Tran Hoai Phuong | Ngày: | Loại File: DOC | Số trang:0

0
261
lượt xem
144
download

Phân tích dữ liệu bằng SPSS - Phần 3

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Công việc đầu tiên rất quan trọng và cần phải thực hiện một cách cẩn thận trước khi đi vào các bước mô tả hay các phân tích thông kê phức tạp sau này là tiến hành xem xét dữ liệu một cách cẩn thận. SPSS cung cấp cho công cụ Explore để xem xét và kiểm tra dữ liệu:

Chủ đề:
Lưu

Nội dung Text: Phân tích dữ liệu bằng SPSS - Phần 3

  1. Phaân tích döõ lieäu baèng SPSS CHÖÔNG 6: XÖÕ LYÙ VAØ PHAÂN TÍCH DÖÕ LIEÄU 1. Kieåm tra döõ lieäu (Explore) Coâng vieäc ñaàu tieân raát quan troïng vaø caàn phaûi thöïc hieän moät caùch caån thaän tröôùc khi ñi vaøo caùc böôùc moâ taû hay caùc phaân tích thoâng keâ phöùc taïp sau naøy laø tieán haønh xem xeùt döõ lieäu moät caùch caån thaän. SPSS cung caáp cho coâng cuï Explore ñeå xem xeùt vaø kieåm tra döõ lieäu: - Phaùt hieän caùc sai soùt - Nhaän daïng döõ lieäu ñeå tìm phöông phaùp phaân tích thích hôïp vaø chuaån bò cho vieäc kieåm tra giaû thuyeát Ñeå nhaän daïng vaø phaùt hieän sai soùt trong döõ lieäu, ta coù ba caùch hieãn thò döõ lieäu nhö sau - Bieåu ñoà Histogram - Sô ñoà caønh vaø laù Stem-and-leaf plot - Sô ñoà hoäp Boxplot Ñeå öôùc löôïng caùc giaõ ñònh ñöôïc duøng cho vieäc kieåm nghieäm caùc giaû thuyeát, ta duøng caùc pheùp kieåm tra sau: - Kieåm tra levene: Kieåm tra tính ñoàng ñeàu cuûa phöông sai - Kieåm tra K-S Lilliefors: Kieåm tra tính chuaån taéc cuûa toång theå, xem döõ lieäu coù ñöôïc laáy töø moät phaân boá chuaån hay khoâng Chuùng ta thöôøng duøng giaù trò trung bình soá hoïc ñeå öôùc löôïng ñoä hoäi tuï cuûa döõ lieäu. Tuy nhieân vì giaù trò trung bình bò aûnh höôûng bôûi taát caû caùc giaù trò quan saùt. Ñeå giaûm thieåu nhöõng aûnh höôûng cuûa caùc giaù trò baát thöôøng (quaù lôùn hoaëc quaù beù), ngöôøi ta thöôøng loaïi boû caùc giaù trò lôùn nhaát vaø caùc giaù trò nhoû nhaát (Outliers) theo cuøng moät tyû leä naøo ñoù. Khi ñoù giaù trò trung bình ñöôïc goïi laø giaù trò trung bình giaõn löôïc (Timmed-mean). Moät caùch laøm khaùc laø gaùn caùc troïng soá khaùc nhau cho caùc giaù trò quan saùt tuøy theo khoaûng caùch cuûa noù ñeán giaù trò trung bình, caøng xa troïng soá caøng nhoû. Caùc trong soá naøy goïi laø M-estimators. Coù 4 loaïi troïng soá laø Huber, Turkey, Hampel, vaø Andrew. Döïa vaøo troïng soá naøy ta öôùc löôïng laïi giaù trò trung bình cho döõ lieäu. Bieân soaïn: Ñaøo Hoaøi Nam 33
  2. Phaân tích döõ lieäu baèng SPSS Ñeå kieåm tra döõ lieäu, choïn treân menu Statistic/Summarize/Explore… ñeå môû hoäp thoaïi Explore nhö Hình 6-1: Hình 6­1 Caùc bieán trong taäp döõ lieäu xuaát hieän trong hoäp beân traùi. Choïn moät hay nhieàu bieán ñöa vaøo oâ Dependent  list,  caùc bieán caàn quan saùt seõ ñöôïc lieät keâ rong oâ naøy. Chuùng ta cuõng coù theå taùch caùc quan saùt thaønh caùc nhoùm nhoû rieâng bieät ñeå kieåm tra döïa vaøo caùc giaù trò cuûa caùc bieán kieåm soaùt seõ ñöôïc ñöa vaøo oâ Factor List. Ví duï nhö kieåm tra bieán möùc ñoä ñaùnh giaù noùi chung döïa vaøo bieán nhaõn hieäu ñang söû duïng. Coù theå laàn ra caùc quan saùt naøy baèng caùch gaùn nhaõn cho noù baèng gía trò cuûa moät bieán naøo ñoù, bieán naøy seõ ñöôïc ñöa vaøo trong oâ label cases by. Ví duï muoán bieát nhöõng giaù trò di thöôøng trong bieán möùc ñoä ñaùnh giaù noùi chung theo nhaõn hieäu TV ñang duøng. Ta gaùn nhaõn cho caùc quan saùt naøy baèng caùc giaù trò trong bieán soá baûng caâu hoûi. Luùc naøy neáu coù caùc giaù trò dò thöôøng ta deã daøng laàn ra noù baèng soá baûng caâu hoûi keøm theo OÂ Display, cho pheùp chuùng ta choïn caùch hieãn thò keát quaû, caùc tham soâ thoáng keâ (Statistic), hoaëc ñoà thò (Plot), SPSS maëc ñònh laø hieãn thò caû hai Bieân soaïn: Ñaøo Hoaøi Nam 34
  3. Phaân tích döõ lieäu baèng SPSS Söû duïng coâng cuï Statistics cho pheùp ta löïa choïn caùc thoáng keâ hieãn thò nhö hoäp thoaïi Hình 6-2: Hình 6­2 - Descriptives: Cho pheùp ta hieãn thò caùc giaù trò thoáng keâ nhö giaù trò trung bình, khoaûng tin caäy, trung vò, trung bình giaõn löôïc, giaù trò nhoû nhaát, lôùn nhaát, khoaûng bieán thieân, caùc baùch phaân vò - M­estimators: Hieãn thò caùc giaù trò trung bình theo 4 loaïi troïng soá - Outliers: Hieãn thò caùc quan saùt coù 5 giaù trò nhoû nhaát vaø 5 giaù trò lôùn nhaát, goïi laø Extreme Values - Percentiles: Hieån thò caùc giaù trí baùch vò phaân Söû duïng coâng cuï Plots (Hình 6-3), ñeå löïa choïn hieãn thò daïng ñoà thò (Histogram), bieåu ñoà chænh taéc, caùc pheùp kieåm tra veà phaân phoái chuaån, tính ñoàng ñeàu cuûa phöông sai Hình 6­3 Bieân soaïn: Ñaøo Hoaøi Nam 35
  4. Phaân tích döõ lieäu baèng SPSS - Boxplots: Ñieàu kieän ñeå hieãn thò cuûa Boxplots laø ta phaûi ñang quan saùt nhieàu hôn moät bieán phuï thuoäc (hieãn thò trong oâ dependent list). o Factor levels together ñöa ra moät hieån thò rieâng bieät cho moãi bieán phuï thuoäc. Trong phaïm vi moät hieån thò, Boxplots ñöôïc hieån thò cho moãi moät nhoùm ñöôïc phaân ra theo giaù trò cuûa bieán ñieàu khieån (factor variable). Dependents together ñöa ra moät hieån thò rieâng bieät theo moãi nhoùm ñöôïc phaân theo caùc giaù trò trong bieán ñieàu khieån. Trong phaïm vi cuûa hieãn thò, boxplots ñöôïc ñöa ra laàn löôït cho moãi bieán phuï thuoäc - Descriptive: Cho pheùp löïa choïn hieån thò daïng ñoà thò Histogram hay daïng caønh laù (stem-and-leaf plots) - Normality   plots   with   tests. Ñöa ra caùc daïng ñoà thò veà phaân phoái chuaån. Ñoàng thôøi cung caáp moät kieåm nghieäm thoáng keâ Kolmogorov-Smirnov statistic, vôùi möùc tin caäy Lilliefors duøng ñeå kieåm nghieän tính chuaån cuûa phaân phoái maãu ñang quan saùt. Moät kieåm nghieäm khaùc laø thoáng keâ Shapiro-Wilk ñöôïc söû duïng cho maãu coù kích côû nhoû hôn hoaëc baèng 50 maãu. - Spread   vs.   Level   with   Levene   Test. Cho pheùp chuùng ta kieåm tra tính ñoàng ñeàu cuûa phöông sai giöõa caùc maãu trong döõ lieäu goác hay döõ lieäu ñaõ ñöôïc bieán ñoåi. Ñeå thöïc hieän pheùp thoáng keâ Levene ñoøi hoûi phaûi coù khai baùo bieán ñieàu khieån trong khuoân Factor lists, Thoàng thöôøng ta thöôøng laøm vieäc treân döõ lieäu goác do ñoù löïa choïn Untransformed trong khung Spread vs Level with Levene test  Kieåm nghieäm Kolmogorov­Smirnov (Lilliefors) Kieåm nghieäm Lilliefors laø moät daïng kieåm nghieäm Kolmogorov-Smirnov, duøng ñeå kieåm nghieäm tính chuaån taéc cuûa moät maãu hay hai maãu. Vôùi giaù trò sig. nhoû hôn möùc yù nghóa (0.05) laø keát quaû baùc boû giaû thuyeát phaân phoái maãu laø phaân phoái chuaån. Pheùp kieåm nghieäp Shapiro-Wilk chæ duøng trong nhöõng tröôøng hôïp soá maãu nhoû hôn 40.  Kieåm nghieäm Levene  Bieân soaïn: Ñaøo Hoaøi Nam 36
  5. Phaân tích döõ lieäu baèng SPSS Tröôùc khi ñi vaøo caùc kieåm nghieäm trung bình ta caàn phaûi tham khaûo moät kieåm nghieäm khaùc maø keát quaû cuûa noù laø raát quan troïng cho caùc kieåm nghieäm trung bình sau naøy. Kieåm nghieäm Levene laø pheùp kieåm nghieäm tính ñoàng nhaát cuûa phöông sai. ÔÛ ñaây ta kieåm nghieäm giaû thuyeát cho raèng phöông sai cuûa giöõa caùc maãu quan saùt laø baèng nhau. Kieåm nghieäm cho ta keát quaû Sig. nhoû hôn möùc tin caäy (5%) ta keát luaän khoâng chaáp nhaän giaû thuyeát cho raèng phöông sai maãu thì baèng nhau. Chuù yù trong moät soá kieåm nghieäm nhö ANOVA, kieåm nghieäm t, … Ñoøi hoûi phaûi kieåm nghieäm thoâng keâ Levene tröôùc ñeå xaùc ñònh tinh caân baèng hay khoâng caân baèng cuûa caùc phöông sai maãu. Keát quaû naøy seõ aûnh höôûng ñeán vieäc löïa choïn caùc kieåm nghieäm trung bình khaùc (Kieåm nghieäp trung bình vôùi phöông sai maãu baèng nhau hoaëc kieåm nghieäm trung bình vôùi phöông sai maãu khoâng baèng nhau) b. Laäp baûng phaân boá taàn suaát cho bieán moät  traû lôøi (Frequencies) Coâng cuï Frequencies söû duïng caùc tham soá thoáng keâ ñeå moâ taû cho nhieàu loaïi bieán, ñaây cuõng laø moät coâng cuï höõu ích ñeå ta khaûo saùt döõ lieäu tìm loãi cho döõ lieäu. Chuùng ta coù theå khaûo saùt döõ lieäu thoâng qua caùc coâng cuï nhö: Taàn suaát xuaát hieän, phaàn traêm, phaàn traêm tích luõy. Ngoaøi ra noù coøn cung caáp cho ta caùc pheùp ño löôøng thoâng keâ nhö ñoä taäp trung (central tendency measurement), ñoä phaân taùn (dispersion), töù phaân vò (Quartiles) vaø caùc baùch phaân vò (percentiles), phaân phoái döõ lieäu (distribution). Laäp baûng naøy ngoaøi vieäc toùm taét döõ lieäu, noù coøn giuùp ta phaùt hieän nhöõng sai soùt trong döõ lieäu nhö, nhöõng giaù trò baát thöôøng (quaù lôùn hay quaù nhoû) coù theå laøm sai leäch keát quaû phaân tích thoáng keâ, nhöõng giaù trò maõ hoùa baát thöôøng do sai soùt vieäc nhaäp lieäu hay maõ hoùa Ñeå tieán haønh laäp baûng ñôn ta choïn coâng cuï Statistic/ sumarize/frequencies ta coù hoäp thoaïi nhö Hình 6-4: Bieân soaïn: Ñaøo Hoaøi Nam 37
  6. Phaân tích döõ lieäu baèng SPSS Hình 6­4 Bieân soaïn: Ñaøo Hoaøi Nam 38
  7. Phaân tích döõ lieäu baèng SPSS Chuyeån bieán caàn moâ taû sang hoäp thoaïi variable(s, ta coù theå löïa choïn nhieàu bieán caàn quan saùt cuøng moät luùc. Coâng cuï Charts ñöôïc duøng ñeå veõ ñoà thò cho döõ lieäu, vaø coâng cuï Format ñöôïc söû duïng ñònh ra kieåu hieån thò cuûa döõ lieäu, theo thöù töï taêng daàn hoaëc giaõm daàn. Coâng cuï statistics ñeå truy suaát hoäp thoaïi nhö Hình 6-5. Trong hoäp thoaïi statistics naøy seõ bao goàm caùc coâng cuï ñeå ño löôøng caùc giaù trò thoáng keâ cuûa döõ lieäu nhö vò trí töông ñoái cuûa caùc nhoùm giaù trò hay coøn goïi laø caùc phaân vò, maät ñoä taäp trung vaø phaân taùn cuûa döõ lieäu, nhöõng ñaëc tính veà phaân phoái cuûa döõ lieäu (Distribution) Hình 6­5 - Giaù trò baùch phaân vò (percentile values): Ñöôïc duøng ñeå xaùc ñònh caùc ranh giôùi töông ñoái cuûa caùc nhoùm töø maãu quan saùt, ñieàu löu yù laø döõ lieäu caàn quan saùt ñaõ ñöôïc xaép xeáp thep thöù töï töø thaáp ñeán cao. o Ta coù coâng cuï phaân nhaùnh döõ lieäu thaønh 4 phaàn baèng nhau goïi laø töù phaân vò (quartiles). o Hoaëc ta coù theå chia döõ lieäu theo caùc phaàn baèng nhau cuï theå baèng caùch goõ soá phaàn muoán chia vaøo coâng cuï cuts points for equal groups. o Hoaëc ta coù theå xem giaù trò ôû phaân nhaùnh cuï theå naøo ñoù töø coâng cuï percentile(s). Söû duïng thanh Add ñeå xaùc nhaän soá thöù töï phaân vò caàn quan saùt, söû duïng thanh Remove vaø Change ñeå loaïi boû hoaëc thay ñoåi söï xaùc nhaän ban ñaàu. Bieân soaïn: Ñaøo Hoaøi Nam 39
  8. Phaân tích döõ lieäu baèng SPSS Ví duï nhö ñoái vôùi bieán chöùa caùc caâu traû lôøi tröïc tieáp veà soá tuoåi cuûa ngöôøi traû lôøi trong moät cuoäc khaûo saùt daân soá (tuoåi ngöôøi traû lôøi ñöôïc ghi tröïc tieáp töø 18 – 89 tuoåi) ta coù theå duøng coâng cuï phaân vò döõ lieäu ñeå phaân caùc ñoä tuoåi naøy thaønh caùc nhoùm nhoû, ví duï nhö ta phaân caùc ñoä tuoåi naøy baèng phöông phaùp töù phaân vò (quartiles). Luùc ñoù tuoåi cuûa ngöôøi traû lôøi seõ ñöôïc phaân thaønh 4 phaàn sao cho moãi nhoùm tuoåi ñöôïc phaân chieám 25% soá laàn xuaát hieän (taàn suaát xuaát hieän). - Ñaëc tính phaân phoái (Distribution): Coù hai ñaïi löôïng ño löôøng nhöõng ñaëc tính cuûa söï phaân phoái döõ lieäu laø (1) Heä soá ñoái xöùng Skewness (Cs) cho ta bieát daïng phaân phoái cuûa caùc giaù trò quan saùt Standard Error of Skewness coù theå ñöôïc söû duïng ñeå kieåm nghieäm tính phaân phoái chuaån. Moät phaân phoái Skewness khoâng ñöôïc xem laø phaân phoái chuaån khi Statndard error cuûa noù nhoû hôn –2 hoaëc lôùn hôn 2. Moät giaù trò döông lôùn cuûa Statndard error cho thaáy nhaùnh cuûa phaân phoái naøy daøi qua beân phaûi vaø ngöôïc laïi moät trò aâm chæ ra nhaùnh cuûa phaân phoái naøy daøi qua beân traùi - Cs = 0: Caùc quan saùt ñöôïc phaân phoái moät caùc ñoái xöùng xung quanh giaù trò trung bình - Cs > 0: Caùc quan saùt taäp trung chuû yeáu vaøo caùc giaù trò nhoû nhaát - Cs < 0: Caùc quan saùt taäp trung chuû yeáu vaøo caùc giaù trò lôùn nhaát (2) Heä soá taäp trung Kurtosis (Cc) duøng ñeå so saùnh ñöôøng cong quan saùt vôùi daïng ñöôøng cong phaân phoái chuaån. Standard Error of Kurtosis coù theå ñöôïc söû duïng ñeå kieåm nghieäm tính phaân phoái chuaån. Moät phaân phoái Kurtosis khoâng ñöôïc xem laø phaân phoái chuaån khi Statndard error cuûa noù nhoû hôn –2 hoaëc lôùn hôn 2. Moät giaù trò döông lôùn cuûa Statndard error cho ta bieát hai nhaùnh cuûa phaân phoái naøy daøi hôn nhaùnh cuûa phaân phoái chuaån vaø ngöôïc laïi moät trò aâm chæ ra hai nhaùnh cuûa phaân phoái ngaén hôn phaân phoái chuaàn - Cc > 0: Cho thaáy xu höôùng taïp trung maïnh cuûa caùc quan saùt xung quanh giaù trò trung bình Bieân soaïn: Ñaøo Hoaøi Nam 40
  9. Phaân tích döõ lieäu baèng SPSS - Cc < 0: Cho thaáy ñöôøng cong coù daïng heïp hôn. Bieân soaïn: Ñaøo Hoaøi Nam 41
  10. Phaân tích döõ lieäu baèng SPSS 3. Laäp baûng  moâ taû (Descriptive) Söû duïng Statisticts\Summaries\Descriptives ñeå môû hoäp thoaïi moâ taû thoáng keâ nhö Hình 6-6: Hình 6­6 Ñaây laø moät daïng coâng cuï khaùc coù theå ñöôïc duøng ñeå toùm taéc döõ lieäu vaø chæ cho pheùp thao taùc treân daïng döõ lieäu ñònh löôïng (thang ño khoaûng caùch vaø tyû leä). Ñöôïc duøng ñeå theå hieän xu höôùng taäp trung cuûa döõ lieäu (central tendency) thoâng qua giaù trò trung bình cuûa caùc giaù trò trong bieán (mean), vaø moâ taû söï phaân taùn cuûa döõ lieäu thoâng qua phöông sai vaø ñoä leäch chuaån. Chuyeån caùc bieán caàn toùm taéc vaøo hoäp thoaïi variables vaø nhaáp thanh options ñeå löïa choïn caùc thoâng soá thoáng keâ caàn moâ taû, nhö giaù trò trung bình–mean, giaù trò toái thieåu, giaù trò toái ña, phöông sai vaø ñoä leäch chuaån,… (Hình 6-7) Hình 6­7 Bieân soaïn: Ñaøo Hoaøi Nam 42
  11. Phaân tích döõ lieäu baèng SPSS d. Laäp   baûng   nhieàu   chieàu   cho   caùc   bieán   moät  traû lôøi (Crosstabs) Baûng nhieàu chieàu laø daïng baûng cheùo theå hieän taàn suaát xuaát hieän cuûa moät bieán naøy trong moái quan heä vôùi moät hay nhieàu bieán khaùc. Baûng cheùo coøn cung caáp nhieàu loaïi kieåm nghieäm thoáng keâ vaø ño löôøng moái quan heä vaø töông quan giöõa caùc bieán trong baûng. Caáu truùc cuûa baûng vaø loaïi döõ lieäu (loaïi thang ñoù) seõ quyeát ñònh loaïi coâng cuï naøo ñöôïc söû duïng ñeå ño löôøng. Ngoaøi vieäc theå hieän moái lieân heä giöõa caùc bieán. Baûng nhieàu chieàu coøn giuùp ta phaùt hieän nhöõng sai soùt trong döõ lieäu töø vieäc phaùt hieän ra nhöõng moái quan heä voâ lyù vaø baát thöôøng giöõa hai bieán. Choïn treân menu Statistics/Summaries/Crosstabs ñeå môû hoäp thoaïi nhö Hình 6-8: Hình 6­8 Caùc bieán trong taäp döõ lieäu ñöôïc hieån thò beân hoäp beân traùi. Choïn caùc bieán haøng ñöa vaùo hoäp Row(s) vaø caùc bieán coät ñöa vaøo hoäp Column(s). Thoâng thöôøng bieán phuï thuoäc hay bieán caàn quan saùt thöôøng ñöôïc ñöa vaø haøng (rows) vaø bieán ñoäc laäp hay bieán kieåm soaùt ñöôïc ñöa vaø coät (columns). Vieäc löïa choïn caùc phaân tích theo caùc tyû leä phaàn traêm, %row vaø %column cuõng nhö %total tuyø thuoäc vaøo yeâu caàu nghieân cöùu. Ngoaøi ra, chuùng ta coù theå ñöa theâm vaøo baûng cheùo caùc lôùp bieán ñieàu khieån (layer) ñeå taïo ra caùc baûng bieán cheùo nhieàu chieàu. Moãi baûng cheùo rieâng bieät seõ ñöôïc taïo ra öùng vôùi moãi giaù trò cuûa moãi bieán ñieàu Bieân soaïn: Ñaøo Hoaøi Nam 43
  12. Phaân tích döõ lieäu baèng SPSS khieån. Moãi lôùp ñieàu khieån seõ chia baûng cheùo thaønh nhieàu nhoùm nhoû hôn. Coù theå theâm toái ña 8 bieán ñieàu khieån, duøng caùc thanh Next vaø previous ñeå di chuyeån giöõa caùc bieán ñieàu khieån naøy. Vieäc ñöa vaøo caùc bieán ñieàu khieån naøy cho pheùp ta xem xeùt caùc moái quan heä maø luùc ban ñaàu khoâng theå thaáy ngay. Caùc coâng cuï thoáng keâ seõ cho ra caùc keát quaû rieâng bieát ñoái vôùi töøng giaù trò cuûa bieán ñieàu khieån. Coâng cuï Cells trong hoäp thoaïi cho pheùp ta tính toaùn caùc heä soá ño löôøng moái quan heä giöõa caùc bieán ñoù nhö % haøng, % coät, % Total. Coâng cuï Exact cung caáp cho chuùng ta hai phöông phaùp ñeå tính ra möùc ñoä tin caäy cho caùc pheùp kieåm nghieäm söû duïng trong baûng cheùo, hoaëc caùc pheùp thöû phi tham soá (nonparametric). Hai phöông phaùp naøy bao goàm phöông phaùp Exact vaø phöông phaùp Monte Carlo ñöôïc söû duïng nhö coâng cuï ñeå thu ñöôïc nhöõng keát quaû chính xaùc trong tröôøng hôïp döõ lieäu cuûa chuùng ta khoâng ñaùp öùng ñöôïc nhöõng giaû thuyeát caàn thieát cho moät keát quaû ñaùng tin caäy khi söû duïng phöông phaùp tieäm caän tieâu chuaån (Standard asymptonic) phöông phaùp maø keøm theo noù döõ lieäu cuûa chuùng ta ñoøi hoûi phaûi thoaû maõn nhöõng ñieàu kieän sau: - Döõ lieäu söû duïng coù phaân phoái chuaån, hoaëc kích côû maãu phaûi ñuû lôùn (n>=30) - Khoâng toàn taïi taàn suaát mong muoán naøo cuûa baát kyø giaù trò naøo trong baûng cheùo nhoû hôn 5. Ñoái vôùi tröôøng hôïp döõ lieäu khoâng gaëp ñöôïc nhöõng yeâu caàu nhö treân. Phöông phaùp exact hoaëc Monte Carlo veà ñoä tin caäy luoân luoân cho ta keát quaû ñaùng tin caäy maø khoâng caàn quan taâm ñeán kích côû maãu, phaân phoái cuûa caùc quan saùt cuõng nhö söï caân baèng cuûa döõ lieäu (caân baèng veà soá löôïng caùc giaù trò khaùc nhau trong Bieân soaïn: Ñaøo Hoaøi Nam 44
  13. Phaân tích döõ lieäu baèng SPSS bieán). Choïn coâng cuï Exact trong hoäp thoaïi Crosstabs ta coù hoäp thoaïi con nhö Hình 6-9. Hình 6­9 SPSS maëc ñònh laø söû duïng phöông phaùp tieäm caän thoâng thöôøng (Asymptotic). Neáu ta söû duïng phöông phaùp exact hoaëc mote carlo ñeå xaùc ñònh tính ñoä tin caäy thì caàn chuù yù caùc ñieåm sau: - Neáu ta löïa choïn phöông phaùp Monte Carlo, goû khoaûng tin caäy mong muoán vaøo coâng cuï Confidence level, ñoàng thôøi cho bieát kích côû maãu ñöôïc söõ duïng. Söû duïng phöông phaùp cho ta keát quaû nhanh hôn phöông phaùp exact - Neáu löïa choïn phöông phaùp Exact, nhaäp vaøo thôøi gian giôùi haïn toái ña cho vieäc tính toaùn cho moãi pheùp thöû. Neáu moät pheùp kieåm nghieäm vöôït quaù thôøi gian giôùi haïn toái ña 30 phuùt, caùch toát hôn neân söû duïng laø Moten Carlo Coâng cuï Statistics cho pheùp ta tính caùc kieåm nghieäm giaû thuyeát veà tính ñoäc laäp cuûa caùc bieán, vaø moái lieân heä giöõa caùc caùc bieán, heä soá töông quan, cuõng nhö ño löôøng caùc moái quan heä ñoù. (Xem Hình 6-10) Hình 6­10  Caùc   kieåm   nghieäm   thoáng   keâ   –   kieåm   nghieäm  moái   quan   heä   vaø   töông   quan   giöõa   caùc   bieán  söû duïng trong baûng cheùo  Kieåm nghieäp Chi­square: - Laø moät coâng cuï thoâng keâ söû duïng ñeå kieåm nghieäp giaû thuyeát cho raèng caùc bieán trong haøng Bieân soaïn: Ñaøo Hoaøi Nam 45
  14. Phaân tích döõ lieäu baèng SPSS vaø coät thì ñoäc laäp vôùi nhau (H0). Phöông phaùp kieåm nghieäm naøy chæ cho ta bieát ñöôïc lieäu moät bieán naøy coù quan heä hay khoâng vôùi moät bieán khaùc, tuy nhieân phöông phaùp kieåm nghieäp naøy khoâng chæ ra cöôøng ñoä cuûa moái quan heä giöõa hai bieán maïnh hay yeáu (neáu coù quan heä), cuõng nhö khoâng chæ ra höôùng thuaän hay nghòch cuûa moái quan heä naøy (neáu coù quan heä). - Ñeå kieåm nghieäp tính ñoäc laäp giöõa hai bieán coät vaø haøng, kieåm nghieäp Chi-square seõ cho ra caùc keát quaû kieåm nghieäp nhö sau: Pearson chi-square, likelihood-ratio chi-square, and linear-by-linear association chi-square moãi caùi seõ ñöôïc söû duïng trong nhöõng tröôøng hôïp cuï theå - Theo ñònh nghóa hai bieán trong baûng laø ñoäc laäp vôùi nhau neáu nhö xaùc suaát sao cho moät tröôøng hôïp quan saùt (case) rôi vaøo moät tröôøng hôïp cuï theå (ví duï nhö giôùi tính laø Nam vaø ñang thaát nghieäp) laø ñöôïc taïo ra töø caùc xaùc suaát bieân (xaùc suaát coät vaø xaùc suaát haøng). Ví duï ta coù xaùc suaát moät ñoái töôïng quan saùt laø thaát nghieäp laø 35/923. Vaø xaùc suaát ñeå ñoái töôïng quan saùt laø Nam giôùi laø 452/923. Do hai bieán laø ñoäc laäp, theo lyù thuyeát xaùc suaát ñeå moät tröôøng hôïp quan saùt vöøa laø Nam giôùi vöøa laø Thaát nghieäp thì xaùc suaát trong tröôøng hôïp naøy phaûi laø (452/923) x (35/923) vaø baèng 0.018. Xaùc suaát naøy seõ ñöôïc söû duïng ñeå öôùc löôïng (estimate) soá löôïng caùc tröôøng hôïp quan saùt mong ñôïi trong töøng phaàn giao nhau giöõa hai bieán treân baûng cheùo döôùi ñieàu kieän hai bieán laø ñoäc laäp vôùi nhau. Do ñoù ñeå tính toaùn ñöôïc soá löôïng quan saùt mong ñôïi laø Nam giôùi vaø thaát nghieäp ta chæ vieäc nhaân xaùc suaát vöøa tìm ñöôïc vôùi toång soá maãu quan saùt (0.018 x 923). (Xem baûng phía cheùo phía döôùi) Bieân soaïn: Ñaøo Hoaøi Nam 46
  15. Phaân tích döõ lieäu baèng SPSS Tinh trang cong viec * Gioi tinh nguoi tra loi Crosstabulation Gioi tinh nguoi tra loi Nam Nu Total Tinh Lam viec toan thoi gian Count 379 308 687 trang Expected Count 336.4 350.6 687.0 cong % of Total 41.1% 33.4% 74.4% viec Lam viec ban thoi gian Count 32 94 126 Expected Count 61.7 64.3 126.0 % of Total 3.5% 10.2% 13.7% Tam thoi khong di lam Count 8 22 30 Expected Count 14.7 15.3 30.0 % of Total .9% 2.4% 3.3% That nghiep Count 25 10 35 Expected Count 17.1 17.9 35.0 % of Total 2.7% 1.1% 3.8% Khac Count 8 37 45 Expected Count 22.0 23.0 45.0 % of Total .9% 4.0% 4.9% Total Count 452 471 923 Expected Count 452.0 471.0 923.0 % of Total 49.0% 51.0% 100.0% - Ñeå kieåm nghieäm tính ñoäc laäp giöõa hai bieán, ngöôøi ta söû duïng phaân phoái ngaãu nhieân Chi bình phöông (χ2)  vôùi  tham soá thoáng keâ Pearson   chi   bình  phöông ñeå tieán haønh so saùnh soá löôïng caùc tröôøng hôïp quan saùt ñöôïc vôùi soá löôïng caùc tröôøng hôïp mong ñôïi baèng coâng thöùc sau: r c (Oij − Eij ) 2 X 2 = ∑∑ i =1 j =1 Eij - Khi keát quaû thoáng keâ Chi bình phöông (χ2) ñuû lôùn (Döïa vaøo lyù thuyeát phaân phoái Chi bình phöông vôùi ñoä tin caäy xaùc ñònh, kích côû maãu laø n, baät töï do- degree of freedom laø df=(r-1)(c-1)) ta coù theå keát luaän baùc boû giaû thuyeát ñoäc laäp giöõa hai bieán (H0). Hoaëc söû duïng giaù trò P (P-value hay Asymtotic Significance) so saùnh vôùi möùc yù nghóa (Significance level) thöôøng laø α = 0.05 töông öùng vôùi 95% ñoä tin caäy, ta coù theå keát luaän baùc boû H0 khi p-value nhoû hôn hoaëc baèng möùc yù nghóa vaø ngöôïc laïi chaáp nhaän H0 khi p-value lôùn hôn möùc yù nghóa. - Tuy nhieân ñeå vieäc kieåm nghieäm naøy laø ñaùng tin caäy thì caùc soá lieäu trong baûng cheùo giöõa hai bieán Bieân soaïn: Ñaøo Hoaøi Nam 47
  16. Phaân tích döõ lieäu baèng SPSS ñang khaûo saùt phaûi thoûa maõn moät soá ñieàu kieän nhaát ñònh sau: o Khoâng toàn taïi ôû baát kyø oâ giao nhau giöõa hai bieán coù giaù trò mong ñôïi nhoû hôn 1. o Khoâng vöôït quaù 20% löôïng oâ giao nhau giöõa hai bieán ñang khaûo saùt trong baûng cheùo coù giaù trò nhoû hôn 5 (ñoái vôùi baûng 2x2-baûng maø moãi bieán trong baûng cheùo chæ coù hai giaù trò, phaàn traêm giôùi haïn naøy laø 0%) - Neáu khoâng thoûa maõn caùc ñieàu kieän treân ta phaûi tieán haønh loaïi boû bôùt caùc giaù trò trong moät bieán maø döõ lieäu giao nhau cuûa noù laø khoâng ñaùng keå (quaù nhoû) - Ñeå kieåm nghieäm tính ñoäc laäp giöõa hai bieán coät vaø haøng trong baûng cheùo, kieåm nghieäp Chi-square seõ cho ra caùc keát quaû kieåm nghieäp khaùc nhau nhö sau: Pearson   chi­square,   likelihood­ratio   chi­ square, vaø linear­by­linear   association   chi­ square. - Thoâng thöôøng ñeå xaùc ñònh moái quan heä giöõa hai bieán trong baûng cheùo, vieäc söû duïng chæ soá naøo ñeå kieåm nghieäm tích ñoäc laäp giöõa hai bieán phuï thuoäc vaøo soá löôïng coät vaø haøng trong baûng, soá maãu nghieân cöùu, taàn suaát xuaát hieän mong muoán cuûa moät giaù trò trong bieán trong ñieàu kieän cuûa bieán khaùc, daïng ño löôøng cuûa caùc bieán trong baûng (daïng thang ño). Ta coù: o Döïa vaøo caùc heä soá Pearson  Chi­square  vaø  Likelihood Ratio  ta coù theå kieåm nghieäp moái lieân heä giöõa hai bieán maø khoâng caàn quan taâm ñeán soá löôïng haøng vaø coät trong baûng. o Hoaëc ta coù theå duøng chæ soá Linear­by­ linear   association khi maø caùc bieán trong baûng laø bieán ñònh löôïng. o Ñoái vôùi daïng baûng cheùo coù hai coät vaø hai doøng (2X2 tables) – moãi bieán trong baûng chæ coù hai giaù trò, ta duøng caùc chæ soá Yate’s  corrected   chi­square  hay coøn goïi laø Continuity   Correction ñaùnh giaù moái töông quan giöõa hai bieán trong baûng. Bieân soaïn: Ñaøo Hoaøi Nam 48
  17. Phaân tích döõ lieäu baèng SPSS o Söû duïng chæ soá Fisher’s exact test  khi maø soá maãu nghieân cöùu vaø caùc giaù trò mong ñôïi nhoû, thoâng thöôøng ta seõ söû duïng chæ soá naøy khi maãu trong baûng nhoû hôn hoaëc baèng 20 hoaëc taàn suaát xuaát hieän mong muoán trong moät phaàn giao nhau giöõa hai bieán trong baûng (cell) nhoû hôn 5. - Ñeå keát luaän moái lieân heä giöõa hai bieán laø ñoäc laäp hay phuï thuoäc vaøo nhau (coù hay khoâng coù töông quan) ngöôøi ta döïa vaøo Asymptotic Significance vôùi soá maãu ñuû lôùn hoaëc phaân phoái laø phaân phoái chuaån. Ñaây laø chæ soá thoáng keâ ñeå ño löôøng vôùi möùc yù nghóa (thöôøng laø 5%) nhaèm ñöa ra keát luaän phaûn baùt hay chaáp nhaän giaû thuyeát ban ñaàu (Hai bieán laø ñoäc laäp vôùi nhau). Ta coù theå keát luaän giöõa hai bieán toàn taïi moät moái quan heä vôùi nhau khi maø Asym. Sig. nhoû hôn möùc yù nghóa vaø ngöôïc laïi. - Ñoái vôùi kieåm nghieäm Chi-square ta chæ coù theå xaùc ñònh giöõa hai bieán coù hay khoâng toàn taïi moät moái quan heä. Tuy nhieân ñeå ño löôøng cöôøng ñoä cuûa caùc moái quan heä naøy ñoøi hoûi caùc coâng cuï thoáng keâ khaùc seõ ñöôïc ñeà caäp sau ñaây.  Correlation:  - Duøng ñeå ño löôøng moái töông quan giöõa hai bieán thöù tö hoaëc khoaûng caùchï. Vieäc ño löôøng moái töông quan giöõa hai bieán thöù töï naøy chuû yeáu döï vaøo hai heä soá Spearman’s correlation coefficient rho vaø Pearson correlation coefficient. Trong ñoù: o Spearman’s rho ñöôïc duøng ñeå ño löôøng moái quan heä giöõa hai bieán thöù töï (caùc bieán naøy haàu heát ñeàu ñöôïc xaép xeáp töø thaáp nhaát ñeán cao nhaát). o Khi caùc bieán trong baûng laø caùc bieán ñònh löôïng ta söû duïng heä soá Pearson correlation coefficient ñeå ño löôøng moái quan heä tuyeán tính giöõa caùc bieán naøy. - Caùc giaù trò cuûa heä soá töông quan bieán thieân töø – 1 ñeán 1, daáu coäng hoaëc tröø chæ ra höông töông quan giöõa caùc bieán (thuaän hay nghòch), giaù trò tuyeät ñoái cuûa chæ soá naøy cho bieát cöôøng ñoä Bieân soaïn: Ñaøo Hoaøi Nam 49
  18. Phaân tích döõ lieäu baèng SPSS töông quan giöõa hai bieán, giaù trò naøy caøng lôùn moái töông quan caøng maïnh.  Moät soá ño löôøng moái töông quan khaùc giöõa hai  bieán • Giöõa hai bieán ñònh danh:  - Ñeå ño löôøng moái quan heä giöõa hai bieán bieåu danh. Söû duïng caùc heä soá Phi (coefficient) vaø Craémr’s   V,   Contingency   coefficient  ñeå ño löôøng neáu döïa vaøo keát quaû kieåm nghieäm Chi- bình phöông. ÔÛ ñaây caùc heä soá naøy seõ baèng 0 neáu vaø chæ neáu heä soá Pearson chi bình phöông  baèng 0. Do ñoù ngöôøi ta söû duïng caùc thoâng soá naøy ñeå kieåm nghieäm giaû thuyeát cho raèng caùc heä soá naøy ñeàu baèng 0 - ñieàu naøy töông ñöông vôùi giaû thuyeát ñoäc laäp giöõa hai bieán, hay hai bieán khoâng coù moâí quan heä vôùi nhau. Ta seõ töø choái giaû thuyeát naøy - Phi: Chæ duøng cho daïng baûng 2x2 tables, heä soá phi coefficient naøy bieán thieân töø -1 ñeán +1. Do ñoù heä soá naøy ngoaøi khaû naêng chæ ra moái quan heä vaø cöôøng ñoä cuûa moái quan heä noù coøn chæ ra höôùng cuûa moái quan heä ñoù - Cramer's V vaø Contingency coefficient (heä soá ngaãu hieân): Ñöôïc söû duïng cho baûng maø soá coät vaø haøng laø baát kyø, giaù trò kieåm nghieäm bieán thieân töø 0 ñeán 1, vôùi giaù trò 0 chæ ra khoâng coù moái quan heä giöõa caùc bieán - Ngoaøi ra coøn coù caùc heä soá ño löôøng tröïc tieáp nhö Lambda   (symmetric   and   asymmetric   lambdas  and Goodman and Kruskal’s tau), vaø Uncertainty  coefficient.  Laø caùc ño löôøng khoâng döïa vaøo giaù trò Chi-square ñeå tính toaùn, vaø khoâng quan taâm ñeán tính ñoái xöùng cuûa phaân phoái chuaån. Caùc giaù trò cuûa heä soá naøy cuõng bieán thieân töø 0 ñeá 1 vaø ñöôïc duøng ñeå ño löôøng khaû naêng döï baùo cuûa moät bieán (bieán ñoäc laäp) ñoái vôùi moät bieán khaùc (bieán phuï thuoäc). Vôùi giaù trò 0 nhaän ñöôïc coù yù nghóa raèng nhöõng kieán thöùc veà bieán ñoäc laäp khoâng giuùp ích gì cho vieäc döï baùo nhöõng khaû naêng xaûy ra cuûa bieán phuï thuoäc, vaø giaù trò 1 cho bieát khi ta bieát ñöôïc nhöõng thoâng tin veà bieán ñoäc laäp thì noù seõ Bieân soaïn: Ñaøo Hoaøi Nam 50
  19. Phaân tích döõ lieäu baèng SPSS giuùp ta xaùc ñònh ñöôïc moät caùch hoaøn haûo caùc khaû naêng xaûy ra cho bieán phuï thuoäc. - Vieäc löïa choïn bieán naøo laø bieán ñoäc laäp vaø bieán naøo laø bieán phuï thuoäc tuøy thuoäc vaøo vaán ñeà cuï theå maø ta ñang khaûo saùt - Heä soá Asymptotic   Std.   Error  coù theå ñöôïc duøng ñeå ñònh ra khoaûng tin caäy (95%) cho caùc tham soá ño löôøng (Value +(-) 2*Asymptotic std. Error) • Söû duïng Odds Ratio cho baûng hai coät hai haøng  (2x2 tables) - Ñeå ño löôøng moái töông quan giöõa hai bieán cho loaïi baûng naøy ngöôøi ta coù theå söû duïng caùc keát quaû thoáng keâ Yates’ corrected chi – bình phöông vaø Fisher’s exact test. Caùc keát quaû naøy ñöôïc duøng ñeå kieåm nghieäm giaû thuyeát cho raèng caùc tyû leä giöõa caùc giaù trò trong hai bieán naøy laø ngang baèng nhau (ví duï nhö tyû leä ngöôøi nam ñi baûo taøng thì ngang baèng vôùi tyû leä ngöôøi nöõ ñi baûo taøng), töông töï vôùi caùc keát quaû thoáng keâ chi – bình phöông khaùc ta seõ töø choái giaû thuyeát H0 khi p-value nhoû hôn möùc tin caäy. - Ngoaøi phöông phaùp treân ta coøn coù theå söû duïng phöông phaùp odds ratio vaø relative risk ñeå ño löôøng moái lieân heä giöõa hai ñaëc tính. Thoâng thöôøng moät trong hai ñaëc tính ñoù xuaát hieän tröôùc (ví duï nhö bieán chöùa ñaëc tính coù huùt thuoác hay khoâng) vaø sau ñoù laø seõ daãn ñeán moät ñaëc tính khaùc xuaát hieän theo sau (ví duï bieán chöùa ñaëc tính coù bò beänh lao phoåi hay khoâng). Ta goïi bieán chöùa ñaëc tính xuaát hieän tröôùc laø bieán nhaân toá (factor) vaø bieán theo sau laø bieán söï kieän (event). Ta coù hai phöông phaùp tính nhö sau: (1) Relative risk: Bieán söï kieän Yes No Tyû leä Tyû leä ruûi ro ruûi ro risk töông ñoái Relative risk Bieân soaïn: Ñaøo Hoaøi Nam 51
  20. Phaân tích döõ lieäu baèng SPSS Bieán nhaân Yes a b a/(a+b) a(c+d) toá No c d c/(c+d) c(a+b) Phöông phaùp naøy baét ñaàu vôùi bieán nhaân toá vaø theo sau ñoù ta ñeám soá moãi söï kieän xuaát hieän trong moãi nhoùm nhaân toá. Tyû leä ruûi ro ñöôïc tính rieâng bieät cho töøng nhoùm nhaân toá vaø tyû leä ruûi ro töông öùng laø tyû soá giuõa hai tyû leä ruûi ro cuûa töøng nhoùm nhaân toá (2) Odds ratio: Bieán nhaân toá Yes No odds Tyû leä odds Bieán söï kieän Yes a b a/b ad No c d c/d cb Phöông phaùp naøy baét ñaàu vôùi bieán söï kieän. Vôùi moät söï kieän (ví duï bò beänh lao phoåi) thì tyû leä giöõa ngöôøi huùt thuoác ñoái vôùi ngöôøi khoâng huùt thuoác laø bao nhieâu, goïi laø odd. Sau ñoù ta laäp tyû leä caùc odds naøy. - Caû hai phöông phaùp naøy ñeàu coù caùch kieåm nghieäp keát quaû gioáng nhau. Caû Tyû leä Odds vaø relative risk ñeàu nhaän giaù trò 1 khi caùc tyû leä naøy laø gioáng nhau. Vaø ñeå kieåm nghieäm giaõ thuyeát ban ñaàu cho raèng caùc tyû soá naøy laø nhö nhau (H0) - töø choái hay chaáp nhaän ta döïa vaøo khoaûng tin caäy (95%) xem xem giaù trò 1 coù naèm trong khoaûng tin caäy ñoù hay khoâng. Neáu giaù trò 1 khoâng naèm trong khoaûng tin caäy 95% ta töø choái giaû thuyeát H0, vaø coù theå xem giaù trò trong oâ (value) laø tyû soá dieãn giaûi. Neáu giaù trò 1 naèm trong khoaûng tin caäy 95%, khoâng caàn quan taâm ñeán caùc giaù trò trong coät value, bôûi vì kieåm nghieäm cho ta keát quaû chaáp nhaän giaû thuyeát hai tæ leä odds hoaëc relative cuûa hai giaù trò laø nhö nhau - Chuù yù phöông phaùp Odds ratio luoân luoân laáy tyû soá odd ôû haøng thöù nhaát chia cho haøng thöù hai, Bieân soaïn: Ñaøo Hoaøi Nam 52
Đồng bộ tài khoản