Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

Bài 8. Nhập và xử lý dữ liệu

Môn học: Phương pháp nghiên cứu kinh tế Khoa Kinh tế Phát triển Đại học Kinh Tế TP. Hồ Chí Minh

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.1 Giới thiệu

Nhằm hướng dẫn sinh viên cách: o Cách nhập liệu, xử lý và phân tích dữ liệu. o Các kỹ thuật phân tích dữ liệu mang tính khám phá (exploratory data analysis). o Cách sử dụng bảng chéo (cross-tabulation) để trắc nghiệm mối quan hệ giữa các biến phân loại (categorical variables).

o Cách sử dụng các thống kê phân tích trắc

nghiệm giả thiết.

2

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.2 Quy trình phân tích dữ liệu

Lập đề cương NC

Kế hoạch phân tích sơ khởi

Xác định lại giả thiết

Thu thập và chuẩn bị dữ liệu

Thể hiện trực quan dữ liệu

Hình 8.1 Các bước khám phá, trắc nghiệm và phân tích trong quá trình nghiên cứu

Phân tích và diễn giải dữ liệu

Phân tích mô tả các biến số

Lập bảng chéo cho các biến số

Trình bày dữ liệu (histogram, boxplots, Pareto, stem- and-leaf, AID, etc.)

Phân tích dữ liệu

Trắc nghiệm giả thiết

Báo cáo nghiên cứu

Ra quyết định

3

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.3 Nhập số liệu

8.3.1 Cách bố trí dữ liệu trên máy

tính

o Mục tiêu:

n Nhằm tạo điều kiện thuận tiện cho việc

nhập liệu

n Nhằm tạo sự thuận lợi cho việc chỉnh sửa

dữ liệu

4

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.3 Nhập số liệu

o Thực hiện:

n Nguyên tắc chung: đặt tên biến ngắn gọn, viết tắt (tiếng Việt không dấu hoặc tiếng Anh). Tên biến nên được đặt theo quy định.

n Dùng Excel: dễ thao tác và chỉnh sửa, không

gian lưu trữ hạn chế, công cụ thống kê và kinh tế lượng không đủ cho phân tích.

n Dùng SPSS: không gian lưu trữ gần như không

hạn chế, công cụ thống kê và kinh tế lượng phát triển đầy đủ cho nhu cầu phân tích. Khai báo dữ liệu bắt buộc, mất thời gian.

5

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.3 Nhập số liệu

6

Hình 5. 2 Cách nhập dữ liệu vào bảng tính SPSS

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.3 Nhập số liệu

7

Hình 8.3 Cách định nghĩa các thuộc tính của các biến số định tính và định lượng

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

Định nghĩa kiểu biến

8

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

Xác định nhãn (giải thích) của biến

9

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

Xác định giá trị phân loại của biến

10

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

Xác định thang đo của biến

11

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.4 Làm sạch dữ liệu

8.4.1 Phát hiện giá trị dị biệt trong dữ liệu

12

a. Sử dụng Excel: hàm Max và Min, công cụ Auto Filter, đồ thị Scatter

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.4 Làm sạch dữ liệu

13

Hình 5.4 Công cụ đồ thị Scatter trong Excel

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.4 Làm sạch dữ liệu

8.4.1 Phát hiện giá trị dị biệt trong dữ liệu

14

b. Sử dụng SPSS: đồ thị Scatter, công cụ Frequency, Bar Chart, Pie Chart, và Box Plot trong Explore

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.4 Làm sạch dữ liệu

80

Others

Honda @

70

Honda Dream

60

SYM Attila

50

Yamaha Cygnus

Honda Wave

40

i

Yamaha Jupiter

r e s u e k b r o

t

30

Yamaha Sirius

o m

f

20

Honda Future Neo

10

Honda AirBlade

o e g A

0

10

20

30

40

Number of used days in a month

15

b. Sử dụng SPSS: đồ thị Scatter

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.4 Làm sạch dữ liệu

16

b. Sử dụng SPSS: công cụ Frequency, Explore

Hình 8.6 Công cụ Frequency và Explore trong SPSS

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.4 Làm sạch dữ liệu

b. Sử dụng SPSS: công cụ Frequency

Frequency Percent %Valid

Honda Air Blade

10

10.0

10.0

10.0

Honda Future Neo

8

8.0

8.0

18.0

Yamaha Sirius

7

7.0

7.0

25.0

Yamaha Jupiter

13

13.0

13.0

38.0

Honda Wave

24

24.0

24.0

62.0

Yamaha Cygnus

4

4.0

4.0

66.0

SYM Attila

11

11.0

11.0

77.0

Honda Dream

6

6.0

6.0

83.0

Honda @

7

7.0

7.0

90.0

Others

10

10.0

10.0

100.0 17

Cumulative Percent

Total

100

100.0

100.0

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.4 Làm sạch dữ liệu

30

Others

Honda AirBlade

10.0%

10.0%

20

Honda @

Honda Future Neo

7.0%

8.0%

Honda Dream

Yamaha Sirius

10

6.0%

7.0%

SYM Attila

0

t n e c r e P

Yamaha Jupiter

H

H

Y

Y

H

Y

S

H

O

H

11.0%

a

a

a

Y

o

o

o

o

o

t h

m

m

m

n

n

n

n

n

M

d

d

d

d

d

a

a

a

e r

13.0%

A

s

h

h

h

a

a

a

a

a

Yamaha Cygnus

A

F

W

D

@

a

a

ttil

r

S

a J

C

ir

a

a

e

B

u

v

y

a

p

u t u r

e

g

la

iriu

m

n

4.0%

it

d

s

e

u

e

N

e r

s

e

Honda Wave

o

24.0%

Motobike Names

18

b. Sử dụng SPSS: công cụ Pie Chart và Bar Chart

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.4 Làm sạch dữ liệu

o Biểu đồ histogram là một giải pháp quy ước

dùng để thể hiện các dữ liệu tỷ lệ hoặc khoảng cách.

o Biểu đồ histogram được sử dụng để phân nhóm các giá trị dữ liệu của các biến số (variable) thành các khoảng cách. o Biểu đồ histogram được xây dựng dưới dạng các thanh thể hiện giá trị dữ liệu.

19

b. Sử dụng SPSS: công cụ Histogram

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.4 Làm sạch dữ liệu

o Biểu đồ histogram rất hữu dụng cho việc: (1) thể hiện tất cả các khoảng cách trong một phân phối (distribution), và (2) trắc nghiệm dạng hình của phân phối như độ méo (skewness), độ nhọn (kurtosis).

o Ghi chú: Biểu đồ histogram không dùng được

cho các biến danh nghĩa.

20

b. Sử dụng SPSS: công cụ Histogram

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.4 Làm sạch dữ liệu

30

b. Sử dụng SPSS: công cụ Histogram

20

10

Std. Dev = 14.42

Mean = 39

N = 100.00

0

20

25

30

35

40

45

50

55

60

65

70

75

Age of motorbike user

21

Ví dụ 8.2 Phân phối biến số tuổi của người sử dụng xe máy

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.4 Làm sạch dữ liệu

o Mỗi dòng của biểu đồ được gọi là một thân; và mỗi số liệu thể hiện trên một thân gọi là một lá.

o Khi biểu đồ thân-và-lá được quay trái 900 , nó sẽ có dạng hình tương tự như biểu đồ histogram.

22

b. Sử dụng SPSS: biểu đồ Thân-và-Lá (Stem-and-Leaf Displays)

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.4 Làm sạch dữ liệu

Age of motorbike user Stem-and-Leaf Plot

Frequency Stem & Leaf

b. Sử dụng SPSS: biểu đồ Thân-và-Lá (Stem-and-Leaf Displays)

6.00 1 . 889999 18.00 2 . 000111122222233344 8.00 2 . 55677788 13.00 3 . 0012233334444 4.00 3 . 5556 12.00 4 . 123333334444 13.00 4 . 5555566777789 10.00 5 . 0123344444 9.00 5 . 566667779 2.00 6 . 03 4.00 6 . 5567 .00 7 . 1.00 7 . 6

23

Stem width: 10 Each leaf: 1 case(s)

8.3 Biểu đồ Thân-và Lá của biến số Tuổi của người sử dụng xe máy

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.4 Làm sạch dữ liệu

o Biểu đồ hộp, hay còn gọi là biểu đồ hộp-và-râu (box-and- whisker plot), cho ta một hình ảnh trực quan khác về vị trí, độ phân tán, dạng hình, độ dài đuôi và các giá trị bất thường (outliers) của phân phối.

o Biểu đồ hộp thể hiện tóm tắt 5 giá trị thống kê của một

phân phối là trung vị (median), hai tứ phân vị trên và dưới (the upper and lower quartiles), và các giá trị quan sát lớn nhất và nhỏ nhất

24

b. Sử dụng SPSS: biểu đồ hộp (Box-Plots)

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.4 Làm sạch dữ liệu

o Các thành phần chủ yếu của biểu đồ hộp là:

n Hộp hình chữ nhật chứa đựng 50% các giá trị dữ liệu. n Đường thẳng ở trung tâm hộp là giá trị trung vị. n Hai lề của hộp thể hiện hai giá trị tứ phân vị thứ 1 và

thứ 3 (tương ứng với giá trị thứ 25% (25th percentile) và giá trị thứ 75% (75th percentile) của dãy số liệu.

n Các “râu” kéo dài từ lề phía trên và phía dưới của

hộp thể hiện giá trị lớn nhất và nhỏ nhất. Các giá trị này nằm trong khoảng tối đa 1,5 lần khoảng cách giữa các tứ phân vị tính từ lề của hộp.

25

b. Sử dụng SPSS: biểu đồ hộp (Box-Plots)

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.4 Làm sạch dữ liệu

Các giá trị lớn hơn 3 lần so với độ dài của hộp tính từ giá trị tứ phân vị thứ 3 (75th percentile) (extremes) Các giá trị lớn hơn 1,5 lần so với độ dài của hộp tính từ giá trị tứ phân vị thứ 3 (75th percentile) (outliers)

Giá trị lớn nhất quan sát được không phải là giá trị bất thường

Tứ phân vị thứ 3 (75th PERCENTILE)

Trung vị (MEDIAN)

50% trường hợp có giá trị nằm trong hộp

Tứ phân vị thứ 1 (25th PERCENTILE)

Giá trị lớn nhất quan sát được không phải là giá trị bất thường

Các giá trị lớn hơn 1,5 lần so với độ dài của hộp tính từ giá trị tứ phân vị thứ 1 (25th percentile) (outliers)

Các giá trị lớn hơn 3 lần so với độ dài của hộp tính từ giá trị tứ phân vị thứ 1 (25th percentile) (extremes)

26

b. Sử dụng SPSS: biểu đồ hộp (Box-Plots)

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.4 Làm sạch dữ liệu

100

80

60

40

20

0 N =

100

100

Age of motorbike use

Number of used days

b. Sử dụng SPSS: biểu đồ hộp (Box-Plots)

27

8.4 Biểu đồ hộp của biến số Tuổi của người sử dụng xe máy và số ngày sử dụng trong tháng

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.5 Phân tích thống kê mô tả

8.5.1 Phân tích thống kê mô tả định lượng

o Sử dụng Excel: công cụ Descriptives

Statistics trong chức năng Data Analysis.

o Sử dụng SPSS: công cụ Frequency,

Descriptives, Explore trong chức năng Descriptive Statistics của SPSS.

28

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.5 Phân tích thống kê mô tả

8.5.1 Phân tích thống kê mô tả định lượng

Các chỉ tiêu thống kê mô tả : o xu hướng trung tâm, o tính biến thiên và o dạng hình phân phối của dữ liệu.

29

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.5 Phân tích thống kê mô tả

8.5.1 Phân tích thống kê mô tả định lượng

Đo lường xu hướng trung tâm (Measures of Central

Tendency)

o Giá trị trung bình (mean) là tổng tất cả giá trị của các dữ liệu

chia cho số lượng của dữ liệu.

o Trung vị (median) là giá trị của số liệu có vị trí nằm giữa bộ số liệu sắp xếp theo trật tự. Đây chính là điểm giữa của phân phối. Khi số quan sát là chẵn, trung vị là giá trị trung bình của hai quan sát ở vị trí trung tâm.

o Mode là giá trị của quan sát có tần suất xuất hiện nhiều nhất

trong bộ dữ liệu.

o Khoảng cách (range) là giá trị khác biệt giữa con số lớn nhất

30

và nhỏ nhất trong bộ dữ liệu.

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.5 Phân tích thống kê mô tả

8.5.1 Phân tích thống kê mô tả định lượng

Đo lường tính biến thiên (Measures of Variability) o Phương sai (Variance; σ2) là trung bình tổng các sai số

bình phương giữa các giá trị của các quan sát và giá trị trung bình.

o Độ lệch chuẩn (Standard deviation; SD; σ) đo lường mức độ phân tán của số liệu xung quanh giá trị trung bình.

o Sai số chuẩn của giá trị trung bình (Standard error of the mean; s.e.) đo lường phạm vi mà giá trị trung bình của quần thể (µ) có thể xuất hiện với một xác suất cho trước dựa trên giá trị trung bình của mẫu (mean).

31

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.5 Phân tích thống kê mô tả

8.5.1 Phân tích thống kê mô tả định lượng

Đo lường dạng hình của phân phối (Measures of Shape) o Độ méo (skewness) đo lường độ lệch của phân phối về

một trong hai phía.

o Phân phối méo trái (negative skew, left-skewed) khi đuôi phía trái dài hơn, và phần lớn số liệu tập trung ở phía phải của phân phối.

o Phân phối méo phải (positive sknew, right-skewed) khi

đuôi phía phải dài hơn, và phần lớn số liệu tập trung ở phía trái của phân phối.

32

o Khi lệch phải, giá trị sknewness dương; khi lệch trái, giá trị skewness âm. Độ méo càng lớn thì giá trị sknewness càng lớn hơn 0.

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.5 Phân tích thống kê mô tả

8.5.1 Phân tích thống kê mô tả định lượng

33

Hình 8.10 Đường phân phối chuẩn và các đặc tính

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.5 Phân tích thống kê mô tả

8.5.1 Phân tích thống kê mô tả định lượng

34

Hình 8.11 Các dạng phân phối lệch trái và lệch phải so với phân phối bình thường

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.5 Phân tích thống kê mô tả

8.5.1 Phân tích thống kê mô tả định lượng

phân phối so với phân phối bình thường (có độ nhọn bằng 0). Phân phối có dạng nhọn khi giá trị kurtosis dương và có dạng bẹt khi giá trị kurtosis âm. o Với phân phối bình thường, giá trị của độ méo và độ

nhọn bằng 0. Căn cứ trên tỷ số giữa giá trị skewness và kurtosis và sai số chuẩn của nó, ta có thể đánh giá phân phối có bình thường hay không (khi tỷ số này nhỏ hơn - 2 và lớn hơn +2, phân phối là không bình thường).

35

Đo lường dạng hình của phân phối (Measures of Shape) o Độ nhọn (kurtosis) đo lường mức độ nhọn hay bẹt của

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.5 Phân tích thống kê mô tả

Phân tích thống kê mô tả với SPSS: công cụ Descriptive

36

Hình 8.13 Các chức năng thống kê mô tả của công cụ Descriptives

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.5 Phân tích thống kê mô tả

Phân tích thống kê mô tả với SPSS: công cụ Descriptive

Statistic

Std. Error

Age of motorbike user

N

100

Range

58

Minimum

18

Maximum

76

Mean

39.01

1.44

Std. Deviation

14.42

Variance

207.909

Skewness

.242

.241

Kurtosis

-.948

.478

37

Bảng 8.6 Thống kê mô tả các biến số Tuổi của người sử dụng xe máy

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.5 Phân tích thống kê mô tả

Phân tích thống kê mô tả với SPSS: công cụ Explore

38

Công cụ Explore rất thích hợp để thống kê mô tả chi tiết các biến số phân nhóm theo một biến phân loại khác (factor variable).

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

Age of motorbike user

Number of used days in a month

Statistic

Std. Error

Statistic

User gender

Std. Error

female

2.11

1.07

Mean

38.46

20.71

34.19

18.54

Lower Bound

95% Confidence Interval for Mean

42.74

22.88

Upper Bound

5% Trimmed Mean

38.13

20.95

Median

41.00

22.00

Variance

183.205

47.212

Std. Deviation

13.54

6.87

Minimum

19

7

Maximum

65

30

Range

46

23

Interquartile Range

23.00

11.00

Skewness

.118

-.513

.369

.369

Kurtosis

-1.089

-.838

.724

39.724

8.7 Thống kê mô tả các biến số Tuổi của người sử dụng xe máy và số ngày sử dụng trong tháng phân theo giới tính

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

male

Mean

1.97

1.01

39.39

19.76

95% Confidence

Lower Bound

35.45

17.74

Interval for Mean

Upper Bound

43.33

21.79

5% Trimmed Mean

38.87

19.90

Median

42.00

21.00

Variance

228.173

60.460

Std. Deviation

15.11

7.78

Minimum

18

5

Maximum

76

32

Range

58

27

Interquartile Range

28.00

15.00

Skewness

.292

-.175

.311

.311

Kurtosis

-.932

-1.271

.613

.613

40

8.7 Thống kê mô tả các biến số Tuổi của người sử dụng xe máy và số ngày sử dụng trong tháng phân theo giới tính

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.5 Phân tích thống kê mô tả

8.5.2 Phân tích thống kê mô tả định tính

41

a. Sử dụng công cụ Basic Table trong SPSS

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.5 Phân tích thống kê mô tả

8.5.2 Phân tích thống kê mô tả định tính

42

a. Sử dụng công cụ Basic Table trong SPSS

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.5 Phân tích thống kê mô tả

8.5.2 Phân tích thống kê mô tả định tính

a. Sử dụng công cụ Basic Table trong SPSS

Age groups

under 20

under 30

under 40

under 50

under 60

older than 60

Count

Count

Count

Count

Count

Row %

Count

2

Row % 20.0%

Row % 30.0%

3

Motobike Names

Row %

3

42.9%

1

4.2%

1

4.2%

1 2 2 4 5 1

10.0% 25.0% 28.6% 30.8% 20.8% 25.0%

3

27.3%

7.7% 33.3% 25.0% 9.1% 16.7%

1 8 1 1 1

1 1

9.1% 16.7%

4

57.1%

Honda AirBlade Honda Future Neo Yamaha Sirius Yamaha Jupiter Honda Wave Yamaha Cygnus SYM Attila Honda Dream Honda @ Others

Row % 30.0% 50.0% 14.3% 30.8% 8.3% 25.0% 36.4% 50.0% 28.6% 20.0%

3 4 1 4 2 1 4 3 2 2

20.0%

2

Row % 10.0% 25.0% 14.3% 30.8% 29.2% 25.0% 18.2% 16.7% 14.3% 50.0%

1 2 1 4 7 1 2 1 1 5

1

10.0%

43

Bảng. Phân bố nhóm tuổi của người sử dụng xe máy theo nhãn hiệu

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.5 Phân tích thống kê mô tả

8.5.2 Phân tích thống kê mô tả định tính

b. Sử dụng công cụ Bảng chéo (Cross-Tabulation) trong SPSS

o Bảng chéo là một kỹ thuật dùng để so sánh dữ liệu từ hai hoặc

nhiều hơn các biến phân loại hoặc danh nghĩa (categorical or nominal variables), ví dụ như là giới tính. Bảng chéo sử dụng các bảng có các cột và dòng thể hiện các mức độ hoặc các giá trị mã hóa của từng biến phân loại hoặc danh nghĩa.

o Bảng chéo là bước đầu tiên để xác định các quan hệ giữa các

44

biến. Khi bảng chéo được xây dựng để trắc nghiệm thống kê, ta gọi chúng là bảng contingency (contingency tables), và loại trắc nghiệm dùng để đánh giá liệu các biến phân loại có độc lập với nhau hay không là χ2 (Chi bình phương / chi-square).

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.5 Phân tích thống kê mô tả

8.5.2 Phân tích thống kê mô tả định tính

45

b. Sử dụng công cụ Bảng chéo (Cross-Tabulation) trong SPSS

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.5 Phân tích thống kê mô tả

8.5.2 Phân tích thống kê mô tả định tính

46

b. Sử dụng công cụ Bảng chéo (Cross-Tabulation) trong SPSS

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.5 Phân tích thống kê mô tả

Bảng. Phân bố giới tính của người sử dụng xe máy theo nhãn hiệu

Motobike Names * User gender Crosstabulation

Count

User gender

female

male

Total

Motobike Names

Honda AirBlade Honda Future Neo Yamaha Sirius Yamaha Jupiter Honda Wave Yamaha Cygnus SYM Attila Honda Dream Honda @ Others

Total

3 4 3 6 9 2 5 2 3 4 41

7 4 4 7 15 2 6 4 4 6 59

10 8 7 13 24 4 11 6 7 10 100

47

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.5 Phân tích thống kê mô tả

Bảng. Phân bố giới tính của người sử dụng xe máy theo nhãn hiệu

User gender * Motobike Names Crosstabulation

Honda Future Neo

Yamaha Jupiter Honda Wave

User gender

female

Motobike Names Yamaha Cygnus SYM AttilaHonda DreamHonda @ Others 4 4.1

Yamaha Sirius 3 2.9

2 1.6

4 3.3 9.8%

3 2.9 7.3%

2 2.5 4.9%

male

3.0% 4 4.1

4.0% 4 4.7 6.8%

2.0% 4 3.5 6.8%

Total

4.0% 7 7.0

Honda AirBlade 3 4.1 7.3% 30.0% 3.0% 7 5.9 11.9% 70.0% 7.0% 10 10.0 10.0%

6 5.3 7.3% 14.6% 50.0% 42.9% 46.2% 6.0% 3.0% 4 7 7.7 4.1 6.8% 11.9% 50.0% 57.1% 53.8% 7.0% 4.0% 7 13 13.0 7.0 7.0% 13.0%

4.0% 8 8.0 8.0%

4.0% 6 6.0 6.0%

Count Expected Count % within User gender % within Motobike Names % of Total Count Expected Count % within User gender % within Motobike Names % of Total Count Expected Count % within User gender % within Motobike Names % of Total

5 9 4.5 9.8 22.0% 4.9% 12.2% 37.5% 50.0% 45.5% 5.0% 2.0% 9.0% 6 2 15 6.5 2.4 14.2 25.4% 3.4% 10.2% 62.5% 50.0% 54.5% 6.0% 2.0% 15.0% 11 4 24 11.0 4.0 24.0 4.0% 11.0% 24.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 4.0% 11.0%

7.0% 13.0%

10.0%

24.0%

8.0%

Total 41 41.0 9.8% 100.0% 33.3% 42.9% 40.0% 41.0% 4.0% 41.0% 59 6 59.0 5.9 6.8% 10.2% 100.0% 66.7% 57.1% 60.0% 59.0% 6.0% 59.0% 100 10 100.0 10.0 7.0% 10.0% 100.0% 100.0% 100.0% 100.0% 100.0% 7.0% 10.0% 100.0%

6.0%

48

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.6 Phân tích trắc nghiệm giả thiết

8.6.1 Trắc nghiệm giả thiết

o Mục tiêu của trắc nghiệm giả thiết là nhằm quyết

định tính chính xác của giả thiết dựa trên các số liệu mẫu thu thập được. Chúng ta đánh giá tính chính xác của các giả thiết bằng cách áp dụng các kỹ thuật thống kê; và đánh giá tầm quan trọng của sự khác biệt có ý nghĩa thống kê.

o Cách tiếp cận cổ điển hay là lý thuyết lấy mẫu thể hiện cách nhìn mục tiêu theo xác suất dựa trên phân tích dữ liệu mẫu. Một giả thiết được xây dựng, nó sẽ bị bác bỏ hoặc chấp nhận dựa trên mẫu dữ liệu thu thập.

49

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.6 Phân tích trắc nghiệm giả thiết

Mục tiêu và kiểu của các câu hỏi nghiên cứu

Mục tiêu chung Quan hệ giữa các biến Thuần Mô tả

Mục tiêu cụ thể

Tóm lược dữ liệu So sánh nhóm

Mức độ liên quan, các biến liên quan

Kiểu câu hỏi/ giả thiết Khác biệt Liên quan Mô tả

Kiểu thống kê

50

Thống kê khác biệt (v.d. t-test, ANOVA) Thống kê mô tả (v.d. trung bình, tỷ lệ)

Thống kê liên quan (v.d. tương quan, hồi quy)

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.6 Phân tích trắc nghiệm giả thiết

Xây dựng giả thiết H0 và giả thiết thay thế

Câu hỏi NC

Giả thiết H0

Giả thiết H1

Biểu diễn giả thiết H0 H0: µnam = µnữ

Biểu diễn giả thiết H1 H0: µnam ≠ µnữ

Có sự khác biệt về tuổi giữa nam và nữ?

Không có sự khác biệt về tuổi giữa nam và nữ.

Có sự khác biệt về tuổi giữa nam và nữ.

H0: рGM = 0

H0: рGM ≠ 0

Có liên hệ gì giữa giới tính và nhãn hiệu xe?

Có liên hệ giữa giới tính và nhãn hiệu xe.

Không có liên hệ gì giữa giới tính và nhãn hiệu xe.

th

th

H0: µu

th = µu

H1: µu

th ≠ µu

Có khác biệt giữa các nhóm tuổi về mức độ sử dụng xe.

Mức độ sử dụng xe có khác biệt giữa các nhóm tuổi không?

Không có khác biệt giữa các nhóm tuổi về mức độ sử dụng xe.

51

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.6 Phân tích trắc nghiệm giả thiết

8.6.2 Quy trình trắc nghiệm giả thiết

1. Phát biểu giả thiết

2. Chọn loại trắc nghiệm thống kê

3. Chọn mức ý nghĩa mong muốn

4. Tính giá trị khác biệt

5. Có được giá trị trắc nghiệm

52

6. Diễn giải kết quả trắc nghiệm

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.6 Phân tích trắc nghiệm giả thiết

8.6.2 Quy trình trắc nghiệm giả thiết

1. Phát biểu giả thiết và giả thiết

thay thế

2. Chọn mức ý nghĩa mong muốn

3. Có được giá trị xác suất p

4. So sánh giá trị xác suất p và

mức ý nghĩa và ra quyết định

53

5. Diễn giải kết quả trắc nghiệm

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.6 Phân tích trắc nghiệm giả thiết

Giá trị xác suất (p Values)

o Hầu hết các phần mềm thống kê đều cho kết quả với giá trị xác suất (p values).

o Giá trị xác suất p value là xác suất để

đạt được một kết quả, ít nhất cao bằng, hoặc cao hơn giá trị được quan sát trong thực tế, với điều kiện cho trước là giả thiết H0 là đúng.

54

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.6 Phân tích trắc nghiệm giả thiết

Giá trị xác suất (p Values)

o Giá trị p value được so sánh với mức ý

nghĩa (significant level - α), và dựa trên kết quả này để bác bỏ hay không bác bỏ giả thiết.

o Nếu giá trị p value nhỏ hơn mức ý nghĩa, giả thiết bị bác bỏ (p value < α, bác bỏ giả thiết H0).

o Nếu giá trị p value bằng hoặc lớn hơn mức ý nghĩa, không bác bỏ giả thiết (p value > α, không bác bỏ giả thiết H0).

55

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.6 Phân tích trắc nghiệm giả thiết

Kiểm định ý nghĩa: các kiểu kiểm định

o Có hai loại: parametric (tham số) và

nonparametric (phi tham số).

o Parametric tests là công cụ mạnh vì

xử lý các dữ liệu dạng scale (interval, ratio).

o Nonparametric tests là công cụ xử lý các dữ liệu dạng nominal và ordinal.

56

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.6 Phân tích trắc nghiệm giả thiết

Parametric tests

o Parametric tests đòi hỏi một số giả

định: n Các quan sát phải độc lập với nhau. n Các quan sát phải được rút ra từ các dân số

phân phối bình thường chuẩn.

n Các dân số nên có phương sai tương đương. n Thang đo phải ở dạng scale để các tính toán

có thể thực hiện được.

57

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.6 Phân tích trắc nghiệm giả thiết

Parametric tests

o Nonparametric tests ít đòi hỏi các giả định: n Không đòi hỏi các quan sát phải được rút ra từ các

dân số phân phối bình thường chuẩn.

n Không đòi hỏi các dân số phải có phương sai tương

đương.

n Là cách duy nhất để xử lý dữ liệu nominal. n Là cách đúng đắn để xử lý dữ liệu ordinal, mặc dù

parametric có thể áp dụng được.

n Dễ hiểu và dễ sử dụng.

58

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.6 Phân tích trắc nghiệm giả thiết

Làm sao chọn một trắc nghiệm thống kê phù hợp?

o Để chọn một trắc nghiệm thống kê phù hợp, nên suy nghĩ đến 3 câu hỏi: n Trắc nghiệm liên quan đến 1 mẫu, 2 mẫu hay

nhiều hơn 2 mẫu (k)?

n Nếu có 2 mẫu hay nhiều hơn 2 mẫu (k),

chúng có độc lập với nhau hay không?

n Dữ liệu thuộc loại nào (nominal, ordinal,

scale)?

59

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.6 Phân tích trắc nghiệm giả thiết

Các kỹ thuật phân tích thống kê nên dùng theo loại dữ liệu và trắc nghiệm

Two-Samples Tests

k-Samples Tests

Measurement scale

One-sample Case

Related Samples

Independent Samples

Related Samples

Independent Samples

Nominal

- McNemar

- Cochran Q

- χ2 for k- samples

- Binomial - χ2 one-sample test

- Fisher exact test - χ2 two-sample test

Ordinal

-Friedman two- way ANOVA

- Kolmogorov- Smirnov one- sample test - Runs test

- Sign test - Wilcoxon matched-pairs test

- Median extension - Kruskal- Wallis one-way ANOVA

-Median test Mann-Whitney U - Kolmogorov- Smirnov Wald- Wolfowitz

Interval and Ratio

- T-test - Z test

- T-test for paired samples

- T-test - Z test

- Repeated- measured ANOVA

60

- One-way ANOVA - N-way ANOVA

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.6 Phân tích trắc nghiệm giả thiết

8.6.3 Phân tích dữ liệu a. Excel: công cụ Correlation, Anova và Regression trong chức năng Data Analysis

61

b. SPSS: các công cụ Compare Means và Nonparametric Tests

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.6 Phân tích trắc nghiệm giả thiết

8.6.3 Phân tích dữ liệu

62

b. SPSS: các công cụ Compare Means và Nonparametric Tests

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.7 Một số áp dụng cụ thể

o One-sample tests được dùng khi ta có 1 mẫu và muốn kiểm định giả thiết là liệu mẫu này có đến từ 1 dân số cụ thể nào đó không? Ví dụ: n Liệu có sự khác biệt giữa tần suất quan sát và 1

tần suất chuẩn nào đó dựa trên lý thuyết?

n Liệu có sự khác biệt giữa tỷ phần quan sát với 1

tỷ phần kỳ vọng nào đó không?

63

1. One-Sample T Test

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.7 Một số áp dụng cụ thể

o Ví dụ 1 (Parametric test)

n Có số liệu tốc độ tăng doanh số của 9

doanh nghiệp.

n Tốc độ tăng trưởng chuẩn là 6,5%/năm. n Giả thiết: tốc độ tăng trưởng doanh số bình quân của 9 doanh nghiệp không khác biệt với tốc độ chuẩn (6,5%/năm).

64

1. One-Sample T Test

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.7 Một số áp dụng cụ thể

65

1. One-Sample T Test. Ví dụ 1 (parametric test)

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.7 Một số áp dụng cụ thể

1. One-Sample T Test

66

Analyze (cid:224) Compare Means (cid:224) One-Sample T Test (TẠI SAO?)

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.7 Một số áp dụng cụ thể

1. One-Sample T Test

67

Analyze (cid:224) Compare Means (cid:224) One-Sample T Test

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.7 Một số áp dụng cụ thể

1. One-Sample T Test

o Diễn giải kết quả phân tích Ví dụ 1

(Parametric test) n P value (Sig. 2 tailed) > 0.05. n Khác biệt giữa tốc độ tăng trưởng doanh số bình quân của 9 doanh nghiệp và tốc độ chuẩn không có ý nghĩa thống kê ở mức ý nghĩa 0.05.

n Chấp nhận giả thiết (không bác bỏ): tốc độ tăng trưởng doanh số bình quân của 9 doanh nghiệp không khác biệt với tốc độ chuẩn (6,5%/năm).

68

Analyze (cid:224) Compare Means (cid:224) One-Sample T Test

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.7 Một số áp dụng cụ thể

o Ví dụ 2 (Nonparametric test)

n Số liệu điều tra sử dụng xe máy. n Giả thiết H0: tất cả các nhãn hiệu xe máy đều có cơ hội được người sử dụng xe lựa chọn như nhau.

2. One-Sample Chi-Square Test

Analyze (cid:224) Nonparametric Tests (cid:224) Chi-Square

69

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.7 Một số áp dụng cụ thể

70

2. One-Sample Chi-Square Test

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.7 Một số áp dụng cụ thể

Ta có 100 quan sát và 10 nhãn xe máy. Cơ hội để mỗi nhãn xe được chọn là 10%, và số lượng kỳ vọng là 10 xe/nhãn hiệu.

Tuy nhiên, sự khác biệt giữa N quan sát và N kỳ vọng cho từng nhãn xe là lớn.

Với P value < 0.05, ta bác bỏ giả thiết Ho và phát biểu là các nhãn hiệu xe máy được người sử dụng lựa 71 chọn khác biệt nhau.

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.7 Một số áp dụng cụ thể

o Có hai kiểu T Test cho hai mẫu:

n Không bắt cặp (unpaired, independent T Test): cho hai mẫu độc lập với nhau, ví dụ nam, nữ, các nhóm người, nhóm nghề nghiệp, v.v.)

n Bắt cặp (paired T Test): cho hai mẫu có liên hệ với nhau, ví dụ 1 nhóm người trước và sau khi bị một yếu tố tác động.

72

3. Two-Sample T Test

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.7 Một số áp dụng cụ thể

o Ví dụ 3. Số liệu điều tra sử dụng xe

máy n Giả thiết: tuổi trung bình của người sử dụng xe máy nam và nữ là như nhau.

73

3. Two-Sample T Test

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.7 Một số áp dụng cụ thể

3. Two-Sample T Test

74

Analyze (cid:224) Compare Means (cid:224) Independent-Samples T Test

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.7 Một số áp dụng cụ thể

75

3. Two-Sample T Test

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.7 Một số áp dụng cụ thể

Chọn biến Age cho ô Test Variable(s)

Grouping Variable: Group 1 = 1 (male); Group 2 = 0 (female)

76

3. Two-Sample T Test

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.7 Một số áp dụng cụ thể

3. Two-Sample T Test

Independent Samples Test

Levene's Test for Equality of Variances

t-test for Equality of Means

95% Confidence Interval of the Difference

Mean Difference

F

Sig.

t

df

Sig. (2-tailed)

Std. Error Difference Lower

Upper

Age of motorbike user

1.239

.268

-.315

98

.754

-.93

2.95

-6.77

4.92

-.321

91.785

.749

-.93

2.89

-6.66

4.81

Equal variances assumed Equal variances not assumed

P values (Sig. (2-tailed)) cao hơn α = 0.05 rất nhiều. Ta chấp nhận giả thiết và diễn giải là không có sự khác biệt về tuổi trung bình giữa người sử dụng xe máy là Nam và Nữ.

77

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.7 Một số áp dụng cụ thể

o Ví dụ 4. Số liệu điều tra sử dụng xe

máy n Giả thiết: sự lựa chọn nhãn hiệu xe máy

giữa người sử dụng nam và nữ là như nhau.

4. Two-Sample Nonparametric Test

Analyze (cid:224) Nonparametric Test (cid:224) Two-Independent Samples

78

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.7 Một số áp dụng cụ thể

79

4. Two-Sample Nonparametric Test

Analyze (cid:224) Nonparametric Test (cid:224) Two-Independent Samples

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.7 Một số áp dụng cụ thể

4. Two-Sample Nonparametric Test

Mann-Whitney Test Two-Sample Kolmogorov-Smirnov Test

Test Statisticsa

Test Statisticsa

Most Extreme Differences

Absolute Positive Negative

Mann-Whitney U Wilcoxon W Z Asymp. Sig. (2-tailed)

Motobike Names 1200.000 2970.000 -.067 .946

Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed)

Motobike Names .045 .045 -.018 .224 1.000

a.

Grouping Variable: User gender

a.

Grouping Variable: User gender

80

Kết luận: chấp nhận giả thiết và phát biểu rằng sự lựa chọn nhãn hiệu xe máy giữa người sử dụng nam và nữ là như nhau.

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.7 Một số áp dụng cụ thể

5. One-Way ANOVA (Parametric Test)

o Phương pháp thống kê để kiểm định giả thiết là các trung bình của các dân số bằng nhau là Phân tích phương sai - analysis of variance (ANOVA).

o One-way ANOVA sử dụng các mô hình 1 yếu tố, các ảnh hưởng cố định để so sánh ảnh hưởng của một nghiệm thức (treatment) hoặc một yếu tố (factor) trên một biến phụ thuộc và liên tục.

81

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.7 Một số áp dụng cụ thể

5. One-Way ANOVA (Parametric Test)

o Ví dụ 5. Số liệu điều tra sử dụng xe máy o Giả thiết: Không có sự khác biệt giữa các người sử dụng xe máy ở các nhóm tuổi khác nhau về số ngày sử dụng bình quân trong tháng.

Analyze (cid:224) Compare Means (cid:224) One-Way ANOVA…

82

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.7 Một số áp dụng cụ thể

5. One-Way ANOVA (Parametric Test)

83

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.7 Một số áp dụng cụ thể

5. One-Way ANOVA (Parametric Test)

84

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.7 Một số áp dụng cụ thể

5. One-Way ANOVA (Parametric Test)

ANOVA

Number of used days in a month

df

Sig.

F 6.737

.000

Mean Square 285.789 42.423

Between Groups Within Groups Total

Sum of Squares 1428.944 3987.806 5416.750

5 94 99

P value < 0.05.

Kết luận: bác bỏ giả thiết;

85

Phát biểu rằng có sự khác biệt giữa các người sử dụng xe máy ở các nhóm tuổi khác nhau về số ngày sử dụng bình quân trong tháng

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.7 Một số áp dụng cụ thể

5. One-Way ANOVA (Parametric Test)

Number of used days in a month

N

1

Subset for alpha = .05 2

3

a,b

Tukey HSD

14.47 17.96 18.33

17.96 18.33 22.62 24.12

19 25 6 26 17 7

.198

22.62 24.12 26.14 .769

a,b

Duncan

.695 14.47 17.96 18.33

17.96 18.33 22.62

19 25 6 26 17 7

Age groups under 60 under 50 under 20 under 30 under 40 older than 60 Sig. under 60 under 50 under 20 under 30 under 40 older than 60 Sig.

.175

.101

22.62 24.12 26.14 .215

Means for groups in homogeneous subsets are displayed.

a.

Uses Harmonic Mean Sample Size = 12.013.

b.

The group sizes are unequal. The harmonic mean of the group sizes is used. Type I error levels are not guaranteed.

86

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.7 Một số áp dụng cụ thể

5. One-Way ANOVA (Parametric Test)

Age Group

Value

Grouping

Under 60

14,5

a

Under 50

17,9

ab

Under 20

18,3

ab

Under 30

22,6

abc

Under 40

24,1

abc

Older than 60

26,1

abc

87

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.7 Một số áp dụng cụ thể

5. One-Way ANOVA (Parametric Test)

88

Hình. Phân bố số ngày sử dụng xe máy bình quân trong tháng theo độ tuổi của người sử dụng

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.7 Một số áp dụng cụ thể

6. Nonparametric Test for k-Independent Samples

o Ví dụ 6. Số liệu điều tra sử dụng xe máy o Giả thiết: Không có sự khác biệt giữa các người sử dụng xe máy ở các nhóm tuổi khác nhau về nhãn hiệu xe.

Analyze (cid:224) Nonparametric Tests (cid:224) k Independent Samples

89

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.7 Một số áp dụng cụ thể

6. Nonparametric Test for k-Independent Samples

90

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

8.7 Một số áp dụng cụ thể

6. Nonparametric Test for k-Independent Samples

Kruskal-Wallis Test

Ranks

Test Statisticsa,b

N

Motobike Names

Motobike Names

Chi-Square df Asymp. Sig.

1.493 5 .914

a.

Kruskal Wallis Test

Mean Rank 46.25 49.40 50.62 55.66 45.87 52.07

b.

Grouping Variable: Age groups

Age groups under 20 under 30 under 40 under 50 under 60 older than 60 Total

6 26 17 25 19 7 100

P value > 0.05 (cid:224) Kết luận: chấp nhận giả thiết;

91

Phát biểu rằng sự lựa chọn các nhãn hiệu xe máy giữa các người sử dụng xe máy ở các nhóm tuổi khác nhau là như nhau.