Chương V XỬ LÝ DỮ LIỆU VÀ PHÂN TÍCH KẾT QUẢ NGHIÊN CỨU

XỬ LÝ DỮ LIỆU

PHÂN TÍCH KẾT QUẢ NGHIÊN CỨU

I II

I. XỬ LÝ DỮ LIỆU

Chuẩn bị dữ liệu

1

Phương pháp mô tả và phân tích dữ liệu

2

Tập hợp phiếu

Hiệu chỉnh

Kiểm tra

Mã hoá

Nhập tin

Kiểm tra

Tổng hợp

1. Chuẩn bị dữ liệu

Kiểm tra dữ liệu

Hiệu chỉnh dữ liệu

Mã hoá dữ liệu

Nhập dữ liệu

Kiểm tra dữ liệu

 Mục đích: xác định dữ liệu đã thu thập được có thể chấp

nhận được hay không? "dữ liệu đó có thực sự chính xác

hay không?"

 Nội dung: Kiểm tra: con số và logic......

Kiểm tra dữ liệu

Cách làm:

- Nếu bản thân người nghiên cứu đi thu thập: kiểm tra tính chính

xác trên phiếu điều tra.

- Nếu việc thu thập dữ liệu đặt hàng cho một tổ chức khác: kiểm

tra lấy mẫu và chọn mẫu, tính chính xác trên phiếu điều tra...

Hiệu chỉnh dữ liệu

Cách tiếp cận để xử lý

Một số thiếu sót phổ biến cần hiệu chỉnh

 Những câu trả lời không

 Quay trở lại điều tra viên hay

đầy đủ

người trả lời để làm sáng tỏ.

 Những câu trả lời thiếu

 Suy luận từ những câu trả

nhất quán

lời khác.

 Những câu trả lời không

 Loại toàn bộ câu trả lời

thích hợp

 Những câu trả lời không

đọc được

Mã hoá dữ liệu

Các thủ tục mã hóa

 Mã hóa trước

 Mã hóa sau

Mã hoá dữ liệu

 Các nguyên tắc thiết lập mã hóa

 Số lượng "kiểu mã hóa" thích hợp

 Tính tương đương của thông tin trả lời trong cùng “loại mã"

 Sự khác biệt của các thông tin trả lời giữa các "loại mã"

 Nguyên tắc loại trừ giữa các loại mã hóa

 Nguyên tắc toàn diện

Mã hoá dữ liệu

 Lập danh bạ mã hóa

 Danh bạ mã hóa: là bảng gồm nhiều cột, chứa đựng những lời

giải thích về mã hiệu đã được sử dụng trong những trường dữ liệu

Chức năng của danh bạ mã hóa:

 Giúp người làm mã hóa thực hiện việc làm biến đổi từ một câu trả

lời ra một ký hiệu (mã hiệu) thích hợp mà máy tính có thể đọc được.

 Giúp nhà nghiên cứu nhận diện được các biến số sử dụng trong

các quá trình phân tích.

Mã hoá dữ liệu

Một phần của một bảng danh bạ mã hoá

Mã hiệu

Cột trên máy tính

Tên của biến số

STT câu hỏi

Vấn đề của câu hỏi

2

14

Gioi_tinh

Giới tính

1 = Nam 2 = Nữ

8

28

Ky_nang

1 = không biết 2 = Biết ít 3 = Sử dụng được

Bạn đánh giá kỹ năng sử dụng máy tính cá nhân của bạn như thế nào?

4 = Rất k/ nghiệm

9

34

Tienganh

Biết ngoại ngữ nào?

1 = Biết 2 = Không

35

Tiengphap

Biết ngoại ngữ nào?

1 = Biết 2 = Không

Nhập dữ liệu

Thiết kế form nhập dữ liệu

Nhập trực tiếp vào phần mềm xử lý

Công nghệ Scanning

Thiết kế form nhập dữ liệu

Nhập trực tiếp vào phần mềm xử lý

Công nghệ scanning

I. XỬ LÝ DỮ LIỆU

Chuẩn bị dữ liệu

1

Phương pháp mô tả và phân tích dữ liệu

2

2. Phương pháp mô tả và phân tích dữ liệu

2.1. Mô tả dữ liệu

2.2. Phân tích dữ liệu

Phương pháp xử lý dữ liệu

 Xử lý bằng máy tính

Đây là phương pháp thích hợp nhất và mang lại hiệu quả cao về

kinh tế cũng như kỹ thuật xử lý, phân tích. Hiện nay có nhiều

phần mềm hữu hiệu cho việc nhập, xử lý và phân tích các dữ liệu

phân tích kinh tế xã hội. (SPSS, STATA, SAS, Minitab, Eviews,

Excel,...)

2.1. Mô tả dữ liệu

2.1.1 Sắp xếp dữ liệu và phân tổ thống kê

2.1.2. Bảng thống kê và đồ thị thống kê

2.1.3. Tóm tắt dữ liệu bằng các tham số đặc trưng

2.1.1 Sắp xếp dữ liệu và phân tổ thống kê

2.1.1.1 Sắp xếp dữ liệu

2.1.1.2 Phân tổ thống kê

2.1.1.1 Sắp xếp dữ liệu

 Sắp xếp số liệu theo thứ tự

TUOI Stem -and-Leaf Plot Frequency Stem & Leaf

3,00 2 . 1& 10,00 2 . 2333 30,00 2 . 44444445555555 33,00 2 . 6666667777777777 76,00 2 . 8888888888888888888999999999999999999 56,00 3 . 0000000000000000000001111111 62,00 3 . 2222222222222222222233333333333 51,00 3 . 4444444444455555555555555 25,00 3 . 666666777777 45,00 3 . 8888888888888889999999 31,00 4 . 000000000000011 23,00 4 . 22222233333 41,00 4 . 44444444455555555555 17,00 4 . 66666677 25,00 4 . 888888899999 20,00 5 . 000000011 9,00 5 . 2233 4,00 5 . 5& 4,00 5 . 7& 3,00 5 . 8

 Biểu hiện bằng sơ đồ thân lá (Stem and leaf)

Stem width: 10 Each leaf: 2 case(s)

Sắp xếp???

2.1.1.2 Phân tổ thống kê

Phân tổ thống kê là căn cứ vào một (hay một số) tiêu

thức nào đó để tiến hành phân chia các đơn vị của

hiện tượng nghiên cứu thành các tổ (hoặc các tiểu tổ)

có tính chất khác nhau.

2.1.1.2 Phân tổ thống kê

Các loại phân tổ thống kê

Phân tổ phân loại

Phân tổ kết cấu

Phân tổ liên hệ

Phân tổ theo 1 tiêu thức

Phân tổ theo nhiều tiêu thức

Phân tổ kết hợp

Phân tổ nhiều chiều

Các loại phân tổ thống kê Căn cứ vào số lượng tiêu thức của phân tổ

2.1.1.2 Phân tổ thống kê

Phân phối các đơn vị vào từng tổ

Bước 4

Xác định số tổ và khoảng cách tổ

Bước 3

Lựa chọn tiêu thức phân tổ

Bước 2

Xác định mục đích phân tổ

Bước 1

2.1. Mô tả dữ liệu

2.1.1 Sắp xếp dữ liệu và phân tổ thống kê

2.1.2. Bảng thống kê và đồ thị thống kê

2.1.3. Tóm tắt dữ liệu bằng các tham số đặc trưng

2.1.2. Bảng thống kê và đồ thị thống kê

2.1.2.1 Bảng thống kê

2.1.2.2 Đồ thị thống kê

2.1.3.1 Bảng thống kê

Bảng thống kê là một hình thức trình bày các tài

liệu thống kê một cách có hệ

thống, hợp lý và rõ ràng, nhằm nêu lên các đặc trưng về mặt lượng của hiện tượng

nghiên cứu.

Cấu thành bảng thống kê

Tên bảng thống kê (tiêu đề chung)

Phần giải thích

Các chỉ tiêu giải thích (tên cột)

Phần chủ đề

(A)

(1)

(2)

(3)

(4)

Các chỉ tiêu giải thích (tên cột)

Nguyên tắc trình bày bảng

- Quy mô của bảng thống kê không nên quá lớn.

- Các tiêu đề và tiêu mục trong bảng cần ghi chính xác, gọn và

dễ hiểu.

- Các hàng và cột thường được ký hiệu bằng chữ hoặc bằng số.

- Các chỉ tiêu giải thích trong bảng cần được sắp xếp theo thứ tự

hợp lý.

- Cách ghi các số liệu vào bảng thống kê.

- Phần ghi chú ở cuối bảng thống kê.

Cách ghi số liệu vào bảng thống kê

+ Nếu hiện tượng không có số liệu đó, thì trong ô sẽ ghi một

dấu gạch ngang (-).

+ Nếu số liệu còn thiếu, sau này có thể bổ sung, thì trong ô có

ký hiệu 3 chấm (...).

+ Trong một ô nào đó: hiện tượng không có liên quan đến chỉ

tiêu đó, nếu viết số liệu vào ô đó sẽ vô nghĩa, thì trong ô có ký

hiệu gạch chéo (x).

+ Các số liệu trong cùng một cột, có đơn vị tính toán giống

nhau, phải ghi theo trình độ chính xác như nhau (số lẻ đến 0,1

hay 0,01,...) đơn vị tính phải ghi thống nhất theo quy định.

Nguyên tắc trình bày bảng

- Quy mô của bảng thống kê không nên quá lớn.

- Các tiêu đề và tiêu mục trong bảng cần ghi chính xác, gọn và

dễ hiểu.

- Các hàng và cột thường được ký hiệu bằng chữ hoặc bằng số.

- Các chỉ tiêu giải thích trong bảng cần được sắp xếp theo thứ tự

hợp lý.

- Cách ghi các số liệu vào bảng thống kê.

- Phần ghi chú ở cuối bảng thống kê.

2.1.3.2 Đồ thị thống kê

Là các hình vẽ hoặc đường nét hình học dùng để miêu tả

có tính chất quy ước các tài liệu thống kê.

Có tính quần chúng, có sức hấp dẫn và sinh động, làm cho

người hiểu biết ít về thống kê vẫn lĩnh hội được vấn đề chủ yếu

một các dễ dàng, đồng thời giữ được ấn tượng sâu đối với

người đọc.

Nguyên tắc trình bày đồ thị

- Quy mô của đồ thị

- Các ký hiệu hình học

- Hệ tọa độ

- Thang và tỷ lệ xích

- Phần ghi chú

Đồ thị hình cột

25

20

15

10

5

0

Jan

Feb

Mar

Apr

May

Jun

Đồ thị so sánh hình cột

35

Food

Gas

30

25

20

15

10

5

0

Jan

Feb

Mar

Apr

May

Jun

Đồ thị cơ cấu

12

19

17

12

14

22

Đồ thị so sánh cơ cấu

100%

90%

Oil

Gas

Food

80%

70%

60%

50%

40%

30%

20%

10%

0%

Jan

Feb

Mar

Apr

May

Jun

Đồ thị tượng hình

25

20

15

10

5

0

Jan

Feb

Mar

Apr

May

Jun

Đồ thị diện tích

0.003

0.0025

0.002

0.0015

0.001

0.0005

0

1

7 1

3 3

9 4

5 6

1 8

7 9

3 1 1

9 2 1

5 4 1

1 6 1

7 7 1

3 9 1

9 0 2

5 2 2

1 4 2

7 5 2

3 7 2

9 8 2

5 0 3

1 2 3

7 3 3

3 5 3

9 6 3

5 8 3

1 0 4

7 1 4

3 3 4

9 4 4

5 6 4

1 8 4

7 9 4

3 1 5

9 2 5

5 4 5

1 6 5

7 7 5

3 9 5

9 0 6

5 2 6

1 4 6

7 5 6

3 7 6

9 8 6

5 0 7

1 2 7

7 3 7

3 5 7

9 6 7

5 8 7

1 0 8

7 1 8

3 3 8

9 4 8

5 6 8

1 8 8

7 9 8

3 1 9

9 2 9

Đồ thị liên hệ

750

700

650

600

550

500

450

400

0

5

10

15

20

25

30

35

40

Đồ thị hình “mạng nhện”

TC1

SP1

30

TC10

TC2

25

SP2

20

15

10

TC3

TC9

5

0

TC4

TC8

TC7

TC5

TC6

Đồ thị đường gấp khúc

Food

25

20

15

10

5

0

Jan

Feb

Mar

Apr

May

Jun

Bản đồ thống kê

2.1. Mô tả dữ liệu

2.1.1 Sắp xếp dữ liệu và phân tổ thống kê

2.1.2. Bảng thống kê và đồ thị thống kê

2.1.3. Tóm tắt dữ liệu bằng các tham số đặc trưng

2.1.3. Tóm tắt dữ liệu bằng các tham số đặc trưng

2.1.3.1 Các mức độ điển hình

2.1.3.2 Các tham số biến thiên (phân tán)

2.1.3.1 Các mức độ trung tâm

Số bình quân

Trung vị

Mốt

Số bình quân

Số bình quân trong thống kê là mức độ biểu hiện trị số

đại biểu theo một tiêu thức nào đó của một tổng thể bao

gồm nhiều đơn vị cùng loại.

Số bình quân

-Số bình quân cộng:

x

x 1

x 2

+ Giản đơn:

_ x

...  n

n  x i  n

. fx 1

1

. fx n

n

i

+ Gia quyền:

x

 f

. fx 2 f 

...  2  ... f

.  fx i f 

1

2

n

i

i

_ x

+ Điều hoà gia quyền

i

.

 

fx . i i fx . i x i

M M x i

+ Điều hoà giản đơn

_ x

fx .  i  f n 1 ix

Số bình quân

- Số bình quân nhân:

n

n

+ Giản đơn:

n

x

x

x

..

n

i

xx . 1

2

i

1 

n

f i

n

+ Gia quyền:

f i

x

x

x

x





.

..

f n

f i i

f x 1 1

f 2 2

i

1 

Số bình quân

Đặc điểm

• Nêu lên mức độ chung nhất, phổ biến nhất, có tính chất đại

biểu nhất của tiêu thức nghiên cứu, không kể đến chênh lệch

thực tế giữa các đơn vị tổng thể.

• San bằng mọi chênh lệch giữa các đơn vị về trị số của tiêu

thức nghiên cứu.

• Chịu ảnh hưởng của các lượng biến đột xuất.

Số bình quân

Điều kiện vận dụng:

- Số bình quân chỉ được tính ra từ tổng thể đồng chất (bao gồm

nhiều đơn vị, phần tử hoặc hiện tượng có cùng chung một tính

chất, thuộc cùng một loại hình kinh tế xã hội, xét theo một tiêu

thức nào đó).

- Số bình quân chung cần được vận dụng kết hợp với các số

bình quân tổ hoặc dãy số phân phối.

Ví dụ:

Hợp tác xã A Hợp tác xã B

Vụ lúa

Diện tích (ha) Sản lượng (tạ) Năng suất (tạ/ha) Diện tích (ha) Sản lượng (tạ) Năng suất (tạ/ha)

Vụ đông xuân 100 3000 300 9600 30 32

Vụ hè thu 300 10500 100 3700 35 37

Cả 2 vụ 400 13500 33,75 400 13300 32,25

2.1.3.1 Các mức độ trung tâm

Số bình quân

Trung vị

Mốt

Mốt (Mo)

Là biểu hiện của một tiêu thức được gặp nhiều nhất trong một

tổng thể hay trong một dãy số phân phối.

(Được sử dụng đối với cả biến định tính và định lượng)

- Đối với một dãy số lượng biến, mốt là lượng biến có tần số lớn nhất

- Đối với một dãy số lượng biến có khoảng cách tổ, muốn tìm mốt

trước hết cần xác định tổ có mốt, tức là tổ có tần số lớn nhất. Sau đó,

trị số gần đúng của mốt tính theo công thức: f

f

M

 1

o

o

.

xM  0

M

h M

0

0

min

M f (

(

f

f

)

f

)

M

M

M

 1

M

 1

o

o

o

o

Mốt (Mo)

Tác dụng

• Là mức độ đại biểu, nên có thể dùng Mo để thay thế cho số

trung bình trong những trường hợp tính số trung bình gặp khó

khăn.

• Không chịu ảnh hưởng bởi các lượng biến đột xuất nên có ý

nghĩa hơn số bình quân trong trường hợp dãy số có lượng biến

đột xuất.

• Là một trong những tham số nêu lên đặc trưng phân phối.

• Phục vụ nhu cầu hợp lý.

Mốt (Mo)

Hạn chế

• Kém nhạy bén với sự biến thiên của tiêu thức.

• Không xác định được trong trường hợp dãy số phân phối

không bình thường.

2.1.3.1 Các mức độ trung tâm

Số bình quân

Trung vị

Mốt

Trung vị (Me)

Là một lượng biến tiêu thức của đơn vị đứng ở vị trí giữa trong

một dãy số lượng biến.

- Nếu số đơn vị tổng thể lẻ (n = 2m + 1), số trung vị sẽ là lượng biến

của đơn vị đứng ở vị trí giữa.

- Nếu số đơn vị tổng thể chẵn (n = 2m), số trung vị là bình quân của

hai lượng biến đứng ở vị trí giữa.

- Dãy số lượng biến có khoảng cách tổ: xác định tổ có số trung vị và

tính theo công thức:

S

M e

1 

.

xM  e

M e

h M e

min

f i 2 f

M

e

Trung vị (Me)

Tác dụng

• Là mức độ đại biểu, có thể dùng Me để thay thế cho số trung

bình trong những trường hợp tính số trung bình gặp khó khăn.

• Không chịu ảnh hưởng bởi các lượng biến đột xuất nên có ý

nghĩa hơn số bình quân trong trường hợp dãy số có lượng biến

đột xuất.

• Là một trong những tham số nêu lên đặc trưng phân phối.

• Tác dụng trong kỹ thuật và phục vụ công cộng.

Khoảng tứ phân vị,…

Q1 Me Q2

70

60

50

40

30

20

10

N =

568

TUOI

Đặc trưng phân phối

K

 0Mx  K<0 dãy số phân phối chuẩn lệch trái

Hệ số bất đối xứng

K>0 dãy số phân phối chuẩn lệch phải

K=0 dãy số phân phối chuẩn đối xứng

X Me Mo

K càng lớn thì dãy số càng không đối xứng

2.1.3. Tóm tắt dữ liệu bằng các tham số đặc trưng

2.1.3.1 Các mức độ điển hình

2.1.3.2 Các tham số biến thiên (phân tán)

2.1.3.2 Các tham số biến thiên (phân tán)

Ý nghĩa nghiên cứu:

- Xét trình độ đại biểu của số

bình quân

- Thấy rõ nhiều đặc trưng của

dãy số, như đặc trưng về phân

phối, về kết cấu, tính chất đồng

đều của tổng thể nghiên cứu

- Sử dụng trong nhiều trường

hợp nghiên cứu thống kê khác

Phân tán

như: phân tích biến động, phân

tích mối liên hệ, dự đoán thống

kê...

Khoảng biến thiên (R)

Là độ lệch giữa lượng biến lớn nhất và lượng biến nhỏ nhất

của tiêu thức nghiên cứu, biểu hiện bằng công thức:

R = Xmax - Xmin

Không phụ thuộc vào sự phân bố của dữ liệu:

R = 12 - 7 = 5 R = 12 - 7 = 5

7 8 9 10 11 12

7 8 9 10 11 12

R = 78-72 = 4 (inches)

R = 84-67 = 17 (inches)

Độ lệch tuyệt đối bình quân

Là số bình quân cộng của các độ lệch tuyệt đối giữa các lượng

fx i

i

x

d

d

i  x n

biến với số bình quân cộng của các lượng biến đó

  x  f i

Phương sai

Là số bình quân cộng của bình phương các độ lệch giữa các

2

2

x

)

f i

i

x

)

2 

2 

i

xi  ( n

  x (  f

2

lượng biến với số bình quân cộng của các lượng biến đó.

2 

2 x 

)(x

Công thức thực hành:

Độ lệch tiêu chuẩn

2

2  

2 x 

)(x

Là căn bậc hai của phương sai, tức là số bình quân toàn phương của bình phương các độ lệch giữa các lượng biến với số bình quân cộng của các lượng biến đó.

Là chỉ tiêu hoàn thiện nhất và thường dùng nhất trong nghiên cứu thống kê để đánh giá độ biến thiên của tiêu thức.

Hệ số biến thiên

Là số tương đối (%) rút ra từ sự so sánh giữa độ lệch tiêu

chuẩn (hoặc độ lệch tuyệt đối bình quân) với số bình quân

V

100.

 x

cộng.

Là thước đo độ biến thiên tương đối, có thể dùng để so

sánh giữa các chỉ tiêu khác loại hoặc cùng loại và có số

trung bình không bằng nhau.

2. Phương pháp mô tả và phân tích dữ liệu

2.1. Mô tả dữ liệu

2.2. Phân tích dữ liệu

2.2. Phân tích dữ liệu

Phương pháp hồi quy tương quan

Phương pháp dãy số thời gian

Một số phương pháp dự đoán thống kê

Chương V XỬ LÝ DỮ LIỆU VÀ PHÂN TÍCH KẾT QUẢ NGHIÊN CỨU

XỬ LÝ DỮ LIỆU

PHÂN TÍCH KẾT QUẢ NGHIÊN CỨU

I II

II. TRÌNH BÀY KẾT QUẢ NGHIÊN CỨU

Vai trò của báo cáo

1

Các loại báo cáo

2

Nguyên tắc trình bày kết quả nghiên cứu

3

Cách thuyết trình

4

1. Vai trò của báo cáo

- Là phương tiện mà qua đó các dữ liệu, các phân tích và các

kết quả được sắp xếp có hệ thống.

- Phản ánh chất lượng của công trình nghiên cứu.

- Hiệu quả của bản báo cáo có thể xác định những hoạt động

sẽ được tiến hành (kết luận, đề xuất, kiến nghị giải pháp,…).

2. Các loại báo cáo

1

Báo cáo gốc

Báo cáo gốc

Bản báo cáo đầu tiên được chuẩn bị dựa trên các kết

quả có được của dự án và được nhà nghiên cứu viết

để sử dụng. Bao gồm các tài

liệu làm việc và bản

phác thảo sơ bộ.

2. Các loại báo cáo

1

Báo cáo gốc

2

Báo cáo được phổ biến

Báo cáo được phổ biến

Được soạn ra từ những kết quả nghiên cứu để đăng tải

trong những tạp chí chuyên ngành hoặc trong các chuyên

khảo, các tạp chí phổ thông, các tập san,...

2. Các loại báo cáo

1

Báo cáo gốc

2

Báo cáo được phổ biến

3

Báo cáo kỹ thuật

Báo cáo kỹ thuật

Loại này thường dành cho các chuyên gia khoa học, quan

tâm chủ yếu đến các mô tả chi tiết về toàn bộ quá trình

nghiên cứu. Các loại báo cáo này cũng có thể kèm theo

những phụ lục kỹ thuật phức tạp về phương pháp luận và

thư mục đầy đủ để cung cấp cho độc giả các nguồn tài

liệu tham khảo đầy đủ hơn.

2. Các loại báo cáo

1

Báo cáo gốc

2

Báo cáo được phổ biến

3

Báo cáo kỹ thuật

4

Báo cáo cho lãnh đạo

Báo cáo cho lãnh đạo

Loại này phục vụ cho những người ra quyết định.

Gồm những nội dung chủ yếu phần cốt lõi của công

trình nghiên cứu, những kết luận chính cùng những

đề xuất và kiến nghị.

2. Các loại báo cáo

1

Báo cáo gốc

2

Báo cáo được phổ biến

3

Báo cáo kỹ thuật

4

Báo cáo cho lãnh đạo

3. Nguyên tắc soạn thảo báo cáo

- Rõ ràng, dễ theo dõi

- Dùng câu có cấu trúc tốt

- Tránh dùng ngôn ngữ chuyên môn

- Trình bày ngắn gọn

- Nhấn mạnh các kết luận có tính thực tiễn

- Sử dụng các bảng, đồ thị, hình vẽ,… trong bản báo cáo

4. Cách thuyết trình

a) Lựa chọn kỹ thuật thuyết trình:

- Đọc một bài soạn trước

- Đọc thuộc lòng

- Nói tuỳ hứng

- Nói ứng biến

b) Lựa chọn phương tiện hỗ trợ

- Tính hiệu quả

- Các kỹ thuật

NỘI DUNG THỰC HÀNH

• Khai biến • Nhập số liệu vào chương trình xử lý • Thao tác đổi/tính toán với biến số • Thao tác một số thống kê mô tả • Thao tác lập bảng (biến 1 trả lời, nhiều trả lời) • Thao tác vẽ một số đồ thị thông dụng • Thao tác hồi quy tương quan