I. XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

Chương V PHÂN TÍCH DỮ LIỆU VÀ TRÌNH BÀY KẾT QUẢ NGHIÊN CỨU

Chuẩn bị dữ liệu và xử lý

PHÂN TÍCH DỮ LIỆU

TRÌNH BÀY KẾT QUẢ NGHIÊN CỨU

1 I II

Phương pháp mô tả và phân tích dữ liệu

2

Nhập dữ liệu

1. Chuẩn bị dữ liệu và xử lý

Nhập dữ liệu

Mã hoá dữ liệu

Chuẩn bị (làm sạch) dữ liệu

Thiết kế form nhập dữ liệu

Phương pháp xử lý dữ liệu

Nhập trực tiếp vào phần mềm xử lý

Mã hoá dữ liệu

Mã hoá dữ liệu

Các thủ tục mã hóa

 Các nguyên tắc thiết lập mã hóa

 Số lượng "kiểu mã hóa" thích hợp

 Tính tương đương của thông tin trả lời trong cùng “loại mã"

 Sự khác biệt của các thông tin trả lời giữa các "loại mã"

 Nguyên tắc loại trừ giữa các loại mã hóa

 Nguyên tắc toàn diện

Page 1

 Mã hóa trước  Mã hóa sau

Chuẩn bị (làm sạch) dữ liệu

Mã hoá dữ liệu

 Lập danh bạ mã hóa

Kiểm tra dữ liệu

Danh bạ mã hóa: là bảng gồm nhiều cột, chứa đựng những lời

giải thích về mã hiệu đã được sử dụng trong những trường dữ liệu

Hiệu chỉnh dữ liệu

Chức năng của danh bạ mã hóa:

 Giúp người làm mã hóa thực hiện việc làm biến đổi từ một câu trả

lời ra một ký hiệu (mã hiệu) thích hợp mà máy tính có thể đọc được.

 Giúp nhà nghiên cứu nhận diện được các biến số sử dụng trong

các quá trình phân tích.

Kiểm tra dữ liệu

Kiểm tra dữ liệu

 Mục đích: xác định dữ liệu đã thu thập được có thể chấp Cách làm: nhận được hay không? Trả lời câu hỏi "dữ liệu đó có thực - Nếu bản thân người nghiên cứu đi thu thập: kiểm tra tính chính sự chính xác hay không?" xác trên phiếu điều tra.  Nội dung: Kiểm tra: con số và logic...... - Nếu việc thu thập dữ liệu đặt hàng cho một tổ chức khác: kiểm tra lấy mẫu và chọn mẫu, tính chính xác trên phiếu điều tra...

Phương pháp xử lý dữ liệu

Hiệu chỉnh dữ liệu

 Xử lý bằng máy tính

Cách tiếp cận để xử lý

Một số thiếu sót phổ biến cần hiệu chỉnh

Xử lý thủ công (bằng tay):  - Phương pháp kiểm đếm bằng tay  - Phương pháp lựa ra và đếm

Đây là phương pháp thích hợp nhất và

mang lại hiệu quả cao về kinh tế cũng

 Những câu trả lời không

như kỹ thuật xử lý, phân tích. Hiện nay

 Quay trở lại điều tra viên hay

đầy đủ

có nhiều phần mềm hữu hiệu cho việc

người trả lời để làm sáng tỏ.

 Những câu trả lời thiếu

nhập, xử lý và phân tích các dữ liệu

 Suy luận từ những câu trả

phân tích kinh tế xã hội. (SPSS, STATA,

nhất quán

SAS, Minitab, Eviews...)

lời khác.

 Những câu trả lời không

 Loại toàn bộ câu trả lời

thích hợp

 Ưu điểm:  Không đòi hỏi các thiết bị kỹ thuật phức tạp.  Đơn giản với kỹ thuật viên tính toán  Khi lập bảng có thể dùng ngôn ngữ phổ thông

 Những câu trả lời không

 Nhược điểm  Khả năng phân tích dữ liệu đa chiều  Mất nhiều thời gian khi phải xử lý một số lớn đơn vị điều tra, Không có khả năng thực hiện khi số lượng biến lớn và khối lượng dữ liệu nhiều.  Không có khả năng kết hợp nhập, phân tích dữ liệu, in kết quả và lưu trữ dữ liệu, kết quả.

đọc được

Page 2

I. XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

2. Phương pháp mô tả và phân tích dữ liệu

Chuẩn bị dữ liệu và xử lý

2.1. Mô tả dữ liệu

2.2. Phân tích dữ liệu

1

Phương pháp mô tả và phân tích dữ liệu

2

2.1. Mô tả dữ liệu

2.1.1 Sắp xếp dữ liệu và phân tổ thống kê

2.1.1 Sắp xếp dữ liệu và phân tổ thống kê

2.1.1.1 Sắp xếp dữ liệu

2.1.2. Bảng thống kê và đồ thị thống kê

2.1.1.2 Phân tổ thống kê

2.1.3. Tóm tắt dữ liệu bằng các tham số đặc trưng

2.1.1.1 Sắp xếp dữ liệu

2.1.1.2 Phân tổ thống kê

Phân tổ thống kê là căn cứ vào một (hay một số) tiêu

thức nào đó để tiến hành phân chia các đơn vị của

TUOI Stem-and-Leaf Plot Frequency Stem & Leaf

hiện tượng nghiên cứu thành các tổ (hoặc các tiểu tổ)

có tính chất khác nhau

3,00 2 . 1& 10,00 2 . 2333 30,00 2 . 44444445555555 33,00 2 . 6666667777777777 76,00 2 . 8888888888888888888999999999999999999 56,00 3 . 0000000000000000000001111111 62,00 3 . 2222222222222222222233333333333 51,00 3 . 4444444444455555555555555 25,00 3 . 666666777777 45,00 3 . 8888888888888889999999 31,00 4 . 000000000000011 23,00 4 . 22222233333 41,00 4 . 44444444455555555555 17,00 4 . 66666677 25,00 4 . 888888899999 20,00 5 . 000000011 9,00 5 . 2233 4,00 5 . 5& 4,00 5 . 7& 3,00 5 . 8

 Sắp xếp số liệu theo thứ tự  Biểu hiện bằng sơ đồ thân lá (Stem and leaf)

Stem width: 10 Each leaf: 2 case(s)

Page 3

S¾p xÕp???

2.1.1.2 Phân tổ thống kê

2.1.1.2 Phân tổ thống kê

Phân phối các đơn vị vào từng tổ

Bước 4 Bước 4

Xác định số tổ và khoảng cách tổ

Bước 3 Bước 3

Các loại phân tổ thống kê

Lựa chọn tiêu thức phân tổ

Phân tổ phân loại

Phân tổ kết cấu

Phân tổ liên hệ

Phân tổ theo 1 tiêu thức

Phân tổ theo nhiều tiêu thức

Bước 2 Bước 2

Phân tổ kết hợp

Phân tổ nhiều chiều

Xác định mục đích phân tổ

Bước 1 Bước 1

Các loại phân tổ thống kê Căn cứ vào số lượng tiêu thức của phân tổ

2.1. Mô tả dữ liệu

2.1.2. Bảng thống kê và đồ thị thống kê

2.1.1 Sắp xếp dữ liệu và phân tổ thống kê

2.1.2.1 Bảng thống kê

2.1.2. Bảng thống kê và đồ thị thống kê

2.1.2.2 Đồ thị thống kê

2.1.3. Tóm tắt dữ liệu bằng các tham số đặc trưng

Nguyên tắc trình bày bảng

2.1.3.1 Bảng thống kê

Bảng thống kê là một hình thức trình bày các tài liệu thống kê một cách có hệ

thống, hợp lý và rõ ràng, nhằm nêu lên các đặc trưng về mặt lượng của hiện tượng

nghiên cứu.

- Quy mô của bảng thống kê không nên quá lớn. - Các tiêu đề và tiêu mục trong bảng cần ghi chính xác, gọn và

Cấu thành bảng thống kê

dễ hiểu.

Tên bảng thống kê (tiêu đề chung)

Phần giải thích

Các chỉ tiêu giải thích (tên cột)

Phần chủ đề

(A)

(1)

(2)

(3)

(4)

Các chỉ tiêu giải thích (tên cột)

Page 4

- Các hàng và cột thường được ký hiệu bằng chữ hoặc bằng số. - Các chỉ tiêu giải thích trong bảng cần được sắp xếp theo thứ tự hợp lý - Cách ghi các số liệu vào bảng thống kê. - Phần ghi chú ở cuối bảng thống kê.

2.1.3.2 Đồ thị thống kê

Nguyên tắc trình bày đồ thị

Là các hình vẽ hoặc đường nét hình học dùng để miêu tả - Quy mô của đồ thị có tính chất quy ước các tài liệu thống kê. - Các ký hiệu hình học Có tính quần chúng, có sức hấp dẫn và sinh động, làm cho - Hệ tọa độ người hiểu biết ít về thống kê vẫn lĩnh hội được vấn đề chủ yếu - Thang và tỷ lệ xích một các dễ dàng, đồng thời giữ được ấn tượng sâu đối với - Phần ghi chú người đọc.

Đồ thị hình cột

Đồ thị so sánh hình cột

25

Food

30

Food Gas

20

25

20

15

15

10

10

5

5

0

Jan

Feb

Mar

Apr

May

Jun

0

Jan

Feb

Mar

Apr

May

Jun

Đồ thị cơ cấu

Đồ thị đường gấp khúc

12

19

Food

25

17

20

15

10

5

14

0

22

Jan

Feb

Mar

Apr

May

Jun

Page 5

Đồ thị so sánh cơ cấu

Đồ thị liên hệ

750

100%

700

Motel Gas Food

80%

650

60%

600

550

40%

500

20%

450

0%

400

Jan

Feb

Mar

Apr

May

Jun

0

5

10

15

20

25

30

35

40

Đồ thị hình “mạng nhện”

Bản đồ thống kê

Jan

30

25

Food Gas

20

Jun

Feb

15

10

5

0

May

Mar

Apr

2.1. Mô tả dữ liệu

2.1.3. Tóm tắt dữ liệu bằng các tham số đặc trưng

2.1.1 Sắp xếp dữ liệu và phân tổ thống kê

2.1.3.1 Các mức độ điển hình

2.1.2. Bảng thống kê và đồ thị thống kê

2.1.3.2 Các tham số biến thiên (phân tán)

2.1.3. Tóm tắt dữ liệu bằng các tham số đặc trưng

Page 6

Số bình quân

2.1.3.1 Các mức độ trung tâm

Số bình quân

Số bình quân trong thống kê là mức độ biểu hiện trị số

đại biểu theo một tiêu thức nào đó của một tổng thể bao

gồm nhiều đơn vị cùng loại

Trung vị

Mốt

Số bình quân

Số bình quân

-Số bình quân cộng:

- Số bình quân nhân:

n

x

x 1

x 2

+ Giản đơn:

n

_ x

+ Giản đơn:

n

x

n

x i

xxx . .. 1 2

...  n

n  x i  n

i

1 

n

. fx 1 1

. fx n

n

i

f i

n

2

+ Gia quyền:

x

f i

+ Gia quyền:

x

x

x





..

f n

f i i

f xx . 1 1

f 2

. fx 2 f 

...  2  ... f

.  fx i f 

 f 1

2

n

i

i

1 

i

_ x

+ Điều hoà gia quyền

i

.

 

fx . i i . fx i x i

M M x i

+ Điều hoà giản đơn

_ x

fx .  i  f n 1 ix

Số bình quân

Số bình quân

Page 7

Điều kiện vận dụng Đặc điểm - Số bình quân chỉ được tính ra từ tổng thể đồng chất (bao gồm •Nêu lên mức độ chung nhất, phổ biến nhất, có tính chất đại nhiều đơn vị, phần tử hoặc hiện tượng có cùng chung một tính biểu nhất của tiêu thức nghiên cứu, không kể đến chênh lệch chất, thuộc cùng một loại hình kinh tế xã hội, xét theo một tiêu thực tế giữa các đơn vị tổng thể thức nào đó) •San bằng mọi chênh lệch giữa các đơn vị về trị số của tiêu - Số bình quân chung cần được vận dụng kết hợp với các số thức nghiên cứu bình quân tổ hoặc dãy số phân phối •Chịu ảnh hưởng của các lượng biến đột xuất

Mốt (Mo)

2.1.3.1 Các mức độ trung tâm

Số bình quân

Là biểu hiện của một tiêu thức được gặp nhiều nhất trong một

tổng thể hay trong một dãy số phân phối

(Được sử dụng đối với cả biến định tính và định lượng)

- Đối với một dãy số lượng biến, mốt là lượng biến có tần số lớn nhất

- Đối với một dãy số lượng biến có khoảng cách tổ, muốn tìm mốt

Trung vị

trước hết cần xác định tổ có mốt, tức là tổ có tần số lớn nhất. Sau đó,

Mốt

trị số gần đúng của mốt tính theo công thức: f

f

M

 1

o

o

.

xM  0 M

h M

0

min

0

M f (

(

f

f

)

f

)

M

M

M

 1

M

 1

o

o

o

o

Mốt (Mo)

Mốt (Mo)

Tác dụng Hạn chế • Là mức độ đại biểu, nên có thể dùng Mo để thay thế cho số • Kém nhạy bén với sự biến thiên của tiêu thức trung bình trong những trường hợp tính số trung bình gặp khó • Không xác định được trong trường hợp dãy số phân phối khăn. không bình thường • Không chịu ảnh hưởng bởi các lượng biến đột xuất nên có ý nghĩa hơn số bình quân trong trường hợp dãy số có lượng biến đột xuất •Là một trong những tham số nêu lên đặc trưng phân phối • Phục vụ nhu cầu hợp lý

Trung vị (Me)

2.1.3.1 Các mức độ trung tâm

Số bình quân

Là một lượng biến tiêu thức của đơn vị đứng ở vị trí giữa trong

một dãy số lượng biến

-Nếu số đơn vị tổng thể lẻ (n = 2m + 1), số trung vị sẽ là lượng biến

của đơn vị đứng ở vị trí giữa

- Nếu số đơn vị tổng thể chẵn (n = 2m), số trung vị là bình quân của

Trung vị

2 số đứng ở vị trí giữa:

- Dãy số lượng biến có khoảng cách tổ: xác định tổ có số trung vị và

Mốt

tính theo công thức:

S

M e

1 

.

xM  e

M

h M

e

e

min

f i 2 f

M

e

Page 8

Trung vị (Me)

Khoảng tứ phân vị,…

Q1 Me Q2

70

60

50

40

30

20

10

N =

568

TUOI

Tác dụng • Là mức độ đại biểu, có thể dùng Me để thay thế cho số trung bình trong những trường hợp tính số trung bình gặp khó khăn. • Không chịu ảnh hưởng bởi các lượng biến đột xuất nên có ý nghĩa hơn số bình quân trong trường hợp dãy số có lượng biến đột xuất •Là một trong những tham số nêu lên đặc trưng phân phối • Tác dụng trong kỹ thuật và phục vụ công cộng

Đặc trưng phân phối

2.1.3. Tóm tắt dữ liệu bằng các tham số đặc trưng

K

 0Mx  K<0 dãy số phân phối chuẩn lệch trái

Hệ số bất đối xứng 2.1.3.1 Các mức độ điển hình

X Me Mo

2.1.3.2 Các tham số biến thiên (phân tán)

2.1.3.2 Các tham số biến thiên (phân tán) K>0 dãy số phân phối chuẩn lệch phải K=0 dãy số phân phối chuẩn đối xứng K càng lớn thì dãy số càng không đối xứng

Khoảng biến thiên (R)

Ý nghĩa nghiên cứu:

- Xét trình độ đại biểu của số

bình quân

- Thấy rõ nhiều đặc trưng của

dãy số, như đặc trưng về phân

phối, về kết cấu, tính chất đồng

đều của tổng thể nghiên cứu

- Sử dụng trong nhiều trường

Là độ lệch giữa lượng biến lớn nhất và lượng biến nhỏ nhất của tiêu thức nghiên cứu, biểu hiện bằng công thức: R = Xmax - Xmin Không phụ thuộc vào sự phân bố của dữ liệu:

hợp nghiên cứu thống kê khác

R = 12 - 7 = 5 R = 12 - 7 = 5

Phân tán

như: phân tích biến động, phân

7 8 9 10 11 12

7 8 9 10 11 12

tích mối liên hệ, dự đoán thống

kê...

Page 9

Độ lệch tuyệt đối bình quân

Phương sai

2

2 fx )

i

i

x

)

fx

i

i

2 

x

2 

d

i

d

xi  ( n

  x (  f

i

i  x n

Là số bình quân cộng của bình phương các độ lệch giữa các Là số bình quân cộng của các độ lệch tuyệt đối giữa các lượng lượng biến với số bình quân cộng của các lượng biến đó biến với số bình quân cộng của các lượng biến đó

  x  f

2

2 

2 x 

( x

)

Công thức thực hành:

Độ lệch tiêu chuẩn

Hệ số biến thiên

V

. 100

2

2  

2 x 

)(x

 x

Là số tương đối (%) rút ra từ sự so sánh giữa độ lệch tuyệt đối bình quân (hoặc độ lệch tiêu chuẩn) với số bình quân cộng Là căn bậc hai của phương sai, tức là số bình quân toàn phương của bình phương các độ lệch giữa các lượng biến với số bình quân cộng của các lượng biến đó

Là thước đo độ biến thiên tương đối, có thể dùng để so sánh giữa các chỉ tiêu khác loại hoặc cùng loại và có số trung bình Là chỉ tiêu hoàn thiện nhất và thường dùng nhất trong nghiên cứu thống kê để đánh giá độ biến thiên của tiêu thức không bằng nhau

2.2. Phân tích dữ liệu

2. Phương pháp mô tả và phân tích dữ liệu

2.1. Mô tả dữ liệu

Phương pháp hồi quy tương quan

2.2. Phân tích dữ liệu

Phương pháp dãy số thời gian

Page 10

Một số phương pháp dự đoán thống kê

II. TRÌNH BÀY KẾT QUẢ NGHIÊN CỨU

Chương V PHÂN TÍCH DỮ LIỆU VÀ TRÌNH BÀY KẾT QUẢ NGHIÊN CỨU

Vai trò của báo cáo

1 I II

Các loại báo cáo

PHÂN TÍCH DỮ LIỆU

TRÌNH BÀY KẾT QUẢ NGHIÊN CỨU

2

Nguyên tắc trình bày kết quả nghiên cứu

3

Cách thuyết trình

4

1. Vai trò của báo cáo

2. Các loại báo cáo

11 - Là phương tiện mà qua đó các dữ liệu, các phân tích và các

Báo cáo gốc

kết quả được sắp xếp có hệ thống. 22

Báo cáo được phổ biến

- Phản ánh chất lượng của công trình nghiên cứu. - Hiệu quả của bản báo cáo có thể xác định những hoạt động 33

Báo cáo kỹ thuật

sẽ được tiến hành (kết luận, đề xuất, kiến nghị giải pháp,…). 44

Báo cáo cho lãnh đạo

3. Nguyên tắc soạn thảo báo cáo

4. Cách thuyết trình

a) Lựa chọn kỹ thuật thuyết trình:

- Rõ ràng, dễ theo dõi

- Đọc một bài soạn trước

- Dùng câu có cấu trúc tốt

- Đọc thuộc lòng

- Tránh dùng ngôn ngữ chuyên môn

- Nói tuỳ hứng

- Trình bày ngắn gọn

- Nói ứng biến

- Nhấn mạnh các kết luận có tính thực tiễn

b) Lựa chọn phương tiện hỗ trợ

- Sử dụng các bảng, đồ thị, hình vẽ,… trong bản báo cáo

- Tính hiệu quả

- Các kỹ thuật

Page 11