5/12/2009

NGUYỄN DUY TÂM

1 5/12/2009 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

NỘI DUNG

1. Nhập dữ liệu vào excel 2. Thống kê dữ liệu dạng bảng 3. Thống kê dữ liệu dạng đồ thị 4. Thống kê dữ liệu bằng các đại lượng thống kê mô tả 5. Ước lượng và kiểm định giả thiết 6. Phân tích phương sai ANOVA 7. Hồi quy tương quan 8. Kiểm định phi tham số 9. Lý thuyết quyết định

1

5/12/2009 2 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Nhập số liệu vào Excel

Sử dụng file Excel: Business Statistics/ Resources/Learning-by-Doing/ Affair.xls = Số thứ tự của người được phỏng vấn OBS = Số lần quan hệ tình dục ngoài hôn nhân trong năm Y-PT = 1 nếu là nam, 0 nếu là nữ Z1_MALE = Tuổi Z2_AGE = Số năm kết hôn Z3_NOYM Z4_CHILD = 1 nếu có con, 0 nếu chưa có con Z8_SATISFACTION = Mức độ thỏa mãn về hôn nhân, thang Likert 1-5 Ghi chú : Biến số theo cột, quan sát ghi theo hàng 5/12/2009

3 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Tạo biểu nhập liệu (Form)

 Trên một trang bảng tính mới (New worksheet)  Tạo dòng tiêu đề (biến số) ở dòng 1.  Quét khối dòng tiêu đề, rồi vào  Data/ Form

2

5/12/2009 4 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Tạo biểu nhập liệu (Form)

 Vì chúng ta không định nghĩa chính xác số dòng của bảng tính, nên Excel có hỏi như bảng giao diện ở trên. Đơn giản là chọn OK.

5/12/2009 5 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Bản ghi cho ngƣời thứ nhất

= 1 = 0 = 0 = 22 = 4 = 1

 Nhập cho người thứ nhất  Bảng số liệu điều tra của người này như sau Người thứ nhất  OBS Chưa ngoại tình  Y-PT Nữ  Z1_MALE 22 tuổi  Z2_AGE Kết hôn được 4 năm  Z3_NOYM Đã có con  Z4_CHILD Hài lòng về cuộc hôn  Z8_SATISFACTION = 4

nhân của mình

3

5/12/2009 6 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Bản ghi cho ngƣời thứ nhất

5/12/2009 7 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Bản ghi cho ngƣời thứ hai

 Từ Form nhập liệu, click New để nhập một bản ghi (record)

hay quan sát (observation) mới.

= 2 = 1 = 1 = 22 = 0.125

= 0

 Bảng số liệu điều tra của người thứ hai như sau Người thứ hai  OBS Đã ngoại tình  Y-PT Nam  Z1_MALE 22 tuổi  Z2_AGE Kết hôn được 1.5 tháng  Z3_NOYM (1.5/12) Chưa có con Rất hài lòng về cuộc hôn

 Z4_CHILD  Z8_SATISFACTION = 5

nhân của mình

4

5/12/2009 8 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Bản ghi cho ngƣời thứ hai

Làm tương tự cho đến người thứ 10 ở slide 3.

5/12/2009 9 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Mảng thứ tự

 Chọn biến Z2_AGE  Sắp xếp thành mảng thứ

tự từ nhỏ đến lớn  Quét khối toàn bộ số liệu, kể cả dòng tên biến.

 Data/ Sort

5

5/12/2009 10 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Giao diện Sort

Kết quả

 Chọn Sort by: Z2_AGE  Chọn Asending: Sắp xếp theo thứ tự tăng dần

5/12/2009 11 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

1. THỐNG KÊ DỮ LiỆU DẠNG BẢNG

 Yêu cầu của nội dung: Lập bảng thống kê cho các biến thuộc

tính và thuộc lượng.

 Đối với biến ít biểu hiện: mỗi biểu hiện 1 phân tổ  Đối với biến nhiều biểu hiện: tiến hành phân tổ lại (Lập Bin)

 Công cụ trên excel:  Dùng lệnh =FREQUENCY[ (data_array, bins_array)]

6

5/12/2009 12 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

1. THỐNG KÊ DỮ LiỆU DẠNG BẢNG

 Quy trình dùng lệnh FREQUENCY  Đối với biến có ít biểu hiện  B1: Lập cột các biểu hiện (cột BIN): là giá trị các biểu hiện  B2: Chọn vùng dữ liệu bảng thống kê, lập lệnh Frequency Cú pháp: = FREQUENCY(data_array, bins_array)

 Data_array: Dữ liệu cần lập bảng  Bins_array: các biểu hiện

 Chú ý: Với các lệnh thông thường, sau khi lập lệnh, chỉ cần ENTER, nhưng với lệnh FREQUENCY, ta cần gõ tổ hợp fím [ctrl+shift+enter]

 Ví dụ: lập bảng thống kê cho tình trạng hôn nhân [Marital]

5/12/2009 13 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

1. THỐNG KÊ DỮ LiỆU DẠNG BẢNG

Quy trình dùng lệnh FREQUENCY Đối với biến có nhiều biểu hiện:  B1: Cần lập các [giới hạn dưới] và [giới hạn trên] của mỗi

phân tổ.

 B2: Lập cột Bin chỉ gồm các số giới hạn trên của mỗi phân tổ.

Ví dụ biến [trình độ học vấn]_edu

 B3: dùng lệnh FREQUENCY để lập bảng.

 Bài tập: lập bảng tần số theo trình độ học vấn, độ tuổi và trình độ

kết hôn.

 Chú ý: phân tổ do sinh viên tự phân, có thể phân tổ đều hoặc

không đều

7

5/12/2009 14 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Biểu đồ tần số-Thủ tục Data Analysis

 Dùng thủ tục Data

Analysis trong thư viện hàm Add-Ins của Excel  Kiểm tra xem có thủ tục Data Analysis trong Tools hay chưa?

 Tools/ Add-Ins/ Check vào Analysis ToolPak/ OK

5/12/2009 15 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Biểu đồ tần số-Thủ tục Data Analysis

 Tools/ Data Analysis/ Histogram

8

5/12/2009 16 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Biểu đồ tần số-Thủ tục Data Analysis

 Input Range: Quét khối số liệu, nhớ có cả tên biến  Bin Range: Quét biên khối biên trên của biểu đồ tần số, nhớ có cả tên  Labels: Khai báo có dòng đầu tiên là tên biến  Chọn Output range: ô đầu tiên chứa kết quả  Khai báo các kết quả cần nhận: Pareto, Cumulative Percentage, Chart

Output

5/12/2009 17 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Biểu đồ tần số-Thủ tục Data Analysis

 Bảng tần số, tần suất tích lũy và phân phối Pareto

9

5/12/2009 18 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Biểu đồ tần số-Thủ tục Data Analysis

 Biểu đồ Pareto

5/12/2009 19 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

2. THỐNG KÊ DỮ LiỆU DẠNG ĐỒ THỊ

Các dạng đồ thị: 1. Hình thanh : 2. Hình tròn, (bánh) : 3. Đường gấp khúc : : 4. Phân tán

Column, Bar, Pie Line Scatter

10

5/12/2009 20 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

2. THỐNG KÊ DỮ LiỆU DẠNG ĐỒ THỊ

QUY TRÌNH VẼ ĐỒ THỊ

ĐỒ THỊ HÌNH TRÕN

 B1: chọn vùng dữ liệu  B2: chọn biểu tượng đồ thị

[chart wizart] hoặc insert/chart

 B3: Chọn các hiệu chỉnh

tương ứng

Đồ thị hình tròn thường dùng tần suất (%) để hiển thị

5/12/2009 21 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

2. THỐNG KÊ DỮ LiỆU DẠNG ĐỒ THỊ

ĐỒ THỊ HÌNH THANH [COLUMN]

ĐỒ THỊ HÌNH THANH [BAR]

Tên thuộc tính dài

Tên thuộc tính ngắn

11

5/12/2009 22 Nguyễn Duy Tâm _ IDR

5/12/2009

ĐỒ THỊ ĐƯỜNG GẤP KHÚC _ LINE 5/12/2009

Đồ thị Line: thường dùng cho trường hợp dữ liệu theo dõi qua thời gian

23 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Bảng tóm tắt-Pivot Table

 Data/ Pivot Table

12

5/12/2009 24 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Bảng tóm tắt-Pivot Table

 Quét khối dữ liệu cần tính toán, kể cả tên biến, sẽ

được xem là tên trường(Field)

5/12/2009 25 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Bảng tóm tắt-Pivot Table

 Nên chọn trang bảng tính mới

13

5/12/2009 26 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Bảng tóm tắt-Pivot Table

 Kéo và nhả (Drag and Drop) Z8_SATISFACTION vào Row

Fields và Data Items

5/12/2009 27 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Bảng tóm tắt-Pivot Table

 Nhấp đúp vào A3 (ô giao giữa Row Fields và Column Fields)

và chọn Count of Z8_SATISFACTION.

Ưu điểm: có thể tính Tổng, tần số và nhiều lệnh khác

14

5/12/2009 28 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Pivot Table với 2 biến phân loại

5/12/2009 29 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Pivot Table với 2 biến phân loại

 Click vào A3, kéo và thả trường Z1_MALE vào Column

Fields.

Ưu điểm: lập bảng tần số chéo cho nhiều biến.

15

5/12/2009 30 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Pivot Table với 3 biến phân loại

 Kéo và thả Z4_Child vào Page Fields

5/12/2009 31 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Một số yêu cầu

Dùng công cụ Pivot table: 1. Lập bảng tổng số con của các hộ gia đình có 1,2,…,n con cụ thể. 2. Lập bảng tổng số anh,chị em trong nhà ứng với từng loại gia đình cụ thể. 3. Lập bảng tần số cho biến Marital, vẽ biểu đồ và cho biết loại tình trạng

hôn nhân nào chiếm đa số

4. Lập bảng tần số cho biến marita (column) và biến sex (row). Vẽ biểu đồ

và cho biết giới tính nào ứng với tình trạng hôn nhân nào chiếm đa số. Vẽ biểu đồ tương ứng.

5. Lập bảng tần số giữa hai biến marital (column) và wrkstat (row). 6. Lập bảng tần số giữa hai biến marital (column) và wrkstat (row) .

16

5/12/2009 32 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả

CHỈ TIÊU TẬP TRUNG

CHỈ TIÊU PHÂN TÁN

: var

: stdev

: Median

 Phương sai  =var(data)  Độ lệch chuẩn  =stdev(data)

: Mode

 Trung bình : average  =average(data)  Trung vị  =median(data)  Mode  =mode(data)  Tứ phân vị : quartile  =quartile(data,số phân vị)

(1: Q1; 2:Q2; 3:Q3)

5/12/2009 33 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả

MỘT SỐ LỆNH KHÁC

MỘT SỐ LỆNH CÓ TRONG EXCEL 2007  Tính tổng thỏa điều kiện

nâng cao.

 Tính tổng thoả điều kiện  =sumif(vùng ĐK, ĐK,

 =sumifs(vùng tính tổng, vùng ĐK1, ĐK1, vùng ĐK2, ĐK2)

Vùng tính tổng)  Đếm thỏa điều kiện  =countif(vùng ĐK,ĐK)

 Đếm thỏa điều kiện nâng

cao.

 =countifs(vùng ĐK1,

ĐK1,vùng ĐK2, ĐK2,…)

17

Nguyễn Duy Tâm _ IDR 5/12/2009 34

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả

BÀI TẬP (AFFAIR)

MỘT SỐ LỆNH CÓ TRONG EXCEL 2007

1. Tính giá trị trung bình, trung vị,

 Trung bình thỏa điều kiện  =averageif(vùng ĐK, ĐK,

Vùng tính mean)

 =averageifs(vùng tính

mode, tứ phân vị, phương sai, độ lệch chuẩn cho các biến: Z2_age, Z4_child, Z6_edu. Nêu ý nghĩa của các số trên. 2. Tính tổng số con của những

mean,vùng ĐK1, ĐK1, Vùng ĐK2, ĐK2)

người có độ tuổi dưới 30. hoặc của những người hài lòng về tình trạng hôn nhân. 3. Đếm những người có 1 con

5/12/2009 35 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Thống kê dữ liệu bằng các đại lƣợng thống kê mô tả

BÀI TẬP (THUC HANH EXCEL)

BÀI TẬP (THUC HANH EXCEL)

1. Đếm những người làm

việc toàn thời gian trong mẫu khảo sát

1. Tính tổng số anh/chị/em của những người lý dị, ly thân.

2. Tính tổng số con của

2. Đếm những người đã lập gia đình, chưa lập gia đình

những người là nữ giới.

18

5/12/2009 36 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Tính trị thống kê bằng thủ tục Data Analysis Tools/ Data Analysis/ Descriptive Statistics

 Nhập số liệu và các tùy chọn vào giao diện

5/12/2009 37 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Tính trị thống kê bằng thủ tục Data Analysis Tools/ Data Analysis/ Descriptive Statistics

 Kết quả sau khi đã hiệu chỉnh.  Bài tập: Tính các chỉ tiêu thống kê mô tả bằng công cụ DATA ANALYSIS cho các biến: agewed sibs childs age educ trong bài tập thực hành excel

19

5/12/2009 38 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

HỆ SỐ TƢƠNG QUAN

 Đối tượng biến áp dụng: biến định lượng (scale) hoặc biến

thuộc thang đo thứ bậc (ordinal), biến thuộc thang đo khoảng (interval).

 Chú ý: Đối với thang đo định danh (norminal): những chỉ số

tính toán không có ý nghĩa thống kê.

 Công thức lệnh: tính rxy =correl(data_X, data_Y)  Ý nghĩa:  Đo lường về mức độ quan hệ tuyến tính giữa hai biến X và Y -1 < = rxy < 0 : X và Y nghịch biến : X và Y đồng biến 0< rxy <=1

5/12/2009 39 Nguyễn Duy Tâm _ IDR

Dùng thủ tục Data Analysis để tính ma trận Con người –Tầm nhìn mới Con người –Tầm nhìn mới tƣơng quan

 Tools/ Data Analysis/ Correlation

20

5/12/2009 40 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới Dùng thủ tục Data Analysis để tính ma trận tƣơng quan

 Kết quả.  BT thực hành excel: Tính matrận hệ số tương quan cho các biến agewed sibs childs age educ và nhận xét về mối quan hệ giữa các biến

5/12/2009 41 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới Đồ thị phân tán: Hài lòng phụ thuộc vào học vấn

 Chọn loại đồ thị là Scatter

21

5/12/2009 42 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới Đồ thị phân tán: Hài lòng phụ thuộc vào học vấn

 Nhập số liệu

5/12/2009 43 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới Đồ thị phân tán:Hài lòng phụ thuộc vào học vấn

 Các tùy chọn

22

5/12/2009 44 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới Đồ thị phân tán: Hài lòng phụ thuộc vào học vấn

 Xuất ra trang riêng

5/12/2009 45 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Đồ thị phân tán: Hài lòng phụ thuộc vào học vấn

 Chọn loại đồ thị là Scatter

23

5/12/2009 46 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Đồ thị phân tán: Hài lòng phụ thuộc vào học vấn

 Nhập số liệu

5/12/2009 47 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Đồ thị phân tán: Hài lòng phụ thuộc vào học vấn

 Các tùy chọn

24

5/12/2009 48 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Đồ thị phân tán: Hài lòng phụ thuộc vào học vấn

 Xuất ra trang riêng

5/12/2009 49 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

MÔ PHỎNG LẤY MẪU LẶP LẠI CHỌN CỠ MẪU n = 9 TỪ Z2_AGE

 Số thứ tự trong tổng thể: Hàm Randbetween

25

5/12/2009 50 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

MÔ PHỎNG LẤY MẪU LẶP LẠI CHỌN CỠ MẪU n = 9 TỪ Z2_AGE

 Điền kết quả lấy mẫu: Hàm Vlookup

5/12/2009 51 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

MÔ PHỎNG LẤY MẪU LẶP LẠI CHỌN CỠ MẪU n = 9 TỪ Z2_AGE

 MÔ PHỎNG BẰNG THỦ TỤC SAMPLING  Tools/ Data Analysis/ Sampling

26

5/12/2009 52 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

MÔ PHỎNG LẤY MẪU LẶP LẠI CHỌN CỠ MẪU n = 9 TỪ Z2_AGE

 KẾT QUẢ MÔ PHỎNG BẰNG THỦ TỤC SAMPLING 10 MẪU  LƢU Ý: KẾT QUẢ NHẬN ĐƢỢC LÀ NGẪU NHIÊN

Tạo 10 mẫu theo bảng trên (dùng công cụ Sample, số quan sát mỗi mẫu là 9)

5/12/2009 53 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

MÔ PHỎNG LẤY MẪU LẶP LẠI CHỌN CỠ MẪU n = 9 TỪ Z2_AGE

 TRUNG BÌNH: HÀM AVERAGE  ĐỘ LỆCH CHUẨN: HÀM STDEV  LƢU Ý: THEO LÝ THUYẾT THÌ VÀ  CÓ THỂ ĐẠT ĐƢỢC ĐiỀU NÀY VỚI VÔ SỐ LẦN LẤY MẪU

27

5/12/2009 54 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới ƢỚC LƢỢNG KHOẢNG TÌN CẬY CHO GIÁ TRỊ TRUNG BÌNH (BiẾT )

 Chọn a = 0.05 =>P(1-a/2)= 0.975  Tra Za/2 = 1.96  Tính trung bình = 32.49  Ƣớc lƣợng khỏang tin cậy 95%: (31.77; 33.21)

5/12/2009 55 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

ƢỚC LƢỢNG KHOẢNG TÌN CẬY CHO GIÁ TRỊ TRUNG BÌNH (CHƢA BiẾT )

 Chọn a = 0.05 =>P(1-a/2)= 0.975  Tra ta/2 = 1.964  Tính trung bình = 32.49 và độ lệch chuẩn mẫu =9.29  Ƣớc lƣợng khỏang tin cậy 95%: (31.74; 33.23)

28

5/12/2009 56 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới ƢỚC LƢỢNG KHOẢNG TÌN CẬY CHO GIÁ TRỊ TRUNG BÌNH (CHƢA BiẾT )_THỦ TỤC DATA ANALYSIS

 Tools/ Data Analysis/ Descriptive Statistics  Chọn Summary Statistics và Confidence Level for Mean

5/12/2009 57 Nguyễn Duy Tâm _ IDR

ƢỚC LƢỢNG KHOẢNG TÌN CẬY CHO GIÁ TRỊ TRUNG Con người –Tầm nhìn mới Con người –Tầm nhìn mới BÌNH (CHƢA BiẾT )_THỦ TỤC DATA ANALYSIS

 Cận dƣới = Mean – Confidence Level (95%)  Cận trên = Mean + Confidence Level (95%)

29

5/12/2009 58 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Bài tập ƣớc lƣợng

BÀI TẬP AFFAIR

BÀI TẬP “THUC HANH EXCEL

1. Ước lượng độ tuổi bình quân (age) của những người được khảo sát.

1. Ước lượng độ tuổi bình quân (age) của những người được khảo sát 2. Ước lượng độ tuổi bình quân kết hôn (agewed). 3. Ước lượng trình độ học

vấn (educ) bình quân của những người được khảo sát.

5/12/2009 59 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Kiểm định 1 đuôi (Biết s) Ho: Số năm học trung bình của ngƣời Mỹ tối đa là 15 năm

 Nhắc lại đường dẫn hàm thống kê: fx/ Statistical/ Average…

30

5/12/2009 60 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Kiểm định 1 đuôi (Biết s) Ho: Số năm học trung bình của ngƣời Mỹ tối đa là 15 năm

 Giá trị Z = 11.44 nằm ở miền bác bỏ  =>Có bằng chứng thống kê cho thấy số năm học trung bình của

người Mỹ lớn hơn 15 năm.

5/12/2009 61 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Kiểm định 1 đuôi (Không biết s) Ho: Số năm học trung bình của ngƣời Mỹ tối đa là 16 năm

Lưu ý: Hàm TINV ứng với tra t hai đuôi nên khi tra t một đuôi cần tra ứng với 2a.

31

5/12/2009 62 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Kiểm định 1 đuôi (Không biết s) Ho: Số năm học trung bình của ngƣời Mỹ tối đa là 16 năm

Vì trị thống kê t = 1.70 nằm ở miền bác bỏ nên chúng ta bác bỏ Ho.

Vậy số năm học trung bình của người Mỹ cao hơn 16.

5/12/2009 63 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Kiểm định 2 đuôi (Biết s) Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm

Hàm NORMINV trả về giá trị Z ứng với xác suất tích lũy nên phải

nhập tham số là (1-a/2)

32

5/12/2009 64 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Kiểm định 2 đuôi (Biết s) Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm

Hàm NORMINV trả về giá trị Z ứng với xác suất tích lũy nên phải

nhập tham số là (1-a/2)

Vì trị thống kê Z = 1.63 nằm trong miền chấp nhận nên ta không thể

bác bỏ Ho.

5/12/2009 65 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Kiểm định 2 đuôi (Chƣa biết s) Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm

Hàm TINV(a, n-1)

33

5/12/2009 66 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Kiểm định 2 đuôi (Chƣa biết s) Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm

Vì trị thống kê t = 1.70 nằm trong miền chấp nhận nên ta không thể bác bỏ Ho.

5/12/2009 67 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Bài tập kiểm định

BÀI TẬP AFFAIR

BTẬP THỰC HÀNH EXCEL

1. Có giả thiết cho rằng,

1. Có giả thiết cho rằng, độ tuổi (age) bình quân của những người được khảo sát là dưới 40. Bạn hãy kiểm định giả thiết nàyα=5%.

độ tuổi (age) bình quân của những người được khảo sát là dưới 30. Bạn hãy kiểm định giả thiết này với mức ý nghĩa α=5%.

2. Có giả thiết cho rằng,

2. Có giả thiết cho rằng, độ tuổi (age) bình quân của những người được khảo sát là 46. Theo bạn, đúng hay sai α=3%? 3. Có giả thiết cho rằng, độ tuổi (agewed) bình quân của những người được khảo sát là dưới 40. Bạn hãy kiểm định giả thiết này α=4%.

độ tuổi (age) bình quân của những người được khảo sát là 33. Theo bạn, giả thiết này đúng hay sai? (α=10%)

34

5/12/2009 68 Nguyễn Duy Tâm _ IDR

5/12/2009

Kiểm định 2 đuôi (Biết và Chƣa biết )-Giá trị p Con người –Tầm nhìn mới Con người –Tầm nhìn mới Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm

ZTEST(Array, x, sigma) với Array: Số liệu cần kiểm định x: Giá trị của phát biểu Ho, Sigma: Nhập  nếu biết hoặc để trống

nếu không biết.

5/12/2009 69 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới Kiểm định 2 đuôi (Biết và Chƣa biết )-Giá trị p Ho: Số năm học trung bình của ngƣời Mỹ là 16 năm

P_Value = 2*Min(ZTEST, 1-ZTEST) P_Value = 0.09> a = 0.05 => Không thể bác bỏ Ho.

35

5/12/2009 70 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới Kiểm định sự khác biệt về trung bình của hai tổng thể-Biết độ lệch chuẩn Affair.xls trang Edu

 Ho: Không có sự khác biệt về học vấn trung bình của

hai giới

 Kết quả khảo sát cho thấy học vấn trung bình của

nam nhỉnh hơn của nữ nhưng độ lệch chuẩn cao hơn.

 Kiểm định Ho bằng thủ tục

 Tools | Data Analysis | z-test: Two Sample for Means

5/12/2009 71 Nguyễn Duy Tâm _ IDR

Kiểm định sự khác biệt về trung bình của hai Con người –Tầm nhìn mới Con người –Tầm nhìn mới tổng thể-Biết độ lệch chuẩn

Tools | Data Analysis | z-test: Two Sample for Means

36

5/12/2009 72 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Kiểm định sự khác biệt về trung bình của hai tổng thể-Biết độ lệch chuẩn

Kết quả kiểm định: Bác bỏ Ho

5/12/2009 73 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Kiểm định sự khác biệt về trung bình của hai tổng thể-Chƣa biết độ lệch chuẩn

Ho: Không có sự khác biệt về học vấn trung bình của hai giới Tools | Data Analysis | t-Test: Two Sample Assuming Equal

Variances

37

5/12/2009 74 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Kiểm định sự khác biệt về trung bình của hai tổng thể-Chƣa biết độ lệch chuẩn

Ho: Không có sự khác biệt về học vấn trung bình của hai giới Tools | Data Analysis | t-Test: Two Sample Assuming Equal

Variances

Kết quả: Bác bỏ Ho

5/12/2009 75 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Bài tập kiểm định mức lƣơng trung bình theo giới tính

1. Có ý kiến cho rằng mức lương trung bình theo giới tính giữa nam và nữ là như nhau. Với số liệu của bài tập Tien luong khoi diem theo gioi tinh nam - nu.xls, bạn hãy kiểm định giả thiết trên.

2. Có giả thiết cho rằng, việc cải tiến phần mềm làm việc hiện

tại không có hiệu quả. Bằng dữ liệu bài tập hieu qua software.xls, bạn hãy kiểm định hiệu quả của phần mềm mới và cũ.

38

5/12/2009 76 Nguyễn Duy Tâm _ IDR

5/12/2009

Kiểm định F cho sự khác biệt về phƣơng sai của Con người –Tầm nhìn mới Con người –Tầm nhìn mới hai tổng thể

Ho: Không có sự khác biệt về phương sai của học vấn trên hai giới Tools | Data Analysis | F-Test: Two-Sample for Variances

5/12/2009 77 Nguyễn Duy Tâm _ IDR

Kiểm định F cho sự khác biệt về phƣơng sai của Con người –Tầm nhìn mới Con người –Tầm nhìn mới hai tổng thể

Ho: Không có sự khác biệt về phương sai của học vấn trên hai giới Kết quả: Bác bỏ Ho

39

5/12/2009 78 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Kiểm định mẫu cặp: Vợ và chồng có cảm nhận khác biệt về hạnh phúc không? Affair.xls/ Satisfaction

Ho: Vợ và chồng thỏa mãn về hôn nhân như nhau.  Tools | Data Analysis… | t-test: Paired Two Sample for Means

5/12/2009 79 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Kiểm định mẫu cặp: Vợ và chồng có cảm nhận khác biệt về hạnh phúc không?

Ho: Vợ và chồng thỏa mãn về hôn nhân như nhau.  Kết quả: Chấp nhận Ho.

40

5/12/2009 80 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Bài tập kiểm định cặp

 Có giả định cho rằng, hiệu quả của một phương pháp quảng cáo được tiến hành cho nhiều công ty khác nhau hiện tại không có hiệu quả. Bằng số liệu của bài tập truoc - sau quang cao ve doanh thu.xls, anh chị hãy kiểm định giả thiết trên

5/12/2009 81 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

HÀM TTEST-Kiểm định sự khác biệt

 fx/ Statistical/ TTEST  Type: 1 cho mẫu cặp, 2 cho phƣơng sai bằng nhau, 3 cho

phƣơng sai khác nhau

41

5/12/2009 82 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

ANOVA: Vợ và chồng có có mức độ hài lòng về hôn nhân trung bình khác nhau không?

Ho: Vợ và chồng thỏa mãn về hôn nhân như nhau.  Tools/ Data Analysis/ ANOVA-Single Factor

5/12/2009 83 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

ANOVA: Nam và nữ có có mức độ hài lòng về hôn nhân khác nhau không?

Ho: Hai giới thỏa mãn về hôn nhân trung bình như nhau.  Kết quả: Chấp nhận Ho

42

5/12/2009 84 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

ANOVA một nhân tố-Ví dụ chƣơng 8 Worksheet in Chapter8(V)

 So sánh năng suất của 3 máy  Ho: Năng suất của 3 máy là như nhau

5/12/2009 85 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

ANOVA một nhân tố-Ví dụ chƣơng 8

Ho: Năng suất của 3 máy là như nhau Kết quả kiểm định: Bác bỏ Ho

43

5/12/2009 86 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Thủ tục Tukey-Kramer

 Tools/ Lumenaut Statistics/ Tukey-Kramer Test  Lumenaut là một phần mềm Add-Ins miễn phí, chạy trên nền Excel.

5/12/2009 87 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Thủ tục Tukey-Kramer

 Tools/ Lumenaut Statistics/ Tukey-Kramer Test

44

5/12/2009 88 Nguyễn Duy Tâm _ IDR

5/12/2009

Thủ tục Tukey-Kramer

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

 Tools/ Lumenaut Statistics/ Tukey-Kramer Test

5/12/2009 89 Nguyễn Duy Tâm _ IDR

Tìm hệ số chặn và độ dốc

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

 Hệ số chặn: fx/ Statistical/ INTERCEPT  Độ dốc: fx/ Statistical/ SLOPE

45

5/12/2009 90 Nguyễn Duy Tâm _ IDR

5/12/2009

Tìm hệ số chặn và độ dốc

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

 Hệ số chặn: fx/ Statistical/ INTERCEPT  Độ dốc: fx/ Statistical/ SLOPE

5/12/2009 91 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Vẽ đƣờng xu hƣớng trong Chart

 Click phải/ Add Trendline/

46

5/12/2009 92 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Vẽ đƣờng xu hƣớng trong Chart

 Type: Linear  Options: Display Equation on chart

5/12/2009 93 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Vẽ đƣờng xu hƣớng trong Chart

 Kết quả

47

5/12/2009 94 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Thủ tục REGRESSION

 Tools/ Data Analysis/ REGRESSION

5/12/2009 95 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

KẾT QUẢ

48

5/12/2009 96 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Từ bảng kết xuất của Excel

5/12/2009 97 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Phần dƣ theo biến độc lập

49

5/12/2009 98 Nguyễn Duy Tâm _ IDR

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Real and Fitted Values

5/12/2009 99 Nguyễn Duy Tâm _ IDR

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Tools/ Data Analysis/ Regression

 Hồi quy đơn: Oil theo Temp

50

5/12/2009 100 Lê Tấn Luật

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Hồi quy đơn: Oil theo Temp

5/12/2009 101 Lê Tấn Luật

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Hồi quy đơn: Oil theo Insulation

51

5/12/2009 102 Lê Tấn Luật

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Hồi quy bội: Oil theo Temp và Insulation Quét Known’s X: cả Temp và Insulation

5/12/2009 103 Lê Tấn Luật

Con người –Tầm nhìn mới Con người –Tầm nhìn mới Biến Insulation có cải thiện mô hình từ Oil = f(Temp) không?

 Kết quả tính toán cho Fc = 73

52

5/12/2009 104 Lê Tấn Luật

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Tra giá trị tới hạn của F: FINV

 Kết quả tính toán F* = 4.75  F =73 > F*: 4.75 Kết luận: Insulation làm

tăng mức độ giải thích của mô hình.

5/12/2009 105 Lê Tấn Luật

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Hồi quy bậc hai: Chuẩn bị số liệu Temp2=Tem^2

53

5/12/2009 106 Lê Tấn Luật

5/12/2009

Kết quả hồi quy

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

5/12/2009 107 Lê Tấn Luật

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Hồi quy với biến giả

 TC = Tổng chi phí sản xuất  Q = Tổng sản lượng  CN = 1 cho các quý đã thay đổi công nghệ, 0 cho các quý

trước khi thay đổi công nghệ.

 TCN = 0 cho các quý đã thay đổi công nghệ, 1 cho các quý

trước khi thay đổi công nghệ.

54

5/12/2009 108 Lê Tấn Luật

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Sai lầm -> Đa cộng tuyến hoàn hảo

5/12/2009 109 Lê Tấn Luật

Hồi quy với biến giả

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

55

5/12/2009 110 Lê Tấn Luật

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Hồi quy với biến tƣơng tác CNQ = CN*Q

5/12/2009 111 Lê Tấn Luật

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Ý nghĩa của biến giả và biến tƣơng tác

TC = 401 + 1.24*Q + 368*CN – 0.64CNQ P (0.00) (0.00) (0.01) (0.00) R2 = 0.96 Adjusted R2= 0.95 n= 16 Trước thay đổi công nghệ: CN=CNQ=0 TC = 401 + 1.24*Q Sau thay đổi công nghệ: CN=1, CNQ=Q TC = (401+368) + (1.24-0.68)*Q TC = 769 + 0.56*Q Vậy thay đổi công nghệ làm định phí tăng nhưng biến

phí đơn vị giảm.

56

5/12/2009 112 Lê Tấn Luật

5/12/2009

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Hồi quy với biến chuyển dạng log-log Mô hình tuyến tính: Q=b1+b2*L+b3*K

5/12/2009 113 Lê Tấn Luật

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

Chuyển dạng log-log

*Kb (1)

Hàm sản xuất Cobb-Douglas Q = A*La Không thể ước lượng trực tiếp hàm (1) ln(Q) = ln(A) + a*ln(L) + b*ln(K) Y = b0 + b1*X1 + b2*X2 Với b0 = ln(A); b1= a; b2=b; X1= ln(L); X2=ln(K) Chúng ta đã chuyển về dạng mô hình hồi quy tuyến tính thông

thường

57

5/12/2009 114 Lê Tấn Luật

5/12/2009

Chuẩn bị số liệu log-log: Hàm ln(Number) Con người –Tầm nhìn mới Con người –Tầm nhìn mới

5/12/2009 115 Lê Tấn Luật

Kết quả hồi quy

Con người –Tầm nhìn mới Con người –Tầm nhìn mới

58

5/12/2009 116 Lê Tấn Luật