Đ I H C QU C GIA TP. H CHÍ MINH

NG Đ I H C BÁCH KHOA

Ạ Ọ TR

ƯỜ

Ạ Ọ

BÁO CÁO BÀI T P XÁC SU T TH NG KÊ

GVHD: Th yầ Nguy nễ

Ố Bá Thi

Sinh viên: Nguy n Ph c L c ộ ễ

ướ MSSV : 40901457 Nhóm 3 L p:ớ

Bài 1

ộ ệ ấ ớ ỏ ố

M t xí nghi p may s n xu t áo khoác v i 4 màu: đ , xanh, vàng và tím than. S khách ả hàng nam và n mua áo khoác v i các màu đ c ghi trong b ng sau: ượ ữ ả ớ

Xanh Vàng Tím than Đỏ

62 34 71 42 Nữ

Nam 125 233 52 54

V i m c ý nghĩa α = 1% hãy so sánh t l ỷ ệ ộ khách hàng nam và n a chu ng m t ữ ư ộ ớ

ứ trong các màu s c nói trên. ắ

BÀI LÀM

thi ể ế ề ỷ ệ. ị

o:

: t H Nh n xét ậ thi Gi ế ả t v t khách hàng nam và n a chu ng m t trong các màu s c là ộ ả ữ ư l ộ ắ

Đây là bài toán ki m đ nh gi T l ỷ ệ nh nhau ư

. ự

ệ :

• Nh p giá tr vào b ng tính ị

Th c hi n bài toán b ng Excel ả

Trang 2

• Tính các t ng s : ố ổ

• T ng hàng:

ổ Ch n ô ọ E8 và nh p ậ = SUM(C8:D8)

• T ng c t: ổ

Dùng con tr kéo nút t đi n t ỏ ự ề ừ E8 đ n ế E11

ộ Ch n ọ C12 và nh p ậ = SUM(C8:C11)

• T ng c ng:

Dùng con tr kéo nút t đi n t ỏ ự ề ừ C12 đ n ế D12

Ch n E12 và nh p ổ ộ ậ =SUM(E8:E11) ọ

• Ch n ọ C16 và nh p ậ =$C$12*E8/$E$12

• Tinh cac tân sô lý thuyêt: ́ ́ ̀ ́ ́

• Ch n ọ D16 và nh p ậ =$D$12*E8/$E$12

Dùng con tr kéo nút t đi n t ỏ ự ề ừ C16 đ n ế C19

Dùng con tr kéo nút t đi n t ỏ ự ề ừ D16 đ n ế D19

• Ch n ọ C21 và nh p ậ = CHITEST(C8:D11,C16:D19) • Ta se co đ

• Ap dung ham sô CHITEST : ́ ̣ ̀ ́

Trang 3

êt qua cua c k ́ ượ ̃ ́ ̉ ̉ P(X>X²).

Trang 4

:

• Bi n lu n ệ

thi t H ỏ ả

o. ữ ư

T l ậ ỉ ệ P(X>X²) = 1,71514e-18 < α = 0,01. => Bác b gi ế khách hàng nam và n a chu ng m t trong các màu s c là ộ ắ ộ

• K t lu n : ế khác nhau.

Trang 5

Bài 2

ng s a v t đ ẹ c b i 16 con bò cái khi nghe các lo i nh c khác nhau (nh c nh , ạ ạ

nh c r c, nh c c đi n, không có nh c) đ c th ng kê trong b ng sau đây: L ượ ạ ố ữ ắ ượ ở ạ ổ ể ạ ượ ố ạ ả

15 18 22 17 Nh c nhạ ẹ

13 20 16 15 Nh c r c ạ ố

15 14 19 23 24 17 28 14 Nh c c đi n ạ ổ ể Không có nh cạ

ứ ượ ị

ng đ n l ậ ệ ạ ng s a trung bình c a m i nhóm nh ả ư ủ ng s a c a các con ế ượ ỗ ữ ủ ưở

V i m c ý nghĩa 5%, nh n đ nh xem l ữ ớ trên nh nhau hay khác nhau. Li u âm nh c có nh h ư bò hay không?

BÀI LÀM

ươ ố.

: t H Đây là bài toán phân tích ph o: L Nh n xét ậ thi Gi ế ả ượ ̀ ̉ ̃ ́

ng sai m t nhân t ộ ng s a trung binh cua môi nhom la nh nhau. ̀ ư ữ Th c hi n bài toán b ng Excel

• Nh p d li u vào b ng tính :

• Vào Data /Data analysis, ch n ọ Anova: Single Factor.

Trang 6

ậ ữ ệ ả

Trang 7

• Trong h p tho i Anova: ạ

Single Factor l n l : t n đ nh ộ ầ ượ ấ ị

Ph m vi đ u vào: Input Range, quét ch n vùng ( ọ ầ ạ

dòng đ u). ằ ở ầ

• C4:F8). • Cách nhóm theo hàng hay c t: ộ Group By, ch n ọ Columns (nhóm theo c t).ộ • Ch n ọ Labels in first row (nhãn d li u n m • M c ý nghĩa α: • Ph m vi đ u ra:

• Nh n OK, ta s c

C10. ữ ệ α=0,05). Alpha ( n đ nh ị ấ Output Range, ch n ô ọ ứ ạ ầ

Trang 8

ẽ ó b ng k t qu sau: ế ả ả ấ

Bi n lu n ậ ệ

thi : F = 1.354679803 < F0.05 = 3.490295. ậ ả

K t lu n ậ

 Ch p nh n gi ượ

Trang 9

ư . ng s a c a các con bò ế Hay âm nh c không nh h ạ : L ả t H ế o ng s a trung bình c a các nhóm là nh nhau. ủ ữ ủ ấ ữ ng đ n l ưở ế ượ

Bài 3

ng quan, h ặ s t ỷ ố ươ ừ ặ ế

ủ ứ ớ

T 12 c p quan sát (x,y) sau đây t ệ c p 2 bi n (X,Y) ,tính t ừ ế ng quan và h s xác đ nh c a Y đ i v i X. V i m c ý nghĩa α = 5%, có k t ố ớ ệ ố ồ ng h i ng quan gi a X và Y (tuy n tính hay phi tuy n )? Tìm đ ế ị ữ ườ ế

s t ố ươ lu n gì v m i t ề ố ươ ậ quy c a Y đ i v i X. ố ớ ủ

X 123 118 118

356, 9 4,1 111, 1 3,74 12 3 4,5 356, 9 4,1 111, 1 3 11 8 3,8 12 3 2 356, 9 3,1 111, 1 3,4 3

Y 4,1 5 3,8 9

BÀI LÀM Nh n xét

: đây là bài toán phân tích t ng quan. ậ ươ

Th c hi n bài toán b ng Excel

ng quan tuy n t

ế ính.

ươ Nh p giá tr vào b ng tính:

1. Phân tích t ị ậ

Trang 10

• Thi

t l p b ng Correlation . ế ậ ả

Vào Data /Data analysis , ch n ọ Correlation.

• • Cách nhóm theo hang hay c t: ộ Group By, ch n ọ Columns (nhóm theo

Ph m vi đ u vào: Input Range, quét vùng (C5:D17). ạ ầ

c t).ộ

• Ch n ọ Labels in first row (nhãn d li u ữ ệ ở • Output Range, ch n ô

Trang 11

Ph m vi đ u ra: hàng đ u). F6. ầ ạ ọ

• Nh n OK, ta s có b ng k t qu sau: ẽ ế ấ ả ả

ng quan ệ ố ươ

ệ ố ị

c ượ h s t Ta tìm đ Và h s xác đ nh o : X và Y không có t ng quan tuy n tính * Gi thi t H ươ r = 0.17875. r2 = 0.03195. . ế ả ế

r n

=

T

2 2

- Ta có: T = 0.574506 v iớ

1

r

-

(c là phân v m c 10 b c t do). ậ ự

c = 2,228. Mà: ị ứ α/2=0.025 c a phân b ủ Vì T < c nên ch a có c s bác b gi t H

o.

Trang 12

ố Student v i n-2= ớ thi ỏ ả ơ ở ư ế

c X và Y có t ng quan tuy n tính . V y: ậ Ch a k t lu n đ ư ế ậ ượ ươ ế

2. Phân tích t

ng quan phi tuy n.

ươ

ế

Trang 13

S p x p l i các giá tr c a X và Y theo b ng sau: ế ạ ắ ị ủ ả

• Thi

t l p b ng ả Anova: Single Factor.

ế ậ • Vào Data /Data analysis , ch n ọ Anova: Single Factor.

• Trong h p tho i Anova: Single Factor ạ

l n l : t n đ nh ộ ầ ượ ấ ị

o Ph m vi đ u vào: o Cách nhóm theo hàng hay c t: ộ Group By, ch n ọ Columns (nhóm theo

Input Range, quét vùng (D29:G32). ạ ầ

c t).ộ

hàng đ u). ằ ở ầ

o Ch n ọ Labels in first row (nhãn d li u n m o M c ý nghĩa α: o Ph m vi đ u ra:

Trang 14

C34. ữ ệ α=0,05). Alpha ( n đ nh ị ấ Output Range, ch n ô ọ ứ ạ ầ

• Nh n OK, ta s c

ẽ ó b ng k t qu sau: ế ả ả ấ

• Rút ra đ b ng Anova: c t ượ ừ ả

Y/X = SSF/SST = 0,04243.

Tính: SSF = 0,22537. SST = 5,3115. η2

=> T s t ng quan : ỷ ố ươ

Suy ra : ηY/X = 0,206. Y/X - r² = 0.174034 ≠ 0. η2

o : X và Y không có t

2

* Gi thi t H ả ế ươ ế . ng quan phi tuy n

h - -

)

(

r

=

F

2 Y X / 1 -

Ta có: F = 0,87673 v i ớ

n k )

h -

(

) ( ) ( k

2

2 Y X /

Trang 15

c = 4,46.

do (k-2,n-k)=( 2,8)). ủ

ậ ự o. thi t H

Trang 16

Mà: (c là phân v m c Vì: V y: ậ X và Y không có t ố Fisher b c t ị ứ α=0,05 c a phân b F < c nên ch p nh n gi ế ả ấ ế . ng quan phi tuy n ậ ươ

ng quan:

r = 0.178749. r² = 0.03195. ị

• K t lu n : ậ ế  H s t ệ ố ươ  H s xác đ nh: ệ ố  T s t

ng quan: ηY/X = 0.206. ỷ ố ươ

do 10). ủ

c X và Y có t (c là phân v m c Ch a k t lu n đ => ng quan tuy n tính. • T = 0,574506 < c = 2,228. ị ứ 0.025 c a phân b ươ ậ ượ ư ế ố Student b c t ậ ự ế

2,8)). do ( • F = 0,043772 < c = 4,46 ị ứ 0,05 c a phân b ủ

(c là phân v m c X và Y không có t => ố Fisher b c t ậ ự ng quan phi tuy n v i m c ý nghĩa 5%. ế ớ ứ ươ

3. Tìm đ

ườ

ng h i quy c a Y đ i v i X. ủ

ố ớ

Trang 17

Bài 4

ự ế ườ ủ ề ậ

4 khu v c khác nhau sau đây: Hãy phân tích s bi n đ ng c a thu nh p ($/tháng/ng ộ v t thu nh p trung bình c a 4 lo i ngành ngh ủ ề i) trên c s s li u đi u tra ơ ở ố ệ ự ề ở ạ ậ

N i làm vi c ệ ơ

Lo i ngành ạ nghề 1 2 3 4 V2 200 205 250 228 V1 212 222 241 240 V3 230 222 245 230 V4 220 225 235 240

. ế ố ươ

t Ho: “l ế ng sai hai y u t  Nh n xét: Đây là d ng bài t p phân tích ph ạ  Gi ng thu nh p trung bình là nh nhau theo ngành và n i làm ư ậ ậ ượ ơ

 Ta áp d ng ph

BÀI LÀM ậ thi ả vi c”ệ

ng pháp phân tích ph ng sai 2 y u t ụ ươ ươ . ế ố

Th c hi n bài toán b ng Excel

Trang 18

1. Nh p d li u vào b ng tính: ậ ữ ệ ả