intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Nghiên cứu marketing - Chương 8: Phân tích và diễn giải dữ liệu trong nghiên cứu marketing

Chia sẻ: Nguyen Trinh | Ngày: | Loại File: PDF | Số trang:57

484
lượt xem
268
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Nội dung chương này bàn đến bao gồm: Thế nào là giả thuyết nghiên cứu Các loại sai lầm khi thực hiện kiểm định giả thuyết Các bước giải quyết một bài toán kiểm định Các phương pháp kiểm định tham số Các phương pháp kiểm định phi tham số

Chủ đề:
Lưu

Nội dung Text: Nghiên cứu marketing - Chương 8: Phân tích và diễn giải dữ liệu trong nghiên cứu marketing

  1. CHƯƠNG TÁM PHÂN TÍCH VÀ DIỄN GIẢI DỮ LIỆU 8 TRONG NGHIÊN CỨU MARKETING NỘI DUNG CHÍNH Nội dung chương này bàn đến bao gồm: - Thế nào là giả thuyết nghiên cứu - Các loại sai lầm khi thực hiện kiểm định giả thuyết - Các bước giải quyết một bài toán kiểm định - Các phương pháp kiểm định tham số - Các phương pháp kiểm định phi tham số 131
  2. MÔ HÌNH LỰA CHỌN PHƯƠNG PHÁP KIỂM ĐỊNH Giả thiết thống kê là một giả thiết có liên quan đến một trong ba vấn đề sau: (1) Tính độc lập hay phụ thuộc của đại lượng ngẫu nhiên cần nghiên cứu. (2) Dạng của qui luật phân phối xác suất của đại lượng ngẫu nhiên. (3) Giá trị của tham số của qui luật phân phối xác suất đã biết dạng. (1) & (2) là giả thiết phi tham số và (3) là giả thiết về tham số. Trong phần này sẽ giới thiệu phương pháp kiểm định giả thiết về tham số như tham số trung bình x trong qui luật phân phối chuẩn N(µ,σ2), tham số tỷ lệ p trong qui luật phân phối A(P), tham số chi bình phương, tham số Fisher… Trong khuôn khổ cuốn sách này, chúng tôi chỉ giới thiệu cách thức áp dụng những phương pháp kiểm định đó để giải quyết những vấn đề liên quan đến nghiên cứu tiếp thị, những vấn đề khác liên quan đến việc giải thích bản chất của các công thức có thể tham khảo thêm trong các giáo trình chuyên môn về thống kê toán. Các khái niệm cơ bản Giả thiết cần kiểm định Giả sử đại lượng ngẫu nhiên X cần nghiên cứu tuân theo một qui luật phân phối xác suất đã biết dạng, nhưng chưa biết giá trị của tham số θ nào đó của nó. Trên cơ sở những tin tức thu được, ta có thể giả định rằng θ = θ0, trong đó θ0 là số thực. Tất nhiên điều giả định θ = θ0 này có thể đúng hoặc có thể sai, do đó cần phải kiểm tra lại giả định đó. Từ đó ta có giả thiết cần kiểm định là {H0: θ = θ0}. Các giả thiết đối (đối thiết) Vì giả thiết H0 cũng có thể đúng và cũng có thể sai với một độ tin cậy nào đó, khi giả thiết H0 sai thì ta phải bác bỏ nó. Khi đó phải chấp nhận một trong ba giả thiết đối (ký hiệu: H1) sau đây: - Trong trường hợp kiểm định dạng "hai đuôi" (Two-tail test): ⎧H 0 : θ = θ 0 ⎨ ⎩H1 : θ ≠ θ 0 - Trong trường hợp kiểm định dạng "một đuôi" (One-tail test): ⎧H 0 : θ = θ 0 ⎧H 0 : θ = θ 0 ⎨ hoặc ⎨ ⎩H 1 : θ > θ 0 ⎩H1 : θ < θ 0 Do vậy trong bài toán kiểm định giả thiết, sau khi đã đề ra giả thiết cần kiểm định H0, ta cần phát biểu kèm một giả thiết đối H1 để khẳng định rằng nếu như giả thiết H0 bị bác bỏ thì ta chấp nhận giả thiết đối kèm theo với một mức ý nghĩa α nào đấy (1- α được gọi là độ tin cậy). Các loại sai lầm Chú ý rằng, vì mẫu không phải là hình ảnh chính xác của tổng thể, nên mọi mẫu chọn được đều chứa một sai số ngẫu nhiên nào đó. Do vậy, khi dựa vào mẫu để kiểm định giả thiết có thể gặp phải hai loại sai lầm sau: - Sai lầm loại 1: Khi ta bác bỏ một giả thiết đúng. - Sai lầm loại 2: Khi ta thừa nhận một giả thiết sai. 132
  3. Trong khi tiến hành kiểm định, người ta thường ấn định trước một xác suất mức sai lầm loại 1. Nếu xác suất này bằng α, thì α được gọi là mức ý nghĩa của kiểm định (thông thường α phải khá bé, α = 0,05, α = 0,1). Giả thiết H0 đúng Giả thiết H0 sai Chấp nhận Quyết định đúng Sai lầm loại 2 (xác suất β) Bác bỏ Sai lầm loại 1 (xác suất α) Quyết định đúng Tiêu chuẩn kiểm định và miền bác bỏ Sau khi đã đề ra giả thuyết H0 cần kiểm định kèm theo giả thiết đối H1 và qui định mức ý nghĩa α, ta cần phải tìm một thống kê T cùng qui luật phân phối xác suất của nó. Với một mức ý nghĩa ( ) α xác định, ta luôn tìm được mọi miền Wα, thỏa mãn điều kiện P K ∈ Wα H 0 = α (xác suất để K thuộc miền miền bác bỏ Wα với điều kiện H0 đúng bằng α). Do α khá bé, nên ta có thể coi biến cố (K∈Wα) là biến cố không thể có (với điều kiện giả thiết H0 đúng). Vì vậy, trong thực tế nếu dựa vào giá trị x của mẫu ngẫu nhiên X, ta tính được giá trị kqs của thống kê K mà lại thấy giá trị kqs∈Wα, thì điều này sẽ mâu thuẫn với điều kiện nói trên. Nguyên nhân sinh ra mâu thuẫn giữa lý thuyết và thực tế là do ta giả thiết rằng H0 đúng. Để tránh mâu thuẫn này ta phải bác bỏ giả thiết, vì thế Wα được gọi là miền bác bỏ và kqs được gọi là tiêu chuẩn kiểm định. Chú ý: - Khi giả thiết H0 đúng thì tiêu chuẩn kiểm định K vẫn có thể nhận giá trị kqs∈Wα với xác suất xảy ra là α. Vì vậy trong trường hợp kqs∈Wα mà ta bác bỏ giả thiết H0 thì ta có thể mắc sai lầm loại 1, với xác suất mắc sai lầm loại 1 chính là α. - Nếu ta ký hiệu P(k qs ∈ Wα H 1 ) = β thì β là xác suất bác bỏ một giả thiết sai. Do đó, xác suất ( ) không bác bỏ một giả thiết sai P K qs ∈ Wα H 1 = 1 − β là xác suất mắc sai lầm loại 2 và β sẽ được gọi là xác suất không mắc sai lầm loại 2, người ta gọi β là hiệu lực của kiểm định. - Với kích thước mẫu n xác định thì với mẫu tiêu chuẩn kiểm định ta sẽ có miền bác bỏ Wα thỏa mãn điều kiện: P(K qs ∈ Wα H 0 ) = α . Nếu tồn tại một tiêu chuẩn kiểm định kqs với miền bác bỏ Wα sao cho (1-β) là nhỏ nhất và β lớn nhất. Khi đó kqs được gọi là tiêu chuẩn kiểm định mạnh nhất. Một tiêu chuẩn được coi là mạnh nhất thì nó đảm bảo 3 yêu cầu: - Xác suất mắc sai lầm loại 1 là α qui định trước. - Xác suất mắc sai lầm loại 2 là nhỏ nhất. - Khi bác bỏ giả thiết H0 thì ta có thể thừa nhận giả thiết đối H1. Như vậy chúng ta có thể xác định miền bác bỏ và miền chấp nhận trong các trường hợp kiểm định một đuôi và hai đuôi là: - Trong kiểm định hai đuôi: 133
  4. Miền bác bỏ Miền chấp nhận Miền bác bỏ -W1-α/2 W1-α/2 - Trong kiểm định một đuôi: Miền bác bỏ Miền chấp nhận -W1-α Miền chấp nhận Miền bác bỏ W1-α Các bước chung để giải bài toán kiểm định Bước 1: Phát biểu giả thiết và đối thiết ⎧H 0 : θ = θ 0 ⎧H 0 : θ = θ 0 ⎧H 0 : θ = θ 0 ⎨ hoặc ⎨ hoặc ⎨ ⎩H1 : θ ≠ θ 0 ⎩H 1 : θ > θ 0 ⎩H 1 : θ < θ 0 Bước 2: Xác định mức ý nghĩa và xây dựng miền bác bỏ + Mức ý nghĩa α + Miền bác bỏ (tùy thuộc vào phương pháp kiểm định, loại phân phối và mức ý nghĩa). Bước 2: Lựa chọn phương pháp kiểm định và loại phân phối của nó. Bước 4: Tính giá trị quan sát của tiêu chuẩn kiểm định kqs Bước 5: So sánh với miền bác bỏ để kết luận: 134
  5. - Nếu kqs∈ Wα ta sẽ bác bỏ giả thiết H0 và thừa nhận giả thiết H1. - Nếu kqs∉ Wα : Ta kết luận rằng chưa có cơ sở để thừa nhận giả thiết H1. Có thể tóm tắt các bước để giải bài toán kiểm định theo sơ đồ sau: B1: Phát biểu giả thiết và đối thiết B2: Xác định mức ý nghĩa B3: Lựa chọn phương pháp kiểm định và loại phân phối của nó B4: Tính giá trị kiểm định (giá trị quan sát) kqs B5: Tìm miền bác bỏ và kết luận CÁC PHƯƠNG PHÁP KIỂM ĐỊNH THAM SỐ Kiểm định giả thiết về tham số trung bình µ của tổng thể Điều kiện: Biến định lượng và phân phối của biến phải tuân theo quy luật phân phối chuẩn. Trường hợp đã biết phương sai (σ2) hoặc độ lệch chuẩn của tổng thể Đối với trường hợp kiểm định giả thiết về tham số trung bình của tổng thể, chúng ta có thể thực hiện thông qua các bước sau: B1: Phát biểu giả thiết và đối thiết: Đối xứng Phải Trái Giả thiết H0: µ = µ0 H0: µ ≤µ0 H0: µ ≥ µ0 Đối thiết H1: µ ≠ µ0 H1: µ > µ0 H1: µ < µ0 B2: Xác định mức ý nghĩa α B3: Xác định phương pháp kiểm định: Phương pháp kiểm định tham số trung bình với σ đã biết. B 4: Tính tiêu chuẩn kiểm định K qs ≡ U = (x − µ ) 0 n , trong đó x là trung bình mẫu. σ Bước 3: Xác định miền bác bỏ Miền bác bỏ Wα là tập hợp những điểm thoả mãn điều kiện: ⎧ ⎪ Wα = ⎨U = ⎜ ( ⎛ x − µ0 ) n⎞ ⎫ ⎟,U 1−α ⎪ ⎬ ⎪ ⎜ σ ⎟ ⎪ ⎩ ⎝ ⎠ ⎭ hay U ≥U α kiểm định đối xứng - bác bỏ H0, chấp nhận H1 với µ ≠ µ0. 1− 2 135
  6. U ≥ U 1−α kiểm định phía phải - bác bỏ H0, chấp nhận H1 với µ > µ0. U ≤ −U 1−α kiểm định phía phải - bác bỏ H0, chấp nhận H1 với µ < µ0. Chúng ta so sánh kqs với Wα để đưa ra kết luận Để tiện cho việc theo dõi, có thể tóm lược những bước của bài toán kiểm định tham số trung bình ở trên như bảng sau: KIỂM ĐỊNH THAM SỐ TRUNG BÌNH CỦA TỔNG THỂ (khi σ đã biết) 1. Giả thiết và đối thiết: Đối xứng Phải Trái Giả thiết H0: µ = µ0 H0: µ ≤ µ0 H0: µ ≥ µ0 Đối thiết H1: µ ≠ µ0 H1: µ > µ0 H1: µ < µ0 2. Xác định mức ý nghĩa 3. Phương pháp kiểm nghiệm: Tham số trung bình tổng thể 4. Tiểu chuẩn kiểm định: (khi chưa biết σ thay bằng s’) (x − µ0 ) n k qs ≡ U = 5. Điểm tới hạn và miền bác bỏ: σ Đối xứng Phải Trái Điểm tới hạn - U1-α/2 và U1-α/2 U1-α - U1-α Miền bác bỏ UU1-α/2 U>U1-α U
  7. B4. Xác định tiêu chuẩn kiểm định: Tiêu chuẩn kiểm định được chọn là: k qs ≡ U = (x − µ ) 0 n (20,35 − 20 ) 100 3,5 = = 1,75 σ 2 2 B5. Xác định miền bác bỏ và kết luận: Với mức ý nghĩa α = 0,05, miền bác bỏ tương ứng trong trường hợp này có dạng: ⎧ ⎪ Wα = ⎨U = x − µ0 ( ) n ,U ≥U ⎫ ⎪ = U 0,975 = 1,96⎬ α ⎪ ⎩ σ 1− 2 ⎪ ⎭ Minh họa bằng hình vẽ: 1,75 1,96 Miền bác bỏ Miền bác bỏ Kết luận: Vì kqs∉ Wα nên chưa có cơ sở để bác bỏ giả thiết H0, tức là ý kiến cho rằng trọng lượng trung bình của sản phẩm bị thay đổi là chưa có cơ sở. Trường hợp chưa biết phương sai (σ2): Đối với trường hợp chưa biết phương sai tổng thể, cần phải xem xét hai trường hợp sau: a. Trường hợp mẫu nhỏ n
  8. độ lệch chuẩn hiệu chỉnh mẫu là 6 giờ và tuổi thọ trung bình của loại bóng đèn trên là đại lượng ngẫu nhiên phân phối chuẩn. Giải: Gọi µ là tuổi thọ trung bình của loại bóng đèn trên, theo giả thiết µ là đại lượng ngẫu nhiên phân phối chuẩn. Ta có bài toán kiểm định giả thiết tham số µ với n ≤ 30. B1. Phát biểu giả thiết: H0 : µ ≥ µ0 = 150 H1 : µ
  9. Vì công ty quan tâm đến việc cải tiến các dịch vụ của công ty thiết bị viễn thông có làm thỏa mãn khách hàng ở mức độ cao hơn so với trước hay không. Do đó ta đặt giải thiết: H0: µ ≤ µ0 = 75 H1: µ >µ0 = 75 B2. Chọn mức ý nghĩa α=0,05 B3. Xác định phương pháp kiểm đinh: Đây là bài toán kiểm định tham số trung bình, σ chưa biết, mẫu lớn hơn 30 B4. Tính giá trị kiểm định k qs ≡ U = (x − µ ) 0 n = (82 − 75 ) 350 = 6 , 2363 , s 8 B4. Tính giá trị kiểm định Với mức ý nghĩa α = 0,05 và đây là bài toán kiểm định một đuôi nên miền bác bỏ tương ứng trong trường hợp này có dạng: ⎧ ⎪ W α = ⎨U = ( x − µ0 ) n ⎫ ⎪ , U > U 1−α = U 0 , 95 = 1,645 ⎬ ⎪ ⎩ s' ⎪ ⎭ Với mức ý nghĩa 5%,vì U1-α=1,645 1,645 6,2363 Miền bác bỏ Kết luận: Vì kqs∈Wα nên giả thiết H0 bị bác bỏ, ta kết luận rằng với việc cải tiến các dịch vụ, công ty thiết bị viễn thông ATC đã làm cho thỏa mãn khách hàng ở mức độ cao hơn trước Kiểm định giả thiết tham số tỷ lệ Trong một số trường hợp, chúng ta cần kiểm định giả thiết về tham số tỷ lệ của các phần tử loại A (loại phần tử mà chúng ta muốn nghiên cứu) trong tổng thể (P), gọi fn là tỷ lệ của phần tử loại A có trong mẫu và P0 là một tỷ lệ đã được xác định trước. Quy trình kiểm định như sau: B1. Phát biểu giả thiết và đối thiết Đối xứng Phải Trái Giả thiết H0: P = P0 H0: P ≤ P0 H0: P ≥ P0 Đối thiết H1: P ≠ P0 H1: P > P0 H1: P < P0 B2. Lựa chọn mức ý nghĩa α=0,05 B3. Phương pháp kiểm định: Kiểm định tham số tỷ lệ các phần tử loại A có trong tổng thể. B4. Tính giá trị kiểm định: ( f n − P0 ) n k qs ≡ U = P0 (1 − P0 ) B5. Miền bác bỏ và kết luận: 139
  10. Với α cho trước, ta có miền bác bỏ Wα là: ⎧ ⎪ ( f − P0 ) n ;U ⎫ Wα = ⎨U = n ⎪ 1−α ⎬ ⎪ ⎩ P0 (1 − P0 ) ⎪ ⎭ Khi đó: U ≥ U 1−α kiểm định phía phải - bác bỏ H0 và chấp nhập H1 (hay P > P0). U ≤ −U 1−α kiểm định phía trái - bác bỏ H0 và chấp nhận H1 (hay P < P0). U ≥U α kiểm định đối xứng – bác bỏ H0 và chấp nhận H1 (hay P ≠ P0). 1− 2 Chúng ta so sánh kqs với Wα để đưa ra kết luận Các bước của bài toán kiểm định tham số tỷ lệ các phần tử loại A trong tổng thể được thể hiện trong bảng sau: KIỂM ĐỊNH THAM SỐ TỶ LỆ CỦA TỔNG THỂ 1. Giả thiết và đối thiết: Đối xứng Phải Trái Giả thiết H0: P = P0 H0: P ≤ P0 H0: P ≥ P0 Đối thiết H1: P ≠ P0 H1: P > P0 H1: P < P0 2. Xác định mức ý nghĩa 3. Phương pháp kiểm nghiệm tham số tỷ lệ tổng thể 4. Tiểu chuẩn kiểm định: ( f n − P0 ) n P = P0 (1 − P0 ) 5. Điểm tới hạn và miền bác bỏ: Đối xứng Phải Trái Điểm tới hạn - U1-α/2 và U1-α/2 U1-α - U1-α Miền bác bỏ PU1-α/2 P>U1-α P
  11. B4. Tính tiêu chuẩn kiểm định 219 ( − 0,42 ) 550 ( f n − P0 ) n k qs ≡ P = = 550 = − 1,037 P0 (1 − P0 ) 0,42 (1 − 0,42 ) Với mức ý nghĩa 5%, ta có thể xác định miền bác bỏ như sau: ⎧ ⎪ ( f − P0 ) n ⎫ ⎪ Wα = ⎨U = n , U > U α = U 0 , 975 = 1,96 ⎬ ⎪ ⎩ P0 (1 − P0 ) 1− 2 ⎪ ⎭ Thể hiện qua hình vẽ Miền bác bỏ Miền bác bỏ -1,96 -1,037 -1,96 Vì kqs∈Wα nên chúng ta bác bỏ giả thiết H0 và chấp nhập H1 có nghĩa thị phần của công ty đã thay đổi so với 42%. Kiểm định sự khác nhau giữa trung bình của hai tổng thể Điều kiện ứng dụng: Hai biến nghiên cứu (đại diện đo lường hai mẫu) phải là biến định lượng, tuân theo quy luật phân phối chuẩn và phương sai bằng nhau. Kiểm định tham số trung bình dựa trên hai biến (mẫu) độc lập a.Trường hợp đã biết phương sai σ2 của các mẫu Điều kiện để thực hiện phương pháp kiểm định sự khác biệt của hai trung bình tổng thể (dựa trên mẫu ngẫu nhiên độc lập) là dữ liệu mẫu phải theo luật phân phối chuẩn. B1. Giả thiết và đối thiết: Đối xứng Phải Trái Giả thiết H0: µx - µy = D0 H0: µx - µy ≤ D0 H0: µx - µy ≥ D0 Đối thiết H1: µx - µy ≠ D0 H1: µx - µy > D0 H1: µx - µy < D0 B2. Chọn mức ý nghĩa α B3. Xác định phương pháp kiểm định : Phương pháp kiểm định sự khác biệt tham số trung bình giữa hai mẫu (độc lập) – Phân phối chuẩn. B4. Xác định tiêu chuẩn kiểm định : x − y − D0 k qs ≡ U = σ x2 σy 2 + nx ny B5. Miền bác bỏ và kết luận: Miền bác bỏ với α cho trước : 141
  12. x − y − D0 Nếu H1 đúng tức µx - µy > D0, khi đó Wα: U = > U1−α σ 2 σy 2 x + nx ny Nếu H1 đúng tức µx - µy < D0, khi đó Wα: U = x − y − D0 < −U 1−α σ x2 σy 2 + nx ny Nếu H1 đúng tức µx - µy < D0, khi đó Wα : U = x − y − D0 ≥ U α σ x2 σy 2 1− 2 + nx ny Tính hệ số quan sát, so sánh với miền bác bỏ và kết luận. Ví dụ: Người ta tiến hành nghiên cứu về thời gian sử dụng trung bình của hai nhãn hiệu pin X và Y (cùng chủng loại) của hai nhà sản xuất khác nhau. Chọn ngẫu nhiên mỗi nhãn hiệu 100 viên pin kết quả ghi nhận được như sau: Pin X có thời gian sử dụng trung bình là 308 phút, độ lệch chuẩn 84 phút, các chỉ số tương tứng của pin Y lần lượt là 254 phút và 67 phút. Với mức ý nghĩa α = 0,10 ,có thể kết luận thời gian sử dụng trung bình của pin X lớn hơn pin Y ít nhất là 45 phút được không ? Biết thời gian sử dụng trung bình của hai nhãn hiệu pin trên là các đại lượng ngẫu nhiên phân phối chuẩn. Giải: Áp dụng phương pháp kiểm định sự khác biệt giữa hai trung bình tổng thể theo luật phân phối chuẩn (chưa biết σ và nx, ny 45 B2. Chọn mức ý nghĩa α=0.1 B3. Phương pháp kiểm định : Phương pháp kiểm định sự khác biệt giữa hai tham số trung bình khi σ đa biết B4. Tiêu chuẩn kiểm định : x − y − D0 308 − 254 − 45 k qs = = = 0 , 838 σ 2 σ 2 84 2 67 2 x + y + nx ny 100 100 B5. Miền bác bỏ với α=0,05 cho trước : Ta có Wα : x − y − D0 U= > U 1−α = U 0,90 = 1,28 σ x2 σy 2 + nx ny 142
  13. Minh họa bằng vẽ: 0,838 1,28 Miền bác bỏ Kết luận: vì kqs ∉ Wα nên ta chưa thể bác bỏ H0 và chấp nhận H1, tức là chưa có cơ sở để kết luận thời gian sử dụng trung bình của pin X có lớn hơn pin Y ít nhất là 45 phút. b.Trường hợp chưa biết σ2: • Trường hợp kích thước mẫu lớn (nx, ny ≥30): Trường hợp kích thước mẫu lớn (nx, ny ≥30) với giả định cả hai tổng thể X và Y phân phối chuẩn, ta có thể dùng công thức và quy tắc trên để kiểm định và với phương sai hiệu chỉnh mẫu s’2x, s’2y thay cho phương sai tổng thể kể cả trường hợp phân phối tổng thể không chuẩn. • Trường hợp kích thước mẫu nhỏ (nx
  14. Nếu H1 đúng tức µx - µy > D0, khi đó Wα: x − y − D0 btd T = ,2 ,2 > Tα s x + s y nx ny Nếu H1 đúng tức µx - µy < D0, khi đó Wα: x − y − D0 T = < − Tαbtd '2 '2 s s x y + nx ny Nếu H1 đúng tức µx - µy ≠ D0, khi đó Wα: x − y − D0 T = < − T αbtd '2 '2 s s x y 2 + nx ny Tính hệ số quan sát, so sánh với Wα và kết luận . Ví dụ: Kiểm tra chiều dài trung bình của một chi tiết được chế tạo từ hai thiết bị khác nhau một cách ngẫu nhiên, ta có : mẫu ngẫu nhiên 15 chi tiết của thiết bị thứ nhất có chiều dài trung bình là 100 cm và độ lệch chuẩn hiệu chỉnh là 5 cm ; mẫu ngẫu nhiên 10 chi tiết của thiết bị thứ hai có chiều daì trung bình là 110 cm và độ lệch chuẩn hiệu chỉnh là 3cm. Với mức ý nghĩa α = 0,05, hãy kết luận xem kích thước trung bình của chi tiết trên được chế tạo ở hai thiết bị trên có như nhau hay không. Biết chiều dài trung bình của chi tiết trên là đại lượng ngẫu nhiên phân phối chuẩn. Giải: Áp dụng phương pháp kiểm định sự khác biệt giữa hai trung bình tổng thể theo luật phân phối chuẩn (chưa biết σ và nx, ny
  15. 25 9 2 ( + ) btd = 15 10 = 22 , 84 25 2 9 2 ( ) ( ) 15 + 10 14 9 Minh họa bằng hình vẽ: -6,242 -2,074 2,074 Miền bác bỏ Miền bác bỏ Kết luận: kqs ∈ Wα, ta bác bỏ giả thiết H0 và chấp nhận đối thuyết H1, nghĩa là chiều dài trung bình của chi tiết được chế tạo ở hai thiết bị trên là khác nhau. Hai biến (mẫu) phối hợp từng cặp Điều kiện áp dụng: Khi tiến hình so sánh sự khác nhau giữa trung bình hai tổng thể, hai mẫu cần thỏa mãn điều kiện là dữ liệu phải tuân theo quy luật phân phối chuẩn và phương sai của hai mẫu phải bằng nhau. B1. Giả thuyết và đối thuyết: Đối xứng Phải Trái Giả thiết H0: µx - µy = D0 H1: µx - µy ≤ D0 H0: µx - µy ≥ D0 Đối thiết H1: µx - µy ≠ D0 H1: µx - µy > D0 H1: µx - µy < D0 B2. Lựa chọn mức ý nghĩa α B3. Lựa chọn phương pháp kiểm định: Phương pháp kiểm định sự khác nhau trung bình của hai tổng thể (mẫu phối hợp từng cặp), chúng ta dùng bảng phân phối chuẩn (nếu mẫu lớn hơn hoặc bằng 30) hay phân phối T-student (nếu mẫu nhỏ hơn 30) B4. Tiêu chuẩn kiểm định ( x − D0 ) n K ≡D = với x và s’d là trung bình và độ lệch chuẩn của n khác biệt. s'd B5. Miền bác bỏ với α cho trước: ( x − D0 ) n Nếu H0 : µx - µy > D0, khi đó Wα: T = > U1-α (hoặc -T(n-1);α nếu n
  16. KIỂM ĐỊNH THAM SỰ KHÁC NHAU HAI TRUNG BÌNH TỔNG THỂ (dựa trên sự phân phối từng cặp) 1. Giả thiết và đối thiết: Đối xứng Phải Trái Giả thiết H0: µx - µy =D0 H0: µx - µy ≤ D0 H0: µx - µy ≥ D0 Đối thiết H1: µx - µy ≠ D0 H1: µx - µy > D0 H1: µx - µy < D0 2. Xác định mức ý nghĩa 3. Phương pháp kiểm nghiệm sự khác nhau của hai trung bình tổng thể - Bảng phân phối chuẩn hoặc T-student (nếu n
  17. Với mức ý nghĩa α=0,05, có thể kết luận chiến dịch khuyến mãi đã làm tăng doanh số hay không? Giải: Gọi µx , µy lần lượt là doanh số trung bình sau và trước khi thực hiện chiến dịch khuyến mãi, µx , µy là đại lượng ngẫu nhiên tuân theo quy luật phân phối T-student (vì n=15 0 B2. Mức ý nghĩa α=0,05. B3. Phương pháp kiểm định: Kiểm định sự khác nhau giữa hai trung bình của tổng thể (hai mẫu phối hợp từng cặp). B4. Tính giá trị kiểm định: ( x − D0 ) n k qs ≡ D = với x và s’d là trung bình và độ lệch chuẩn của n khác biệt. s 'd Từ số liệu trên, ta tính được x =-1,2 và s’d = 5,78. Khi đó Kqs sẽ là: (x − D0 ) n − 1, 2 15 k qs = ' = = − 0 ,803 sd 5 , 78 B4. Miền bác bỏ và kết luận: (x − D 0 ) n Với H1: µx - µy > 0, khi đó Wα : T = >T(n-1);α = T(14),0,05 = 1,761 s' d Minh họa bằng hình vẽ: -0,803 1,761 Miền bác bỏ Kết luận: vì kqs không thuộc Wα nên chưa có cơ sở để bác bỏ giả thiết H0 và chấp nhận giả thuyết đối H1 ở mức ý nghĩa α=0,05, hay chiến dịch khuyến mãi của công ty vẫn chưa làm tăng doanh số. Kiểm định sự khác nhau giữa trung bình từ hai mẫu trở lên – Phân tích ANOVA (Gồm một biến định lượng và một biến phân loại (biến định tính)) Mục tiêu của phân tích phương sai là so sánh trung bình của nhiều tổng thể dựa trên các trung bình mẫu, đây là hình thức mở rộng của kiểm định T-student. Trong trường hợp biến phân loại có nhiều hơn 2, chúng ta thường sử dụng phân tích phương sai (ANOVA – Analysis of variance). Tại sao vây?, bởi vì khi sử dụng kiểm định t đối với hai mẫu độc lập, trong trường hợp biến phân loại có 3 hoặc nhiều hơn 3 nhóm, chúng ta phải thực hiện rất nhiều cặp (k) so sánh lẫn nhau từng đôi một, điều này dẫn đến một tình trạng là sai số của kiểm định sẽ lớn hơn rất nhiều so với mong muốn ban đầu. Ví dụ, mỗi một kiểm định Z hay t (kiểm định sự khác nhau tham số trung bình giữa hai mẫu độc lập) chứa đựng một sai số dạng I, tổng sai số của dạng I đối với k đôi giá trị trung bình bằng I=1-(1 - α)k. Trong một trường hợp cụ thể, giả sử chúng ta có một biến phân loại 147
  18. với 5 giá trị lựa chọn và α = 0,05, khi đó chúng ta sẽ có 10 so sánh nếu chúng ta dùng phương pháp kiểm định t. Sai số dạng I của kiểm định t khi đó sẽ là: I =1 – (1- α)k = 1- (1-0,05) = 1-(0,95)10 = 0.40 Trong trường hợp này, sai số để chúng ta bác bỏ giả thuyết H0 về bằng nhau của các giá trị trung bình ngay cả khi H0 đúng là 40% chứ không phải là 5% như ban đầu. Các điều kiện sử dụng: Các mẫu được rút ra theo cách ngẫu nhiên và độc lập (điều kiện này phải được đảm bảo), các tổng thể có phân phối chuẩn (hoặc gần phân phối chuẩn) và các tổng thể có cùng phương sai. Phân tích phương sai một chiều: (One-Way Analysis of Variance) Phân tích phương sai một chiều là phân tích dựa trên ảnh hưởng của một nhân tố định lượng đến một nhân tố định tính (dạng phân loại). Giả sử từ một biến phân loại, chúng ta có thể chia tổng thể thành k nhóm tuân theo quy luật phân phối chuẩn và có phương sai bằng nhau dựa trên k mẫu ngẫu nhiên độc lập gồm n1, n2,..., nk quan sát. Gọi xij là giá trị của biến định lượng đang nghiên cứu tại quan sát thứ j của nhóm thứ I, khi đó, x 1 , x 2 ,…, x k là giá trị trung bình của các nhóm, x là trung bình chung của tất cả các nhóm theo biến định lượng đang nghiên cứu. Gọi giá trị trung bình của các nhóm trong tổng thể là µ1, µ2,…, µk thì phương pháp phân tích phương sai sẽ cho phép chúng ta so sánh sự khác nhau giữa tham số trung bình của 2 hay nhiều nhóm có trong mẫu để suy rộng lên tổng thể. B1. Giả thiết và đối thiết trong phân tích phương sai một chiều được phát biểu như sau: H0: µ1= µ2 =… = µk H1: Tồn tại ít nhất một giá trị trung bình của nhóm thứ I (µi) khác với ít nhất một giá trị trung bình của nhóm còn lại. B2. Lựa chọn mức ý nghĩa α B3. Bài toán phân tích phương sai một chiều (One-way ANOVA). B4. Tính tiêu chuẩn kiểm định Để tính tiêu chuẩn kiểm định trong phân tích phương sai (ANOVA), chúng ta cần tiến hành tính các chỉ tiêu sau: - Tổng độ lệch bình phương giữa các nhóm (Sum of squares between groups): phản ánh biến thiên của biến định lượng đánh nghiên cứu do tác động của biến phân loại đang xem xét k SSG = ∑ ( x − x i ) 2 i =1 - Tổng độ lệch bình phương trong nội bộ nhóm (Sum of squares within groups) phản ánh biến thiên ngẫu nhiên do ảnh hưởng của các yếu tố khác không xem xét ở mẫu. k ni SSW = ∑ ∑ ( x ij − x i ) 2 i =1 j =1 - Tổng các độ lệch bình phương toàn bộ (Total sum of squares): phản ánh toàn bộ biến thiên của biến định lượng đang nghiên cứu. 148
  19. k ni SST = ∑∑ ( xij − x) 2 hay SST = SSW + SSG. i =1 j =1 - Phương sai giữa các nhóm (Mean squares between groups): SSG MSG = k −1 - Phương sai trong nội bộ các nhóm (Mean squares within groups): SSW MSW = n−k Lúc đó tiêu chuẩn kiểm định F (Fisher) được tính bằng: MSG F= MSW Chúng ta có thể tóm gọn cách tính thông qua bảng sau: ANOVA Sum of Squares df Mean Square F Sig. Between k SSG MSG SSG = ∑ ( x − x i ) 2 k-1 MSG = F= P(F) Groups i =1 k −1 MSW ni Within k SSW SSW = ∑∑ ( xij − x i ) 2 n-1 MSW = Groups i =1 j =1 n−k k ni SST = ∑ ∑ ( x ij − x ) 2 Total i =1 j =1 (SST=SSG+SSW) B5. Miền bác bỏ: Với α cho trước, chúng ta bác bỏ H0 nếu F>Fk-1,n-k,α với k-1 là bậc tự do của tử số và n-k là bậc tự do của mẫu số. Ví dụ: Công ty A là công ty chuyên phân phối bột giặt cho thị trường Thành phố Đà Nẵng, hiện tại công ty phân phối đến khách hàng thông qua 4 của hàng 1, 2, 3, 4. Để đưa ra những quyết định marketing phù hợp, công ty muốn xem xét có sự khác nhau trong doanh số bán của các cửa hàng hay không, số liệu thu thập trong một năm tại các cửa hàng được thể hiện ở bảng sau: ĐVT: triệu đồng Cửa hàng số 1 Cửa hàng số 2 Cửa hàng số 3 Cửa hàng số 4 Tháng 1 120 123 112 119 Tháng 2 123 143 127 134 Tháng 3 134 132 156 245 Tháng 4 123 153 176 256 Tháng 5 132 143 145 364 Tháng 6 111 164 204 373 Tháng 7 176 174 275 367 Tháng 8 192 184 284 283 149
  20. Tháng 9 145 142 195 293 Tháng 10 133 165 143 274 Tháng 11 126 102 134 246 Tháng 12 138 123 127 234 B1. Giả thuyết và đối thiết: H0: Doanh số bán trung bình hàng tháng của các cửa hàng là bằng nhau (µ1=µ2=µ3=µk) H1 : Tồn tại ít nhất một cửa hàng có doanh số bán khác với ít nhất một cửa hàng còn lại. B2. Mức ý nghĩa α=0,05 B3. Phương pháp kiểm định : Thực hiện phương pháp phân tích phương sai một chiều. B4. Tính tiêu chuẩn kiểm định : - Doanh số trung bình của cửa hàng số 1: 137,75 triệu - Doanh số trung bình của cửa hàng số 2: 145,67 triệu - Doanh số trung bình của cửa hàng số 3: 173,17 triệu - Doanh số trung bình của cửa hàng số 4: 265,67 triệu - Doanh số trung bình của hàng tháng của công ty là 180,56 triệu - Tham số SSG = 124176,56 - Tham số SSW = 121275,25 - Bậc tự do k-1=3 - Bậc tự do n-k = 44 - Tham số MSG = 41392,18 - Tham số MSW= 2756,25 - Hệ số Fisher (F) = 15,01 B5. Miền bác bỏ và kết luận: - Ta có Fk-1;n-k;α = F 3;47;0,05 = 2,816 - Vì F = 15,01 > 2,816 nên chúng ta bác bỏ H0, chấp nhận H1 có nghĩa là tồn tại ít nhất một của hàng có doanh số bán khác với doanh số bán của ít nhất một của hàng còn lại. Hồi quy tương quan (mối quan hệ giữa hai hay nhiều biến định lượng) Khi nghiên cứu mối quan hệ giữa hai hay nhiều biến định lượng, chúng ta có thể sử dụng phương pháp hồi quy, trong đói có một biến nguyên nhân (biến độc lập) và một biến kết quả (biến phụ thuộc). Trong phương pháp này người ta có thể tìm ra được mối quan hệ và mức độ tác động của biến nguyên nhân đến biến kết quả như thế nào. Giả sử chúng ta kiểm tra mối quan hệ tuyến tính giữa số năm làm việc trong doanh nghiệp với thu nhập. Khi đó, ta có thể thấy rằng biến phụ thuộc là biến thu nhập (biến Y) và biến độc lập là biến số năm làm việc (biến X) Điều kiên ứng dụng - Giá trị của biến X là hoàn toàn độc lập so với biến Y - Sai số trong mô hình phải tuân theo quy luật phân phối chuẩn - Trung bình các sai số của mô hình phải bằng không 150
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
6=>0