intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài thảo luận: Lý thuyết xác suất và thống kê toán

Chia sẻ: Dang Thi Nhung | Ngày: | Loại File: DOC | Số trang:16

939
lượt xem
96
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Cùng với lý thuyết ước lượng, lý thuyết kiểm định các giả thuyết thống kê là một bộ phận quan trọng của thống kê toán. Nó là phương tiện giúp ta giải quyết những bài toán nhìn từ góc độ khác liên quan đến dấu hiệu cần nghiên cứu trong tổng thể.

Chủ đề:
Lưu

Nội dung Text: Bài thảo luận: Lý thuyết xác suất và thống kê toán

  1. Bài thảo luận môn học: Lý thuyết xác suất và thống kê toán Nhóm 7 BÀI THẢO LUẬN Môn học: Lý thuyết xác suất và thống kê toán (Nhóm 7) Đề tài 3: Ước lượng mức chi tiêu trung bình hàng tháng và kiểm định lại tỷ lệ mức chi tiêu hàng tháng đến 1.4 triệu đồng là kho ảng 60% c ủa sinh viên ngoại tỉnh trường Đại học Thương Mại. Danh sách sinh viên: Lê Thị Ngoan 1. Hoàng Văn Nam 6. 2. Nguyễn Thị Nam Ngô Thị Ngọc 7. 3. Lê Thị Nga Đặng Thị Nhung 8. 4. Nguyễn Thị Nga Lê Thị Nhung 9. 5. Nguyễn Thị Ngà 10. Nguyễn Thị Hồng Nhung F2 1 Khoa: Kinh tế Thương Mại Trường : Đại học Thương Mại Hà Nội
  2. Bài thảo luận môn học: Lý thuyết xác suất và thống kê toán Nhóm 7 Lời mở đầu Thuật ngữ “Thống kê” đầu tiên bắt nguồn từ tiếng Latinh “ Statistium collegium” (Hội đồng chính quyền) và một từ tiếng Ý “Statista” (Ng ười làm cho chính quyền hay người làm chính trị). Trong thế kỷ XIX, thuật ngữ “Thống kê” được hiểu một cách phổ biến là thu thập và phân loại dữ liệu được sử dụng để đáp ứng nhu c ầu c ủa chính ph ủ và các cơ quan quản lý. Ngày nay, thống kê được sử dụng rộng rãi hơn nhiều so với xuất phát điểm đầu tiên là phục vụ cho chính quyền hay chính phủ mà còn có các tổ chức và các cá nhân sử dụng thống kê để phân tích dữ liệu và đưa ra các quyết định. Thống kê là một trong những công cụ quản lý vĩ mô quan trọng, cung cấp các thông tin thống kê trung thực, khách quan, chính xác, đầy đủ, kịp thời trong việc đánh giá, dự báo tình hình, hoạch định chiến lược, chính sách,xây d ựng k ế hoạch nhằm phát triển kinh tế - xã hội và đáp ứng nhu cầu thông tin th ống kê của các tổ chức, cá nhân. Cùng với lý thuyết ước lượng, lý thuyết kiểm định các giả thuy ết th ống kê là một bộ phận quan trọng của thống kê toán. Nó là phương ti ện giúp ta gi ải quyết những bài toán nhìn từ góc độ khác liên quan đến dấu hiệu c ần nghiên cứu trong tổng thể. Trong quá trình học đại học, bài thảo luận về phần thống kê sẽ giúp chúng ta phần nào áp dụng những công thức vào thực tiễn và từ đó đưa ra nh ững k ết luận khách quan mà những con số muốn nói đến. Cụ thể h ơn đó là công vi ệc nghiên cứu về “số tiền chi tiêu của sinh viên ngoại tỉnh trường ĐHTM ” được thực hiện bởi các thành viên nhóm 7. Hơn nữa là trong thống kê, một ước lượng là một giá trị được tính toán t ừ một mẫu thử và người ta hi vọng đó là giá trị tiêu biểu trong giá trị cần xác định. Cũng với ý nghĩa như vậy, nhóm làm đề tài về ước lượng số tiền chi tiêu trung bình của sinh viên ngoại tỉnh ttường ĐHTM và mong muốn đ ưa ra cái nhìn tổng quát về số tiền chi tiêu trung bình thông qua số liệu thực tế mà nhóm thu thập được từ 150 bạn sinh viên khóa 44, 45, 46, 47. 2 Khoa: Kinh tế Thương Mại Trường : Đại học Thương Mại Hà Nội
  3. Bài thảo luận môn học: Lý thuyết xác suất và thống kê toán Nhóm 7 Sau khi thực hiện bài toán ước lượng, nhóm sẽ tiến hành kiểm định xem tỷ lệ sinh viên ngoại tỉnh trường ĐHTM có mức chi tiêu hàng tháng đến 1.4 triệu đồng là khoảng 60% có đúng hay không? Với một sinh viên từ nơi khác lên thành phố học tập thì tiền sinh hoạt hằng tháng đáng lo h ơn nhi ều, nh ất là th ời buổi giá cả leo thang như hiện nay. Sinh viên thuộc diện chính sách, gia đình khó khăn hoặc có hoàn cảnh đặc biệt có thể được bố trí vào ở ký túc xá (KTX) c ủa trường. Những sinh viên không đủ điều kiện để được ở trong KTX của trường thì phải thuê phòng trọ ở bên ngoài và họ sẽ phải đối mặt với rất nhi ều kho ản chi tiêu. Vì vậy nhóm làm đề tài nhận th ấy đây là một đ ề tài r ất thú v ị không ch ỉ giúp chúng tôi hiểu hơn về những lí thuyết thống kê thầy cô dạy trên lớp mà còn có được những cái nhìn thiết thực, phản ánh một phần nào đó cu ộc s ống xa gia đình của những bạn sinh viên . Thực sự đây là cơ hội rất tốt để chúng tôi có th ể hoàn thi ện ki ến th ức c ủa mình cho môn học đồng thời cũng là cơ hội để được làm việc theo nhóm. Bài thảo luận này được xây dựng dựa trên cơ sở của: giáo trình Lý thuyết xác suất và thống kê toán của trường Đại học Thương Mại, giáo trình Lý thuy ết xác suất và thống kê toán của trường Đại học Kinh Tế Quốc Dân cùng với các kiến thức đã tiếp thu được từ các bài giảng của gi ảng viên b ộ môn tr ường Đ ại học Thương Mại. Do thời gian, điều kiện và khả năng có h ạn, bài th ảo lu ận nhóm chúng tôi không tránh khỏi những khiếm khuyết. Chúng tôi rất mong nhận được sự cảm thông, chia sẻ và góp ý từ phía các giảng viên, các bạn sinh viên và nh ững ai quan tâm để bài thảo luận nhóm được hoàn thiện hơn. Hà Nội, ngày 21tháng 11 năm 2011 Sinh viên nhóm 7 3 Khoa: Kinh tế Thương Mại Trường : Đại học Thương Mại Hà Nội
  4. Bài thảo luận môn học: Lý thuyết xác suất và thống kê toán Nhóm 7 NỘI DUNG THẢO LUẬN I. Ứng dụng và hạn chế của thống kê Thống kê toán là một nhánh của toán ứng dụng sử dụng lý thuyết và phân tích xác suất để nghiên cứu cơ sở lý thuyết toán học của khoa học th ống kê nh ư các luật phân phối. 1. Ứng dụng của thống kê trong kinh tế xã hội. Thống kê hiện nay đã được ứng dụng trong mọi lĩnh vực. Trong các lĩnh vực xã hội nói chung và trong kinh tế nói riêng, thống kê đóng vai trò là công c ụ cơ bản quan trọng trong việc nhận thức tình hình và hỗ trợ ra quyết định: − Chính phủ sử dụng những kết luận đưa ra từ những đưa ra từ những dữ liệu gần nhất về thất nghiệp và lạm phát để đưa ra các chính sách. − Các nhà đầu tư chứng khoán sử dụng những xu hướng gần đây nhất về giá của thị trường chứng khoán để đưa ra những quyết định đầu tư. − Doanh nghiệp sử dụng dữ liệu phân bố về sở thích của người tiêu dùng để quyết định sản phẩm nào được sản xuất, phát triển và đưa vào thị trường. − Nhà sản xuất sử dụng dữ liệu sản xuất để đánh giá, diều khiển và cải thiện chất lượng sản phẩm. − Các nhà điều tra xã hội học dựa vào thông tin đi ều tra trên m ột s ố nhóm đối tượng để đưa ra kết luận chung về xu hướng nào đó của toàn xã hội. 2. Những hạn chế của thống kê. Thống kê vẫn có những hạn chế và có thể bị lợi dụng để đưa ra những kết luận không phù hợp với thực tế. Đặc biệt, khi cả người làm thống kê l ẫn ng ười đọc kết quả thống kê không hiểu một cách sâu sắc vào bản chất của thống kê. − Thống kê thường bị dùng sai có chủ ý qua việc diễn giải dữ liệu có lợi cho người trình bày.Chọn ( hoặc bác bỏ, hoặc thay đổi) 1 giá tr ị nào đó cũng có thể điều khiển được kết quả . Đây có th ể là sự lừa đ ối có ch ủ ý, ho ặc sai l ệch không chủ ý và khó nhận thấy của người nghiên cứu. 4 Khoa: Kinh tế Thương Mại Trường : Đại học Thương Mại Hà Nội
  5. Bài thảo luận môn học: Lý thuyết xác suất và thống kê toán Nhóm 7 − Bối cảnh nghiên cứu, dữ liệu quan sát theo những phương pháp khác nhau, thủ tục tiến hành nghiên cứu khác nhau. Và khi người đ ọc k ết qu ả th ống kê không nắm vững hoặc các phương tiện truyền thông đơn giản hóa quá mức thông tin, sẽ dẫn tới vấn đề bị hiểu sai và do đó sự m ất lòng ti c ủa công chúng về thống kê tăng lên. II. Cơ sở lý thuyết và áp dụng vào bài tập. 1. Ước lượng. Giả sử cần nghiên cứu dấu hiệu X trên một đám đông nào đó. Một trong những mục tiêu cơ bản của việc nghiên cứu là xác định các tham số đặc trưng của X như trung bình của đám đông µ = E(X), phương sai của đám đông σ² =Var(X)… Những tham số này thường chưa biết vì chúng ta không chủ trương điều tra cả đám đông. Chúng ta sẽ đi ước lượng các tham số nói trên. Để thuận tiện, ta kí hiệu chung cho tham s ố của đám đông c ần nghiên c ứu là θ. Có 2 phương pháp ước lượng θ là ước lượng điểm và ước lượng khoảng. a, Ước lượng điểm. Ta lấy mẫu ngẫu nhiên có kích thước n: W = ( X1,X2,…,Xn). Tùy thuộc vào θ, xây dựng thống kê θ* = f( X1,X2,…,Xn) (θ là một hằng số còn θ* là một ĐLNN). Khi đó với mẫu cụ thể w = (x 1,x2,…,xn) ta tính toán được giá trị cụ thể của thống kê θ* = f(x1,x2,…,xn) là ước lượng của θ . Cùng với một mẫu ngẫu nhiên có thể xây dựng nhiều thống kê θ* khác nhau để ước lượng cho tham số θ . Vì vậy, ta cần lựa chọn thống kê tốt nhất để ước lượng cho tham số θ dựa vào các tiêu chuẩn sau: b, Các tiêu chuẩn đánh giá bản chất tốt của ước lượng * Ước lượng không chệch Thống kê θ* được gọi là ước lượng không chệch của θ nếu E(θ*)= θ. Ngược lại nếu E(θ*) ≠θ thì ta nói θ* là ước lượng chệch của θ. 5 Khoa: Kinh tế Thương Mại Trường : Đại học Thương Mại Hà Nội
  6. Bài thảo luận môn học: Lý thuyết xác suất và thống kê toán Nhóm 7 Ta có: là ước lượng không chệch của µ. S’2 là ước lượng không chệch của σ2. Nếu θ* là ước lượng chệch của θ song thỏa mãn điều kiện: * lim E(θ )=θ n Thì θ* được gọi là ước lượng tiệm cận không chệch của θ. * Ước lượng vững. Thống kê θ* được gọi là ước lượng vững của θ nếu với mọi ε >0 ta có: lim P ( θ * − θ < ε ) = 1 n Theo định lí Trebusep thì là ước lượng vững của µ. Theo định lí Bernoulli thì tần suất mẫu f là ước lượng vững của tỉ lệ đám đông p. Nếu θ* là ước lượng không chệch của θ và lim Var(θ * ) = 0 n Thì θ* là ước lượng vững của θ. * Ước lượng hiệu quả. Thống kê θ* là ước lượng hiệu quả của θ của ĐLNN gốc X, nếu nó là ước lượng không chệch và có phương sai nhỏ nhất so với mọi ước lượng không chệch khác được xây dựng trên cùng một mẫu. Ta có: là ước lượng hiệu quả của µ. Tần suất mẫu f là ước lượng hiệu quả của tỉ lệ đám đông p. Đương nhiên, nếu θ*1và θ*2 là hai ước lượng không chệch của θ mà Var(θ*1)
  7. Bài thảo luận môn học: Lý thuyết xác suất và thống kê toán Nhóm 7 c, Ước lượng bằng khoảng tin cậy. Các phương pháp ước lượng điểm nói trên tuy có ưu điểm là đơn gi ản nhưng cũng có nhược điểm là không cho biết sai số và không chỉ ra được kh ả năng mắc sai lầm khi ước lượng la bao nhiêu. Đặc bi ệt, khi kích th ước m ẫu bé thì ước lượng điểm có thể sai lệch rất nhiều so với giá trị của tham s ố c ần ước lượng. Mặt khác phương pháp trên cũng không thể đánh giá được khả năng mắc sai lầm khi ước lượng là bao nhiêu. Do đó, khi kích thước mẫu bé người ta thường dùng phương pháp ước lượng khoảng tin cậy. Để ước lượng tham số θ của ĐLNN X trước hết từ đám đông ta lấy mẫu ngẫu nhiên kích thước n: W = ( X1,X2,…,Xn). Từ ước lượng điểm tốt nhất của θ xây dựng thống kê G = f ( X1,X1,...,Xn,θ) sao cho quy luật phân phối xác suất của G hoàn toàn xác đ ịnh, không ph ụ thu ộc vào tham số θ (nhưng thống kê G thi hoàn toàn phụ thuộc vào θ). Với xác suất γ = 1- α cho trước ta xác định cặp giá trị α1 , α2 thỏa mãn các điều kiện α1 ≥ 0 , α2 ≥ 0 và α1+α2 =α. Từ quy luật phân phối xác suất của G Từ đó xác định được phân vị g1-α1 và gα2 sao cho: P( G> g1-α1)= 1- α1 và P(G> gα2)= α2 Khi đó: P(g1-α1 < G < gα2) = 1- α = γ Cuối cùng bằng biến đổi tương đương ta có: P(θ*1 < θ< θ*2) = 1- α = γ Trong đó: γ = 1- α được gọi là độ tin cậy. Khoảng (θ*1, θ*2) được gọi là khoảng tin cậy. Độ dài I= θ*2 - θ*1 được gọi là độ dài của khoảng tin cậy. Chú ý: Thường chọn độ tin cậy khá lớn. Khi đó theo nguyên lí xác suất lớn: “ Nếu một biến cố có xác suất khá gần 1 thì trong th ực hành ta có th ể coi nó s ẽ 7 Khoa: Kinh tế Thương Mại Trường : Đại học Thương Mại Hà Nội
  8. Bài thảo luận môn học: Lý thuyết xác suất và thống kê toán Nhóm 7 xảy ra trong một lần thực hiện phép thủ” thì biến cố (θ*1 < θ < θ*2 ) hầu như chắc chắn xảy ra trong một lần lấy mẫu. d, Đối với bài tập thảo luận của nhóm, có dạng ước l ượng v ề kỳ v ọng toán của 1 ĐLNN X chưa biết quy luật phân phối nhưng n > 30. Giả sử dấu hiệu X cần nghiên cứu trên đám đông có : E(X) = µ , Var(X) = σ , trong đó: - µ chưa biết, cần ước lượng. - E(X) : kỳ vọng toán của đại lượng ngẫu nhiên X. - Var(X) : phương sai của ĐLNN X. Từ đám đông ta lấy một mẫu kích thước n : W = ( X , X , …, X ). T ừ m ẫu này ta tính được: 1 =X S’ = (X − ) n −1 Với: : trung bình mẫu của ĐLNN X S’ : phương sai mẫu điều chỉnh σ2 Vì n > 30 ⇒ ≈N(µ, ) n X −µ N ( 0;1) U= ⇒ Khi đó σ/ n Cụ thể vào bài tập thuộc đề tài thảo luận của nhóm, với độ tin cậy γ = 1-α ta tìm được phân vị uα/2 sao cho: P(│U│< uα/2) ≈1-α = γ Thay biểu thức của U vào và biến đổi tương đương ta có: P(│-µ│< (σ.uα/2)/ n ) ≈ 1-α = γ P(- ε < µ < +ε) ≈1-α = γ 8 Khoa: Kinh tế Thương Mại Trường : Đại học Thương Mại Hà Nội
  9. Bài thảo luận môn học: Lý thuyết xác suất và thống kê toán Nhóm 7 Trong đó: ε = (σ.uα/2)/ n Khi đó: Độ tin cậy của ước lượng là: 1-α = γ Khoảng tin cậy đối xứng là (- ε, +ε) Độ dài khoảng tin cậy là: 2ε Sai số của ước lượng là: ε Chú ý: Do σ chưa biết vì n > 30 nên ta lấy σ ≈ s’ e, Áp dụng vào bài làm của nhóm. Đề bài: Phỏng vấn 150 sinh viên ngoại tỉnh trường đại học Thương Mại về số tiền chi tiêu trong một tháng được bảng số liệu sau ( đơn vị triệu đồng/ tháng): Ta có bảng sau: Mức chi 1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 2 2.2 2.3 2.5 3 4 tiêu xi Số sinh 7 1 11 1 1 38 5 19 14 35 4 2 10 1 1 viên ni Với độ tin cậy 95% hãy ước lượng mức chi tiêu trung bình hàng tháng c ủa sinh viên ngoại tỉnh trường đại học Thương mại. Bài làm Gọi X là mức chi tiêu hàng tháng của sinh viên ngoại tỉnh trường ĐHTM. là mức chi tiêu hàng tháng của sinh viên ngoại tỉnh trường ĐHTM xét trên mẫu. µ là mức chi tiêu hàng tháng của sinh viên ngoại t ỉnh trường ĐHTM xét trên đám đông. Ta có bảng sau: 9 Khoa: Kinh tế Thương Mại Trường : Đại học Thương Mại Hà Nội
  10. Bài thảo luận môn học: Lý thuyết xác suất và thống kê toán Nhóm 7 Mức chi tiêu xi Số sinh viên ni x2i.ni xi.ni 1 7 7 7 1.1 1 1.1 1.21 1.2 11 13.2 15.84 1.3 1 1.3 1.69 1.4 1 1.4 1.96 1.5 38 57 85.5 1.6 5 8 12.8 1.7 19 32.3 54.91 1.8 14 25.2 45.36 2 35 70 140 2.2 4 8.8 19.36 2.3 3 4.6 10.58 2.5 10 25 62.5 3 1 3 9 4 1 4 16 Tổng 150 261.9 483.71 k () 1� 2� 1 k x= ni xi = 1.746 s' = ni xi2 − n x � 1.489 = 2 n −1 �1 n � � i= i =1 s ' = s '2 = 1.220 = σ Khi đó: do n =150 >30 Ta chưa biết quy luật phân phối xác suất của X 10 Khoa: Kinh tế Thương Mại Trường : Đại học Thương Mại Hà Nội
  11. Bài thảo luận môn học: Lý thuyết xác suất và thống kê toán Nhóm 7 σ2 Vì n>30 nên ≈ N ( µ , ) n Khi đó : Với độ tin cậy 1-α ta tìm được phân vị uα/2 sao cho: P(│U│< uα/2) ≈ 1-α Thay biểu thức của U vào và biến đổi tương đương ta có: P(│-µ│< (σ.uα/2)/ n ) ≈ 1-α ⇔ P(- ε < µ < + ε) ≈ 1-α 1.220 1.220 Trong đó: ε = (σ.uα/2) / n = u0,025 = x1.96 = 0.1952 150 150 ⇒ 1.746 - 0.1952 < µ < 1.746 +0.1952 ⇔ 1.5508 < µ < 1.9412 Kết luận: Với độ tin cậy 95% có thể nói rằng mức chi tiêu trung bình hàng thángcủa sinh viên ngoại tỉnh trường ĐHTM nằm trong khoảng từ 1.5508 tri ệu đồng đến 1.9412 triệu đồng. 2. Kiểm định a, Khái niệm kiểm định giả thuyết thống kê. Trong thực tế, thường gặp những vấn đề: phải kiểm tra xem điều gì đó đúng hay sai, nội dung thông tin mà ta nh ận đ ược t ừ các ngu ồn cung c ấp, ngu ồn tài liệu… có tin cậy hay không. Công việc ki ểm tra lại nội dung thông tin mà ta nhận được có tin cậy không chính là bài toán kiểm định. Như ta đã biết, vì không điều tra cả đám đông nên ta không bi ết d ạng phân phối xác suất của dấu hiệu cần nghiên cứu X trên đám đông, hoặc có thể biết dạng phân phối xác suất của X nhưng chưa biết đặc trưng nào đó c ủa nó. Ta có thể đưa ra những nhận xét khác nhau về các yếu tố ch ưa biết, đó là các gi ả thuyết thống kê. Ví dụ: Ta có thể có những giả thuyết thống kê sau: 11 Khoa: Kinh tế Thương Mại Trường : Đại học Thương Mại Hà Nội
  12. Bài thảo luận môn học: Lý thuyết xác suất và thống kê toán Nhóm 7 ĐLNN X phân phối theo quy luật chuẩn. Tham số θ của X bằng θ*… Định nghĩa: Giả thuyết về dạng phân phối xác suất của ĐLNN, về các tham số đặc trưng của ĐLNN hoặc về tính độc lập c ủa các ĐLNN đ ược g ọi là giả thuyết thống kê, ký hiệu là H. Giả thuyết H đươc đưa ra kiểm định được gọi là giả thuy ết g ốc, đó là gi ả thuyết ta đang nghi ngờ. Một giả thuyết trái với giả thuy ết gốc đ ược g ọi là đ ối thuyết, ký hiệu là H. ta quy ước khi đã chọn cặp gi ả thuy ết H và H, thì vi ệc bác bỏ H0 tức là chấp nhận H và ngược lại, H và H lập thành m ột gi ả thuy ết th ống kê. Công việc tiến hành theo một quy tắc hay một thủ tục nào đó để từ một mẫu cụ thể được lấy ra từ đám đông cho phép ta đi đén quy ết định: ch ấp nh ận hay bác bỏ một giả thuyết thống kê được gọi la kiểm định giả thuyết thống kê. b, Phương pháp kiểm định một giả thuyết thống kê Nguyên tắc chung của việc kiểm định giả thuyết thống kê là sử dụng nguyên tắc xác suất nhỏ “nếu một biến cố có xác suất khá bé thì trong thực hành ta có thể coi nó không xảy ra trong một lần thực hiện phép thử ”. * Tiêu chuẩn kiểm định. Xét một cặp giả thuyết thống kê H , H. Từ đám đông ta chọn ra một mẫu ngẫu nhiên kích thước n : W = (X1, X, … , X ). Từ mẫu này ta xây dựng một thống kê: G = f ( X, X, …, X ; θ ). Trong đó: θ là tham số liên quan đến H sao cho nếu H đúng thì quy lu ật phân phối xác suất của G hoàn toàn xác định. Thống kê như vậy gọi là tiêu chuẩn kiểm định (TCKĐ). * Miền bác bỏ, quy tắc kiểm định. Để xây dựng miền bác bỏ, ta sử dụng nguyên lý xác su ất nh ỏ. Vì bi ết quy luật phân phối xác suất của G, nên với một xác suất α khá bé cho trước ta có 12 Khoa: Kinh tế Thương Mại Trường : Đại học Thương Mại Hà Nội
  13. Bài thảo luận môn học: Lý thuyết xác suất và thống kê toán Nhóm 7 thể tìm được miền W, gọi là miền bác bỏ, sao cho nếu giả thuy ết H đúng thì xác suất để G nhận giá trị thuộc miền W = α. P(G∈W/H)=α (*) Từ đám đông ta lấy ra một mẫu cụ thể kích thước n : w = ( x , x ,…., x , ta tìm được giá trị thực nghiệm g = f( x , x ,…., x ; θ ) mà: - nếu g ∈ W thì bác bỏ H, chấp nhận H - nếu g ∉ W thì chưa có cơ sở bác bỏ H * Các bước kiểm định giả thuyết thống kê: - B: xây dựng bài toán - B : xây dựng tiêu chuẩn kiểm định G và khi H đúng thì G có quy luật phân phối xác định - B : tìm miền bác bỏ W - B : tính g và kết luận. *Các loại sai lầm: • Sai lầm loại 1: là sai lầm bác bỏ giả thuyết H 0 khi chính H0 đúng. Ta thấy xác suất mắc sai lầm loại 1 bằng α. Thật vậy, theo quy tắc kiểm định trên, từ một mẫu cụ thể sau khi tính được gtn mà thấy g tn ∈ Wα thì bác bỏ H0. Nhưng thực ra theo công thức (*) trên thì biến cố (G ∈Wα/H0) vẫn có thể xảy ra với xác suất bằng α. α được gọi là mức ý nghĩa. • Sai lầm loại 2: là sai lầm chấp nhận H 0 khi chính nó sai.Nếu ký hiệu xác suất mắc sai lầm loại 2 là β thì ta có: P (G �Wα / H1 ) = β ( ) Vì biến cố G Wα / H1 và biến cố (G∈Wα/H1)là hai biến cố đối lập, nên: P(G∈Wα/H1) = 1 - β Xác suất 1 - β được gọi là lực kiểm định. 13 Khoa: Kinh tế Thương Mại Trường : Đại học Thương Mại Hà Nội
  14. Bài thảo luận môn học: Lý thuyết xác suất và thống kê toán Nhóm 7 Sai lầm loại 1 và sai lầm loại 2 có quan h ệ mật thi ết v ới nhau: khi kích thước mẫu xác định, nếu giảm α thì β tăng và ngược lại. Do đó, không thể lấy α bé tùy ý được. c, Đối với bài tập thảo luận của nhóm, có dạng kiểm định gi ả thuy ết v ề tỷ lệ của đám đông. Giả sử trên một đám đông, tỷ lệ phần tử mang dấu hiệu A là p. Với mức ý nghĩa α, ta cần kiểm định giả thuyết H0 : p = p0. Chọn từ đám đông mấu có kích thước n từ đó ta tìm được f là tỷ lệ mang dấu hiệu A trên mẫu. Với n đủ lớn khi thỏa mãn một trong ba điều kiện : { p q { − nf >10 np >5 q p 1( 1− f ) >10 < 0.3 nq uα/2) = α. Vì α khá bé, theo nguyên lý xác suất nhỏ ta có miền bác bỏ: Wα= {utn: tn> uα/2 } u 14 Khoa: Kinh tế Thương Mại Trường : Đại học Thương Mại Hà Nội
  15. Bài thảo luận môn học: Lý thuyết xác suất và thống kê toán Nhóm 7 f − p0 utn = trong đó: p0 q0 n - nếu u ∈ W ⇒ bác bỏ H chấp nhận H. - nếu u ∉ W ⇒ chưa có đủ cơ sở bác bỏ H. d, Áp dụng vào bài làm của nhóm. Đề bài: Phỏng vấn 150 sinh viên ngoại tỉnh trường ĐHTM về mức chi tiêu (MTC) trong một tháng được bảng số liệu sau: Đơn vị: triệu đồng/ tháng MCT 1. 1. 1. 1. 1. 1. 1. 1. 2. 2. 2. 1 2 34 (Xi) 1 2 3 4 5 6 7 8 2 3 5 3 Số SV(ni) 7 1 11 1 1 38 5 19 14 4 3 10 1 1 5 Với mức ý nghĩa 0,05 có thể nói rằng tỷ lệ sinh viên ngo ại t ỉnh tr ường ĐHTM có mức chi tiêu hàng tháng đến 1.4 triệu đồng là khoảng 60 % có đúng hay không? Bài làm Gọi p là tỷ lệ của sinh viên ngoại tỉnh có mức chi tiêu hàng tháng đến 1.4 triệu đồng trên đám đông. Gọi f là tỷ lệ sinh viên ngoại tỉnh có mức chi tiêu hàng tháng đ ến 1.4 tri ệu đồng trên mẫu. Theo bài ra ta có, tỷ lệ sinh viên ngoại tỉnh có m ức chi tiêu hàng tháng đ ến 1.4 triệu đồng là khoảng 60% nên p0 = 0.6 Mặt khác, theo số liệu thu được thì số sv có mức chi tiêu đ ến 1.4 tri ệu đồng ở bảng trên là 21 người trong số 150 người đã điều tra được. ⇒ f = 21/150 = 0.14 15 Khoa: Kinh tế Thương Mại Trường : Đại học Thương Mại Hà Nội
  16. Bài thảo luận môn học: Lý thuyết xác suất và thống kê toán Nhóm 7 { H 0 : p = p0 Với mức ý nghĩa α = 0,05 cần kiểm định: H1 : p p0 � pq � Do n =150 là lớn nên f ; N �; p � � n� f − p0 U= p0 q0 XDTCKĐ: n Nếu giả thiết H0 đúng thì U ≈ N ( 0 ; 1 ) Với mức ý nghĩa α, ta tìm được phân vị chuẩn uα/2 sao cho P(  uα/2) = α. U> Vì α khá bé, theo nguyên lý xác suất nhỏ (  utn ) được coi là không xảy ra U> f − p0 utn = trong thực tế,nên trong một lần lấy mẫu ta tìm được: p0 q0 n Mà  tn > u= thì giả thiết H0 tỏ ra không đúng u ⇒ Miền bác bỏ Wα= {utn: tn> uα/2} u ⇒ Wα={utn: tn> uα/2 = u0.025= 1.96} u Mặt khác 0.14 − 0.6 −0.46 utn = = = −11.5 0.6(1 − 0.6) 0.04 150 ⇒  tn 11.5 > 1.96 ⇒ utn ∈ Wα ⇒ bác bỏ H0 u= Kết luận: Với mức ý nghĩa 0,05 ta có thể nói rằng mức chi tiêu trung bình của sinh viên ngoại tỉnh trường ĐHTM đến 1.4 triệu đồng/tháng không phải là 60%. 16 Khoa: Kinh tế Thương Mại Trường : Đại học Thương Mại Hà Nội
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
18=>0