YOMEDIA
ADSENSE
Bài giảng 6sigma: Thống kê cơ bản
29
lượt xem 3
download
lượt xem 3
download
Download
Vui lòng tải xuống để xem tài liệu đầy đủ
Sau khi học xong bài giảng này, bạn sẽ nắm được nhu cầu về thống kê; nắm được các khái niệm cơ bản của phương thức dùng để nhận biết đặc điểm dữ liệu và nắm được cách tính xác suất và các thống kê cơ bản sử dụng phần mềm thống kê minitab. Mời các bạn tham khảo!
AMBIENT/
Chủ đề:
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Bài giảng 6sigma: Thống kê cơ bản
- Thố ng kê cơ ban ̉ Phân tích thống kê cơ ban ̉ Phân bố xác xuất rời rac ̣ Phân bố xác xuất liên tuc̣ Muc tiêu hoc tâp ̣ ̣ ̣ Nắm được nhu cầu về thống kê Nắm được các khái niệm cơ bản của phương thức dùng để nhận biết đặc điểm dữ liệu Nắm được khái niệm cơ bản của phân bố xác suất Nắm được cách tính xác suất và các thống kê cơ bản sử dụng phần mềm thống kê minitab
- Thố ng kê cơ ban? ̉ Đinh nghi ̣ ̃ a về thố ng kê Quá trình tính toán số lần, tần suất hoặc tỉ lệ… thể hiện các đặc điểm của dữ liệu bằng cách phân tích, tổng hợp dữ liệu cụ thể hoặc thông tin hay là các giá trị tính được bằng số. Sử dung thô ̣ ́ ng kê – trong 6 Sigma Được sử dung đê phân ti ̣ ̉ ́ch dữ liêu (vd. nh ̣ ững giá tri đăc tr ̣ ̣ ưng) được thu thâp ̣ từ giai đoan đo l ̣ ường. Định lượng dữ liệu biểu thị đặc tính quá trình X’s và Y’s Dùng để ước tính tương lai với dữ liệu đã có trong quá trình hoạt động. Dùng như là một cơ sở để giải quyết các vấn đề phức tạp về thống kê
- Phân loai vê ̣ ̀ thố ng kê Thố ng kê mô ta ̉ Các thống kê liên quan đến những đặc điểm cơ bản của dữ liệu. Chúng cung cấp những phần tóm tắt đơn giản về dữ liệu thống kê (với các thống kê mô tả đơn giản bạn chỉ mô tả những gì dữ liệu thể hiện). Mục đích chính của thống kê mô tả là mô tả thuộc tính /đặc điểm của nhóm thống kê đã quan sát Thố ng kê suy luân ̣ Thống kê cố gắng xác định các đặc trưng bằng cách phân tích mẫu thu được từ một tập hợp
- Khá i quá t về thố ng kê cơ ban ̉ Cầ n thiế t cho thố ng kê Khái niệm thống kê – thứ ngôn ngữ dựa trên thực tế chứ không phải trực giác. Thống kê hỗ trợ việc đưa ra quyết định trong những tình huống chưa chắc chắn bằng cách thu thập, phân tích và biên dịch dữ liệu. Đây là lầ n Vây thi ̣ ̀ đầ u tiên trong ,đây là lầ n 19 năm qua, nó ng nhấ t nhiêt đô v ̣ ̣ ượt cho chú ng quá ngưỡ ng ta… Thố ng kê cung cấ p nhữ ng thông tin 38℃ cơ ban câ ̉ ̀ n thiế t cho viêc quyê ̣ ́ t đinh. ̣ Điên năng tiêu thu ti ̣ ̣ ́ nh trên đầ u ngườ i đã tăng Thât không? ̣ 3 lầ n kê t ̉ ừ năm 1980 Chú ng ta phai đâ ̉ ̀ u tư xây dựng nhiề u nhà má y năng lượng hơn nữ a… Thố ng kê? Biế n đôi th ̉ ực tế thà nh nhữ ng con số !
- Thố ng kê cơ ban ̉ Thống kê nhận biết các đặc trưng của tập hợp cho trước từ một mẫu Tâp h ̣ ợp >
- Cách bạn phân tích dữ liệu phụ thuộc vào kiểu dữ liệu bạn đang gặp. Vì vậy, bạn cần phải phân loại dữ liệu trước. Đinh nghi ̣ ̃ a dữ liêu ̣ Tài liệu dựa trên nền tảng logic Thực tế qua quan sát Loai d ̣ ữ liêu ̣ ữ liệu biến thiên (Liên tuc) D ̣ Dữ liệu biến thiên (Liên tuc) ̣ các giá trị đặc trưng được đo theo một chuỗi liên tục như độ Loai d ̣ ̣ ưữ̃ liêu Loai d ̣̣ liêu dài, trọng lượng hoặc thời gian… Sai h Sai hỏỏng ng DDưữ̃ liêu thuôc ti ̣̣ ̣ ̣ ́́nh (R liêu thuôc ti nh (Rơờ̀i rac) ̣̣ i rac) các giá trị đặc trưng được tính LLỗỗi/khuy i/khuyếết t t tậậtt bằng những con số cụ thể như số lượng hàng hóa bị lỗi hay số lượng các lỗi này…
- Cá c đo lường cua d ̉ ữ liêu ̣ Tham số Một đo lường, mà tóm tắt tập hợp số đông thành một giá trị nhất định Một giá trị đại diện cho các đặc tính của tập hợp số đông (trung bình của tập hợp, độ biến thiên của tập hợp, tỉ lệ tập hợp…) Thố ng kê Một đo lường tóm tắt mẫu thành một giá trị nhất định Giá trị này đại diện cho những đặc tính của mẫu và dùng để suy ra các đặc tính tập hợp (trung bình của mẫu, biến thiên của mẫu…)
- Tâp h ̣ ợp Mẫ u Lấ y mẫ u C D A D B B D D A D C A C B B D A A C A B C C D D A A D C C B D C A C B B Tham số Suy luân ra ̣ Thố ng kê cá c đăc tr ̣ ưng Trung bình tâp h ̣ ợp: μ cua tâp h ̉ ̣ ợp Trung bình mẫ u: x Biến thiên tâp h ̣ ợp: σ 2 Biến thiên mẫ u: s2 Đô lêch chu ̣ ̣ ẩn của tập hợp: Mẫ u đô lêch chuân: s ̣ ̣ ̉ σ
- Các đo lường về trung tâm và sự phân tán Đo lường về sự hướ ng trung tâm: Số liêu diê ̣ ̃ n giai vi tri ̉ ̣ ́ (giá tri đai ̣ ̣ diên) ̣ Trung bì nh Trung bì nh cuả “n” là sự quan sát là giá trị thu được khi lấy tổng của tất cả các quan sát chia cho n (số các giá trị quan sát được) Nó khá nhạy cảm với giá tr n ị ngoại lệ (giá trị cực trị). xi Trung bình :x i 1 n Ví du)̣ Để phê chuẩn một bản báo cáo cần qua 7 quá trình từ A đến G. Các dữ liệu sau là khoảng thời gian tiến hành mỗi quá trình đó. Hãy tính khoảng thời gian trung bình của mộ(Đ ơn vi la ̣ ̀ phút) t quá trình. Có th Có thểể nh nhậận th n thấấy rõ r y rõ rằằng giá ng giá A B C D E F G trtrịị c cựực tr c trị ảnh hưởng khá lớớn ị ả nh h ưở ng khá l n đđếến trung bình! n trung bình! 2 2 1 3 2 9 30 ̉ Tông th ời Tra l ̉ ờ i) x ̉ gian cua 7 = 2 2 1 3 2 9 30 quá trình Số quá 7 7 trình
- Số liệu của xu hướng trung tâm - Median là số nằm ở vị trí ở giữa khi thông số được sắp xếp theo kích cỡ (n) Nó ít thay đổi đối với giá trị cực trị (nằm ơ bên ngoài) Khi “n” là một1số lẻ: 2 2 2 3 9 30 Trung bình của 2 và 3 là2.5 1 chẵn2 Khi “n” là một số : 2 2 3 9 10 30 - Mode Median Medianand andMode Mode Một số với tần số xuất hiện lớn nhất thì thìítítlà làm mthay thayđổđổii cá i bên ngoà cái bên ngoài hơn i hơn Nó ít thay đổi nhất đối với giá trị cực trị (bên ngoài) Ví dụ ) Mode trong ví dụ trước là gì ? Giữa các số 2, 2, 1, 3, 2, 9, 30, thì số có tần số xuất hiện nhiều nhất là 2 (Xuất hiện 3 lần). Vì vậy, mode là 2.
- So sá nh vi tri ̣ ́ cua Mean, Median, and Mode ̉ Mean Mode Mode Median Median Median Mode Mean Mean Phân bố đố i xứ ng Phân bố trá i Phân bố phaỉ Giá tr Giá trịị này có này có ảảnh h ưởng nh nh hưở ng nhấất b t bởởi giá tr i giá trịị bên ngoài (giá tr bên ngoài (giá trịị c cựực tr c trịị) là Trung bình!! ) là Trung bình!!
- Các đo lường về trung tâm và phân tá n Đo lường xu hướng dàn trải của dữ liệu: Đo lường đưa ra kiểu phân bố Hai công ty A và B cung cấp vật liệu thô đến Tổng công ty Điện Miền Tây. Biểu đồ dưới chỉ ra rằng việc phân bố cua d ̉ ữ liêu vê ̣ ̀ thời gian bo ra đê mua ̉ ̉ vật liệu thô. Nếu bạn là nhân viên trong phòng mua vật liệu của Tổng công ty Điện., nhà cung nào cấp sẽ được ban l ̣ ựa chọn để mua vật liệu thô ? Công ty A Cty A: Mean = 100 min. MMặặc dù trung bình leadtime c c dù trung bình leadtime củủa a Công ty B Phân bố from 60 to 120 min. công ty B ngă công ty B ngắ́n h n hơơn th n thờời gian c i gian củủa a công ty A, độộ phân tán cua B l công ty A, đ ̉̉ phân tán cua B l ớớn n Cty B: Mean = 80 min. hhơơn c n củủa A và do đó b a A và do đó bạạn không th n không thểể Phân bố from 20 to 160 min. kkếết lu t luậận ră ng công ty B tốốt h n rằ̀ng công ty B t t hơơn n 80 100 công ty A!! công ty A!! Trong phân tích thống kê, chỉ xem xét giá tri trung bình thôi thi ̣ ̀ có thể dẫn đến kết quả không đúng. Do đó, sự phân tán thể hiện các cách mở rộng mà sự phân bổ nên được giảm bớt.
- Đo lường xu hướng dàn trải Biến thiên và sai lệch chuẩn Biến thiên và sai lệch chuẩn mô tả sự phân tán giá trị từ Trung Bình ̣ VD) Giá tri: 4 8 7 5 2 6 3 Mean 5 Lý do đê ̉ ̉ ̣ ̣ Tông đô lêch: (1) + 3 + 2 + 0 + (3) + 1+ (2) = 0 bì nh phương xi x x )2 ( x̀i , s Nếu độ lệch bình phương của from la ự biến thiên được xác định như là độ lệch trung bình (đăt n1 thay vi ̣ ̀ n, cho lý do thống kê) ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ●● ●● ● n 2 2 30 40 50 60 70 Biến thiên mẫ u : s x i x (n 1) i 1 ( xi x) xi x Độ lệch tiêu chuẩn là nguồn gốc của bình phương của biến số n 2 ̉ s Sai lêch chuân: ̣ xi x (n 1) i 1
- Đo lường xu hướng dàn trải Range (khoảng biến thiên) Sự khác nhau giữa giá trị thông số tối đa và tối thiểu ̣ ́i đa – Giá tri tô = Giá tri tô ̣ ́i thiêu ̉ IQR (phân vi biên đô) : Q3Q1 ̣ ̣ ̣ ứ nhất = Điểm dưới 25% của dữ liêụ xây dựng > Q1: Phân vi th ̣ ứ hai :Median) = Gía trị giữa trong bộ thông số > Q2: Phân vi th ̣ ứ ba = Điểm dưới 75% của thông số dựng > Q3: Phân vi th Ví du)̣ Tìm phân vị và IQR của thông số dưới đây 2, 8, 20, 4, 9, 5, 4, 3 Q2 (Median) = 4.5 ̉ ờ i) Sắp xếp theo thứ tự 2 3 4 4 5 8 9 20 Tra l Q1 = 3.25 Q3 = 8.75
- Phân tí ch thố ng kê cơ ban s ̉ ử dung Minitab ̣ ̉ Dùng Minitab đê phân ti ́ch xu hướng trung tâm và xu hướng phân tán. (Tên File : Statistics_Normal.MTW ) ̣̣ ̣̣ Đô tin cây. Đô tin cây. ̉̉ ̣ ̣ ở Tiêu biêu đăt Tiêu biêu đăt mư ở m ứ́c 95% c 95% Stat > Basic Statistics > Graphical Summary 1 Tính thố Tính th ng kê củ ống kê c a mỗ ủa m i biế ỗi bi ến thiên n thiên trong trường hợp biến thiên phứ trong tr ường h ợ p bi ến thiên ph c tạ ức t ạpp 2 3
- Graph Results S ummary fo r No rmal ①① Theo k Theo kếết qu t quảả ki kiểểm nghi m nghiệệm thông m thông Anders on Darling Normality Tes t ththườ ường, bình thường tồn tại nê ng, bình th ườ ng t ồn t ạ i nế u ́ u 1 A Squared 0.42 nh ư giá trị P> 0.05 P Value 0.328 như giá trị P> 0.05 Mean 70.000 2 StDev 10.000 Variance 100.000 ②② Mean ( Gia Mean ( Giá tri trung bi ̣ ̣ ́ tri trung bì nh) ̀ nh) Skewnes s 0.050008 Kurtos is 0.423256 Standard Deviation (Đô lêch chuân) ̣ ̣ ̣ ̣ Standard Deviation (Đô lêch chuân) ̉ ̉ N 500 Minimum 29.824 Variance (bi Variance (biếến thiên) n thiên) 1s t Quartile 63.412 3 Median 69.977 3rd Quartile 76.653 30 40 50 60 70 80 90 100 Maximum 103.301 ③③ Gia Giá tri tô ̣ ̣ ́ i thiêu ́ tri tô ̉ ̉ ́ i thiêu 95% Confidence Interval for Mean 69.121 70.879 Phân vi th Phân vi tḥ ̣ ưứ nhâ ́ nhấ t =Đi ́ t =Điểểm nă m nằ m d ưới ̀ m dướ i 95% Confidence Interval for Median 25% c ủ a d 25% của dữ liêụ ữ liê ụ 69.021 70.737 95% Confidence Interval for StDev Median = Gia Median = Giá tri trung bi ̣ ̣ ̀ nh trong ́ tri trung bi ̀ nh trong 9 5 % Co nfide nc e Inte rv a ls 9.416 10.662 ddưữ liêu ca ̣ ̀ ̃ liêu ca ̣ i đăt ̣ ̀ i đăṭ Me a n Phân vi th ̣ ̣ ưứ ba = Điêm nă Phân vi th ̉ ̉ ̀ m d ́ ba = Điêm nă ướ i ́ i ̀ m dươ Me dia n 75% cua d̉ ̉ ưữ liêu 75% cua d ̣ ̣ ̃ liêu 69.0 69.5 70.0 70.5 71.0 Gia Giá tri tô ̣ ̣ ́ i đa ́ tri tô ́ i đa
- Tì m hiêu vê ̉ ̀ xá c suấ t Xá c suấ t là khá i niêm cung câ ̣ ́ p cơ sở logic đê đ ̉ ưa ra quyế t đinh vê ̣ ̀ sự phân bố chi trong 1 phâ ̉ ̀ n dữ liêu quan sa ̣ ́ t. Xá c suấ t Xác suất đề cập đến khả năng/có thể xảy ra (Số lượng đo lường mô tả độ tin tưởng mà sự kiện xác định sẽ xảy ra.) ̉ ̣ ự kiên A co Kha năng môt s ̣ ̉ ̉ ́ thê xay ra ngoài tất cả các kết quả có khả năng. Đó là tỷ lệ của một sự kiện cụ thể khi những thí nghiệm giống nhau được lặp đi lặp lại nhiều lần Sự kiêṇ P(A) = Khoang ca ̉ ́ ch mẫ u
- Ví du)̣ Xem xét vòng quay cua môt đôi su ̉ ̣ ́c sắc, Khoang ca ̉ ́ ch mẫ u S = {(1, 1), (1, 2), … , (6, 6)} : Một bộ gồm tất cả 36 con súc sắc để thí nghiệm Sự kiên ̣ : Tâp h ̣ ợp khoang ca ̉ ́ch mẫu ̣ E1 = Khi môt con su ̣ ̣ ́ 1 ́c sắc xuất hiên măt sô = {(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6)} Xá c suất của con súc sắc tạo ra số một khi xóc đôi súc sắc, P(E1) P(E1) = P{(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6)}= 6/36 = 1/ 6 1 2 3 4 5 6 1 2 3 4 5 6 7 Xa Xá́c su c suấất c t củủa a 2 3 4 5 6 7 8 m mộột con súc s t con súc sắắc c 3 4 5 6 7 8 9 đđầ ầu tiên ch u tiên chỉỉ 4 5 6 7 8 9 10 th thấấy m y mộột m t mặặt t 5 6 7 8 9 10 11 6 7 8 9 10 11 12 trên la trên là̀ gi gì? ̀?
- Biế n số ngẫ u nhiên Chức năng mà liên kết đến một con số đơn với mỗi sự kiện trong một khoảng mẫu Đó là, nếu như bạn biểu diễn con số mà một con súc sắc tạo ra ưu thế khi xóc con sắc như là biến số X , X trở thà nh biế n số ngẫ u nhiên, có giá tri la ̣ ̀ : 1, 2, 3, 4, 5 và 6. Biế n số ∙ ∙ ∙ ∙ ∙ ∙ ∙ ∙ ngẫ u nhiên { 1, 2, 3, 4, 5, 6} VD) Biến số ngẫu nhiên của số đầu được tạo ra khi tung một đồng xu 2 lần Mặt ngửa là H mặt sấp là T, khoảng cách mẫu vật sẽ là = { HH, HT, TH, TT} Biế n số ngẫ u nhiên là ? = { 0, 1, 2}
- Sự phân bố xá c suấ t Một bảng, biểu đồ hoặc chức năng thể hiện tất cả giá trị mà biết số ngẩu nhiên có thể xuất hiện và tần suất sẽ xảy ra cua mô ̉ ̣ ̃i loai. X 1 2 3 4 5 6 P(X=x) 1/6 1/6 1/6 1/6 1/6 1/6 0.50 Mục đích của việc nghiên cứu 0.40 phân bố xá c suất là để xác định trước xá c suất của biến 0.30 số ngẫu nhiên, lấy được các giá 0.20 trị rõ ràng và chắc chắn hoặc 0.10 giá trị trong vòng phạm vi cụ 0.00 1 2 3 4 5 6 thê. ̉
ADSENSE
Thêm tài liệu vào bộ sưu tập có sẵn:
Báo xấu
LAVA
AANETWORK
TRỢ GIÚP
HỖ TRỢ KHÁCH HÀNG
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn