intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Bài giảng 6sigma: Thống kê cơ bản

Chia sẻ: _ _ | Ngày: | Loại File: PPT | Số trang:44

31
lượt xem
3
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Sau khi học xong bài giảng này, bạn sẽ nắm được nhu cầu về thống kê; nắm được các khái niệm cơ bản của phương thức dùng để nhận biết đặc điểm dữ liệu và nắm được cách tính xác suất và các thống kê cơ bản sử dụng phần mềm thống kê minitab. Mời các bạn tham khảo!

Chủ đề:
Lưu

Nội dung Text: Bài giảng 6sigma: Thống kê cơ bản

  1. Thố ng kê cơ ban ̉  Phân tích thống kê cơ ban ̉  Phân bố xác xuất rời rac  ̣  Phân bố xác xuất liên tuc̣  Muc tiêu hoc tâp  ̣ ̣ ̣  Nắm được nhu cầu về thống kê  Nắm được các khái niệm cơ bản của phương thức dùng để nhận biết đặc điểm  dữ liệu  Nắm được khái niệm cơ bản của phân bố xác suất  Nắm được cách tính xác suất và các thống kê cơ bản sử dụng phần mềm thống kê  minitab
  2. Thố ng kê cơ ban?  ̉  Đinh nghi ̣ ̃ a về  thố ng kê  Quá trình tính toán số lần, tần suất hoặc tỉ lệ… thể hiện các đặc điểm của dữ liệu  bằng cách phân tích, tổng hợp dữ liệu cụ thể hoặc thông tin hay là các giá trị tính  được bằng số.  Sử dung thô ̣ ́ ng kê – trong 6 Sigma   Được sử dung đê phân ti ̣ ̉ ́ch dữ liêu (vd. nh ̣ ững giá tri đăc tr ̣ ̣ ưng) được thu thâp  ̣ từ giai đoan đo l ̣ ường.  Định lượng dữ liệu biểu thị đặc tính quá trình X’s và Y’s   Dùng để ước tính tương lai với dữ liệu đã có trong quá trình hoạt động.  Dùng như là một cơ sở để giải quyết các vấn đề phức tạp về thống kê
  3.  Phân loai vê ̣ ̀  thố ng kê    Thố ng kê mô ta ̉ ­ Các thống kê liên quan đến những đặc điểm cơ bản của dữ liệu. Chúng  cung cấp những phần tóm tắt đơn giản về dữ liệu thống kê (với các  thống kê mô tả đơn giản bạn chỉ mô tả những gì dữ liệu thể hiện). ­ Mục đích chính của thống kê mô tả là mô tả thuộc tính /đặc điểm của  nhóm thống kê đã quan sát   Thố ng kê suy luân  ̣   ­ Thống kê cố gắng xác định các đặc trưng bằng cách phân tích mẫu thu  được từ một tập hợp
  4. Khá i quá t về  thố ng kê cơ  ban  ̉  Cầ n thiế t cho thố ng kê  Khái niệm thống kê – thứ ngôn ngữ dựa trên thực tế chứ không phải trực  giác. Thống kê hỗ trợ việc đưa ra quyết định trong những tình huống chưa  chắc chắn bằng cách thu thập, phân tích và biên dịch dữ liệu. Đây là  lầ n  Vây thi ̣ ̀  đầ u tiên trong  ,đây là  lầ n  19 năm qua,  nó ng nhấ t  nhiêt đô v ̣ ̣ ượt  cho chú ng  quá  ngưỡ ng  ta… Thố ng kê cung cấ p nhữ ng thông tin  38℃ cơ ban câ ̉ ̀ n thiế t cho viêc quyê ̣ ́ t đinh. ̣ Điên năng tiêu thu ti ̣ ̣ ́ nh  trên đầ u ngườ i đã  tăng  Thât không? ̣ 3 lầ n kê t ̉ ừ  năm  1980 Chú ng ta phai đâ ̉ ̀ u tư  xây dựng nhiề u nhà   má y năng lượng hơn  nữ a… Thố ng kê? Biế n đôi th ̉ ực tế  thà nh nhữ ng con số !
  5. Thố ng kê cơ ban ̉ Thống kê nhận biết các đặc trưng của tập hợp cho trước từ một mẫu  Tâp h ̣ ợp >
  6. Cách bạn phân tích dữ liệu phụ thuộc vào kiểu dữ liệu bạn đang gặp. Vì vậy,  bạn cần phải phân loại dữ liệu trước.  Đinh nghi ̣ ̃ a dữ  liêu ̣ ­  Tài liệu dựa trên nền tảng logic ­ Thực tế qua quan sát  Loai d ̣ ữ  liêu ̣ ữ liệu biến thiên (Liên tuc) D ̣ Dữ liệu biến thiên (Liên tuc) ̣  các giá trị đặc trưng được đo  theo một chuỗi liên tục như độ  Loai d ̣ ̣ ưữ̃ liêu Loai d ̣̣  liêu dài, trọng lượng hoặc thời  gian… Sai h Sai hỏỏng ng DDưữ̃ liêu thuôc ti ̣̣ ̣ ̣ ́́nh (R  liêu thuôc ti nh (Rơờ̀i rac) ̣̣ i rac)  các giá trị đặc trưng được tính  LLỗỗi/khuy i/khuyếết t t tậậtt bằng những con số cụ thể như  số lượng hàng hóa bị lỗi hay số  lượng các lỗi này…
  7.  Cá c đo lường cua d ̉ ữ  liêu ̣  Tham số    Một đo lường, mà tóm tắt tập hợp số đông thành một giá trị nhất định      Một giá trị đại diện cho các đặc tính của tập hợp số đông (trung bình của tập  hợp, độ biến thiên của tập hợp, tỉ lệ tập hợp…)  Thố ng kê    Một đo lường tóm tắt mẫu thành một giá trị nhất định              Giá trị này đại diện cho những đặc tính của mẫu và dùng để suy ra các đặc  tính tập hợp               (trung bình của mẫu, biến thiên của mẫu…)  
  8. Tâp h ̣ ợp Mẫ u Lấ y mẫ u C D A D B B D D A D C A C B B D A A C A B C C D D A A D C C B D C A C B B Tham số Suy luân ra  ̣ Thố ng kê cá c đăc tr ̣ ưng  Trung bình tâp h ̣ ợp:   μ cua tâp h ̉ ̣ ợp  Trung bình mẫ u: x Biến thiên tâp h ̣ ợp:  σ 2 Biến thiên mẫ u:  s2 Đô lêch chu ̣ ̣ ẩn của tập hợp:   Mẫ u đô lêch chuân:  s ̣ ̣ ̉ σ 
  9.  Các đo lường về trung tâm và  sự phân tán   Đo lường về sự hướ ng trung tâm: Số  liêu diê ̣ ̃ n giai vi tri ̉ ̣ ́   (giá  tri đai  ̣ ̣ diên) ̣ ­ Trung bì nh Trung bì nh cuả  “n” là sự quan sát là giá trị thu được khi lấy tổng của tất cả  các quan sát chia cho n (số các giá trị quan sát được) Nó khá nhạy cảm với giá tr n ị ngoại lệ (giá trị cực trị). xi Trung bình :x i 1 n Ví du)̣ Để phê chuẩn một bản báo cáo cần qua 7 quá trình từ A đến G.  Các dữ liệu sau là khoảng thời gian tiến hành mỗi quá trình đó. Hãy tính khoảng  thời gian trung bình của mộ(Đ ơn vi la ̣ ̀ phút) t quá trình.  Có th  Có thểể nh  nhậận th n thấấy rõ r y rõ rằằng giá  ng giá  A    B   C    D    E    F    G trtrịị c cựực tr c trị ảnh hưởng khá lớớn  ị  ả nh h ưở ng khá l n  đđếến trung bình!  n trung bình!   2    2    1    3     2     9     30 ̉ Tông th ời  Tra l ̉ ờ i) x ̉ gian cua 7  = 2 2 1 3 2 9 30 quá trình Số quá  7 7 trình 
  10.  Số liệu của xu hướng trung tâm - Median là số nằm ở vị trí ở giữa khi thông số được sắp xếp theo kích cỡ (n) Nó ít thay đổi đối với giá trị cực trị (nằm ơ bên ngoài) Khi “n” là một1số lẻ: 2 2 2 3 9 30 Trung bình của 2 và 3 là2.5 1 chẵn2 Khi “n” là một số : 2 2 3 9 10 30 - Mode Median Medianand andMode Mode Một số với tần số xuất hiện lớn nhất thì thìítítlà làm mthay thayđổđổii cá i bên ngoà cái bên ngoài hơn i hơn Nó ít thay đổi nhất đối với giá trị cực trị (bên ngoài) Ví dụ ) Mode trong ví dụ trước là gì ? Giữa các số 2, 2, 1, 3, 2, 9, 30, thì số có tần số xuất hiện nhiều nhất là 2 (Xuất hiện 3 lần). Vì vậy, mode là 2.
  11.   So sá nh vi tri ̣ ́  cua Mean, Median, and Mode ̉ Mean Mode Mode Median Median Median Mode Mean Mean Phân bố  đố i xứ ng Phân bố  trá i Phân bố  phaỉ Giá tr Giá trịị này có   này có ảảnh h ưởng nh nh hưở ng nhấất b t bởởi giá tr i giá trịị bên ngoài (giá tr  bên ngoài (giá trịị c cựực tr c trịị) là Trung bình!! ) là Trung bình!!
  12.  Các đo lường về trung tâm và  phân tá n  Đo lường xu hướng dàn trải của dữ liệu: Đo lường đưa ra kiểu  phân bố   Hai công ty A và B cung cấp vật liệu thô đến Tổng công ty Điện Miền Tây.  Biểu đồ dưới chỉ ra rằng việc phân bố cua d ̉ ữ liêu vê ̣ ̀ thời gian bo ra đê mua  ̉ ̉ vật liệu thô. Nếu bạn là nhân viên trong phòng mua vật liệu của Tổng công ty  Điện., nhà cung nào cấp sẽ được ban l ̣ ựa chọn để mua vật liệu thô ? Công ty A Cty A: Mean = 100 min. MMặặc dù trung bình lead­time c c dù trung bình lead­time củủa a  Công ty B           Phân bố  from 60 to 120  min. công ty B ngă công ty B ngắ́n h n hơơn th n thờời gian c i gian củủa a              công ty A, độộ phân tán cua B l công ty A, đ ̉̉  phân tán cua B l ớớn n  Cty B: Mean = 80 min. hhơơn c n củủa A và do đó b a A và do đó bạạn không th n không thểể              Phân bố from 20 to 160 min. kkếết lu t luậận  ră ng công ty B tốốt h n  rằ̀ng công ty B t t hơơn n  80 100 công ty A!!  công ty A!!  Trong phân tích thống kê, chỉ xem xét giá tri trung bình thôi thi ̣ ̀  có thể dẫn đến kết quả không đúng. Do đó, sự phân tán thể  hiện các cách mở rộng mà sự phân bổ nên được giảm bớt.
  13.   Đo lường xu hướng dàn trải ­ Biến thiên và sai lệch chuẩn    Biến thiên và sai lệch chuẩn mô tả sự phân tán giá trị từ Trung Bình ̣ VD)   Giá tri:    4      8    7    5       2     6       3        Mean 5 Lý  do đê ̉ ̉ ̣ ̣        Tông đô lêch:  (­1) + 3 + 2 + 0 + (­3) + 1+ (­2)   =  0  bì nh phương  xi x x )2 ( x̀i               , s Nếu độ lệch bình phương của       from        la ự biến thiên được xác  định như là độ lệch trung bình (đăt n­1 thay vi ̣ ̀ n, cho lý do thống kê) ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ●● ●● ● n 2 2 30 40 50 60 70 Biến thiên mẫ u : s x i x (n 1) i 1 ( xi x) xi x Độ lệch tiêu chuẩn là nguồn gốc của bình phương của biến số n 2 ̉ s Sai lêch chuân:  ̣ xi x (n 1) i 1
  14.   Đo lường xu hướng dàn trải ­ Range  (khoảng biến thiên)    Sự khác nhau giữa giá trị thông số tối đa và tối thiểu ̣ ́i đa – Giá tri tô                                   = Giá tri tô ̣ ́i thiêu ̉ ­ IQR (phân vi biên đô) :  Q3­Q1 ̣ ̣ ̣ ứ nhất   = Điểm dưới 25% của dữ liêụ xây dựng > Q1: Phân vi th ̣ ứ  hai :Median) = Gía trị giữa trong bộ thông số > Q2: Phân vi th ̣ ứ  ba = Điểm dưới 75% của thông số dựng > Q3: Phân vi th Ví  du)̣  Tìm phân vị và IQR của thông số dưới đây 2,   8,   20,    4,    9,    5,    4,    3  Q2 (Median) = 4.5 ̉ ờ i) Sắp xếp theo thứ tự  2       3       4       4       5       8       9       20 Tra l Q1 = 3.25 Q3 = 8.75
  15.  Phân tí ch thố ng kê cơ ban s ̉ ử dung Minitab ̣ ̉ Dùng Minitab đê phân ti ́ch xu hướng trung tâm và xu hướng phân tán. (Tên File : Statistics_Normal.MTW ) ̣̣ ̣̣ Đô tin cây. Đô tin cây. ̉̉ ̣ ̣ ở Tiêu biêu đăt  Tiêu biêu đăt   mư ở m ứ́c 95% c 95% Stat > Basic Statistics > Graphical Summary 1 Tính thố Tính th ng kê củ ống kê c a mỗ ủa m i biế ỗi bi ến thiên  n thiên  trong trường hợp biến thiên phứ trong tr ường h ợ p bi ến thiên ph c tạ ức t ạpp 2 3
  16.  Graph Results S ummary  fo r No rmal ①① Theo k  Theo kếết qu t quảả ki  kiểểm nghi m nghiệệm thông  m thông  Anders on­ Darling Normality Tes t ththườ ường, bình thường tồn tại nê ng, bình th ườ ng t ồn t ạ i nế u  ́ u  1 A­ Squared 0.42 nh ư  giá trị  P> 0.05 P­ Value 0.328 như giá trị P> 0.05 Mean 70.000 2 StDev 10.000 Variance 100.000 ②② Mean ( Gia  Mean ( Giá  tri trung bi ̣ ̣ ́  tri trung bì nh) ̀ nh) Skewnes s ­ 0.050008 Kurtos is 0.423256     Standard Deviation (Đô lêch chuân) ̣ ̣ ̣ ̣     Standard Deviation (Đô lêch chuân) ̉ ̉ N 500 Minimum 29.824     Variance (bi     Variance (biếến thiên) n thiên) 1s t Quartile 63.412 3 Median 69.977 3rd Quartile 76.653 30 40 50 60 70 80 90 100 Maximum 103.301 ③③ Gia Giá  tri tô ̣ ̣ ́ i thiêu ́  tri tô ̉ ̉ ́ i thiêu 95% Confidence Interval for Mean 69.121 70.879     Phân vi th     Phân vi tḥ ̣ ưứ  nhâ ́  nhấ t =Đi ́ t =Điểểm nă m nằ m d ưới    ̀ m dướ i    95% Confidence Interval for Median     25% c ủ a d     25% của dữ liêụ  ữ  liê ụ   69.021 70.737 95% Confidence Interval for StDev     Median = Gia     Median = Giá  tri trung bi ̣ ̣ ̀ nh trong  ́  tri trung bi ̀ nh trong  9 5 %  Co nfide nc e   Inte rv a ls 9.416 10.662 ddưữ    liêu ca ̣ ̀ ̃    liêu ca ̣ i đăt ̣ ̀ i đăṭ Me a n     Phân vi th ̣ ̣ ưứ   ba = Điêm nă     Phân vi th ̉ ̉ ̀ m d ́   ba = Điêm nă ướ i ́ i  ̀ m dươ Me dia n 75% cua d̉ ̉ ưữ  liêu 75% cua d ̣ ̣ ̃  liêu 69.0 69.5 70.0 70.5 71.0 Gia Giá  tri tô ̣ ̣ ́ i đa  ́  tri tô ́ i đa 
  17. Tì m hiêu vê ̉ ̀  xá c  suấ t  Xá c suấ t là  khá i niêm cung câ ̣ ́ p cơ sở logic đê đ ̉ ưa ra quyế t đinh vê ̣ ̀  sự  phân bố chi trong 1 phâ ̉ ̀ n dữ  liêu quan sa ̣ ́ t.   Xá c suấ t ­  Xác suất đề cập đến khả năng/có thể xảy ra (Số lượng đo lường mô tả độ tin  tưởng mà sự kiện xác định sẽ xảy ra.) ̉ ̣ ự kiên A co ­  Kha năng môt s ̣ ̉ ̉ ́ thê xay ra ngoài tất cả các kết quả có khả năng. Đó là tỷ lệ của một sự kiện cụ thể  khi những thí nghiệm giống nhau được lặp  đi lặp lại nhiều lần                Sự kiêṇ P(A)   =              Khoang ca ̉ ́ ch mẫ u
  18. Ví  du)̣   Xem xét vòng quay cua môt đôi su ̉ ̣ ́c  sắc,  Khoang ca ̉ ́ ch mẫ u S =  {(1, 1), (1, 2), … , (6, 6)} : Một bộ gồm tất cả 36 con  súc sắc để thí nghiệm  Sự kiên ̣ : Tâp h ̣ ợp khoang ca ̉ ́ch mẫu ̣ E1 = Khi môt con su ̣ ̣ ́ 1  ́c sắc xuất hiên măt sô      = {(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6)}  Xá c suất của con súc sắc tạo ra số một khi xóc đôi súc sắc, P(E1)     P(E1) = P{(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6)}= 6/36 = 1/ 6 1 2 3 4 5 6 1 2 3 4 5 6 7 Xa Xá́c su c suấất c t củủa  a  2 3 4 5 6 7 8 m mộột con súc s t con súc sắắc  c  3 4 5 6 7 8 9 đđầ ầu tiên ch u tiên chỉỉ   4 5 6 7 8 9 10 th thấấy m y mộột m t mặặt t  5 6 7 8 9 10 11 6 7 8 9 10 11 12 trên la trên là̀ gi  gì? ̀?
  19.  Biế n số  ngẫ u nhiên ­ Chức năng mà liên kết đến một con số đơn với mỗi sự kiện trong một  khoảng mẫu   Đó là, nếu như bạn biểu diễn con số mà một con súc sắc tạo ra ưu thế khi xóc  con sắc như là biến số X , X trở thà nh biế n số  ngẫ u nhiên, có giá tri la ̣ ̀ : 1, 2,  3, 4, 5 và 6. Biế n số   ∙ ∙ ∙ ∙ ∙ ∙ ∙ ∙  ngẫ u nhiên { 1, 2, 3, 4, 5, 6} VD) Biến số ngẫu nhiên của số đầu được tạo ra khi tung một đồng xu 2 lần  Mặt ngửa là H mặt sấp là T,  khoảng cách mẫu vật sẽ là  = { HH, HT, TH, TT} Biế n số  ngẫ u nhiên là ?  = { 0, 1, 2}
  20.  Sự phân bố  xá c suấ t Một bảng, biểu đồ hoặc chức năng thể hiện tất cả giá trị mà biết số ngẩu  nhiên có thể xuất hiện và tần suất sẽ xảy ra cua mô ̉ ̣ ̃i loai.  X 1 2 3 4 5 6 P(X=x) 1/6 1/6 1/6 1/6 1/6 1/6 0.50 Mục đích của việc nghiên cứu  0.40 phân bố xá c suất là để xác  định trước xá c suất của biến  0.30 số ngẫu nhiên, lấy được các giá  0.20 trị rõ ràng và chắc chắn hoặc  0.10 giá trị trong vòng phạm vi cụ  0.00 1 2 3 4 5 6 thê. ̉
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2