zunia.vn

Tuyển sinh 2024 dành cho Gen-Z

zunia.vn

» Khoa Học Tự Nhiên

Bài giảng 3: Một số vấn đề cơ bản về xác suất thống kê trong kinh tế lượng - ThS. Phùng Thanh Bình

Chia sẻ: Na Na | Ngày: | Loại File: PDF | Số trang:55

Báo xấu

134
lượt xem 16
download

Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài giảng 3: Một số vấn đề cơ bản về xác suất thống kê trong kinh tế lượng của ThS. Phùng Thanh Bình có mục tiêu trình bày ký hiệu tổng, phép thử, không gian mẫu và biến cố, biến ngẫu nhiên, xác suất, biến ngẫu nhiên và hàm phân phối xác suất, hàm mật độ xác suất đa biến, đặc điểm của các phân phối xác suất, một số phân phối xác suất quan trọng, một số phép toán ma trận, suy diễn thống kê.

Chủ đề:

Bình luận(0) Đăng nhập để gửi bình luận!

Lưu

Nội dung Text: Bài giảng 3: Một số vấn đề cơ bản về xác suất thống kê trong kinh tế lượng - ThS. Phùng Thanh Bình

BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ ThS Phùng Thanh Bình BÀI GIẢNG 3 MỘT SỐ VẤN ĐỀ CƠ BẢN VỀ XÁC SUẤT THỐNG KÊ TRONG KINH TẾ LƯỢNG MỤC TIÊU BÀI GIẢNG: 1. Ký hiệu tổng 2. Phép thử, không gian mẫu và biến cố 3. Biến ngẫu nhiên 4. Xác suất 5. Biến ngẫu nhiên và hàm phân phối xác suất 6. Hàm mật độ xác suất đa biến 7. Đặc điểm của các phân phối xác suất 8. Một số phân phối xác suất quan trọng 9. Một số phép toán ma trận 10. Suy diễn thống kê ĐỐI TƯỢNG BÀI GIẢNG: 1. Tài liệu bài giảng cho sinh viên đại học 2. Tài liệu tham khảo ôn tập cho học viên cao học KÝ HIỆU TỔNG Ký hiệu tổng Ký tự  (sigma) được thống nhất sử dụng để chỉ tổng: n  X i   Xi  X1  X 2  ...  X n (3.1) i 1 Thao tác với Eviews Trên cửa sổ lệnh của Eviews ta nhập: scalar sumX=@sum(x) 1
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ ThS Phùng Thanh Bình Tính chất của phép toán tổng 1. Khi k là một hằng số n  k  nk (3.2) i 1 2. Khi k là một hằng số n n  kX i  k  X i (3.3) i 1 i 1 3. Tổng của tổng hai biến Xi và Yi  (Xi  Yi )   Xi   Yi (3.4) 4. Tổng của một hàm tuyến tính  (a  bXi )  na  b Xi (3.5) PHÉP THỬ, KHÔNG GIAN MẪU, VÀ BIẾN CỐ Phép thử Một phép thử có hai đặc tính: 1) Không biết chắc kết quả nào xảy ra 2) Nhưng biết được các kết quả có thể xảy ra Không gian mẫu hay tổng thể Tập hợp tất cả các kết quả có thể xảy ra của một phép thử được gọi là tổng thể hay không gian mẫu. Biến cố Một biến cố là một nhóm các kết quả có thể xảy ra củ một phép thử. Nói cách khác, đó là một tập hợp con của không gian mẫu. Các phép tính về biến cố:  Biến cố hội (AB): A xảy ra hay B xảy ra  Biến cố giao (AB): A xảy ra vả B xảy ra  Biến cố phụ ( A ): A xảy ra, A không xảy ra  Biến cố xung khắc: AB =  2
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ ThS Phùng Thanh Bình BIẾN NGẪU NHIÊN Ví dụ, tung hai đồng xu, quan sát và lập thành bảng kết quả của các phép thử như sau:  BẢNG 3.1: Định nghĩa khái niệm biến ngẫu nhiên Đồng xu thứ Đồng xu thứ Số mặt ngửa nhất hai T T 0 T H 1 T H 1 H T 1 H H 2 Nguồn: Gujarati, 2006, trang 25 Ta gọi biến “số mặt ngửa” là một biến ngẫu nhiên. Nói một cách tổng quát, một biến mà giá trị (bằng số) của nó được xác định bởi kết quả của một phép thử được gọi là một biến ngẫu nhiên. Như vậy, biến ngẫu nhiên là biến mà giá trị của nó được xác định một cách ngẫu nhiên. Một biến ngẫu nhiên có thể có giá trị rời rạc hoặc liên tục. Một biến ngẫu nhiên rời rạc chỉ có một số giá trị hữu hạn (hoặc vô hạn có thể đếm được). Một biến ngẫu nhiên liên tục là một biến ngẫu nhiên có bất kỳ giá trị nào trong một khoảng giá trị nào đó. XÁC SUẤT Xác suất của một biến cố: Định nghĩa cổ điển Nếu một phép thử có thể có n kết quả loại trừ nhau và có khả năng xảy ra như nhau, và nếu m kết quả từ phép thử này hợp thành biến cố A, thì P(A), xác suất để A xảy ra, là tỷ số m/n. m P(A)  (3.6) n Xác suất của một biến cố: Tần suất tương đối Để giới thiệu khái niệm này, ta xem ví dụ sau đây. Dữ liệu trong bảng 3.1 là phân phối điểm điểm thi mô kinh tế vi mô của 200 sinh viên. Đây là một ví dụ về phân phối 3
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ ThS Phùng Thanh Bình tần suất cho biết các điểm ngẫu nhiên được phân phối như thế nào. Các con số trong cột 3 là các tần suất tuyệt đối, nghĩa là số lần xảy ra của một biến cố nhất định. Các con số trong cột 4 được gọi là các tần suất tương đối, nghĩa là số tần suất tuyệt đối chia tổng số lần xảy ra.  BẢNG 3.2: Phân phối điểm KTL của 200 sinh viên Điểm Điểm giữa của Tần suất Tần suất tương khoảng tuyệt đối đối 0-9 5 0 0 10-19 15 0 0 20-29 25 0 0 30-39 35 10 0.050 40-49 45 20 0.100 50-59 55 35 0.175 60-69 65 50 0.250 70-79 75 45 0.225 80-89 85 30 0.150 90-99 95 10 0.050 Tổng 200 1.000 Nguồn: Gujarati, 2006, trang 28 PHÂN PHỐI XÁC SUẤT Phân phối xác suất của một biến ngẫu nhiên rời rạc Giả sử X là một biến ngẫu nhiên rời rạc với các giá trị x1, x2, ... thì hàm f được xác định bởi f(X=xi) = P(X=xi) i = 1, 2, … (3.7) =0 nếu x ≠ xi được gọi là hàm phân phối xác suất của biến ngẫu nhiên X, ký hiệu là PMF hay PF, trong đó, P(X=xi) là xác suất X có giá trị xi. Hàm PMF có các tính chất sau: 0  f(xi)  1 (3.8) n  f (x i )  1 (3.9) i 1 Ví dụ, biến X là số mặt ngửa khi tung hai đồng xu, ta xét bảng sau đây: 4
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ ThS Phùng Thanh Bình  BẢNG 3.3: PMF của biến ngẫu nhiên rời rạc Số mặt ngửa PMF 0.5 X f(X) 0 ¼ 0.25 0.25 1 ½ 2 ¼ 0 1 2 Tổng 1.00 Hình 3.1: PMF của biến ngẫu nhiên rời rạc Nguồn: Gujarati, 2006, trang 34 Phân phối xác suất của biến ngẫu nhiên liên tục Ví dụ, gọi X là biến chiều cao của một người, được đo bằng mét. Giả sử ta muốn tính xác suất để chiều cao của một người trong khoảng 1.56m đến 1.80m. Xác suất để chiều cao trong 4.04924276 khoảng 1.56 đến 1.8 3.54924276 3.04924276 2.54924276 2.04924276 1.54924276 1.04924276 0.54924276 0.04924276 1.4 1.44 1.48 1.52 1.56 1.6 1.64 1.68 1.72 1.76 1.8 1.84 1.88 1.92 1.96 Hình 3.2: PDF của một biến ngẫu nhiên liên tục Xác suất để chiều cao của một cá nhân nằm trong khoảng từ 1.56m đến 1.80m là diện tích dưới dường phân phối giữa hai giá trị 1.56 và 1.80. Đối với một biến ngẫu nhiên liên tục X, thì hàm mật độ xác suất f(X) như sau: x2 P(x1 X x2) =  f ( x )dx (3.10) x1 Hàm mật độ xác suất của một biến ngẫu nhiên X có các tính chất sau đây: 5
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ ThS Phùng Thanh Bình  Tổng diện tích dưới đường f(x) bằng 1  P(x1  X  x2) là diện tích dưới đường f(x) giữa x1 và x2, với x2 > x1.  Vì xác suất để một biến ngẫu nhiên nhận một giá trị nhất định bằng không, nên các công thức dưới đây là tương đương nhau: P(x1  X  x2) = P(x1  X  x2) = P(x1  X x2) = P(x1  X  x2) (3.11) Hàm phân phối tích lũy của một biến ngẫu nhiên Liên quan đến PMF hay PDF của một biến ngẫu nhiên X là hàm phân phối tích lũy của biến đó, được xác định như sau: F(X) = P(X  x) (3.12) P(X  x) nghĩa là xác suất để một biến ngẫu nhiên X có giá trị nhỏ thua hoặc bằng x, với x đã biết. CDF có các tính chất như sau:  F(-) = 0 và F(+) = 1  F(x) là một hàm không giảm, nghĩa là nếu x2 > x1, thì F(x2)  F(x1)  P(X  k) = 1 – F(k)  P(x1  X  x2) = F(x2) – F(x1)  BẢNG 3.4: Hàm phân phối xác suất tích lũy của một biến ngẫu nhiên Số mặt ngửa PDF CDF (X) X PDF X CDF 0 0  X < 1 1/16 X  0 1/16 1 1  X < 2 4/16 X  1 5/16 2 2  X < 3 6/16 X  2 11/16 3 3  X < 4 4/16 X  3 15/16 4 4  X 1/16 X  4 16/16 Nguồn: Gujarati, 2006, trang 37 Như vậy, CDF chỉ là tích lũy hay đơn giản là tổng của các PDF của các giá trị X nhỏ thua hoặc bằng x. Các hàm mật độ xác suất đa biến Ví dụ, một đại lý bán lẻ máy tính bán hai loại thiết bị là máy tính cá nhân và máy in. Số máy tính và máy in được 6
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ ThS Phùng Thanh Bình bán thay đổi giữa các ngày khác nhau, nhưng giám đốc đại lý đã thu thập doanh số của 200 ngày qua như trong bảng sau.  BẢNG 3.5: Phân phối tần suất của hai biến ngẫu nhiên X và Y Số máy in được bán Số máy tính được bán (X) Tổng (Y) 0 1 2 3 4 0 6 6 4 4 2 22 1 4 10 12 4 2 32 2 2 4 20 10 10 40 3 2 2 10 20 20 54 4 2 2 2 10 30 46 Tổng 16 24 48 48 64 200 Nguồn: Gujarati, 2006, trang 39 Bảng trên cho thấy trong 200 ngày có 30 ngày đại lý bán được 4 máy tính và 4 máy in, có 2 ngày bán được 4 máy tính nhưng không bán được máy in nào. Giải thích tương tự cho các con số còn lại. Đây là một ví dụ về phân phối tần suất kết hợp. Nếu chia từng con số trong bảng trên cho 200, ta sẽ có các tần suất tương đối.  BẢNG 3.6: Phân phối xác suất của hai biến ngẫu nhiên X và Y Số máy in được bán Số máy tính được bán (X) Tổng (Y) 0 1 2 3 4 0 0.03 0.03 0.02 0.02 0.01 0.11 1 0.02 0.05 0.06 0.02 0.01 0.16 2 0.01 0.02 0.01 0.05 0.05 0.23 3 0.01 0.01 0.05 0.10 0.10 0.27 4 0.01 0.01 0.01 0.05 0.05 0.23 Tổng 0.08 0.12 0.24 0.24 0.32 1.00 Nguồn: Gujarati, 2006, trang 39 Do hai biến X và Y là các biến ngẫu nhiên rời rạc, nên bảng 3.6 được gọi là hàm phân phối xác suất kết hợp của hai biến ngẫu nhiên. f(X,Y) = P(X = x và Y = y) (3.13) = 0 khi X  x và Y  y Hàm xác suất kết hợp có các tính chất sau:  f(X,Y)  0    f (X, Y)  1 x y 7
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ ThS Phùng Thanh Bình Hàm xác suất biên Xác suất X nhận một giá trị nhất định bất kể Y nhận giá trị gì được gọi là xác suất biên của X, và phân phối của các xác suất này được gọi là hàm phân phối xác suất biên.  BẢNG 3.7: Phân phối xác suất biên của X và Y X f(X) Y f(Y) 0 0.08 0 0.11 1 0.12 1 0.16 2 0.24 2 0.23 3 0.24 3 0.27 4 0.32 4 0.23 Tổng 1.00. 1.00 Nguồn: Gujarati, 2006, trang 41 Từ bảng xác suất kết hợp giữa X và Y ta có thể tính các hàm xác suất biên như sau: f(X) =  f (X, Y) y f(Y) =  f (X, Y) x Nếu hai biến X và Y là hai biến ngẫu nhiên liện tục thì ta sẽ thay ký hiệu tổng thành ký hiệu tích phân. Hàm xác suất điều kiện Giả sử ta muốn tìm xác suất có 4 máy in được bán nếu biết có 4 máy tính được bán trong này, và đó chính là xác suất có điều kiện. Hàm phân phối xác suất có điều kiện của một biến ngẫu nhiên có thể được định nghĩa như sau: F(YX) = P(Y=yX=x) (3.14) F(XY) = P(X=xY=y) (3.15) Một công thức đơn giản để tính hàm phân phối xác suất có điều kiện sẽ như sau: f ( X, Y ) F(YX) = (3.16) f (X) f ( X, Y ) F(XY) = (3.17) f (Y) 8
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ ThS Phùng Thanh Bình CÁC ĐẶC ĐIỂM CỦA PHÂN PHỐI XÁC SUẤT Giá trị kỳ vọng: Thước đo định tâm Giá trị kỳ vọng của một biến ngẫu nhiên rời rạc, ký hiệu là E(X), được định nghĩa như sau: E(X) = X =  xf (X) (3.18) x Giá trị kỳ vọng của một biến ngẫu nhiên là trung bình có trọng số của các giá trị có thể có của biến đó, với xác suất của các giá trị này, f(X), đóng vai trò như các trọng số. Giá trị kỳ vọng của một biến ngẫu nhiên cũng được gọi là giá trị trung bình, mặc dù chính xác hơn là giá trị trung bình tổng thể. Tính chất của giá trị kỳ vọng  E(b) = b (3.19)  E(X+Y) = E(X) + E(Y) (3.20) E(X)  E(X/Y)  (3.21) E(Y)  E(XY)  E(X)E(Y) (3.22) Nếu X và Y là hai biến ngẫu nhiên độc lập, thì E(XY) = E(X)E(Y) (3.23)  E(X2)  [E(X)]2 (3.24)  E(aX) = aE(X) (3.25)  E(aX+b) = aE(X) + b (3.26) Phương sai: Thước đo phân tán Giá trị kỳ vọng của một biến ngẫu nhiên đơn giản chỉ cho biết trọng tâm của biến đó ở đâu chứ không cho biết các giá trị riêng lẻ của biến đó phân tán như thế nào xung quanh giá trị trung bình. Thước đo phổ biến nhất cho sự phân tán này là phương sai, và được định nghĩa như sau: var(X) =  2 = E(X-x)2 x (3.27) var(X) =  (X   x ) 2 f (X) (3.28) 9
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ ThS Phùng Thanh Bình Phương sai cho biết các giá trị X riêng lẻ được phân phối hay phân tán xung quanh giá trị trung bình như thế nào. Nếu các giá trị X phân tán rộng quanh giá trị trung bình thì phương sai sẽ tương đối lớn (xem Hình 3.3). Căn bậc hai của phương sai là độ lệch chuẩn, ký hiệu là x. Phương sai quá nhỏ Phương sai quá lớn X Hình 3.3: PDF của các biến ngẫu nhiên liên tục cùng giá trị kỳ vọng Tính chất của phương sai  Phương sai của một hằng số bằng không.  Nếu X và Y là hai biến ngẫu nhiên độc lập, thì var(X+Y) = var(X) + var(Y) (3.29) var(X-Y) = var(X) – var(Y)  Nếu b là hằng số, thì var(aX) = a2var(X) (3.30)  Nếu a và b là hằng số, thì var(aX+b) = a2var(X) (3.31)  Nếu X và Y là hai biến độc lập và a và b là hằng số, thì var(aX+bY) = a2var(X) + b2var(Y) (3.32) 10
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ ThS Phùng Thanh Bình  Để tiện lợi cho việc tính toán, công thức phương sai cũng có thể được viết lại như sau: var(X) = E(X2) – [E(X)]2 (3.33) Hệ số biến thiên Lưu ý rằng, vì độ lệch chuẩn (hay phương sai) phụ thuộc vào các đơn vị đo lường khác nhau, cho nên sẽ khó cho việc so sánh giữa các độ lệch chuẩn nếu chúng có các thước đo khác nhau. Để giải quyết vấn đề này, ta có thể sử dụng hệ số biến thiên (V) như sau: x V = .100 (3.34) x Hiệp phương sai Giả sử X và Y là hai biến ngẫu nhiên với E(X) = x và E(Y) = y, thì hiệp phương sai (cov) giữa hai biến sẽ như sau: Cov(X,Y) = E[(X-x)(Y-y)] = E(XY) - xy (3.35) Hiệp phương sai giữa hai biến có thể dương, âm, hoặc bằng không. Nếu hai biến vận động theo cùng chiều, thì hiệp phương sai sẽ dương, nếu khác chiều, thì hiệp phương sai sẽ âm. Nếu hiệp phương sai giữa hai biến bằng không, thì có nghĩa là không có mối quan hệ tuyến tính nào giữa hai biến đó. Ta có thể tính hiệp phương sai theo công thức sau đây: cov(X,Y) =   (X   x )( Y   y )f (X, Y) x y =   XYf (X, Y)   x  y (3.36) x y = E(XY) - xy Tính chất của hiệp phương sai  Nếu X và Y là hai biến ngẫu nhiên độc lập, hiệp phương sai của chúng bằng không vì khi đó E(XY) = E(X)E(Y) = xy.  cov(a+bX, c+dY) = bdcov(X,Y) (3.37)  cov(X,X) = var(X) (3.38) 11
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ ThS Phùng Thanh Bình  Nếu X và Y là hai biến ngẫu nhiên nhưng không nhất thiết phải độc lập, thì công thức tính phương sai (3.29) được viết lại như sau: var(X+Y) = var(X) + var(Y) + 2cov(X,Y) (3.39) var(X-Y) = var(X) + var(Y) – 2cov(X,Y) (3.40) Hệ số tương quan Hệ số tương quan là thước đo mối quan hệ tuyến tính giữa hai biến ngẫu nhiên, nghĩa là nó cho biết hai đó có quan hệ với nhau như thế nào: mạnh hay yếu. Hệ số tương quan tổng thể (, rho) được xác định như sau: cov(X, Y)  = (3.36) xy Tính chất của hệ số tương quan  Giống hiệp phương sai, hệ số tương quan có thể âm hoặc dương.  Hệ số tương quan là một thước đo mối quan hệ tuyến tính giữa hai biến.  -1    1 (3.37)  Hệ số tương quan là một con số thuần túy không có đơn vị đo lường.  Nếu hai biến độc lập, hệ số tương quan bằng không.  Hệ số tương quan không hàm ý mối quan hệ nhân quả. Kỳ vọng có điều kiện Một khái niệm thống kê khác đặc biệt quan trọng trong phân tích hồi qui là khái niệm kỳ vọng có điều kiện. E(XY=y) =  Xf (X / Y  y) (3.38) X Độ nghiêng và độ nhọn Độ nghiêng và độ nhọn cho ta biết điều gì đó về hình dạng của phân phối xác suất. Độ nghiêng (S) là một thước đo sự mất cân xứng của đồ thị phân phối xác suất, và độ nhọn (K) là một thước đo độ cao hay thấp của đồ thị phân phối xác suất. Mô men thứ ba: E(X-x)3 (3.39) Mô men thứ tư: E(X-x)4 (3.40) 12
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ ThS Phùng Thanh Bình E ( X   x )3 S = (3.41) 3 x Đối xứng Nghiêng phải Nghiêng trái X Hình 3.4: Độ nghiêng của phân phối Có ba khả năng xảy ra như sau:  Nếu S = 0, PDF đối xứng quanh giá trị trung bình  Nếu S > 0, PDF bị nghiêng phải  Nếu S < 0, PDF bị nghiêng trái E(X   x ) 4 K = (3.42) [E(X   x ) 2 ] 2 Có ba khả năng xảy ra như sau:  Nếu K = 3, PDF có độ nhọn chuẩn và được gọi là mesokurtic  Nếu K < 3, PDF có đuôi ngắn và được gọi là platykurtic  Nếu K > 3, PDF có đuôi dài và được gọi là leptokurtic 13
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ ThS Phùng Thanh Bình Đuôi ngắn Độ nhọn chuẩn Đuôi dài X Hình 3.5: Độ nhọn của phân phối TỪ TỔNG THỂ ĐẾN MẪU Trung bình mẫu Trung bình mẫu của một biến ngẫu nhiên X có n quan sát được ký hiệu là X (đọc là X ngang) và được định nghĩa như sau: n Xi X  (3.43) i 1 n Trung bình mẫu được xem là một ước lượng của E(X), từ trung bình tổng thể. Một ước lượng đơn giản là một qui tắc, một công thức, hay một thống kê cho ta biết làm sao để ước lượng một đại lượng của tổng thể. Giả sử X có 7 quan sát với các giá trị như sau: 8, 9, 10, 11, 12, 13, 14. Vậy X = 11, và con số 11 này được gọi là một giá trị ước lượng của trung bình tổng thể. Thao tác với Eviews Trên cửa sổ lệnh của Eviews ta nhập: scalar meanX=@mean(x) 14
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ ThS Phùng Thanh Bình Phương sai mẫu Phương sai mẫu được ký hiệu bằng S2 , là ước lượng của x phương sai tổng thể  2 . Phương sai mẫu được định nghĩa x như sau: n (X i  X) 2 S2 x  (3.44) i 1 n  1 n-1 được gọi là số bậc tự do (d.f.). Bậc tự do là số nguồn thông tin (piece of information) về một biến ngẫu nhiên. Để hiểu khái niệm này, ta xét ví dụ sau đây.  BẢNG 3.8: Định nghĩa khái niệm bậc tự do Quan sát X (X- X ) (X- X ) 2 1 8 -3 9 2 9 -2 4 3 10 -1 1 4 11 0 0 5 12 1 1 6 13 2 4 7 14 3 9 Tổng 0 28 Nguồn: Tác giả Ta biết rằng tổng độ lệch luôn luôn bằng không1, nên để xem độ lệch của các giá trị X so với giá trị trung bình ta phải lấy độ lệch bình phương. Tổng của 7 độ lệch bình phương là 28, nhưng thực sự con số 28 này chỉ do 6 “nguồn” đóng góp, vì quan sát thứ tư trùng với giá trị trung bình. Như vậy, để xem độ lệch trung bình ta chỉ lấy 28 chia cho số nguồn thực sự tạo ra nó, tức 7-1 = 6. Vậy phương sai là 4.67 (là một giá trị ước lượng của phương sai tổng thể) và căn bậc hai của phương sai mẫu được gọi là độ lệch chuẩn mẫu (s.d.). Độ lệch chuẩn (2.16) được xem như một thước đo sấp xỉ cho trung bình của 6 độ lệch tuyệt đối ở trên. Mở rộng cho trường hợp một biến ngẫu nhiên liên tục. Thao tác với Eviews Trên cửa sổ lệnh của Eviews ta nhập: scalar varX=@var(x) 1 Chứng minh:  (X  X)   X   X   X  nX   X   X  0 15
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ ThS Phùng Thanh Bình Hiệp phương sai mẫu Hiệp phương sai mẫu giữa hai biến ngẫu nhiên X và Y là ước lượng của hiệp phương sai tổng thể, và được định nghĩa như sau:  (X i  X)( Yi  Y) Cov(X,Y) = (3.45) n 1 Thao tác với Eviews Trên cửa sổ lệnh của Eviews ta nhập: scalar covXY=@cov(x,y) Hệ số biến thiên mẫu Hệ số biến thiên mẫu của X được xác định bằng công thức sau đây: Sx V = .100 (3.46) X Thao tác với Eviews Trên cửa sổ lệnh của Eview ta nhập: scalar cvX=@stdev(x)/@mean(x) Hệ số tương quan mẫu Hệ số tương quan mẫu giữa hai biến ngẫu nhiên X và Y là ước lượng của hệ số tương quan tổng thể, và được định nghĩa như sau:  (Xi  X)( Yi  Y) /(n  1) r (3.47) s.d.( X)s.d.( Y) Thao tác với Eviews Trên cửa sổ lệnh của Eviews ta nhập: scalar corXY=@cor(x,y) Độ nghiêng và độ nhọn mẫu Để tính độ nghiêng và độ nhọn mẫu, ta sử dụng các mô men mẫu thứ ba và thứ tư như sau:  (X  X) 3 Mô men thứ ba: (3.48) (n  1)  (X  X) 4 Mô men thứ tư: (3.49) (n  1) 16
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ ThS Phùng Thanh Bình Thao tác với Eviews Trên cửa sổ lệnh của Eviews ta nhập: scalar skewX=@skew (x) scalar kurtX=@kurt(x) MỘT SỐ PHÂN PHỐI XÁC SUẤT QUAN TRỌNG Phân phối chuẩn Kinh nghiệm cho thấy rằng phân phối chuẩn là một mô hình hợp lý cho một biến ngẫu nhiên liên tục với giá trị của nó phụ thuộc vào nhiều yếu tố, nhưng mỗi yếu tố chỉ có ảnh hưởng tương đối nhỏ lên giá trị của biến số đó. Phân phối chuẩn của một biến ngẫu nhiên X được thể hiện thông qua hai tham số cơ bản là giá trị trung bình và phương sai. Cụ thể như sau: X ~ N(x,  2 ) x (3.50) -3 -3 -2 -2 - -1  0  1 2 2 3 3 khoảng 68% khoảng 95% khoảng 99.7% Hình 3.6: Đồ thị phân phối chuẩn 17
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ ThS Phùng Thanh Bình Tính chất của phân phối chuẩn  Đường phân phối chuẩn đối xứng quanh giá trị trung bình x.  Hàm phân phối xác suất PDF của một biến ngẫu nhiên theo phân phối chuẩn cao nhất tại giá trị trung bình nhưng nhỏ dần về các cực trị của nó. Nghĩa là, xác suất để có một giá trị của một biến ngẫu nhiên theo phân phối chuẩn càng xa giá trị trung bình càng nhỏ.  Theo kinh nghiệm, khoảng 68% diện tích dưới đường phân phối chuẩn nằm giữa giá trị x±x, khoảng 95% diện tích nằm giữa x±2x, và khoảng 99.7% diện tích nằm giữa x±3x.  Một phân phối chuẩn được định nghĩa hoàn toàn bởi hai tham số x và  2 . Một khi biết được hai tham số này x thì ta có thể tính được xác suất của X nằm trong một khoảng nhất định theo công thức sau:  1  X  μ 2   f(X) = 1 exp -  x  (3.51) σx  σ   2Π  2  x     Một kết hợp (hay một hàm) tuyến tính của hai hay nhiều biến ngẫu nhiên theo phân phối chuẩn sẽ theo phân phối chuẩn – đây là một tính chất đặc biệt quan trọng của phân phối chuẩn trong kinh tế lượng.  Đối với phân phối chuẩn, thì độ nghiêng S là 0 và độ nhọn K là 3. Phân phối chuẩn hóa Mặc dù một phân phối chuẩn hoàn toàn được xác định bằng hai tham số, giá trị trung bình và phương sai tổng thể, nhưng các phân phối chuẩn có thể khác nhau hoặc ở giá trị trung bình, hoặc phương sai, hoặc cả hai. 18
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ ThS Phùng Thanh Bình -3 -2 -1 1 0 2 1 2 3 4 Hình 3.7: So sánh các phân phối chuẩn có trung bình và phương sai khác nhau Ta không thể so sánh các phân phối chuẩn có các tính chất khác nhau. Cho nên, người ta qui về cùng một biến chuẩn hóa Z như sau: X  x Z (3.52) x Theo tính chất của phân phối chuẩn, nếu X là một biến ngẫu nhiên có trung bình là x và phương sai là x, X ~ N(X, 2X), thì Z là một kế hợp tuyến tính của X sẽ là một biến ngẫu nhiên có phân phối chuẩn với trung bình là không và phương sai là một, Z ~ N(0, 1)2. Như vậy, bất kỳ một biến ngẫu nhiên theo phân phối chuẩn với một giá trị trung bình và phương sai nhất định đều có thể được chuyển đổi thành một biến chuẩn hóa, điều này giúp đơn giản hóa rất nhiều việc tính xác suất. Để hiểu vai trò của phân phối chuẩn hóa, ta xem xét ví dụ sau đây.  X  x  1 2 Chứng minh: E(Z) = E       E(X   x )  0 do E(X-x) = E(X) – E(x) = x - x = 0. Và Var(Z) =  x  x 2  X  x  1 1 2 2 2 2  E[Z-E(Z)] = E(Z ), do E(Z) = 0, vậy E(Z ) = E    E(X   x ) 2  x  1  x   2 x 2x 19
BÀI GIẢNG 3: ÔN TẬP XÁC SUẤT THỐNG KÊ ThS Phùng Thanh Bình Giả sử X, số lượt khách du lịch quốc tế hàng ngày của một công ty du lịch, theo phân phối chuẩn với giá trị trung bình là 70 và phương sai là 9; nghĩa là, X ~ N(70,9). Hãy tính xác suất cho một ngày bất kỳ công ty có số khách du lịch quốc tế nhiều hơn 75 khách? Ta thấy, do X theo phân phối chuẩn với giá trị trung bình và phương sai đã biết, nê ta có: 75  70 Z   1.67 3 sẽ theo phân phối chuẩn hóa với trung bình bằng 0 và phương sai bằng 1. Thay vì tìm P(X > 75), ta có thể tìm P(Z > 1.67). Lưu ý, trong các sách thống kê và kinh tế lượng thường có kèm phụ lục bảng thống kê giá trị hàm phân phối xác suất tích lũy (CDF) hay giá trị xác suất tích lũy của phân phối chuẩn hóa giữa các giá trị Z = -3 và Z = 3 (tại sao?). Theo bảng thống kê này thì xác suất Z nằm từ -3 đến 1.67 là 0.95253. Cho nên, P(Z > 1.67) = 1 – P(Z < 1.67) = 1 – 0.9525 = 0.0475 Vây xác suất để một ngày bất kỳ công ty có số lượt khách du lịch nhiều hơn 75 người là 4.75%. Tóm lại, một biến ngẫu nhiên bất kỳ mà giá trị của nó phụ thuộc vào rất nhiều yếu tố, nhưng không có yếu tố nào có ảnh hưởng quyết định giá trị đó, thì biến ngẫu nhiên đó sẽ theo phân phối chuẩn4. Và bất kỳ một biến X có phân phối chuẩn với giá trị trung bình và phương sai đã biết thì đều có thể chuyển được sang biến chuẩn hóa Z có giá trị trung bình là 0 và phương sai là 1. Thao tác với Eviews Trên cửa sổ lệnh của Eviews ta nhập: scalar probm167=1-@cnorm(1.67) = 0.0475 scalar probs167=@cnorm(1.67) = 0.9525 scalar probs_167=@cnorm(-1.67) = 0.0475 scalar Zval09525=@qnorm(0.9525) = 1.67 3 Nếu quí vị đang sử dụng máy vi tính mà lụi cụi tra bảng thống kê thì cô ấy nhà bên nhìn qua cười khúc khít đó. Hãy mở Excel ra là làm thế này: = NORMDIST(X, Mean, Standard_dev, Cumulative). Trong đó, “X” là giá trị cần tính xác suất tích lũy (1.67), “Mean” và “Standard_dev” ở đây lần lượt là trung bình (0) và độ lệch chuẩn (1) của biến X, và “Cumulative” có hai lựa chọn là “True” (đồng ý tính xác suất tích lũy) và “False” (không tính xác suất tích lũy). Ở trường hợp đang xét, ta chọn “True”. Ngược lại, nếu ta đã biết xác suất tích lũy, giá trị trung bình và phương sai thì ta dễ dàng tính giá trị của biến đó như sau: =NORMINV(0.9525,0,1) = 1.67. 4 Đây là cơ sở quan trọng cho việc giả định rằng hạn nhiễu ui có phân phối chuẩn (sẽ được nói đến ở bài giảng 6). 20

CÓ THỂ BẠN MUỐN DOWNLOAD

THÔNG TIN

TRỢ GIÚP

HỖ TRỢ KHÁCH HÀNG

Theo dõi chúng tôi

Chịu trách nhiệm nội dung:

Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA

LIÊN HỆ

Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM

Hotline: 093 303 0098

Email: support@tailieu.vn

Giấy phép Mạng Xã Hội số: 670/GP-BTTTT cấp ngày 30/11/2015 Copyright ©2025 TaiLieu.VN. All rights reserved.