Luận văn Thạc sĩ Toán học: Phân tích Bayes theo chuẩn L1

Chia sẻ: Lavie Lavie | Ngày: | Loại File: PDF | Số trang:91

Thêm vào BST

Báo xấu

73
lượt xem 9
download

Download Vui lòng tải xuống để xem tài liệu đầy đủ

Luận văn Thạc sĩ Toán học: Phân tích Bayes theo chuẩn L1 đưa ra những kiến thức chuẩn bị (lý thuyết xác suất, định lý Bayes, phép biến đổi các biến ngẫu nhiên,...); phân tích Bayes theo chuẩn L1; cận của sai số Bayes trong bài toán phân loại.

Chủ đề:

Bình luận(0) Đăng nhập để gửi bình luận!

Lưu

Nội dung Text: Luận văn Thạc sĩ Toán học: Phân tích Bayes theo chuẩn L1

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM TP.HCM Cao Thị Hồng Nhung PHÂN TÍCH BAYES THEO CHUẨN L1 LUẬN VĂN THẠC SĨ TOÁN HỌC Thành phố Hồ Chí Minh – 2012
BỘ GIÁO DỤC VÀ ÐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM TP.HCM Cao Thị Hồng Nhung 1 PHÂN TÍCH BAYES THEO CHUẨN L Chuyên ngành: Toán Giải Tích Mã số: 60 46 01 LUẬN VĂN THẠC SĨ TOÁN HỌC NGƯỜI HƯỚNG DẪN KHOA HỌC GS. TS. ĐẶNG ĐỨC TRỌNG Thành phố Hồ Chí Minh – 2012
LỜI CẢM ƠN Sau hai năm học tập tại đại học Sư phạm Tp.HCM chuyên ngành toán Giải tích với sự quan tâm, giúp đỡ tận tình của thầy cô, gia đình và bạn bè, hôm nay em hoàn thành khóa học với luận văn tốt nghiệp này. Em xin bày tỏ lòng biết ơn chân thành, sâu sắc đến:  Cha mẹ đã luôn quan tâm dạy bảo, lo lắng cho con trên mỗi bước đường đời và là chỗ dựa vững chắc để con hoàn thành tốt luận văn.  Thầy Đặng Đức Trọng – người đã tận tình hướng dẫn luận văn cho em. Là một học viên chuyên ngành giải tích nên kiến thức về lĩnh vực Xác suất - Thống kê vẫn còn nhiều hạn chế, thầy đã dành nhiều thời gian chỉ dạy, hướng dẫn và giúp đỡ em suốt cả quá trình thực hiện luận văn, đó là nguồn động lực vô cùng lớn để em có thể hoàn thành đề tài của mình. Em thật sự rất biết ơn thầy!.  Thầy Chu Đức Khánh và Thầy Đinh Ngọc Thanh. Hai thầy đã tận tình quan tâm giúp đỡ và chỉ dẫn chúng em trong nghiên cứu khoa học. Qua đó em cũng xin cảm ơn ThS. Nguyễn Văn Phong cùng các anh chị trong “nhóm seminar”, đã cùng nhau trao đổi với em về đề tài này.  Các thầy trong Khoa Toán – tin trường Đại học Sư phạm TPHCM, đã tận tình giảng dạy chúng em, cùng các thầy cô Phòng Sau đại học đã tạo điều kiện cho chúng em trong hai năm học Cao học vừa qua.  Cuối cùng xin cảm ơn tất cả các bạn đã giúp đỡ, đóng góp ý kiến để luận văn được hoàn chỉnh hơn. Xin chân thành cảm ơn tất cả!. Tp Hồ Chí Minh, tháng 9 năm 2012 Cao Thị Hồng Nhung
MỤC LỤC LỜI CẢM ƠN DANH MỤC DỊCH MỘT SỐ THUẬT NGỮ TIẾNG ANH PHẦN MỞ ĐẦU CHƯƠNG I. KIẾN THỨC CHUẨN BỊ .....................................................................1 1.1 Lý thuyết xác suất ..............................................................................................1 1.2 Định lý Bayes.....................................................................................................5 1.3 Phép biến đổi các biến ngẫu nhiên ....................................................................7 1.4 Các số đặc trưng của biến ngẫu nhiên ..............................................................8 1.5 Một số phân phối của biến ngẫu nhiên ............................................................10 1.6 Hàm Lauricella D ............................................................................................15 1.7 Lý thuyết và phương pháp phân tích Bayes ...................................................17 1 CHƯƠNG II. PHÂN TÍCH BAYES THEO CHUẨN L ........................................30 2.1 Hệ số chồng lấp và sai số Bayes giữa hai hàm mật độ trong R .......................30 2.2 Phân tích Bayes cho tỷ lệ trộn trong phân loại và nhận dạng hai tổng thể ......42 2.3 Khoảng cách L1 giữa hai hàm mật độ xác suất ................................................54 2.4 Khoảng cách L1 giữa hai tổng thể ....................................................................57 2.5 Ví dụ cụ thể trong phân tích tỷ lệ trộn π ........................................................59 CHƯƠNG III. CẬN CỦA SAI SỐ BAYES TRONG BÀI TOÁN PHÂN LOẠI ...66 3.1 Cận cho sai số Bayes trung bình ......................................................................67 3.2 Phân tích hậu nghiệm.......................................................................................74 3.3 Ví dụ cụ thể ......................................................................................................76 KẾT LUẬN ...............................................................................................................80 TÀI LIỆU THAM KHẢO .........................................................................................82
DANH MỤC DỊCH MỘT SỐ THUẬT NGỮ TIẾNG ANH Population: tổng thể. Observation: quan sát. Observable: quan sát được. Unobservable: không quan sát được. Prior probability: xác suất tiên nghiệm. Posterior probability: xác suất hậu nghiệm. Marginal probability: xác suất lề. Conjugate family prior: họ phân phối tiên nghiệm liên hợp Classification: phân loại. Misclassification: phân loại sai. Likelihood function: hàm hợp lý. Cost of misclassification: giá của phân loại sai. Expected cost of misclassification (ECM): kỳ vọng giá phân loại sai. Overlapping coefficient: hệ số chồng lấp. Incomplete Beta function: hàm Beta khuyết. Binomial distribution: phân phối nhị thức. Predictive distribution: phân phối dự đoán. Improper: tầm thường. Credible interval: khoảng tin cậy. Bayes inference: suy diễn Bayes Decision theory: lý thuyết quyết định. Decision rule: quy tắc quyết định. Actions: các tác động. Loss function: hàm tổn thất. Mean squared error: sai số bình phương trung bình. Normalizing constant: hằng số chuẩn hóa. Proportional: tỷ lệ. Effectiveness: tính hiệu quả
PHẦN MỞ ĐẦU 1 Lý do chọn đề tài Trong thực tế có nhiều vấn đề đòi hỏi chúng ta phải giải quyết bài toán phân loại và phân biệt các tổng thể H1 và H 2 , do đó vấn đề này được rất nhiều nhà toán học quan tâm trên lý thuyết cũng như ứng dụng. Có rất nhiều phương pháp để giải quyết bài toán phân loại đã được đề cập chẳng hạn phương pháp phân loại dựa vào phương pháp phân tích phân biệt của R.A. Fisher (1936), tiêu chuẩn tỷ số hợp lý của T.W. Aderson (1984) [1], phương pháp sai số Bayes đề cập bởi T.P. Logan (1993) và cũng được nhắc đến bởi nhóm tác giả Pham-Gia, N. Tukkan và A. Bekker (2006) [6],…Trong số đó phương pháp Bayes được xem là có hiệu quả hơn hết vì nó tính được xác suất sai lầm trong quá trình phân loại. Trong bài toán phân loại và phân biệt, nghiên cứu sai lầm luôn là vấn đề quan trọng được đặt ra vì nó là tiêu chuẩn để đánh giá việc giải quyết bài toán tốt hay không. Số đo trong phương pháp Bayes gọi là sai số Bayes ( Pe ) và phân loại là tốt nhất khi sai số Bayes là nhỏ nhất. Hơn nữa các tiêu chuẩn phân loại bài toán còn dựa trên sự đánh giá khoảng cách giữa các phần tử hay hàm mật độ xác suất, do đó việc chọn một khoảng cách thích hợp thuận lợi trong xử lý và tính toán luôn được quan tâm đặc biệt. Có nhiều khoảng cách được đưa ra nhưng tối ưu nhất là khoảng cách L1 giữa các hàm mật độ được đề cập bởi Pham-Gia et. al. (2006) [6]. Thông qua khoảng cách này sai số Bayes (cũng như mối quan hệ giữa các đại lượng trong bài toán phân loại và phân biệt) được đề cập. Trong phương pháp phân loại này người ta còn đặc biệt quan tâm đến tổng thể H 3 chứa những phần tử chung của H1 và H 2 , kết hợp từ mỗi tổng thể với tỷ lệ nào đó. Giả sử trên H1 và H 2 ta quan sát biến ngẫu nhiên X , ký hiệu f1 ( x ) , f 2 ( x ) là hàm mật độ xác suất tương ứng trên hai tổng thể và gọi π là tỷ lệ trộn của những phần tử H1 trong H 3 ( 0 ≤ π ≤ 1) , khi đó hàm mật độ xác suất của biến ngẫu nhiên
( x ) π f1 ( x ) + (1 − π ) f 2 ( x ) , trong đó 1 − π là tỷ lệ X trên tổng thể H 3 có dạng: g = trộn của những phần tử H 2 trong H 3 . Tham số π thường không được biết một cách chính xác, vì vậy vấn đề cần quan tâm ở đây là ước lượng π . Ước lượng này đã được nghiên cứu bởi McLachlan và Basford (1988); Everitt (1985) dựa trên phương pháp cực đại tỷ số hợp lý và phương pháp mômen. Trước đó James (1978) đã dựa trên thực tế để ước lượng π nhưng đáng chú ý phải kể đến là phương pháp Bayes của nhóm tác giả Pham-Gia, N. Tukkan và A. Bekker (2006) [6], phương pháp này cho phép chúng ta ước lượng π với giả thiết π có luật phân phối xác suất tiên nghiệm cụ thể chọn trước. Với mong muốn tìm hiểu, nghiên cứu những vấn đề đã nêu, dựa trên hai bài báo [6] và [7], chúng tôi thực hiện đề tài: “PHÂN TÍCH BAYES THEO CHUẨN L1 ” 2 Mục đích nghiên cứu Đề tài nhằm trình bày phương pháp phân loại phần tử quan sát vào một trong hai tổng thể trên R theo chuẩn L1 , từ đó thực hiện phân tích Bayes và tìm hàm mật độ hậu nghiệm cho tỷ lệ trộn π trong hỗn hợp. Đồng thời tìm phân phối cho khoảng cách L1 giữa hai hàm mật độ trên hai tổng thể cũng như khoảng cách giữa hai tổng thể. Xác định chặn trên và chặn dưới cho sai số Bayes trong phân loại, đó là cận Lissack – Fu và cận Bhattacharyya, qua đó đánh giá sự ảnh hưởng của các phân phối tiên nghiệm của π trên hai loại cận này. 3 Đối tượng và phạm vi nghiên cứu Đề tài chủ yếu tập trung phân tích các khái niệm, định lý trên R và theo chuẩn L1. Dựa vào phương pháp Bayes để phân tích tỷ lệ trộn π trong hỗn hợp. Các tổng thể với biến ngẫu nhiên có phân phối chuẩn, mũ, beta và mô hình dữ liệu có phân phối nhị thức. 4 Phương pháp nghiên cứu Phương pháp phân tích:
Phân tích đề tài để xác định đối tượng và phạm vi nghiên cứu. Dựa trên các bài báo, tài liệu tham khảo để phân tích làm rõ vấn đề cần nghiên cứu. Phương pháp tổng hợp, khái quát hóa: Tổng hợp, khái quát các vấn đề đã phân tích. 5 Nội dung nghiên cứu Luận văn chia làm 3 chương Chương I. Kiến thức chuẩn bị Nội dung chương trình bày các kiến thức cơ bản về xác suất, định lý Bayes, lý thuyết và phương pháp phân tích Bayes làm cơ sở nghiên cứu cho các chương sau. Chương II. Phân tích Bayes theo chuẩn L1 Nội dung: Trình bày phương pháp phân loại phần tử quan sát vào một trong hai tổng thể trên R theo khoảng cách L1 . Phân tích tỷ lệ trộn π của những phần tử thuộc H1 trong hỗn hợp H 3 theo phương pháp Bayes với giả thiết π có một phân phối tiên nghiệm cho trước và dựa vào dữ liệu để phân tích hậu nghiệm cho π . Đồng thời dựa trên khoảng cách L1 để tìm phân phối cho khoảng cách giữa hai hàm mật độ trên hai tổng thể và phân phối giữa hai tổng thể. Chương III. Cận của sai số Bayes trong bài toán phân loại Trong chương này nêu hai dạng cận của sai số Bayes đó là cận Lissack – Fu và cận Bhattacharyya trong sự phân loại quan sát phần tử vào một trong hai tổng thể xác định. Đồng thời đưa ra khái niệm các phép đo tính hiệu quả để đánh giá sự thực hiện của một phân phối và so sánh giữa hai phân phối tiên nghiệm.
1 CHƯƠNG I KIẾN THỨC CHUẨN BỊ 1.1 Lý thuyết xác suất 1.1.1 Khái niệm xác suất Cho Ω là không gian mẫu,  là một σ − đại số trên Ω , khi đó hàm P :  → R được gọi là một phân phối xác suất hoặc một độ đo xác suất nếu nó thỏa mãn 3 tiên đề sau: i) P ( A ) ≥ 0 với mọi A∈  . ii) P ( Ω ) =1. iii) 1,..., n và Ai ∩ Aj =∅, ∀i ≠ j , thì Nếu có các Ai ∈  , i = ∞  ∞ P   Ai  = ∑ P ( Ai ).  i =1  i =1 Khi đó một bộ ba ( Ω,  , P ) được gọi là một không gian xác suất, tập A∈  là các biến cố và P ( A ) là xác suất của biến cố A . 1.1.2 Biến ngẫu nhiên Một biến ngẫu nhiên (hay còn gọi là một đại lượng ngẫu nhiên) là một ánh xạ X : → R , trong đó với mỗi sự kiện A∈  , X ( A ) sẽ nhận tương ứng một số thực a . Cho B ⊂ R , ta định nghĩa P ( X ∈ B) = ( P X −1 ( B ) . ) 1.1.3 Hàm phân phối và hàm mật độ 1.1.3.1 Định nghĩa. Giả sử X là biến ngẫu nhiên trên ( Ω,  , P ) . Hàm phân phối tích lũy hay gọi tắt là hàm phân phối (viết tắt cdf) của X là hàm F : R → [ 0,1] xác định bởi ( x) P ( X ≤ x) . F=
2 1.1.3.2 Định nghĩa. Biến ngẫu nhiên X được gọi là rời rạc nếu X nhận hữu hạn hoặc đếm được các giá trị xi , i = 1, 2,... . Khi đó hàm mật độ của X được định nghĩa bởi ( x ) P= f= ( X x) . Như vậy, ta có mối quan hệ F ( x = ) P ( X ≤ x =) ∑ f (x ). xi ≤ x i 1.1.3.3 Định nghĩa. Biến ngẫu nhiên X được gọi là liên tục nếu tồn tại một hàm f ( x ) sao cho i) f ( x ) ≥ 0 với mọi x. +∞ ii) ∫ f ( x ) dx = 1 . −∞ iii) Với mỗi số a, b sao cho a ≤ b ta có b P (a < X < b) = ∫ f ( x ) dx . a Khi đó hàm f ( x ) được gọi là hàm mật độ (pdf) của biến ngẫu nhiên X . Từ đó x F ( x= ) P ( X ≤ x =) ∫ f ( t ) dt −∞ và f ( x) = F '( x) . 1.1.3.4 Một số tính chất. Giả sử F là hàm của biến ngẫu nhiên X . Khi đó i) 0 ≤ F ( x ) ≤ 1, ∀x . ii) F ( x ) không giảm. iii) lim F ( x ) = 0 , lim F ( x ) = 1 . x →−∞ x →+∞ iv) P ( x < X ≤ y= ) F ( y) − F ( x) . v) P ( X > x ) =− 1 F ( x) . vi) Nếu X là liên tục, khi đó
3 F ( b ) − F ( a )= P ( a < X < b )= P ( a ≤ X < b ) = P ( a < X ≤ b )= P ( a ≤ X ≤ b ) . 1.1.4 Phân phối đồng thời cho hai biến ngẫu nhiên 1.1.4.1 Định nghĩa. Cho X và Y là hai biến ngẫu nhiên độc lập rời rạc. Định nghĩa hàm mật độ đồng thời bởi f ( x= , y ) P= ( X x và = Y y ) . Ký hiệu = và Y y ) có thể được viết lại P (= P ( X x= ,Y y ) . X x= 1.1.4.2 Định nghĩa. Giả sử X và Y là các biến ngẫu nhiên liên tục, ta gọi hàm f ( x, y ) là hàm mật độ đồng thời cho cả hai biến ngẫu nhiên liên tục X và Y nếu i) f ( x, y ) ≥ 0 với mọi ( x, y ) . +∞ + ∞ ii) ∫ ∫ f ( x, y ) dxdy = 1. −∞ −∞ iii) Với bất kỳ tập A ⊂ R x R , ta có P ( ( X , Y ) ∈ A) = ∫∫ f ( x, y ) dxdy . A Nếu X , Y là hai biến ngẫu nhiên độc lập ta có f ( x, y ) = f X ( x ) fY ( y ) với tất cả các giá trị của x và y . 1.1.5 Phân phối lề 1.1.5.1 Định nghĩa. Nếu X , Y là các biến ngẫu nhiên rời rạc có phân phối đồng thời với hàm mật độ f ( x, y ) . Khi đó hàm mật độ lề cho biến ngẫu nhiên X được định nghĩa bởi f X ( x= ) P ( X= x=) ∑ P ( X= y ) x, Y= y= ∑ f ( x, y ) y và hàm mật độ lề cho biến ngẫu nhiên Y được định nghĩa fY ( y= ) P (Y= y=) ∑ P ( X= x x, Y ) = y= ∑ f ( x, y ) . x 1.1.5.2 Định nghĩa. Đối với biến ngẫu nhiên X , Y liên tục, ta có các hàm mật độ lề f X ( x ) = ∫ f ( x, y ) dy và fY ( y ) = ∫ f ( x, y ) dx .
4 Chú ý. Trong trường hợp X liên tục và Y rời rạc. Ta có hàm mật độ lề của biến ngẫu nhiên liên tục X xác định bởi f X ( x ) = ∑ y f ( x, y ) và hàm mật độ lề của biến ngẫu nhiên rời rạc Y xác định bởi fY ( y ) = ∫ f ( x, y ) dx . 1.1.6 Các biến ngẫu nhiên độc lập và có điều kiện 1.1.6.1 Định nghĩa. Hai biến ngẫu nhiên X và Y được gọi là độc lập nếu với mọi tập A và B trong R , ta có P ( X ∈ A, Y ∈ B )= P ( X ∈ A ) P (Y ∈ B ) . Ngược lại ta nói X và Y là phụ thuộc. Nếu X và Y là hai biến ngẫu nhiên liên tục có hàm mật độ f X ( x ) và fY ( y ) , khi đó X và Y là độc lập chỉ khi f ( x, y ) = f X ( x ) fY ( y ) . 1.1.6.2 Xác suất có điều kiện Định nghĩa. Nếu biến ngẫu nhiên X và Y là rời rạc, khi đó xác suất có điều kiện của biến ngẫu nhiên X được cho bởi quan sát Y = y xác định bởi P (= ,Y y ) X x= P ( X= x Y ) = y= . P (Y = y ) Từ đó dẫn đến định nghĩa mật độ có điều kiện P (= X x= ,Y y ) f ( x, y ) f ( x y= ) P ( X= x Y= y=) = , với fY ( y ) > 0 . P (Y = y ) fY ( y ) Định nghĩa. Nếu biến ngẫu nhiên X và Y là liên tục thì hàm mật độ có điều kiện là f ( x, y ) f ( x y) = , fY ( y ) > 0 fY ( y ) và P ( X ∈ A Y =y ) =∫ f ( x y ) dx . A Khi X liên tục và Y rời rạc ta có hàm mật độ có điều kiện của X khi Y = y được cho bởi
5 f ( x, y ) f ( x, y ) f ( x y) = = . fY ( y ) ∫ f ( x, y ) dx Tương tự, phân phối có điều kiện của Y = y khi x đã cho xác định bởi f ( x, y ) f ( x, y ) f ( y x) = = . fX ( x) ∑ f ( x, y ) y 1.1.6.3 Phân phối đa thức Lấy X = ( X 1 , X 2 ,..., X n ) trong đó X i , i = 1,..., n là các biến ngẫu nhiên thì X được gọi là một vectơ ngẫu nhiên. Giả sử f ( x1 , x2 ,..., xn ) là hàm mật độ đồng thời của các biến X i , i = 1,..., n , khi đó ta có thể định nghĩa phân phối lề, phân phối có điều kiện của chúng giống như đối với trường hợp hai chiều. Các biến ngẫu nhiên X 1 , X 2 ,..., X n là độc lập nếu n P ( X 1 ∈ A1 ,..., X n ∈ = An ) ∏ P(X i =1 i ∈ Ai ) , n f ( x1 , x2 ,..., xn ) = ∏ f X i ( xi ) . i =1 Định nghĩa. Nếu X 1 , X 2 ,..., X n là các biến ngẫu nhiên độc lập và mỗi X i , i = 1,..., n có cùng một phân phối với hàm phân phối F thì ta nói X 1 , X 2 ,..., X n là phân phối độc lập và đồng nhất (viết tắt iid) và được viết X 1 , X 2 ,..., X n  F . Nếu F có hàm mật độ f thì có thể viết X 1 , X 2 ,..., X n  f . X 1 , X 2 ,..., X n còn được gọi là một mẫu ngẫu nhiên kích thước n từ F . 1.2 Định lý Bayes 1.2.1 Quy tắc nhân. Giả sử A và B là hai sự kiện trong cùng một phép thử. Ký hiệu P ( A ∩ B ) như một xác suất kết hợp của sự kiện A và B , khi đó theo công thức xác suất có điều kiện ta có P ( A ∩ B) P ( B A) = . P ( A)
6 Bây giờ ta xét sự kiện A như một sự kiện không quan sát được và nó có thể xảy ra hoặc không xảy ra. Còn B được xét như một sự kiện được quan sát. Như vậy sự kiện B có thể xảy ra cùng với sự xuất hiện của sự kiện A hoặc phần bù của A . Công thức trên có thể viết lại như một quy tắc nhân: P ( B A) P ( A) . P ( A ∩ B) = 1.2.2 Định lý Bayes đối với các sự kiện. Giả sử A và B là hai sự kiện trên không gian xác suất ( Ω,  , P ) với ( P ( B ) > 0 ) , khi đó công thức Bayes xác định bởi P ( B | A) P ( A) P( A | B) = . P( B) Trong đó vai trò của A, B được xét như trong quy tắt nhân. Ta có P ( A ) là xác suất của riêng sự kiện A không xét đến B , P ( B ) là xác suất của riêng sự kiện B khi chưa biết sự kiện A xảy ra, P ( A B ) là xác suất của sự kiện A khi biết sự kiện B đã xảy ra, P ( B A ) là xác suất của sự kiện B khi sự kiện A xảy ra hoặc không xảy ra. Nếu { A1 , A2 ,..., An } là hệ đầy đủ các sự kiện và B là sự kiện bất kỳ trong cùng một phép thử, định lý Bayes có thể phát biểu P ( Ak ) P ( B Ak ) P ( Ak ) P ( B Ak ) P ( Ak B ) = = , (1 ≤ k ≤ n ) , P ( B) n ∑ P( A ) P(B A ) i =1 i i n với P ( B ) = ∑ P ( Ai ) P ( B Ai ) là công thức xác suất toàn phần. i =1 1.2.3 Trường hợp các biến ngẫu nhiên rời rạc. Định lý Bayes phát biểu như một phân phối có điều kiện P ( X= x Y P (= X x=, Y y ) P= (Y y= ( X x ) P= X x) = ) = y= P (Y y=) = P (Y y ) . 1.2.4 Trường hợp các biến ngẫu nhiên liên tục. Định lý Bayes phát biểu như một hàm mật độ có điều kiện
7 fX ( x) f ( y x) f ( x y) = . fY ( y ) 1.3 Phép biến đổi các biến ngẫu nhiên Giả sử X là một biến ngẫu nhiên với hàm mật độ f và hàm phân phối F . Giả sử Y = r ( X ) là hàm của biến ngẫu nhiên X . Vấn đề : Xác định hàm mật độ và hàm phân phối cho biến ngẫu nhiên Y . 1.3.1 Đối với trường hợp các biến ngẫu nhiên rời rạc. Hàm mật độ của Y được xác định bởi ) P (Y= y=) P ( r ( X=) Y ) f ( y= ({ = P w : r ( X ( w= }) ) ) y= P X ∈ r −1 ( y ) . ( ) 1.3.2 Đối với trường hợp các biến ngẫu nhiên liên tục. Hàm mật độ f của Y được tìm theo các bước sau i) Với mỗi y ,= tìm tập Ay {w : r ( X ( w)) ≤ y} . ii) Tìm hàm phân phối xác suất F ( y )= P (Y ≤ y )= P ( r ( X ) ≤ y ) = P w : r ( X= ({ ( w)) ≤ y }) ∫ Ay f ( x ) dx. iii) Hàm mật độ xác suất chính là f ( y ) = F ' ( y ) . Chú ý. Khi r là hàm tăng hoặc giảm nghiêm ngặt thì r có hàm ngược s = r −1 . Khi đó hàm mật độ f của Y có thể xác định ds ( y ) f ( y) = f ( s ( y )) . dy 1.3.3 Trường hợp nhiều biến ngẫu nhiên. Giả sử Z = r ( X , Y ) là hàm của hai X biến ngẫu nhiên X và Y , chẳng hạn , X + Y , max { X , Y } hay min { X , Y } . Khi đó Y hàm f ( z ) của Z được xác định như sau i) = Với mỗi z , tìm tập Az {(u, v ) : r ( X (u ) , Y ( v )) ≤ z} .
8 ii) Tìm hàm phân phối xác suất F ( z )= P ( Z ≤ z )= P ( r ( X , Y ) ≤ z ) = P ({(u, v ) : r ( X (u ) , Y ( v )) ≤ z}) = ∫ ∫ f ( x, y ) dxdy. Az iii) Hàm mật độ xác suất chính là f ( z ) = F ' ( z ) . Đặc biệt. Giả sử X liên tục có hàm mật độ f ( t ) , Y có hàm mật độ g ( t ) và X , Y độc lập. Khi đó hàm mật độ f ( z ) của Z= X + Y được xác định như sau +∞ +∞ f (z) = ∫ f ( z − t ) g ( t ) dt = hoặc f (z) ∫ f ( t ) g ( z − t ) dt . −∞ −∞ 1.4 Các số đặc trưng của biến ngẫu nhiên 1.4.1 Kỳ vọng của biến ngẫu nhiên Kỳ vọng của biến ngẫu nhiên X , ký hiệu E ( X ) được định nghĩa như sau i) E ( X ) = ∑ x xf ( x ) nếu X rời rạc. ii) E ( X ) = ∫ xf ( x ) dx nếu X liên tục. Chú ý i) Giá trị trung bình hay giá trị kỳ vọng của X có thể được ký hiệu E(X= ) EX= µ= µ X . ii) Nếu biến ngẫu nhiên Y là một hàm theo X : Y = r ( X ) . Khi đó = ( r ( X )) E (Y ) E= ∑ r ( x) f ( x) x nếu X rời rạc và = ( r ( X )) E (Y ) E= ∫ r ( x ) f ( x ) dx nếu X liên tục. Tính chất của kỳ vọng i) Nếu X 1 , X 2 ,..., X n là các biến ngẫu nhiên và a1 , a2 ,..., an là các hằng số. Khi đó  n  n E  ∑ ai X i  = ∑ ai E ( X i ) . =  i 1=  i1 ii) Nếu X 1 , X 2 ,..., X n là các biến ngẫu nhiên độc lập, khi đó
9  n  n E ∏ Xi  = ∏ E ( Xi ) . =  i 1= i1 iii) Nếu X = ( X 1 , X 2 ,..., X n ) là vectơ ngẫu nhiên, khi đó trung bình của X được định nghĩa bởi E ( X ) = ( E ( X 1 ) , E ( X 2 ) ,..., E ( X n ) ) . Bất đẳng thức đối với kỳ vọng i) Định lý (Bất đẳng thức Cauchy – Schwartz). Nếu biến ngẫu nhiên X và Y có phương sai hữu hạn, khi đó ( ) ( ) E XY ≤ E X 2 E Y 2 . ii) Định lý (Bất đẳng thức Jensen). Nếu f là một hàm lồi trên R, nghĩa là với ∀x, y ∈ R và α ∈ [ 0,1] : f α x + (1 − α ) y  ≤ α f ( x ) + (1 − α ) f ( y ) , khi đó E  f ( X )  ≥ f  E ( X )  . Nếu f là một hàm lõm, khi đó E  f ( X )  ≤ f  E ( X )  . iii) Định lý (Bất đẳng thức liên kết). Giả sử X là biến ngẫu nhiên và f , g là hai hàm đơn điệu không giảm trên R, khi đó E  f ( X ) g ( X )  ≥ E  f ( X )  E  g ( X )  . Nếu f là một hàm đơn điệu tăng và g là một hàm đơn điệu giảm, khi đó E  f ( X ) g ( X )  ≤ E  f ( X )  E  g ( X )  . Các bất đẳng thức trên áp dụng đối với tất cả các kỳ vọng tồn tại và hữu hạn. 1.4.2 Phương sai của biến ngẫu nhiên Phương sai của biến ngẫu nhiên X với trung bình µ , ký hiệu Var ( X ) hoặc σ 2 được định nghĩa bởi σ 2 E(X − µ) . 2 = Từ đó =σ2 ∑ x x 2 f ( x ) − µ 2 nếu X rời rạc
10 =σ2 ∫ x f ( x) − µ 2 2 và nếu X liên tục. Độ lệch chuẩn của biến ngẫu nhiên X được xác định σ X = Var ( X ) . Nếu biến ngẫu nhiên Y là một hàm theo X : Y = r ( X ) . Khi đó Var (Y ) Var ( r ( X )) ∑ r ( x ) f ( x ) −  E (Y ) 2 2 = = x nếu X rời rạc Var (Y ) Var ( r ( X )) ∫ r ( x ) f ( x ) dx −  E (Y ) nếu X liên tục. 2 2 và = = Tính chất i) Nếu a và b là các hằng số, khi đó Var ( aX + b ) = a 2 Var ( X ) . ii) Nếu X 1 , X 2 ,..., X n là các biến ngẫu nhiên độc lập và a1 , a2 ,..., an là các hằng số, khi đó  n  n Var  ∑ ai X i  = ∑ ai 2 Var ( X i ) . =  i 1=  i1 1.5 Một số phân phối của biến ngẫu nhiên 1.5.1 Phân phối của biến ngẫu nhiên rời rạc 1.5.1.1 Phân phối đều. Với số nguyên k > 1 , giả sử biến ngẫu nhiên X có hàm mật độ được cho bởi 1 ( x) f= =, x 1,..., k k và f ( x ) = 0 trong trường hợp ngược lại. Khi đó ta nói X có phân phối đều trên {1, 2,.., k } . 1.5.1.2 Phân phối Bernoulli. Trong một phép thử biến ngẫu nhiên X chỉ nhận hai giá trị 1 và 0. X nhận giá trị 1 với xác suất thành công là p ( 0 ≤ p ≤ 1) và nhận giá trị 0 trong trường hợp ngược lại, ta có P ( X = 1) = p, P ( X = 0 ) = 1 − p . Chẳng hạn khi thực hiện phép thử tung đồng tiền bằng kim loại đồng chất có hai mặt xấp và ngửa, giả sử thành công của phép thử là xuất hiện mặt ngửa thì X nhận
11 giá trị 1 nếu mặt ngửa xuất hiện với xác suất p ( 0 ≤ p ≤ 1) và ngược lại nếu đồng tiền xuất hiện mặt xấp. Khi đó ta nói X có phân phối Bernoulli, ký hiệu X ∼ Bernoulli ( p ) . Với hàm mật độ của X f ( x) =p x (1 − p ) , x ∈ {0,1} . 1− x Kỳ vọng và phương sai E ( X ) = p và Var ( X = ) p(1 − p) . Giả sử X 1 , X 2 ,..., X n là các biến ngẫu nhiên độc lập, X i ∼ Bernoulli ( p ) , i = 1,..., n . Khi đó hàm mật độ của X = ( X 1 , X 2 ,..., X n ) là n n f ( x) ∏= f ( x ) ∏ p (1 − p ) , với xi ∈ {0,1} , i = 1− xi = i xi 1,..., n . =i 1 =i 1 1.5.1.3 Phân phối Nhị thức. Giả sử X 1 , X 2 ,..., X n là các biến ngẫu nhiên độc lập, X i ∼ Bernoulli ( p ) , i = 1,..., n . n Đặt Y = ∑ X i . Khi đó Y được gọi là có phân phối nhị thức, ký hiệu Y  B ( n, p ) i =1 với hàm mật độ f ( y= ) P (Y= y=) ( ) p (1 − p ) n y y n− y , với y ∈ {0,1,..., n} , trong đó ( ) = y !( nn−! y )! . n y  n n  = ∑ Chú ý. Nếu Yk  B ( nk , p ) thì Y k 1= k  B  ∑ nk , p  . k 1  Kỳ vọng và phương sai của Y E (Y ) = np và Var (= Y ) np (1 − p ) . Lưu ý rằng trong công thức trên Y là một biến ngẫu nhiên, y là giá một trị riêng của Y còn n và p là các tham số. Trong thực tế tham số p thường chưa biết và phải ước lượng từ dữ liệu.
12 1.5.1.4 Phân phối Nhị thức âm. Giả sử trong một phép thử X là biến ngẫu nhiên chỉ nhận hai kết quả, thành công với xác suất là p và không thành công với xác suất 1 − p , ( 0 ≤ p ≤ 1) . Cho s là giá trị cố định, thực hiện phép thử với biến ngẫu nhiên X cho tới s lần thành công thì dừng. Khi đó X gọi là có phân phối nhị thức âm (hay phân phối Pascal), ký hiệu X  NB ( s, p ) với hàm mật độ f ( x= ) P ( X= x=) ( x + s −1 x ) p (1 − p ) s x , với x = 0,1,... . Hoặc f ( x) = P( X = x) = x −1 s ( ) s −1 p (1 − p ) x−s ,x = s, s + 1,... Kỳ vọng và phương sai s (1 − p ) s (1 − p ) E(X ) = 1 (X) E ( X ) +  E ( X )  . 2 và Var= = 2 p p s  n n  = ∑ Chú ý. Nếu Yk  NB ( nk , p ) thì Y k 1= k  NB  ∑ nk , p  . k 1  1.5.2 Phân phối của biến ngẫu nhiên liên tục 1.5.2.1 Phân phối đều. Biến ngẫu nhiên liên tục X có hàm mật độ  1  , x ∈ [ a, b ] , f ( x) = b − a 0, x ∉ [ a, b ].  được gọi là có phân phối đều trên [ a, b ] , ký hiệu X  Uniform [ a, b ] hay X  R [ a, b ] . Khi đó hàm phân phối xác suất của X xác định bởi 0, x < a, x−a  F ( x)  = , x ∈ [ a, b ] , b − a 1, x > b. Trung bình và phương sai (a − b) . 2 a+b =E(X ) = , Var ( X ) 2 12