TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ QUI, TẬP 02, SỐ 04, 2024 KHOA HỌC CƠ BẢN
4 JOURNAL OF SCIENCE AND TECHNOLOGY QUI, VOL.02, № 04, 2024
NGHIÊN CỨU HÀM -MEN SINH - MỘT CÔNG CỤ HIỆU QUẢ
TRONG PHÂN TÍCH XÁC SUẤT VÀ THỐNG KÊ
Lê Bích Phượng1,*
1Trường Đại hc M - Địa cht Ni
*Email: lebichphuong@humg.edu.vn
TÓM TT
Khoa hc d liu (Data Science) là một lĩnh vực liên ngành s dng các phương pháp, quy trình,
thut toán và h thng khoa học để trích xut kiến thc và thông tin t d liu. Nó kết hp nhiều lĩnh
vực khác nhau như thống kê, hc máy, khai phá d liu, phân tích d liu và tin hc, nhm phân tích
hiểu sâu hơn về d liu. Khoa hc d liệu được ng dng rng rãi trong nhiu ngành công
nghip, bao gm y tế, tài chính, marketing, sn xut dch v công cng. Xác sut thng
đóng vai trò nền tng trong khoa hc d liu. Chúng cung cp các công c và phương pháp cần thiết
để thu thp, phân tích, gii thích trình bày d liu mt cách hiu qu. Hàm -men sinh mt
công c mnh m linh hot trong lí thuyết xác sut và thng nó không ch giúp xác định các
-men ca biến ngu nhiên mà còn h tr trong vic phân tích và xác đnh phân phi ca các biến
ngu nhiên.
T khóa: hàm mô-men sinh, xác sut thng kê, vọng, phương sai, phân phối, độ xiên.
1. ĐẶT VẤN Đ
Hàm sinh của biến ngẫu nhiên một công
cụ toán học được sử dụng để tả phân
tích các tính chất của phân phối xác suất của
biến đó. Nói một cách đơn giản, hàm sinh giá
trị kỳ vọng của một phép biến đổi cụ thể áp dụng
lên biến ngẫu nhiên. nhiều loại hàm sinh
khác nhau, như m -men sinh (Moment
Generating Function - MGF), hàm sinh xác suất
(Probability Generating Function - PGF), hàm
sinh đặc trưng (Characteristic Function) hàm
sinh tích lũy (Cumulant Generating Function).
Mỗi loại hàm sinh một công thức cụ thể
được sử dụng cho các mục đích khác nhau
trong lý thuyết xác suất và thống kê [1-2].
Hàm -men sinh của một biến ngẫu nhiên
X được định nghĩa là:
tX
X
M (t) E(e )=
. Trong đó,
tX
E(e )
giá trị kỳ vọng của
tX
e
.Hàm này thể
được sử dụng để tìm các -men (như trung
bình phương sai) của biến ngẫu nhiên,
cũng thể giúp xác định phân phối xác suất
của biến đó trong những điều kiện nhất định.
Một biến ngẫu nhiên một phân phối xác suất
nhất định nếu hàm sinh của nó xác định. Có một
quá trình khôi phục phân phối từ một hàm sinh,
quá trình này được gọi phép đảo ngược.
Tính chất quan trọng các -men của biến
ngẫu nhiên thể được xác định từ các đạo
hàm của hàm sinh. Tính chất này cùng hữu
ích việc thu được các -men từ hàm sinh
thường dễ dàng hơn so với việc tính trực tiếp
các mô-men từ định nghĩa của chúng.
Một thuộc tính quan trọng khác hàm sinh
của tổng các biến ngẫu nhiên độc lập là tích của
các hàm sinh tương ứng. Thuộc tính này rất
hữu ích hàm mật độ xác suất của tổng các
biến độc lập tích chập của các hàm mật độ
riêng lẻ, phép toán này phức tạp hơn nhiều.
Thuộc tính quan trọng cuối cùng được gọi
định liên tục, khẳng định rằng sự hội tụ của
dãy các hàm sinh tương ứng với sự hội tụ của
các phân phối tương ứng. Thường thì việc
chứng minh sự hội tụ của các hàm sinh dễ dàng
hơn so với chứng minh sự hội tụ của các phân
phối trực tiếp [2-5].
2. PHƯƠNG PHÁP NGHIÊN CỨU
2.1. Phân phối rời rạc liên tục
Một biến ngẫu nhiên là một hàm số X có thể
nhận giá trị một cách ngẫu nhiên phụ thuộc
o một sự kiện ngẫu nhiên nào đó. Không gian
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ QUI, TẬP 02, SỐ 04, 2024 KHOA HỌC CƠ BẢN
JOURNAL OF SCIENCE AND TECHNOLOGY QUI, VOL.02, 04, 2024 5
hoặc miền giá trị của X tập hợp S các giá tr
thể của X. Một biến ngẫu nhiên X được
gọi rời rạc nếu tập hợp này một số lượng
hữu hạn hoặc vô hạn đếm được các giá trị khác
biệt (tức thể liệt kê thành một dãy). Biến
ngẫu nhiên X được gọi phân phối liên tục
nếu thể nhận giá trị bất trong một
khoảng hoặc một đoạn một tập con của tập
hợp số thực [1, 7].
Thông thường thì các hàm số gán xác
suất cho tất cả các sự kiện trong một không gian
mẫu. Những m số này được gọi hàm khối
xác suất (probability mass functions) nếu biến
ngẫu nhiên phân phối rời rạc, hoặc hàm mật
độ xác suất (probability density functions) nếu
biến ngẫu nhiên phân phối liên tục. Tất cả
các giá trị thể có của một biến ngẫu nhiên
các giá trị xác suất tương ứng của chúng tạo
thành phân phối xác suất của biến ngẫu nhiên
đó.
Phân phối của một biến ngẫu nhiên X có thể
được mô tả bằng hàm phân phối tích lũy:
X
F (x) P(X x)=
(1)
Cũng những cách khác để đặc trưng hóa
các phân phối xác suất. Do đó, các phân phối
xác suất cũng thể được xác định bằng nhiều
phép biến đổi khác nhau, tức bằng các hàm
số nào đó hóa các thuộc tính của phân
phối thành một dạng thuận tiện hơn cho các loại
tính toán xác suất nhất định. Đối với một biến
ngẫu nhiên rời rạc X, với hàm khối xác suất
p(x) P(X x)==
(2)
ta có
xp(x) 1=
.
Hàm khi xác sut hoc hàm mật độ xác
sut ca mt biến ngu nhiên X cha tt c
thông tin mà ta cn v biến này.
2.2. Dãy các mô-men của một biến ngẫu
nhiên
Ta biết rằng trung bình
EX=
phương
sai
2 2 2 2
E((X EX) )=E(X ) (EX) =
của một biến
ngẫu nhiên đóng vai trò quan trọng trong các
định bản của xác suất, cũng như trong
nhiều loại tính toán thực tế khác nhau. Những
thuộc tính quan trọng này của một biến ngẫu
nhiên chứa đựng những thông tin về m phân
phối của biến đó. Tuy nhiên, trung bình
phương sai không chứa đựng tất cả thông tin về
hàm mật độ của một biến ngẫu nhiên [2].
Ngoài hai đại lượng
, định v trung
tâm t độ phân tán ca các giá tr ca
mt biến ngu nhiên, chúng ta còn định nghĩa
mt tp hợp các đại lượng khác, gi là c -
men, những đại lượng này xác định duy nht
phân phi xác sut ca mt biến ngu nhiên.
Đối vi mt biến ngu nhiên ri rc hoc liên tc
X, mô-men bc k ca X mt s được định
nghĩa là
k
kE(X )=
vi k=1, 2, 3,... với điều kin
các giá tr tính được. Ta mt dãy các mô-
men gn lin vi mt biến ngu nhiên X. Trong
nhiều trường hợp, dãy này xác định phân phi
xác sut ca X. Tuy nhiên, các mô-men ca X
th không tn ti. Da trên các mô-men này,
trung bình phương sai của X được tính đơn
gin bng
1EX=
2 2 2 2 2
21
E((X EX) )=E(X ) (EX) ( ) = =
(3)
Khi bậc k tăng n, thì các mô-men bc cao
hơn ý nghĩa tr nên phc tạp hơn. Các
-men cung cp nhiu thông tin hu ích v
phân phi ca X. Kiến thc v hai mô-men đầu
tiên ca X cho chúng ta biết trung bình
phương sai của nó, nhưng kiến thc v tt c
các mô-men của X xác định hoàn toàn hàm
phân phi xác sut ca nó. Các phân phi khác
nhau không th các mô-men ging ht nhau.
Đây chính là đim then cht, do ti sao các
-men li quan trng [7].
2.3. Hàm sinh
Nói mt cách đơn giản, hàm sinh chuyển đổi
các bài toán v chui s thành các bài toán v
hàm s. Bng cách này, chúng ta th s
dụng hàm sinh để gii quyết các bài toán đếm
s ng khác nhau. Giả sử rằng
0 1 2
a ,a ,a ...
một dãy số thực hữu hạn hoặc hạn. Hàm
sinh thông thường của dãy này chuỗi lũy
thừa:
2k
0 1 2 k
k0
G(z) a a z a z ... a z
=
= + + + =
(4)
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ QUI, TẬP 02, SỐ 04, 2024 KHOA HỌC CƠ BẢN
6 JOURNAL OF SCIENCE AND TECHNOLOGY QUI, VOL.02, № 04, 2024
Để khôi phc lại dãy ban đầu t mt hàm
sinh thông thường đã cho, công thức sau được
s dng:
k
kkz0
1 d G(z)
a ,k 0,1,2...
k! dz =

==


(5)
Giả sử rằng
0 1 2
a ,a ,a ...
một dãy số thực
hữu hạn hoặc hạn. Hàm sinh lũy thừa của
dãy này là chuỗi lũy thừa:
2k
1 2 k
0k0
a z a z a z
G(z) a ...
1! 2! k!
=
= + + + =
(6)
Để khôi phục lại chuỗi số thực ban đầu từ
hàm sinh lũy thừa đã cho, công thức sau được
sử dụng:
k
kkz0
d G(z)
a ,k 0,1,2...
dz =
==
(7)
Đối vi mt biến ngu nhiên X ch nhn các
giá tr nguyên không âm k, vi xác sut
k
p P(X k)==
, hàm sinh xác suất được đnh
nghĩa là:
Xk
k
k0
G(z) E(z ) p z ,0 z 1.
=
= =
(8)
Bi công thc:
k
kkz1
d G(z)
E(X ) ,k 0,1,2,...
dz =

==


(9)
ta khôi phc các mô-men ca X. Mt hàm sinh
xác sut chính xác s xác đnh duy nht mt
phân phi, mt m sinh xác sut xp x s
xác định xp x mt phân phi xác sut.
2.4. Hàm -men sinh
Hàm -men sinh mang li nhiu kết qu
mt cách d dàng. Các chng minh s dng
hàm -men sinh thường d dàng hơn nhiu so
vi vic chng minh (cùng mt kết qu) bng
cách s dng các hàm mật độ xác sut (hoc
các phương pháp khác). Hàm -men sinh
(MGF) được định nghĩa bởi công thc sau:
tX
X
M (t) E(e )=
(10)
trong công thc trên, k vng tn ti xung quanh
mt lân cn ca 0.
Khi X là biến ngu nhiên ri rc thì mô-men
sinh là:
tx
X
M (t) e p(x)=
(11)
Khi X là biến ngu nhiên liên tc thì -men
sinh là:
tx
X
M (t) e f(x)dx=
(12)
đây, điều quan trng vng phi hu
hạn đối vi mi giá tr t trong mt khoảng nào đó
ca t0 (vi t0> nào đó). Nếu k vng không tn
ti trong mt lân cận nào đó thì hàm -men
sinh không tn tại. Vì hàm mũ luôn dương,
tX
E(e )
luôn tn ti (bng mt s thc hoc bng
dương vô cùng) [1-2].
Các hàm -men sinh th không được
xác định đối vi tt c các giá tr ca t, mt
s phân phi ni tiếng không hàm -men
sinh (ví d như phân phối Cauchy). Phân phi
Cauchy (hay còn được gi phân phi Lorentz
trong vt lý) có hàm mt đ xác suất như sau:
02
0
1
f(x;x , ) xx
1+
= 

 




(13)
trong đó
0
x
thông s v trí (median hoc
mode) t v trí trung tâm ca phân phi;
0
thông s thang đo (scale parameter),
t độ rng ca phân phi;
x
biến. Tích
phân
tx
X0
M (t) e f(x;x , )dx
+
−
=
không hi t nên
không tn ti hàm -men sinh.
Hàm -men sinh một hàm biến t, không
phải của X. m -men sinh của một biến
ngẫu nhiên i gọn tất cả c mô-men của biến
ngẫu nhiên đó vào một biểu thức đơn giản. Về
mặt hình thức, hàm -men sinh được tạo ra
bằng cách thay
t
e
vào hàm sinh xác suất
3. KẾT QUTHẢO LUẬN
Gi s rng hàm -men sinh tn ti trong
mt lân cn ca gc tọa độ. Ta mt s kết
qu sau:
3.1. Tính chất 1
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ QUI, TẬP 02, SỐ 04, 2024 KHOA HỌC CƠ BẢN
JOURNAL OF SCIENCE AND TECHNOLOGY QUI, VOL.02, 04, 2024 7
Nếu
X
g (t)
là hàm -men sinh ca mt biến
ngu nhiên X, thì:
X
g (0) 1.=
Chng minh:
Tht vy ta có,
0.X
X
g (0) 1 E(e ) E(1) 1= = = =
.
3.2. Tính chất 2
Các mô-men ca biến ngu nhiên X có th
đưc tìm bng cách khai trin chuỗi lũy thừa.
Hàm -men sinh ca mt biến ngu nhiên X
hàm sinh lũy thừa ca chui mô-men ca nó:
k
k
Xk0
t
g (t) k!
=
=
(14)
Hàm mũ có khai triển lũy tha:
k
t
k0
t
e,
k!
=
=
(15)
nên nên bng cách khai trin chui ca hàm
tX
e
, ta có:
k
tX
k0
(tX)
e.
k!
=
=
(16)
Ly kì vng hai vế ta có:
( ) ( )
k k k k
tX k
k 0 k 0 k 0
(tX) X t t
E e E E E X
k! k! k!
= = =
= = =
(17)
3.3. Tính toán các mô-men
Ta gi hàm
X
g (t)
là hàm -men sinh ca
biến ngu nhiên X do tt c các mô-men ca X
có th thu đưc bng cách lấy đạo hàm ri thay
t=0. Đạo hàm bc k ca
X
g (t)
tại điểm t=0
-men bc k (
k
) ca X, c th là:
(k)
kg (0)=
(18)
trong đó
k
(k) kt0
d g(t)
g (t) dt =
=
. (19)
Bng cách này, các mô-men của X cũng
th đưc tìm thy thông qua vic lấy đạo hàm.
k k k
tX tX k tX
X
k k k
d d d
g (t) E(e ) E( e ) E(X e )
dt dt dt
===
(20)
Do vy ta có:
k
Xk
kt0
dg (t)
dt =
=
. (21)
Như vậy, hàm -men sinh sinh ra tất cả các
-men của X thông qua việc lấy đạo hàm. Ta
thể tìm các -men của X bằng cách tính
hàm -men sinh sau đó lấy đạo hàm. Đôi
khi, việc làm này dễ dàng thực hiện hơn so với
cách tính trực tiếp. Tất cả các mô-men của một
phân phối hầu như xác định phân phối đó.
Ngoài việc tạo ra c mô-men của X, hàm -
men sinh còn hữu ích trong việc xác định phân
phối của X.
3.4. Tính xác định
Nếu
X
g (t)
tn ti trong mt lân cn ca t=0,
thì vic biết hàm -men sinh ca mt biến
ngẫu nhiên ơng đương với vic biết m mt
độ xác sut của nó. Điều này nghĩa hàm
-men sinh xác định duy nht hàm mật độ
xác sut. Trong trường hp tng quát, chui
X
g (t)
s không hi t vi mọi t. Nhưng trong
trường hợp đặc bit quan trng khi X b chn
(tc khi min giá tr ca X nm trong mt
khong hu hn), ta th chng minh rng
chui này hi t vi mi giá tr ca t. Tc là hàm
phân phối được xác định hoàn toàn bi các mô-
men ca nó.
Định lý 1: Gi s
X
à mt biến ngu nhiên liên
tc vi phm vi nm trong khong thc
[ M,M]
.
Khi đó, chuỗi mô-men
k
k
Xk0
t
g (t) k!
=
=
hi t vi
mi giá tr ca
t
thành mt hàm kh vi hn
()
X
gt
(k)
Xk
g (0) .=
Chng minh. Ta biết rng
Mk
kX
M
x f (x)dx.
=
Do
vy, vi mi
n
ta có:
( )
k
k
nn Mt
k
k 0 k 0
Mt
te.
k! k!
==


(22)
Bất đẳng thc này cho thy chui mô-men
hi t vi mi giá tr ca
t
và tng ca nó là mt
hàm kh vi hn. Bằng cách này, chúng ta đã
chng minh rng chui mô-men
k
xác định
hàm
X
g (t)
. Ngược li,
(k)
kX
g (0)=
, ta thy
()
X
gt
xác định các mô-men
k
.
Nếu
X
mt biến ngu nhiên b chn, thì ta
có th chng minh rng hàm -men sinh
()
X
gt
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ QUI, TẬP 02, SỐ 04, 2024 KHOA HỌC CƠ BẢN
8 JOURNAL OF SCIENCE AND TECHNOLOGY QUI, VOL.02, № 04, 2024
ca
X
xác định duy nht hàm mật độ xác sut
()
X
ft
ca
X
. Điu này quan trng vic tính
toán vi các hàm -men sinh d dàng hơn so
vi vic tính toán vi các hàm mt đ xác sut.
3.5. Tính duy nhất
Hai biến ngu nhiên cùng hàm -men
sinh thì s có cùng phân phi.
Định lí 2: Gi s
X
Y
là hai biến ngu nhiên
vi các hàm -men sinh tương ng
()
X
gt
()
Y
gt
và các hàm phân phi xác sut lần lượt
()
X
Fx
()
Y
Fy
. Nếu
( ) ( )
XY
g t g t=
, thì
( ) ( )
XY
F x F y=
.
Điều này đảm bo rng phân phi ca mt
biến ngu nhiên th được xác định bi hàm
-men sinh ca nó. H qu của định trên
nếu tt c các mô-men ca mt biến ngu nhiên
X tn ti, chúng s hoàn toàn xác định hàm -
men sinh (vì các mô-men các đạo hàm ca
hàm -men sinh trong khai trin Taylor ca nó)
các mô-men này cũng hoàn toàn xác đnh
phân phối, cũng như hàm phân phối tích lũy,
hàm mt đ xác sut và hàm khi xác sut.
Khi hàm -men sinh tn ti, s mt
phân phi duy nhất tương ng vi hàm -men
sinh đó. Do đó, một đơn ánh giữa các hàm
-men sinh các phân phi xác suất. Điều
này cho phép ta s dng các hàm -men sinh
để tìm các phân phi ca các biến ngu nhiên
biến đổi trong mt s trường hp. K thut này
thường được s dng cho các t hp tuyến tính
ca các biến ngẫu nhiên độc lp.
3.6. Tính xác định vô hạn mô-men
Khi hàm -men sinh tồn tại, xác định
một tập hợp hạn các -men. Câu hỏi hiển
nhiên đặt ra là liệu hai phân phối khác nhau
thể cùng một tập hợp -men hạn hay
không. Câu trả lời là, khi hàm -men sinh tồn
tại trong một lân cận của 0, dãy -men hạn
sẽ xác định duy nhất phân phối. Điều này cho
phép chúng ta xác định phân phối của một dãy
các biến ngẫu nhiên bằng cách xem xét các
hàm -men sinh liên quan.
3.7. Tính toán mô-men của tổng hai biến
ngẫu nhiên
Đối vi hai biến ngẫu nhiên độc lp
X
Y
, hàm sinh men ca tng
+XY
tích
ca các hàm mô-men sinh riêng r:
( ) ( ) ( )
X Y X Y
M t M t M t
+=
(23)
3.8. Hàm mô-men sinh của một số phân phối
xác suất phổ biến
Phân phối đều rời rạc
Biến ngu nhiên X phân phối đều ri rc, X
nhn các giá tr trên tp
1 2 n
x ;x ;...;x
với xác
suất mỗi giá trị như nhau
i1
P(X x ) n
==
. Hàm
-men sinh là:
i
ntx
tX
Xi1
1
M (t) E[e ]= e
n=
=
(24)
Phân phi Nh thc (Binomial Distribution)
Biến ngu nhiên
X
phân phi nh thc vi
s ln th
n
xác sut thành công
p
,
( )
Binomial ,X n p
. Hàm mô-men sinh là:
( )
( )
1= + n
t
X
M t p pe
(25)
Phân phi Poisson
Phân phối Poisson đưc s dụng để mô t s
s kin xy ra trong mt khong thi gian vi
tn sut trung bình
. Biến ngu nhiên
X
phân phi Poisson vi tham s
( )
, PoissonX

. Hàm mô-men sinh là:
( )
( )
( )
exp 1=−
t
X
M t e
(26)
Phân phi siêu bi
Phân phi siêu bi, mô t s ng phn t loi
A được chn t mt tp hp có N phn t, trong
đó có K phần t loi A, qua n ln chn không