CHƯƠNG 1: ÔN TP
1.1. Trung bình mu – Phương sai mu
1.1.1. Trung bình mu
Trong phân tích d liu, cũng như trong cuc sng hàng ngày, chúng ta thường nói
đến chiu cao trung bình, thu nhp trung bình, vân vân. Đó chính là trung bình mu.
Hãy xét ví d sau:
Ví d 1.1: Bng quan sát nhit độ Đà Lt
Th 2 Th 3 Th 4 Th 5
(x
(
)
o
x5.1918202119
4
1=+++=
Mt cách khái quát, trung bình mu được tính bng công thc sau:
()
Nxxxx
N
x++++= ......
1321
Hay:
=
=N
n
n
x
N
x
1
1
1.1.2. Phương sai mu
Phương sai mu [ký hiu ] bng trung bình ca tng bình phương độ lch gia giá
tr quan sát so vi giá tr trung bình:
2
X
s
()
(
)
(
)
++
=xxxxxx
N
sN
X
2
2
2
1
2
2......
1
Hay:
(
)
=
=N
n
n
Xxx
N
s
1
2
21
Chng hn, v trung bình mà nói thì khí hu sa mc rt nóng. Hơn na nhit độ
giao động rt ln gia ngày và đêm. Để th hin được s khc nghit ca khí hu sa
mc, chúng ta không nhng ch s dng trung bình (mu) v nhit độ, mà c s giao
1) (x2) (x3) (x4)
19o21o20o18o
1
động ca nhit độ theo tng thi đim so vi trung bình. Đó chính là khái nim v
phương sai mu nói trên.
1.2. Hàm mt độ xác sut, hàm phân b xác sut
1.2.1. Tn sut và xác sut
Để có s hình dung v tn sut, hãy xét ví d sau:
Ví d 1.2: Xếp hng tc độ gia tăng giá c phiếu trên th trường chng khoán Vit
Nam.
Gi X là t l phn trăm mc tăng giá c phiếu trung bình trong 3 tháng đầu tiên sau
khi “lên sàn”; gi P là phn trăm các công ty có mc tăng giá c phiếu tương ng vi
giá tr ca X
X Y
(x1) 50% 10%
(x2) 40% 20%
(x3) 30% 35%
(x4) 20% 25%
Con s P= 10%, X= 50% có nghĩa là có 10% trong tng s các công ty có mc tăng
giá trong 3 tháng đầu sau khi phát hành c phiếu ra công chúng là 50%. Đó chính là ví
d v tn sut
Ví d 1.3: Trò chơi tung đồng xu.
Gi s bn tham gia cuc chơi tung đồng xu ti hi ch. Nếu là mt sp, bn s được
$100. Ngược li, nếu là mt nga, bn được $0. Vi th l đó, bn sn sàng tr bao
nhiêu đôla để tham gia trò chơi?
Để cho tin, hãy kí hiu mt sp là 1, mt nga là 0. Gi s kết qu tung xu sau 10 ln
là như sau:
X P
1 3/10
0 7/10
Con s 3/10 chính là tn sut xut hin mt sp (X = 1). Nghĩa là, trong 10 ln tung
xu, có 3 ln xut hin mt sp. Và do đó, có 7 ln xut hin mt nga.
S tin bn b ra cho vic tham d 10 ln tung xu là: $50 x 10 = $500.
S tin nhn được trong cuc chơi: $100 x 3 + $0 x 7 = $300.
2
Æ Do vy, cuc chơi không hng thú đối vi bn ($500 > $300).
Tuy nhiên, nếu gi s rng bn tham d cuc chơi vô hn ln. Khi đó, s ln xut hin
mt sp và mt nga là như nhau, và bng ½. Khi đó, k vng đượccuc s là:
$100x1/2 + $0x1/2 = $50; và bng chính s tin ln nht bn sn sàng tr để tham d
cuc chơi.
Điu chúng ta cn phân bit là con s P = 3/10 trong ví d nêu trên là tn sut xut
hin mt sp trong 10 ln th. Và con s ½ là xác sut xut hin mt sp (hoc nga).
Khái nim tn sut ng vi tng mu th; còn xác sut tương ng vi tng th.
1.2.2. Biến ngu nhiên ri rc và liên tc
2.2.1. Biến ngu nhiên ri rc:
Mt biến ngu nhiên là ri rc nếu các giá tr có th có ca nó lp nên mt tp hp
hu hn hoc đếm được, nghĩa là có th lit kê được tt c các giá tr có th có ca nó.
Cuc chơi tung xu nêu trên là ví d v biến ngu nhiên ri rc.
Mt cách hình thc hóa, ta có th nói như sau. Gi s đối tượng quan sát X có th
xut hin trong K s kin khác nhau [trong ví d tung xu, K = 2]. Ta ký hiu các s
kin đó là .
K
xxx ,...,, 21
Tn sut xut hin mt biến c trong N phép th, ký hiu là , là t s gia s
ln xut hin biến c c th đó so vi N phép th được thc hin.
k
xk
p
Vi mi ch s, , ta có th viết như sau:
Kk ,...,3,2,1
=
X x x xx
123 K
P p p pp
123 K
p , p
1 2, p ,… p
3K > 0, và
p1 + p2 + p + …… + p
3K = 1, hay cũng vy,
1
1
=
=
K
k
k
p
Nếu s mu N là đủ ln (tiến đến vô hn), khái nim tn sut xut hin mt biến c
được thay bng khái nim xác sut xut hin biến c, ký hiu bi:
Trong đó, là hàm mt độ xác sut ca .,..,2,1),( Kkxff kk == )( k
xf ....2,1, Kkxk=
3
Ta cũng có,
f , f , f ,… f
1 2 3 K > 0, và
1
1
=
=
K
k
k
f
2.2.2. Biến ngu nhiên liên tc
Mt biến ngu nhiên là liên tc nếu các giá tr có th có ca nó lp đầy mt khang
trên trc s, nghĩa là không th lit kê và đếm được tt c các giá tr có th có ca nó.
Tương t vi trường hp phân b xác sut ri rc, nếu gi X là mt biến ngu nhiên
liên tc; và f(x) là hàm mt độ xác sut ca X. Khi đó:
1)(
0)(
=
+
dxxf
x
f
Ta định nghĩa hàm phân b xác sut ca X là:
=xdttfxF )()(
Điu đó có nghĩa là, xác sut ca biến ngu nhiên X nhn giá tr trong khong
s là:
],[ ba
)()()( )( aFbFbXaP b
adxxf ==
Ví d, trong phân b chun, v đồ th ta có th biu din công thc tính xác sut này
như sau:
Đồ th 1.1: Phân b xác sut
4
Phn tô đậm chính là xác sut )( bXaP
, được tính bi tích phân:
.
)()()( aFbF
b
adxxf =
1.3. Phân b xác sut đồng thi
Nhiu khi chúng ta mun đưa ra mt đánh giá xác sut đồng thi cho mt s biến
lượng ngu nhiên. Ví d, bng thng kê có ghi li d kin v tht nghip (u) và lm
phát (п). C hai biến lượng này đều là biến ngu nhiên, rt nhiu kh năng là chính
ph mun hi nhng nhà kinh tế câu hi sau đây: “Liu kh năng lm phát thp hơn
8% và mc độ tht nghip nh hơn 6% vào năm sau là bao nhiêu?”. Điu đó có nghĩa
là, ta cn phi xác định xác sut đồng thi:
P (п < 8, u < 6) = ?
Để tr li được nhng câu hi như vy, chúng ta cn phi xác định hàm mt độ xác
sut đồng thi [joint probability density function].
1.3.1. Hàm mt độ xác sut đồng thi
Định nghĩa: Gi s X và Y là 2 biến ngu nhiên. Hàm mt độ xác sut đồng thi ca x
y là:
),(),( y
Y
x
X
P
y
x
f
=
==
Hàm s đó cn tha mãn điu kin:
0),( y
x
f
, và
1),( =
∑∑
xy yxf nếu X, Y ri rc
dxdyyxf
xy .),(
∫∫ nếu X, Y liên tc
Khi đó,
≤≤
=
bxadyc
yxfdycbxaP ),(),( , nếu X, Y là biến ngu nhiên ri rc, và
5