
1
ĐẠI HỌC QUỐC GIA HÀ NỘI ĐỀ THI KẾT THÚC HỌC PHẦN
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN HỌC KỲ II, NĂM HỌC 2023-2024
Tên học phần: Xác suất thống kê
Mã học phần: MAT1101 Số tín chỉ: 3 Đề số: 01
Thời gian làm bài: 90 phút (không kể thời gian phát đề)
Câu 1. Khi thực hiện sao chép DNA một cách nhân tạo bằng cách dùng các nucleotid và DNA polymerasa, các cặp bazơ sao
chép độc lập với nhau và ở mỗi cặp bazơ tỉ lệ có sai lệch là 10-5 (cứ mỗi 1 triệu cặp bazơ thì có khoảng 10 cặp sai lệch).
a) Vi khuẩn E.coli có 3 triệu cặp bazơ. Gọi X là số cặp sai lệch khi sao chép DNA của vi khuẩn này. Hãy cho biết tên phân bố
của X và các đặc trưng của nó.
b) Xét một DNA, mỗi sai lệch được sữa chữa một cách độc lập với tỉ lệ sửa thành công là 60%. Tính xác suất để còn lại không
quá 20 cặp bazơ sai lệch trong DNA.
Câu 2. Cho X là biến ngẫu nhiên phân bố mũ với tham số λ = 5. Tính xác suất P(X > 10) và P(X > 15| X > 10).
Câu 3. Trong một nghiện cứu để hiệu chỉnh máy đo mật độ tuyết, các nhà khoa học đã sử dụng khối plyethylene biết trước
mật độ (x) và đo được chỉ số (y) như sau:
M
ậ
t đ
ộ
(g/mm
3
)
686
604
508
412
318
2
2
3
148
80
1
Ch
ỉ
s
ố
286
329
365
404
448
487
530
570
606
a) Tìm phương trình hồi quy tuyến tính của chỉ số đo được theo mật độ. Dự đoán chỉ số đo được khi đo khối tuyết có mật đô
100 (g/mm3), biết rằng chỉ số đo được giống với khi đo khối polyethylên như trên.
b) Hãy ước lượng cho hệ số tương quan của mật độ (x) và chỉ số đo được (y). Tìm khoảng tin cậy với độ tin cậy 95% cho hệ
số tương quan này.
Câu 4. Khảo sát 100 sinh viên tại Hà Nội về mức chi tiêu cho một chiếc điện thoại mới thu được số liệu sau:
M
ứ
c giá
T
ừ
2 đ
ế
n 4 tri
ệ
u
T
ừ
4 đ
ế
n 6 tri
ệ
u
T
ừ
6 đ
ế
n 8 tri
ệ
u
T
ừ
8 tri
ệ
u tr
ở
lên
S
ố
sinh viên
8
49
33
10
a) Hãy ước lượng khoảng tin cậy 95% cho tỷ lệ sinh viên sẽ chi từ 6 triệu trở lên cho điện thoại mới.
b) Trước khi khảo sát người ta dự doán rằng tỉ lệ cho 4 nhóm sinh viên nói trên lần lượt là 0,1; 0,4; 0,4; 0,1. Với mức ý nghĩa
5%, hãy cho biết số liệu có phù hợp với dự đoán hay không?
Câu 5. Cho mẫu số liệu về chiều cao (inch) của 31 cây Anh Đào như sau:
Chu vi thân nhỏ hơn 12 inch: 70, 65, 63, 72, 81, 83, 66, 75, 80, 75 ,79, 76, 76, 69, 75,
Chu vi thân lớn hơn 12 inch: 74, 85, 86, 71, 64, 78, 80, 74, 72, 77, 81, 82, 80, 80, 80, 87.
a) Hãy ước lượng khoảng ti cậy 98% cho chiều cao trung bình của mẫu cây Anh Đào trên.
b) Giả thiết rằng chiều cao của cây mang phân bố chuẩn và có phương sai giống nhau đóii với chu vi lớn hơn và nhỏ hơn 12
inch. Khi đó với mức ý nghĩa 5%. Hãy cho biết chiều cao trung bình của các cây có chu vi thân lớn hơn 12 inch có lớn hơn
các cây có chu vi nhỏ hơn 12 inch hay không?
c) Dựa vào số liệu trên nếu muốn ước lượng khoảng tin cậy 99% chiều cao trung bình cho các cây có chu vi lớn hơn 12 inch
với sai số không quá 1 inch thì lấy mẫu mới cỡ bao nhiêu?
Đề gồm 01 trang. Sinh viên được sử dụng tài liệu. Cán bộ coi thi không giải thích gì thêm.
lOMoARcPSD|42620215

2
Bài làm
Câu 1.
a) Do mỗi cặp bazơ là độc lập nhau và mỗi một cặp bazơ đều có tỉ lệ sai lệch là 10-5 nên X có
phân phối nhị thức. Ký hiệu: X ~ B(3;10-5) trong đó n = 3; p = 10-5 và q = 1 – p.
Các đặc trưng của X:
Kỳ vọng của X:
5
E X np 3 10 .
Phương sai của X:
5 5 5
D X npq 3 10 1 10 2,99997 10 .
Độ lệch chuẩn của X:
5 3
X D X 2,99997 10 5,4772 10 .
Mốt của X:
5 5 5 5
np q mod X np p 3 10 1 10 mod X 3 10 10
5 5
4 10 1 mod X 4 10 mod X 0.
b) Gọi Y là số cặp bazơ chưa được sửa thành công trong 50 cặp bazơ bị sai lệch.
Suy ra Y có phân phối nhị thức. Ký hiệu: Y ~ B(50;0,4) trong đó n = 50; p = 0,4 và q = 1 – p = 0,6.
Xác suất để còn lại không quá 20 cặp bazơ sai lệch trong DNA:
20
x x 50 x
50
x 0
P Y 20 P 0 Y 20 P Y 0 P Y 1 ... P Y 20 C 0,4 0,6 0,5610.
Lưu ý: Ngoài ra có thể sử dụng xấp xỉ phân bố chuẩn. Kết quả sẽ có sai số 1 chút nhưng đều
được chấp nhận nhé!
Câu 2.
Ta có:
k 10 10 5 50
50
1
P X k e P X 10 e e e .
e
15
5 5 5 25
10 25
P X 15;X 10 P X 15
e 1
P X 15 X 10 e e e .
P X 10 P X 10 e e
Câu 3.
xi 686 604 508 412 318 223 148 80 1
i
x
= 2980
yi 286 329 365 404 448 487 530 570 606
i
y
= 4025
2
i
x
470596
364816
258064
169744
101124
49729 21904 6400 1
2
i
x
= 1442378
2
i
y
81796 108241
133225
163216
200704
237169
280900
324900
367236
2
i
y
= 1897387
i i
x y
196196
198716
185420
166448
142464
108601
78440 45600 606
i i
x y
= 1122491
lOMoARcPSD|42620215

3
Gọi phương trình hồi quy tuyến tính của chỉ số đo được theo mật độ là y = ax + b.
Trong đó a,b được tính như sau:
n n n
i i i i
i 1 i 1 i 1
22
n n
2
i i
i 1 i 1
n n
i i
i 1 i 1
n x y x . y 9 1122491 2980 4025
a 0,4614.
9 1442378 2980
n x x
y a x 4025 0,4614 2980
b 599,9969.
n 9
Vậy phương trình hồi quy tuyến tính của chỉ số đo được theo mật độ là y = −0,4614x + 599,9969.
Khi đo khối tuyết co mật độ 100 (g/mm3) thì chỉ số đo là:
y = −0,4614 × 100 + 599,9969 = 553,8569.
Lưu ý: Các tổng phía trên mình có thể bấm máy và ghi vào bài làm.
b) Hệ số tương quan mẫu:
n n n
i i i i
i 1 i 1 i 1
2 2 2 2
n n n n
2 2
i i i i
i 1 i 1 i 1 i 1
n x y x y 9 1122491 2980 4025
r 0,9983.
9 1442378 2980 9 1897387 4025
n x x n y y
Gọi ρ là hệ số tương quan giữa x và y.
Độ tin cậy
/2 /2
1 95% 0,05 u 1 0,975 u 1,96.
2
Ta có:
/2 /2
1 1 r r 1 1 1 1 1 r r 1
ln u ln ln u
2 1 r 2 n 1 2 1 2 1 r 2 n 1
n 3 n 3
4 3
4 3
1 0,9983 1 0,9983
1 0,9983 1 1 1 1 0,9983 1
ln 1,96 ln ln 1,96
2 1 0,9983 2 9 1 2 1 2 1 0,9983 2 9 1
9 3 9 3
1 1 1
4,2725 ln 2,6722 1,9452 10 4,7748 10
2 1 1
1,9452 10 1 1 4,7748 10 1 .
Khoảng tin cậy cho hệ số tương quan giữa x và y với độ tin cậy 95%: −0,9996 < ρ < −0,9905.
lOMoARcPSD|42620215

4
Lưu ý:
TH1: n > 30 dùng công thức
2 2
/2 /2
1 r 1 r
r u ;r u
n n
TH2: n ≤ 30 dùng công thức như bài làm phía trên.
Câu 4.
a) Tỷ lệ sinh viên sẽ chi từ 6 triệu trở lên cho điện thoại mới theo mẫu:
f=m
n=33+10
100 =0,43
Độ tin cậy 1 − α=95%⇒α=0,05⇒
u∝/=1−α
2=0,975⇒u∝/ =1,96.
Ước lượng tỷ lệ sinh viên sẽ chi từ 6 triệu trở lên cho điện thoại mới với độ tin cậy 95%:
f−z∝ /.f.(1−f)
n;f+z∝ /.f.(1−f)
n
=0,44−1,96.0,44.(1−0,44)
100 ;0,43+1,96.0,44.(1−0,44)
100
=(0,3327;0,5273).
b) Đặt giả thuyết: H: Số liệu phù hợp với dự đoán
H: Số liệu không phù hợp với dự đoán
Mức giá ni pi Ei = n.pi
(
n
−
E
)
E
T
ừ
2 đ
ế
n 4 tri
ệ
u
8
0,
1
10
0,
4
T
ừ
4 đ
ế
n 6 tri
ệ
u
49
0,
4
40
2,
02
5
T
ừ
6 đ
ế
n 8 tri
ệ
u
33
0,
4
40
1,
225
T
ừ
8 tri
ệ
u tr
ở
lên
10
0,
1
10
0
T
ổ
ng
100
3,65
Giá trị thống kê kiểm định:χ
=(n−E)
E
=3,65.
Miền bác bỏ H: W=χ;
;+∞.
lOMoARcPSD|42620215

5
Với mức ý nghĩa α=5%,k=4,r=0,ta có: χ;
=χ,;
=7,815.
⇒W=(7,815;+∞).
Do χ
W nên chấp nhận H,bác bỏ H.
Kết luận: Với mức ý nghĩa 5%, số liệu đã cho phù hợp với dự đoán.
Câu 5.
a) Gọi X là chiều cao của cây Anh Đào (đơn vị: inch).
Từ số liệu đã cho, ta dễ dàng tính toán được: n=31>30; x=76; s=6,3718.
Độ tin cậy:
α α
α
α α Φ /2 /2
1 98% 0,02 u 1 0,99 u 2,326.
2
Ước lượng chiều cao trung bình của cây Anh Đào với độ tin cậy 98%:
x−u/.s
√n;x+u/.s
√n=76−2,326.6,3718
√31 ;76+2,326.6,3718
√31
=(73,3381;78,6619) (inch).
b) Gọi X1 là chiều cao của cây Anh Đào có chu vi thân nhỏ hơn 12 inch (đơn vị: inch).
Gọi X2 là chiều cao của cây Anh Đào có chu vi thân lớn hơn 12 inch (đơn vị: inch).
Gọi μ1, μ2 lần lượt là chiều cao của cây Anh Đào có chu vi thân nhỏ hơn 12 inch và chu vi thân
lớn hơn 12 inch theo tổng thê (đơn vị: inch).
Từ số liệu đã cho, ta dễ dàng tính toán được:
n=15; x=73,6667; s
=36,5238;n=16; x=78,1875; s
=36,5625.
Đặt giả thuyết: H: μ=μ
H: μ<μ
Do n<30,n<3 và chiều cao có phân phối chuẩn với phương sai bẳng nhau nên ta có tiêu
chuẩn kiểm định:
T= x−x
s1
n+1
n
Ta có:
2 2
1 1 2 22
1 2
n 1 s n 1 s 15 1 36,5238 16 1 36,5625
s 35,3257.
n n 2 15 16 1
lOMoARcPSD|42620215

