1
TRƯ LUỜNG ĐẠ ỌC KINH TẾ - I H ẬT
KHOA TOÁN KINH TẾ
ĐỀ THAM KHẢO CUỐI KỲ
Họ c k : I, Năm học: 2023 – 2024
MÔN: PHÂN TÍCH DỮ ỆU TRONG KINH TẾLI
Thời gian làm bài: 75 phút
PHẦN I. TRẮC NGHIỆM (5,0 điểm)
Dựa vào dữ ệu sau và trả lời câu hỏ từ 1 đếli i n 2:
+-----------------------------------------+
| workinghour | Obs | Rank Sum |
|------------------------+-----+----------|
| Dưới 8 tiếng/tuần | 5 | 61.50 |
| Từ 8 đến 16 tiếng/tuần | 6 | 63.00 |
| Trên 16 tiếng/tuần | 6 | 28.50 |
+-----------------------------------------+
Câu 1. Cho các phát biểu sau:
(1) ịnh củ ịnh trên là 6,915.Giá tr kiểm đ a kiểm đ
(2) Bậ ự do củ ị tớ ạn khi tra bảng là 3.c t a giá tr i h
(3) Số quan sát của lự ọn ố quan sát nhiều nha ch “Dưới 8 tiếng/tuần” có s t.
Trong các phát biểu trên, có bao nhiêu phát biểu chính xác?
A. C. D. 1. B. 2. 3. 0.
Câu 2. Có kế ận gì về kế ả kiể ịnh với mứt lu t qu m đ c ý nghĩa 5%?
A. Kiểm định Kruskal – Wallis ả bác bỏ giả thuyếcho ra kết qu t H0.
B. Kiểm định Kruskal – Wallis cho ra kế ấp nhận t qu ch gi thuyết H0.
C. Kiểm đ t qu t Hịnh Chi bình phương cho ra kế ả bác bỏ giả thuyế 0.
D. Kiểm đ t quịnh Chi bình phương cho ra kế ả chấp nhận gi thuyết H0.
Dựa vào dữ ệu sau và trả lời câu hỏi từ 3 đếli n 4:
Source SS df MS F Prob > F
------------------------------------------------------------------------
Between groups 5318.85556 8 664.856944 ??? 0.0000
Within groups 3055.64444 41 74.5279133
------------------------------------------------------------------------
Total 8374.5 49 170.908163
Bartlett's test for equal variances: chi2(5) = 9.1004 Prob>chi2 = 0.105
Câu 3. Bảng kết quả trên thể hiện kiể ịnh gì? m đ
lOMoARcPSD|42620215
2
A. Kiểm định phương sai hai yếu tố. B. Kiểm đ t yịnh phương sai mộ ếu tố.
C. Kiểm định tổng hạng Wilconxon. ịnh Kruskal – Wallis. D. Kiểm đ
Câu 4. Xác định giá trị ống kê F trong mô hình phân tích phương sai th trên?
A. C. D. 8,92. B. 74,53. 664,85. 170,91.
Câu 5. Dựa vào bảng kết quả được cho ở dưới, anh/chị hãy cho biết trong các phát biểu
sau đây, có bao nhiêu phát biểu không đúng về kế ả của kiểt qu m định?
sign | obs sum ranks expected
-------------+---------------------------------
positive | 16 235 149.5
negative | 7 64 149.5
zero | 1 1 1
-------------+---------------------------------
all | 24 300 300
unadjusted variance 1225.00
adjustment for ties -19.25
adjustment for zeros -0.25
----------
adjusted variance 1205.50
Ho: score = 7
z = 2.463
Prob > |z| = 0.0138
Exact Prob = 0.0116
(1) Kiểm định trên kiểm định dấu hạng Wilconxon với kết quả ểm định ki
bác bỏ giả thuyết H0.
(2) ịnh củ ịnh trên bằng 235.Giá tr kiểm đ a kiểm đ
(3) Số quan sát của mẫu nghiên cứu là 24 quan sát.
(4) ả thuyế của kiể ịnh trên là trung bình của các quan sát bằng 7.Gi t H0 m đ
A. C. D. 1. B. 2. 3. 4.
Câu 6. Ứng vớ ặp giả ết trong kiểm định – Wallis như sau:i c thuy Kruskal
{𝐻0: 𝜇1 2
= 𝜇 = 𝜇3= 𝜇4
𝐻1: ∃!(𝜇𝑖 𝜇𝑗)
Cho các phát biểu sau:
(1) Giả thuyế xảy ra khi t H0 𝑋0
2 𝑋𝛼,𝑘−1
2.
(2) Cặp giả ết trên có 3 nhóm tính ch ần kiểthuy t c m định.
lOMoARcPSD|42620215
3
(3) Nếu giả thuyết H1 xảy ra thì có ít nhất 1 nhóm tính chất có giá trị trung bình khác
biệt với nhau.
Trong các phát biểu trên, có bao nhiêu phát biểu chính xác?
A. C. D. 1. B. 2. 3. 0.
Dựa vào dữ ệu sau và trả lời câu hỏ từ 7 đếli i n 9:
Cho dữ ệu chuỗ ời gian về doanh số bán hàng tạ ửa hàng X như sau:li i th i C
year
sales
year
2013
1031.0
2018
2014
1022.1
2019
2015
1005.6
2020
2016
1025.0
2021
2017
1022.8
2022
Câu 7. Bằng việc sử dụng phương pháp đường trung bình ợt đối xứng khoảng trư
bằng 5, anh/chị hãy cho biết có bao nhiêu dữ ệu bị khuyết khi khi ực hiện vòng li sau th
lặp tính toán?
A. C. 1. B. 2. 3. D. 4 .
Câu 8. Sau khi xây dựng mô hình dự báo trung bình trượt đối xứng có khoảng bằng 5,
nhằm đánh giả tỷ lệ chính xác của mô hình dbáo, chcửa hàng đã thực hiện dự báo
các doanh số bán hàng. Giá trị dự báo doanh số nào sau đây là chính xác?
A. Doanh số dự báo năm 2015 là 1019,57.
B. Doanh số dự báo năm 2019 là 1035,62.
C. Doanh số dự báo năm 2017 là 1021,02.
D. Doanh số dự báo năm 2022 là 1037,44.
Câu 9. Dựa vào kết quả tính toán bằng phương pháp trung bình trượt đối xứng khoảng
bằng 5, anh/chị hãy cho biết phát biểu nào sau đây là đúng?
A. Tất cả các giá trị dự báo lớn hơn giá trị thực tế.
B. Tổng các biến thiên về giá trị ế và giá trị dự báo là mộ ỏ hơn 0.thực t t s nh
C. Sai số lớn nhất trong các giá trị biến thiên của giá trị ực tế giá trị dự báo th
một số nhỏ hơn 0.
D. Giá trị phương sai mẫu của biến thiên giá trị ực tế và giá trị dự báo là 7,998061.th
Câu 10. Dựa vào bảng kết quả được cho bên dưới, ị hãy đưa ra kết luận cần thiếanh/ch t
cho kiểm đ i mịnh dưới đây vớ ức ý nghĩa 5%?
lOMoARcPSD|42620215
4
sign | observed expected
-------------+------------------------
positive | 0 4
negative | 8 4
zero | 1 1
-------------+------------------------
all | 9 9
Ho: median of before - after = 0 vs.
Ha: median of before - after < 0
Pr(#negative >= 8) =
Binomial(n = 8, x >= 8, p = 0.5) = 0.0039
A. Chương trình giảng dạy mới cải thiện điể ố củm s a sinh viên trong trường.
B. Trung bình điể củ trong trường không đổm s a sinh viên i.
C. Trung vị điểm số củ ờng không đa sinh viên trong trư i.
D. Chương trình giảng dạy mớ không cải thiện điể của sinh viên trong trường.i m s
Dựa vào dữ ệu sau và trả lời câu hỏ từ đếli i 11 n 12:
holiday | obs rank sum expected
-------------+---------------------------------
0 | 30 499.5 915
1 | 30 1330.5 915
-------------+---------------------------------
combined | 60 1830 1830
unadjusted variance 4575.00
adjustment for ties -3.18
----------
adjusted variance 4571.82
Ho: revenue(holiday==0) = revenue(holiday==1)
z = -6.145
Prob > |z| = 0.0000
Exact Prob = 0.0000
Câu 11. Giá trị kiể ịnh củ ểm định tổng hạng m đ a ki trên là bao nhiêu?
A. C. D. 499,500. B. 915,000. -6,415. -3,180.
Câu 12. Kiểm đ m định trên nhằ
A. So sánh sự khác biệt củ ố bán hàng theo thời gian.a trung bình doanh s
B. So sánh sự khác biệt củ vị doanh số bán hàng theo thời gian.a trung
lOMoARcPSD|42620215
5
C. So sánh sự khác biệt của trung bình doanh số bán hàng trong ngày đặc biệt so với
ngày thường.
D. So sánh sự khác biệt của trung vị doanh số bán hàng trong ngày đặc biệt so với
ngày thường.
Câu 13. Cho biểu đồ chuỗi thời gian miêu tả ợng tiêu thụ của anh Archibald calories
từ ngày 01/01/2002 đến ngày 31/12/2002 như sau:(365 ngày)
Trong các phát biểu sau, phát biểu nào chưa chính xác?
A. Trước ngày 21/11/2002, dữ ệu về ợng calories của anh Archibald hầu như li
không có xu thế.
B. Vào các dịp lễ, dữ ệu về ợng calories của anh Archibald sự tăng đáng kể li
hơn các ngày bình thường.
C. Dữ ệu về ng calories của anh Archibald ất trong ngày 25/12/2002.li cao nh
D. Dữ ệu về li lượng calories của anh Archibald ấp nhấ là một ngày trong tháng 7.th t
Dựa vào dữ ệu sau và trả lời câu hỏ từ 14 đếli i n 15:
Độ ổi khách | Chấ ợng dịch vụtu t lư
hàng | Không tốt Tạ ợc Tốt | Totalm đư
----------------------+---------------------------------+----------
ới 25 tuổi | 20 40 60 | 120
Từ 25 đến 35 tuổi | 25 30 30 | 85
Trên 35 tuổi | 40 50 20 | 110
----------------------+---------------------------------+----------
Total | 85 120 110 | 315
Câu 14. Đđánh gmối liên hệ giữa độ ổi của khách hàng chất lượng dịch vụtu ,
anh/chị đề ất nên sử dụng kiểm định nào?xu
A. Kiểm định chi bình phương. B. Kiểm đ t yịnh phương sai mộ ếu tố.
lOMoARcPSD|42620215