45
ĐỀ TÀI KHOA HỌC
SỐ: 2.1.3-TC05-06
NGHIÊN CỨU, XÂY DỰNG NỘI DUNG, CẤU TRÚC CƠ SỞ DỮ LIỆU
THỐNG KÊ KINH TẾ - XÃ HỘI TỔNG HỢP QUỐC GIA
1. Cấp đề tài : Tổng cục
2. Thời gian nghiên cứu : 2005-2006
3. Đơn vị chủ trì : Vụ thống kê Tổng hợp
4. Đơn vị quản lý : Viện Khoa học Thống kê
5. Chủ nhiệm đề tài : CN. Nguyễn Thị Ngọc Vân
6. Những ngƣời phối hợp nghiên cứu:
KS. Phạm Thị Thanh
TS. Trần Kim Đồng
CN. Phạm Huy Tú
TS. Thiều Văn Tiến
CN. Nguyễn Thị Chiến
7. Điểm đánh giá nghiệm thu đề tài: 8,75 / Xếp loại: Khá
46
PHẦN I
MỘT SỐ VẤN ĐỀ CHUNG VỀ CSDL TỔNG HỢP
I. Một số ki niệm
1. Dữ liệu
Trong máy tính, thuật ngữ dữ liệu đƣợc xem nhƣ các sự kiện đƣợc
biết đến mà có thể ghi lại và lƣu trữ trên các thiết bị ghi nhớ của máy tính. D
liệu tạo nên nội dung của cơ s d liệu, tuy nhiên không quyết định tính
hiệu qu của cơ s d liệu vì tính hiệu qu đƣợc th hiện qua việc thiết kế
khai thác cơ s d liệu.
2. Cơ sở dữ liệu
th định nghĩa cơ s d liệu nhƣ là một bộ sƣu tập có tổ chức của các
dữ liệu liên quan logic với nhau đƣợc các hệ ứng dụng của một tổ chức cụ
thể nào đó sử dụng.
3. Cơ sở dữ liệu thống kê kinh tế - xã hội
Cơ s d liệu thống kinh tế - xã hội tập hợp t chức các d liệu
v kinh tế xã hội liên quan với nhau, đƣợc cập nhật và lƣu tr một cách
hợp trong c¸c ph- ¬ng tiÖn mang tin ®iÖn m¹ng tin häc sao cho c¸c
ch- ¬ng tr×nh m¸y tÝnh thÓ trî gióp ngƣời sử dụng khai th¸c c¸c th«ng tin
tõ c¬ së d÷ liÖu nµy mét c¸ch dÔ dàng.
sở dữ liệu thống kinh tế - hội gồm sở dữ liệu thống kê kinh
tế - xã hội vi mô và cơ sở dữ liệu thống kê kinh tế - xã hội vĩ mô.
4. Cơ sở dữ liệu thống kê kinh tế - xã hội tổng hợp
Cơ s d liệu thốngkinh tế - hội tổng hợp tập hợp những thông
tin kinh tế - hội theo thời gian, đơn v hành chính đã đƣợc tổng hợp t kết
qu các cuộc điều tra thống kê mẫu, điều tra thống toàn b, tổng điều tra
thống kê; các báo cáo thống c¸c nguån thu thập khác. Những thông tin
y đƣợc nhập, lƣu trữ và đƣợc tổ chức một cách hợp trong c phƣơng
tiện mang tin điện tử, mạng tin học.
5. Cơ sở dữ liệu thống kê kinh tế - hội tổng hợp quốc gia
Cơ sở dữ liệu thống k kinh tế - hi tổng hợp quốc gia tập hợp
những dữ liệu thống kinh tế - hội tổng hợp trên phạm vi cả nƣớc do
ngành Thống xây dựng. Những dữ liệu này đƣợc chuẩn hoá, cập nhật
lƣu trữ một cách hợp lý trong các phƣơng tiện mang tin điện tử, mạng tin học
47
sao cho các chƣơng trình máy tính thể trợ giúp ngƣời sdụng đã đƣợc
phân quyền truy nhập khai thác một cách dễ dàng, thuận tiện các thông tin
theo yêu cầu, mc đích riêng.
6. Các bảng danh mục
+ Bảng danh mục đơn vị hành chính
+ Bảng phân ngành kinh tế quốc dân
+ Bảng danh mục sản phẩm
+ Bảng danh mục nghề nghiệp
+ Bảng danh mục giáo dục, đào tạo
+ Bảng danh mc dân tộc Việt Nam.
PHẦN II
ĐỀ XUẤT NỘI DUNG VÀ CẤU TRÚC CSDL TỔNG HỢP
I. Một số nguyên tắc xây dựng CSDL tổng hợp
CSDL tổng hợp sản phẩm cuối cùng của ngành Thng kê đƣợc
ứng dụng công ngh tin học tuyệt đối tất c các bƣớc: Nhập d liệu, kiểm
tra d liệu, quản d liệu, khai thác d liệu, ngƣời dùng tin s s dụng
nhng d liệu khai thác đƣợc t CSDL tổng hợp để phục v mục đích nghiên
cứu riêng của mỗi đối tƣợng nên quá trình xây dựng CSDL tổng hợp phải
đảm bảo một s nguyên tắc sau đây:
1. CSDL tổng hợp phải đáp ứng tốt nhất nhu cầu của người sử dụng thông
tin thống kê
Nhu cầu thông tin của các đối tƣợng cũng đa dạng phong phú hơn,
điều này đòi hỏi ngƣời phổ biến thông tin phải nhanh chóng tiếp cận ứng
dụng tiến bộ của công nghệ thông tin o công tác phổ biến thông tin để
ngƣời sử dụng có thể tiếp cận đƣợc với thông tin một cách nhanh nhất và tiện
lợi nhất.
Một số loại thông tin thống chủ yếu sau đây đƣợc ngƣời dùng tin
quan tâm:
+ Thông tin tổng hợp vĩ
+ Thông tin tháng, quý, năm
+ Thông tin chuyên ngành
+ Thông tin khác.
48
2. CSDL phải mang tính đồng bộ và toàn diện
Tính toàn diện th hiện ch CSDL tổng hợp phải bao gồm nhng ch
tiêu liên quan đến các hoạt động kinh tế - hội ch yếu đang diễn ra trong
nền kinh tế.
Tính đồng b của CSDL tổng hợp chính mối liên h, s kết nối giữa
s liệu các ch tiêu với những d liệuliên quan đến ch tiêu để làmhơn
v ch tiêu và s liệu của ch tiêu nhƣ: khái niệm/định nghĩa, nguồn s liệu…,
này đƣợc để trong các metadata của CSDL tng hợp.
3. CSDL phải mang tính kịp thời
Dliệu trong CSDL tổng hợp phải đƣợc cập nhật thƣờng xuyên, liên
tục, tránh sự trậm trễ làm cho dữ liệu bị lạc hậu. Tính kịp thời còn đòi hỏi
mọi sự thay đổi, điều chỉnh liên quan đến dliệu phải đƣợc thể hiện ngay
trong CSDL tổng hợp.
4. CSDL phải đáp ứng kh năng truy cập
Nguyên tắc này đòi hỏi h quản tr CSDL phải đảm bảo h thống hoạt
động thƣờng xuyên, tránh tình trạng ngƣời s dụng không truy cập đƣợc vào
bất k một bảng nào của CSDL
5. CSDL phải khả thi
CSDL tổng hợp mang tính khả thi thể hiện những yếu tố sau đây
khả thi hay không:
- Yếu tố cơ sở vật chất kỹ thuật;
- Yếu tố con ngƣời;
- Kinh phí cũng một nhân tố quan trọng quyết định CSDL tổng hợp
đƣợc triển khai nhanh hay chậm và có đảm bảo chất lƣợng tối ƣu hay không.
II. Nội dung đối tƣợng s dụng CSDL tổng hợp
1. Nội dung
1.1 Hệ thống các chỉ tiêu
Nội dung chính của CSDL tổng hợp những thông tin liên quan đến
h thống các ch tiêu thống kê, vì vậy các ch tiêu này phải đƣợc lựa chọn sao
cho đảm bảo các nguyên tắc đã đƣợc đề cập trên đây. Hiện nay, H thống ch
tiêu thống quốc gia đƣợc Thủ tƣớng Chính phủ phê duyệt ban hành
49
theo Quyết định số 305/2005/QĐ-TTg ngày 24 tháng 11 năm 2005 là h
thống ch tiêu thống đầy đủ nhất mang tính pháp lý có thể đáp ứng tốt nhất
nhu cầu của ngƣời sử dụng thông tin thống kê. Hệ thống chỉ tiêu thống
quốc gia gồm 24 nhóm với 381 chỉ tiêu: (1) Nhóm chtiêu về đất đai, khí
hậu, hành chính 8 chỉ tiêu; (2) Nhóm chỉ tiêu về dân số 15 chỉ tiêu; (3) Nhóm
chỉ tiêu về lao động, việc làm 15 chỉ tiêu; (4) Nhóm chỉ tiêu về cơ sở kinh tế,
hành chính, sự nghiệp 15 chỉ tiêu; (5) Nhóm chỉ tiêu về đầu tƣ 12 chỉ tiêu; (6)
Nhóm chỉ tiêu về tài khoản quốc gia 14 chỉ tiêu; (7) Nhóm chỉ tiêu về tài
chính công 7 chỉ tiêu; (8) Nhóm chỉ tiêu về tiền tệ, chứng khoán 13 chỉ tiêu;
(9) Nhóm chỉ tiêu về bảo hiểm 8 chỉ tiêu; (10) Nhóm chỉ tiêu về nông, lâm
nghiệp thủy sản 22 chỉ tiêu; (11) Nhóm chtiêu vcông nghiệp xây
dựng 10 chỉ tiêu; (12) Nhóm chỉ tiêu vthƣơng mại 16 chỉ tiêu; (13) Nhóm
chỉ tiêu về giá cả 8 chỉ tiêu; (14) Nhóm chỉ tiêu vdu lịch 7 chỉ tiêu; (15)
Nhóm chỉ tiêu về giao thông, vận tải 20 chỉ tiêu; (16) Nhóm chỉ tiêu về bƣu
chính viễn thông 8 chỉ tiêu; (17) Nhóm chỉ tiêu về khoa học công nghệ 10 chỉ
tiêu; (18) Nhóm chỉ tiêu về giáo dục đào tạo 57 chỉ tiêu; (19) Nhóm chỉ
tiêu về y tế chăm sóc sức khoẻ 26 chỉ tiêu; (20) Nhóm chỉ tiêu về văn hoá,
thông tin, thể thao 36 chỉ tiêu; (21) Nhóm chỉ tiêu về mức sống dân cƣ 14 chỉ
tiêu; (22) Nhóm chỉ tiêu về trật tự, an toàn xã hội và tƣ pháp 13 chỉ tiêu; (23)
Nhóm chỉ tiêu về bảo vệ môi trƣờng 20 chỉ tiêu; (24) Nhóm chỉ tiêu về tiến
bộ phụ nữ 7 chỉ tiêu.
Trong CSDL tổng hợp, mỗi ch tiêu đều những phân t, k công b
cũng nhƣ nguồn thu thập phù hợp vi nội dung của từng ch tiêu (chi tiết xem
trong báo cáo kết quả đề tài).
1.2. Hệ thống các bảng danh mục, bảng phân loại
Bất kỳ một hệ thống tin học hóa nào cũng bao gồm một loạt các danh
mục có liên quan để mọi dữ liệu trong CSDL của hệ thống trở nên có ý nghĩa.
CSDL các bảng danh mục, bảng phân loại gồm toàn bộ các bảng danh mục
liên quan đến phân tcủa các chỉ tiêu nhƣ: Bảng danh mục các đơn vị
hành chính; bảng danh mục dân tộc; bảng danh mục hàng hoá xuất, nhập
khẩu; bảng danh mục sản phẩm; bảng phân ngành kinh tế quốc dân...
Hệ thống các bảng danh mục, bảng phân loại đƣợc mã hóa vai trò rất
quan trọng trong việc thu thập thông tin, xử thông tin, liên kết chia sẻ
thông tin.