
45
ĐỀ TÀI KHOA HỌC
SỐ: 2.1.3-TC05-06
NGHIÊN CỨU, XÂY DỰNG NỘI DUNG, CẤU TRÚC CƠ SỞ DỮ LIỆU
THỐNG KÊ KINH TẾ - XÃ HỘI TỔNG HỢP QUỐC GIA
1. Cấp đề tài : Tổng cục
2. Thời gian nghiên cứu : 2005-2006
3. Đơn vị chủ trì : Vụ thống kê Tổng hợp
4. Đơn vị quản lý : Viện Khoa học Thống kê
5. Chủ nhiệm đề tài : CN. Nguyễn Thị Ngọc Vân
6. Những ngƣời phối hợp nghiên cứu:
KS. Phạm Thị Thanh
TS. Trần Kim Đồng
CN. Phạm Huy Tú
TS. Thiều Văn Tiến
CN. Nguyễn Thị Chiến
7. Điểm đánh giá nghiệm thu đề tài: 8,75 / Xếp loại: Khá

46
PHẦN I
MỘT SỐ VẤN ĐỀ CHUNG VỀ CSDL TỔNG HỢP
I. Một số khái niệm
1. Dữ liệu
Trong máy tính, thuật ngữ dữ liệu đƣợc xem nhƣ là các sự kiện đƣợc
biết đến mà có thể ghi lại và lƣu trữ trên các thiết bị ghi nhớ của máy tính. Dữ
liệu tạo nên nội dung của cơ sở dữ liệu, tuy nhiên nó không quyết định tính
hiệu quả của cơ sở dữ liệu vì tính hiệu quả đƣợc thể hiện qua việc thiết kế và
khai thác cơ sở dữ liệu.
2. Cơ sở dữ liệu
Có thể định nghĩa cơ sở dữ liệu nhƣ là một bộ sƣu tập có tổ chức của các
dữ liệu liên quan logic với nhau và đƣợc các hệ ứng dụng của một tổ chức cụ
thể nào đó sử dụng.
3. Cơ sở dữ liệu thống kê kinh tế - xã hội
Cơ sở dữ liệu thống kê kinh tế - xã hội là tập hợp có tổ chức các dữ liệu
về kinh tế và xã hội có liên quan với nhau, đƣợc cập nhật và lƣu trữ một cách
hợp lý trong c¸c ph- ¬ng tiÖn mang tin ®iÖn tö vµ m¹ng tin häc sao cho c¸c
ch- ¬ng tr×nh m¸y tÝnh cã thÓ trî gióp ngƣời sử dụng khai th¸c c¸c th«ng tin
tõ c¬ së d÷ liÖu nµy mét c¸ch dÔ dàng.
Cơ sở dữ liệu thống kê kinh tế - xã hội gồm cơ sở dữ liệu thống kê kinh
tế - xã hội vi mô và cơ sở dữ liệu thống kê kinh tế - xã hội vĩ mô.
4. Cơ sở dữ liệu thống kê kinh tế - xã hội tổng hợp
Cơ sở dữ liệu thống kê kinh tế - xã hội tổng hợp là tập hợp những thông
tin kinh tế - xã hội theo thời gian, đơn vị hành chính đã đƣợc tổng hợp từ kết
quả các cuộc điều tra thống kê mẫu, điều tra thống kê toàn bộ, tổng điều tra
thống kê; các báo cáo thống kê và c¸c nguån thu thập khác. Những thông tin
này đƣợc nhập, lƣu trữ và đƣợc tổ chức một cách hợp lý trong các phƣơng
tiện mang tin điện tử, mạng tin học.
5. Cơ sở dữ liệu thống kê kinh tế - xã hội tổng hợp quốc gia
Cơ sở dữ liệu thống kờ kinh tế - xã hội tổng hợp quốc gia là tập hợp
những dữ liệu thống kê kinh tế - xã hội tổng hợp trên phạm vi cả nƣớc do
ngành Thống kê xây dựng. Những dữ liệu này đƣợc chuẩn hoá, cập nhật và
lƣu trữ một cách hợp lý trong các phƣơng tiện mang tin điện tử, mạng tin học

47
sao cho các chƣơng trình máy tính có thể trợ giúp ngƣời sử dụng đã đƣợc
phân quyền truy nhập khai thác một cách dễ dàng, thuận tiện các thông tin
theo yêu cầu, mục đích riêng.
6. Các bảng danh mục
+ Bảng danh mục đơn vị hành chính
+ Bảng phân ngành kinh tế quốc dân
+ Bảng danh mục sản phẩm
+ Bảng danh mục nghề nghiệp
+ Bảng danh mục giáo dục, đào tạo
+ Bảng danh mục dân tộc Việt Nam.
PHẦN II
ĐỀ XUẤT NỘI DUNG VÀ CẤU TRÚC CSDL TỔNG HỢP
I. Một số nguyên tắc xây dựng CSDL tổng hợp
Vì CSDL tổng hợp là sản phẩm cuối cùng của ngành Thống kê đƣợc
ứng dụng công nghệ tin học tuyệt đối ở tất cả các bƣớc: Nhập dữ liệu, kiểm
tra dữ liệu, quản lý dữ liệu, khai thác dữ liệu, ngƣời dùng tin sẽ sử dụng
những dữ liệu khai thác đƣợc từ CSDL tổng hợp để phục vụ mục đích nghiên
cứu riêng của mỗi đối tƣợng nên quá trình xây dựng CSDL tổng hợp phải
đảm bảo một số nguyên tắc sau đây:
1. CSDL tổng hợp phải đáp ứng tốt nhất nhu cầu của người sử dụng thông
tin thống kê
Nhu cầu thông tin của các đối tƣợng cũng đa dạng và phong phú hơn,
điều này đòi hỏi ngƣời phổ biến thông tin phải nhanh chóng tiếp cận và ứng
dụng tiến bộ của công nghệ thông tin vào công tác phổ biến thông tin để
ngƣời sử dụng có thể tiếp cận đƣợc với thông tin một cách nhanh nhất và tiện
lợi nhất.
Một số loại thông tin thống kê chủ yếu sau đây đƣợc ngƣời dùng tin
quan tâm:
+ Thông tin tổng hợp vĩ mô
+ Thông tin tháng, quý, năm
+ Thông tin chuyên ngành
+ Thông tin khác.

48
2. CSDL phải mang tính đồng bộ và toàn diện
Tính toàn diện thể hiện ở chỗ CSDL tổng hợp phải bao gồm những chỉ
tiêu liên quan đến các hoạt động kinh tế - xã hội chủ yếu đang diễn ra trong
nền kinh tế.
Tính đồng bộ của CSDL tổng hợp chính là mối liên hệ, sự kết nối giữa
số liệu các chỉ tiêu với những dữ liệu có liên quan đến chỉ tiêu để làm rõ hơn
về chỉ tiêu và số liệu của chỉ tiêu nhƣ: khái niệm/định nghĩa, nguồn số liệu…,
này đƣợc để trong các metadata của CSDL tổng hợp.
3. CSDL phải mang tính kịp thời
Dữ liệu trong CSDL tổng hợp phải đƣợc cập nhật thƣờng xuyên, liên
tục, tránh sự trậm trễ làm cho dữ liệu bị lạc hậu. Tính kịp thời còn đòi hỏi
mọi sự thay đổi, điều chỉnh có liên quan đến dữ liệu phải đƣợc thể hiện ngay
trong CSDL tổng hợp.
4. CSDL phải đáp ứng khả năng truy cập
Nguyên tắc này đòi hỏi hệ quản trị CSDL phải đảm bảo hệ thống hoạt
động thƣờng xuyên, tránh tình trạng ngƣời sử dụng không truy cập đƣợc vào
bất kỳ một bảng nào của CSDL
5. CSDL phải khả thi
CSDL tổng hợp mang tính khả thi thể hiện ở những yếu tố sau đây có
khả thi hay không:
- Yếu tố cơ sở vật chất kỹ thuật;
- Yếu tố con ngƣời;
- Kinh phí cũng là một nhân tố quan trọng quyết định CSDL tổng hợp
đƣợc triển khai nhanh hay chậm và có đảm bảo chất lƣợng tối ƣu hay không.
II. Nội dung và đối tƣợng sử dụng CSDL tổng hợp
1. Nội dung
1.1 Hệ thống các chỉ tiêu
Nội dung chính của CSDL tổng hợp là những thông tin liên quan đến
hệ thống các chỉ tiêu thống kê, vì vậy các chỉ tiêu này phải đƣợc lựa chọn sao
cho đảm bảo các nguyên tắc đã đƣợc đề cập trên đây. Hiện nay, Hệ thống chỉ
tiêu thống kê quốc gia đƣợc Thủ tƣớng Chính phủ phê duyệt và ban hành

49
theo Quyết định số 305/2005/QĐ-TTg ngày 24 tháng 11 năm 2005 là hệ
thống chỉ tiêu thống kê đầy đủ nhất mang tính pháp lý có thể đáp ứng tốt nhất
nhu cầu của ngƣời sử dụng thông tin thống kê. Hệ thống chỉ tiêu thống kê
quốc gia gồm 24 nhóm với 381 chỉ tiêu: (1) Nhóm chỉ tiêu về đất đai, khí
hậu, hành chính 8 chỉ tiêu; (2) Nhóm chỉ tiêu về dân số 15 chỉ tiêu; (3) Nhóm
chỉ tiêu về lao động, việc làm 15 chỉ tiêu; (4) Nhóm chỉ tiêu về cơ sở kinh tế,
hành chính, sự nghiệp 15 chỉ tiêu; (5) Nhóm chỉ tiêu về đầu tƣ 12 chỉ tiêu; (6)
Nhóm chỉ tiêu về tài khoản quốc gia 14 chỉ tiêu; (7) Nhóm chỉ tiêu về tài
chính công 7 chỉ tiêu; (8) Nhóm chỉ tiêu về tiền tệ, chứng khoán 13 chỉ tiêu;
(9) Nhóm chỉ tiêu về bảo hiểm 8 chỉ tiêu; (10) Nhóm chỉ tiêu về nông, lâm
nghiệp và thủy sản 22 chỉ tiêu; (11) Nhóm chỉ tiêu về công nghiệp và xây
dựng 10 chỉ tiêu; (12) Nhóm chỉ tiêu về thƣơng mại 16 chỉ tiêu; (13) Nhóm
chỉ tiêu về giá cả 8 chỉ tiêu; (14) Nhóm chỉ tiêu về du lịch 7 chỉ tiêu; (15)
Nhóm chỉ tiêu về giao thông, vận tải 20 chỉ tiêu; (16) Nhóm chỉ tiêu về bƣu
chính viễn thông 8 chỉ tiêu; (17) Nhóm chỉ tiêu về khoa học công nghệ 10 chỉ
tiêu; (18) Nhóm chỉ tiêu về giáo dục và đào tạo 57 chỉ tiêu; (19) Nhóm chỉ
tiêu về y tế và chăm sóc sức khoẻ 26 chỉ tiêu; (20) Nhóm chỉ tiêu về văn hoá,
thông tin, thể thao 36 chỉ tiêu; (21) Nhóm chỉ tiêu về mức sống dân cƣ 14 chỉ
tiêu; (22) Nhóm chỉ tiêu về trật tự, an toàn xã hội và tƣ pháp 13 chỉ tiêu; (23)
Nhóm chỉ tiêu về bảo vệ môi trƣờng 20 chỉ tiêu; (24) Nhóm chỉ tiêu về tiến
bộ phụ nữ 7 chỉ tiêu.
Trong CSDL tổng hợp, mỗi chỉ tiêu đều có những phân tổ, kỳ công bố
cũng nhƣ nguồn thu thập phù hợp với nội dung của từng chỉ tiêu (chi tiết xem
trong báo cáo kết quả đề tài).
1.2. Hệ thống các bảng danh mục, bảng phân loại
Bất kỳ một hệ thống tin học hóa nào cũng bao gồm một loạt các danh
mục có liên quan để mọi dữ liệu trong CSDL của hệ thống trở nên có ý nghĩa.
CSDL các bảng danh mục, bảng phân loại gồm toàn bộ các bảng danh mục
có liên quan đến phân tổ của các chỉ tiêu nhƣ: Bảng danh mục các đơn vị
hành chính; bảng danh mục dân tộc; bảng danh mục hàng hoá xuất, nhập
khẩu; bảng danh mục sản phẩm; bảng phân ngành kinh tế quốc dân...
Hệ thống các bảng danh mục, bảng phân loại đƣợc mã hóa có vai trò rất
quan trọng trong việc thu thập thông tin, xử lý thông tin, liên kết và chia sẻ
thông tin.

