Quản trị Hệ thống thông tin
Mục tiêu học tập
CHƯƠNG 3
1. Hiểu tầm quan trọng của cơ sở dữ liệu đối với
QUẢN TRỊ CƠ SỞ DỮ LIỆU
tổ chức
2. Mô tả được nội dung và cách thức vận hành
của cơ sở dữ liệu và hệ quản trị cơ sở dữ liệu
3. Giải thích vì sao tổ chức ngày nay đầu tư vào
công nghệ cơ sở dữ liệu
1 2
Nội dung
I. Quản trị CSDL và chiến lược
1. Tiếp cận hướng CSDL
2. Ưu điểm của hướng tiếp cận bằng CSDL
1. Nhập và truy vấn 2. Tạo report 3. Thiết kế CSDL theo mô hình quan hệ 4. Chuẩn hóa CSDL 5. Từ điển dữ liệu
I. Quản trị cơ sở dữ liệu và chiến lược 1. Tiếp cận hướng cơ sở dữ liệu 2. Ưu điểm của hướng tiếp cận bằng CSDL II. Các hoạt động cơ bản của cơ sở dữ liệu III. Xu hướng khai thác CSDL
1. Liên kết ứng dụng Web với CSDL 2. Data Warehouse 3. Data Marts 4. Data Mining
4 3
1. Tiếp cận hướng CSDL
1. Tiếp cận hướng CSDL
Các khái niệm (cid:1)Hệ quản trị cơ sở dữ liệu (Database Management Systems, DBMS) là một phần mềm dùng để quản trị cơ sở dữ liệu
Các khái niệm (cid:1)Cơ sở dữ liệu (Database) là một tập hợp các dữ liệu có liên quan, được tổ chức để thuận tiện cho việc tìm kiếm và truy xuất dữ liệu.
(cid:1)Ví dụ, sử dụng cơ sở dữ liệu để:
(cid:1)Sử dụng phần mềm quản trị cơ sở dữ liệu để tạo mới, lưu trữ, sắp xếp, và truy xuất dữ liệu từ một hoặc nhiều cơ sở dữ liệu
(cid:1)Các hệ quản trị cơ sở dữ liệu thông dụng:
(cid:1)Microsoft Access, (cid:1)Microsoft SQL Server, (cid:1)Oracle,[
(cid:1)Lưu thông tin 1 quyển sách (cid:1)Theo dõi doanh số bán sách (cid:1)Lên bảng lương (cid:1)Trả lương cho nhân viên
6 5
1
Quản trị Hệ thống thông tin
1. Tiếp cận hướng CSDL
2. Ưu điểm của hướng tiếp cận bằng CSDL
DBMS và con người
Hoạt động sản xuất
Các chương trình ứng dụng
(Tập hợp dữ liệu và xử lý giao tác)
Phân tích/Lập trình viên
(Thiết kế, tạo, và bảo trì)
Hệ quản trị cơ sở dữ liệu
Người dùng
Cơ sở dữ liệu
(cid:2) Độc lập giữa chương trình và dữ liệu (cid:2) Dư thừa dữ liệu ít nhất (cid:2) Tăng tính nhất quán dữ liệu (cid:2) Tăng tính chia sẻ dữ liệu (cid:2) Phát triển ứng dụng hiệu quả hơn (cid:2) Tuân thủ các tiêu chuẩn (cid:2) Chất lượng dữ liệu được cải thiện (cid:2) Tăng khả năng truy xuất dữ liệu (cid:2) Giảm bảo trì chương trình
(Báo cáo, truy vấn, và phân tích)
Người quản trị CSDL (Thiết kế, kiểm soát, các thủ tục)
7 8
1. Nhập liệu và truy vấn
II. Các hoạt động cơ bản của CSDL
Form nhập liệu
1. Nhập liệu và truy vấn
2. Tạo report
3. Thiết kế CSDL theo mô hình quan hệ
4. Chuẩn hóa CSDL
Vùng nhập dữ liệu
5. Từ điển dữ liệu
9 10
1. Nhập liệu và truy vấn
1. Nhập liệu và truy vấn
Ngôn ngữ truy vấn SQL
Truy vấn dữ liệu
SQL:
SELECT CID, Name, Phone, City, AccountBalance FROM Customers WHERE AccountBalance > 200 ;
Hãy cho tôi biết thông tin về các Hãy cho tôi biết[[.. Hãy cho tôi biết doanh thu theo Hãy cho tôi biết khách hàng nào Hãy cho tôi biết doanh thu của Hãy cho tôi biết thông tin về các Hãy cho tôi biết..[[ từng sản phẩm đã mua hàng > 1,000,000 VND cửa hàng trong tháng 8 khách hàng thích uống Pepsi nhân viên nữ ?
?
Ví dụ
Điều kiện
Database
Cửa hàng Cửa hàng
11 12
2
Quản trị Hệ thống thông tin
2. Tạo báo cáo (Report)
Báo cáo (report)
Báo cáo là một tập hợp dữ liệu được tổ chức theo định dạng có thể in được
Một ví dụ về báo cáo
13 14
3. Thiết kế CSDL theo MH quan hệ
3. Thiết kế CSDL theo MH quan hệ
Xác định mục tiêu khai thác CSDL (cid:1)Phân tích hiện trạng thế giới thực của tổ chức,
doanh nghiệp, cửa hàng,[
(cid:1)Xem luồng thông tin hoạt động từng bước như thế nào: đầu vào (những thông tin nào)(cid:3) xử lý (xử lý thông tin đầu vào)(cid:3) kết quả (xuất báo cáo chi tiết). (cid:1)Quyết định thông tin nào sẽ đưa vào CSDL,hình thành các bảng cần thiết để chứa dữ liệu, và định nghĩa các trường thuộc tính sao cho mô tả đầy đủ các đối tượng
15 16
3. Thiết kế CSDL theo MH quan hệ
3. Thiết kế CSDL theo MH quan hệ
Xác định các trường trong bảng (cid:1)Xác định các thông tin thuộc tính của một bảng. (cid:1)Một số phương pháp xác định trường:
Xác định các bảng CSDL (cid:1) Bảng (table) là nơi lưu trữ dữ liệu (cid:1)Thiết kế sao cho có thể lưu được đầy đủ dữ liệu cần thiết, tránh việc dư thừa dữ liệu
(cid:1)Mỗi trường chỉ có mối quan hệ trực tiếp đến 1 đối tượng trong bảng, trường nào mô tả thuộc tính của đối tượng khác phải thuộc bảng khác
(cid:1)Không đưa những trường chứa thông tin có thể rút được từ trường khác, hoặc là kết quả có thể tính toán được.
(cid:1)Các trường phải phủ hết thông tin
17 18
3
Quản trị Hệ thống thông tin
3. Thiết kế CSDL theo MH quan hệ
3. Thiết kế CSDL theo MH quan hệ
Khóa chính
Tên trường
Xác lập các mối quan hệ (MH quan hệ) (cid:1) Quan hệ một nhiều (1-n)
CSDL
Mẩu tin
(cid:1) Đây là mối quan hệ phổ biến nhất. (cid:1) Một mẫu tin của bảng bên 1 sẽ có thể có nhiều mẫu tin tương ứng bên bảng nhiều, ngược lại một mẫu tin bên nhiều chỉ ứng với một mẫu tin bên 1.
(cid:1) Để thiết lập mối quan hệ 1- n, ta thêm khóa chính của bên
Trường
1 vào bên n làm khóa ngoại
Thuộc tính của trường Rating
10/30/2011
19 20
3. Thiết kế CSDL theo MH quan hệ
3. Thiết kế CSDL theo MH quan hệ
Xác lập các mối quan hệ (MH quan hệ) (cid:1) Quan hệ nhiều nhiều (n-n)
Xác lập các mối quan hệ (MH quan hệ) (cid:1) Quan hệ một một (1-1)
(cid:1) Ứng với mỗi mẫu tin trong bảng này thì có 1 mẫu
tin bên bảng kia.
(cid:1) Một mẫu tin bên một bảng sẽ ứng với nhiều mẫu tin bên bảng còn lại và ngược lại. Điều này dẫn đến dư thừa dữ liệu.
(cid:1) Ta có thể chuyển khóa chính bên bảng này sang
bảng kia, hoặc ngược lại
(cid:1) Để thiết lập mối quan hệ n-n, ta tạo thêm 1 bảng trung gian sau đó du nhập 2 khóa chính của 2 bảng trên sang bảng trung gian. Lúc này 2 khóa này trở thành khóa chính của bảng trung gian và là khóa ngoại của 2 bảng nhiều trên
22 21
3. Thiết kế CSDL theo MH quan hệ
4. Chuẩn hóa CSDL
Sơ đồ thực thể kết hợp (ERD)
Định nghĩa
Chuẩn hóa (Normalization) là kỹ thuật làm cho cơ sở dữ liệu phức tạp trở nên hiệu quả hơn, dễ được quản lý bởi hệ quản trị cơ sở dữ liệu (DBMS) hơn.
23 24
4
Quản trị Hệ thống thông tin
4. Chuẩn hóa CSDL
4. Chuẩn hóa CSDL
VD: dạng chuẩn 1
Dạng chuẩn 1
Dạng chuẩn 1 (1NF)
Mã HĐ Ngày lập HĐ Mã KH Tên KH Mã SP Tên SP Số lượng mua HD1 28/11/08 KH3 A. Minh SP1 Bút bi 10 SP3 Bút mực 5 SP9 Bút chì 2 HD2 29/11/08 KH2 C. Thu SP3 Bút mực 6 SP4 Vở 2
Dạng chuẩn 1 (1NF) mô tả định dạng bảng dữ liệu • Tất cả các thuộc tính khóa được xác định • Không có các nhóm lặp lại trong bảng • Mỗi giao điểm hàng/cột chứa 1 và chỉ 1 giá trị • Tất cả các thuộc tính phụ thuộc vào khóa chính
HD3 1/12/08 KH3 A. Minh SP5 Bút xóa 3 SP3 Bút mực 1
Không đạt dạng chuẩn 1
25 26
4. Chuẩn hóa CSDL
4. Chuẩn hóa CSDL
VD: dạng chuẩn 1
Dạng chuẩn 2
Mã HĐ Ngày lập HĐ Mã KH Tên KH Mã SP Tên SP Số lượng mua
Dạng chuẩn 2 (2NF)
HD1 28/11/08 KH3 A. Minh SP1 Bút bi 10 HD2 28/11/08 KH3 A. Minh SP3 Bút mực 5 HD3 28/11/08 KH3 A. Minh SP9 Bút chì 2 HD4 29/11/08 KH2 C. Thu SP3 Bút mực 6 HD5 29/11/08 KH2 C. Thu SP4 Vở 2 HD6 1/12/08 KH3 A. Minh SP5 Bút xóa 3 HD7 1/12/08 KH3 A. Minh SP3 Bút mực 1
Một bảng đạt dạng chuẩn 2NF nếu: • Nó đạt dạng chuẩn 1NF Và • Không có thuộc tính nào chỉ phụ thuộc vào một phần của khóa chính
Đạt dạng chuẩn 1
28 27
4. Chuẩn hóa CSDL
4. Chuẩn hóa CSDL
Dạng chuẩn 2
Dạng chuẩn 2
HOADON ( MaHD, NgayLap, MaKH, TenKH )
SANPHAM ( MaSP, TenSP, Donvitinh, Dongia )
CHITIET_HOADON ( MaHD, MaSP, SoLuong, TenSP )
CHITIET_HOADON ( MaHD, MaSP, SoLuong)
Mã HĐ Ngày lập HĐ Mã KH Tên KH Địa chỉ Điện thoại ......... Mã SP Tên SP Đơn vị tính Đơn giá HD1 28/11/08 A. Minh 33 Vĩnh Viễn 0987654320 ------------ SP1 Bút bi Cây 5.000VND KH1 HD2 28/11/08 KH2 A. Hùng Q.8 0987656788 ----------- SP2 Sách Văn 11 Quyển 15.000VND HD3 28/11/08 KH3 C.Thư Q.10 0999764679 ----------- SP3 Bút mực Cây 10.000VND HD4 29/11/08 KH2 A. Hùng Q.8 0987656788 ----------- SP4 Vở Quyển 6.000VND
TenSP phụ thuộc vào MaSP (cid:4) Không đạt dạng chuẩn 2
Các trường phụ thuộc hoàn toàn vào khóa chính (cid:4)(cid:4)(cid:4)(cid:4)Đạt dạng chuẩn 2
Mã HĐ Mã SP Số lượng Mã HĐ Mã SP Số lượng Tên SP HD1 SP1 3 HD1 SP1 3 Bút bi HD1 SP2 6 HD1 SP2 6 Sách Văn 11 HD2 SP1 10 HD2 SP1 10 Bút bi HD2 SP5 4 HD2 SP5 4 Bút xóa 29 30
5
Quản trị Hệ thống thông tin
4. Chuẩn hóa CSDL
4. Chuẩn hóa CSDL
Dạng chuẩn 3
HOADON ( MaHD, NgayLap, MaKH, TenKH )
Dạng chuẩn 3
Mã HĐ Ngày lập HĐ Mã KH Tên KH Địa chỉ Điện thoại .........
Dạng chuẩn 3 (3NF)
- TenKH phụ thuộc vào MaKH - MaKH phụ thuộc vào MaHD
HD1 28/11/08 A. Minh 33 Vĩnh Viễn 0987654320 ------------ KH1 HD2 28/11/08 KH2 A. Hùng Q.8 0987656788 ----------- HD3 28/11/08 KH3 C.Thư Q.10 0999764679 ----------- HD4 29/11/08 KH2 A. Hùng Q.8 0987656788 -----------
Một bảng đạt dạng chuẩn 3NF nếu: 1. Nó đạt dạng chuẩn 2NF Và 2. Không chứa các phụ thuộc bắt cầu
TenKH phụ thuộc bắt cầu vào MaHD (cid:4) Không đạt dạng chuẩn 3
31 32
5. Từ điển dữ liệu
4. Chuẩn hóa CSDL
Dạng chuẩn 3
KHACHHANG ( MaKH, TenKH, DiaChi, DienThoai )
Mã KH Tên KH Địa chỉ Điện thoại KH1 A. Minh 33 Vĩnh Viễn 0987834664
Từ điển dữ liệu (Data Dictionary) (cid:1) Là một tài liệu mô tả thông tin trong CSDL (cid:1) Do người thiết kế CSDL tạo để hỗ trợ truy cập dữ liệu (cid:1) Cung cấp các thông tin về từng thuộc tính của các thực thể
trong CSDL như:
HOADON ( MaHD, NgayLap, MaKH)
(cid:1) Name (cid:1) Key (is it a key or part of a key) (cid:1) Data Type (date, alpha-numeric, numeric, etc.) (cid:1) Valid Value (the format or numbers allowed)
KH2 A. Hùng Q.8 0923687490 KH3 C. Thư Q.10 37335698 KH4 C. Trâm ĐNai 22142318
(cid:4)(cid:4)(cid:4)(cid:4)Đạt dạng chuẩn 3
(cid:1) Có thể sử dụng để đảm bảo các quy tắc nghiệp vụ như ngăn chặn việc nhập các giá trị không hợp lệ hoặc không logic vào CSDL.
Mã HĐ Ngày lập Mã KH HD1 28/11/08 KH1 HD2 28/11/08 KH2 HD3 28/11/08 KH3 HD4 29/11/08 KH2 34 33
5. Từ điển dữ liệu
III. Xu hướng khai thác CSDL
1. Liên kết ứng dụng Web với CSDL
Các trường trong bảng Customer
2. Data Warehouse (Nhà kho dữ liệu)
3. Data Marts (Trung tâm dữ liệu)
4. Data mining (Khai phá dữ liệu)
Các thuộc tính của Trường State
35 36
6
Quản trị Hệ thống thông tin
1. Liên kết ứng dụng Web với CSDL
1. Liên kết ứng dụng Web với CSDL
(cid:1) Xu hướng hiện nay là tạo liên kết giữa các trang
Web và cơ sở dữ liệu của tổ chức.
(cid:1) Nhiều công ty cho phép khách hàng sử dụng trang Web có thể xem mẫu sản phẩm, kiểm tra tồn kho, và đặt hàng (cid:3)Tất cả các hoạt động đó được ghi nhận trong CSDL của công ty.
(cid:1) Ví dụ: Amazon.com
(cid:3) Một trong những cửa hàng sách lớn nhất thế giới (cid:3) Có khoảng 2,5 triệu đầu sách (cid:3) Quản lý cơ sở dữ liệu trực tuyến rất hiệu quả
37 38
2. Data Warehouse
2. Data Warehouse
Kho dữ liệu
(cid:1) Data warehouse (Nhà kho dữ liệu) (cid:1) Tích hợp nhiều cơ sở dữ liệu lớn thành một
Dữ liệu hoạt động nội bộ
kho dữ liệu dùng chung
Data Warehouse
(cid:1) Thích hợp cho việc truy vấn, phân tích và xử
Dữ liệu quá khứ
Các công cụ truy xuất và phân tích dữ liệu
Các công cụ Tích hợp và chuyển đổi dữ liệu
lý dữ liệu trực tiếp
• Truy vấn và các báo cáo
(cid:1) Mục đích: sử dụng thông tin kinh doanh cho
• Tích hợp ứng dụng doanh nghiệp
Dữ liệu bên ngoài
• Kinh doanh điện tử
các nhà quản trị ra quyết định
• Quan hệ khách hàng CRM
39 40
3. Data Marts
4. Data mining (Khai phá dữ liệu)
(cid:1) Data mining là một công cụ phân tích thông tin, tự động tìm ra các các mối quan hệ trong một kho dữ liệu.
(cid:1) Data Marts (Trung tâm dữ liệu) (cid:1) Thay vì tích hợp thành kho dữ liệu (data warehouse), nhiều tổ chức tạo ra các trung tâm dữ liệu (data marts)
(cid:1) Mỗi trung tâm dữ liệu chứa một tập dữ liệu con
về một lĩnh vực nào đó
(cid:1) Ví dụ: dữ liệu tài chính, dữ liệu tồn kho, dữ liệu
nhân sự,[
(cid:1) Mỗi trung tâm dữ liệu được dùng cho các ứng
(cid:1) Data mining dùng những kỹ thuật thống kê cao cấp và bộ máy nghiên cứu để tìm ra các sự kiện trong một CSDL lớn, kể cả CSDL trên Internet. (cid:1) Data mining dùng công cụ phân tích xây dựng sẵn để tự động rút ra các giả thuyết về các khuôn mẫu và những cái bất thường để dự báo hoạt động trong tương lai.
dụng riêng biệt
41 42