Quản trị Hệ thống thông tin

Mục tiêu học tập

CHƯƠNG 3

1. Hiểu tầm quan trọng của cơ sở dữ liệu đối với

QUẢN TRỊ CƠ SỞ DỮ LIỆU

tổ chức

2. Mô tả được nội dung và cách thức vận hành

của cơ sở dữ liệu và hệ quản trị cơ sở dữ liệu

3. Giải thích vì sao tổ chức ngày nay đầu tư vào

công nghệ cơ sở dữ liệu

1 2

Nội dung

I. Quản trị CSDL và chiến lược

1. Tiếp cận hướng CSDL

2. Ưu điểm của hướng tiếp cận bằng CSDL

1. Nhập và truy vấn 2. Tạo report 3. Thiết kế CSDL theo mô hình quan hệ 4. Chuẩn hóa CSDL 5. Từ điển dữ liệu

I. Quản trị cơ sở dữ liệu và chiến lược 1. Tiếp cận hướng cơ sở dữ liệu 2. Ưu điểm của hướng tiếp cận bằng CSDL II. Các hoạt động cơ bản của cơ sở dữ liệu III. Xu hướng khai thác CSDL

1. Liên kết ứng dụng Web với CSDL 2. Data Warehouse 3. Data Marts 4. Data Mining

4 3

1. Tiếp cận hướng CSDL

1. Tiếp cận hướng CSDL

Các khái niệm (cid:1)Hệ quản trị cơ sở dữ liệu (Database Management Systems, DBMS) là một phần mềm dùng để quản trị cơ sở dữ liệu

Các khái niệm (cid:1)Cơ sở dữ liệu (Database) là một tập hợp các dữ liệu có liên quan, được tổ chức để thuận tiện cho việc tìm kiếm và truy xuất dữ liệu.

(cid:1)Ví dụ, sử dụng cơ sở dữ liệu để:

(cid:1)Sử dụng phần mềm quản trị cơ sở dữ liệu để tạo mới, lưu trữ, sắp xếp, và truy xuất dữ liệu từ một hoặc nhiều cơ sở dữ liệu

(cid:1)Các hệ quản trị cơ sở dữ liệu thông dụng:

(cid:1)Microsoft Access, (cid:1)Microsoft SQL Server, (cid:1)Oracle,[

(cid:1)Lưu thông tin 1 quyển sách (cid:1)Theo dõi doanh số bán sách (cid:1)Lên bảng lương (cid:1)Trả lương cho nhân viên

6 5

1

Quản trị Hệ thống thông tin

1. Tiếp cận hướng CSDL

2. Ưu điểm của hướng tiếp cận bằng CSDL

DBMS và con người

Hoạt động sản xuất

Các chương trình ứng dụng

(Tập hợp dữ liệu và xử lý giao tác)

Phân tích/Lập trình viên

(Thiết kế, tạo, và bảo trì)

Hệ quản trị cơ sở dữ liệu

Người dùng

Cơ sở dữ liệu

(cid:2) Độc lập giữa chương trình và dữ liệu (cid:2) Dư thừa dữ liệu ít nhất (cid:2) Tăng tính nhất quán dữ liệu (cid:2) Tăng tính chia sẻ dữ liệu (cid:2) Phát triển ứng dụng hiệu quả hơn (cid:2) Tuân thủ các tiêu chuẩn (cid:2) Chất lượng dữ liệu được cải thiện (cid:2) Tăng khả năng truy xuất dữ liệu (cid:2) Giảm bảo trì chương trình

(Báo cáo, truy vấn, và phân tích)

Người quản trị CSDL (Thiết kế, kiểm soát, các thủ tục)

7 8

1. Nhập liệu và truy vấn

II. Các hoạt động cơ bản của CSDL

Form nhập liệu

1. Nhập liệu và truy vấn

2. Tạo report

3. Thiết kế CSDL theo mô hình quan hệ

4. Chuẩn hóa CSDL

Vùng nhập dữ liệu

5. Từ điển dữ liệu

9 10

1. Nhập liệu và truy vấn

1. Nhập liệu và truy vấn

Ngôn ngữ truy vấn SQL

Truy vấn dữ liệu

SQL:

SELECT CID, Name, Phone, City, AccountBalance FROM Customers WHERE AccountBalance > 200 ;

Hãy cho tôi biết thông tin về các Hãy cho tôi biết[[.. Hãy cho tôi biết doanh thu theo Hãy cho tôi biết khách hàng nào Hãy cho tôi biết doanh thu của Hãy cho tôi biết thông tin về các Hãy cho tôi biết..[[ từng sản phẩm đã mua hàng > 1,000,000 VND cửa hàng trong tháng 8 khách hàng thích uống Pepsi nhân viên nữ ?

?

Ví dụ

Điều kiện

Database

Cửa hàng Cửa hàng

11 12

2

Quản trị Hệ thống thông tin

2. Tạo báo cáo (Report)

Báo cáo (report)

Báo cáo là một tập hợp dữ liệu được tổ chức theo định dạng có thể in được

Một ví dụ về báo cáo

13 14

3. Thiết kế CSDL theo MH quan hệ

3. Thiết kế CSDL theo MH quan hệ

Xác định mục tiêu khai thác CSDL (cid:1)Phân tích hiện trạng thế giới thực của tổ chức,

doanh nghiệp, cửa hàng,[

(cid:1)Xem luồng thông tin hoạt động từng bước như thế nào: đầu vào (những thông tin nào)(cid:3) xử lý (xử lý thông tin đầu vào)(cid:3) kết quả (xuất báo cáo chi tiết). (cid:1)Quyết định thông tin nào sẽ đưa vào CSDL,hình thành các bảng cần thiết để chứa dữ liệu, và định nghĩa các trường thuộc tính sao cho mô tả đầy đủ các đối tượng

15 16

3. Thiết kế CSDL theo MH quan hệ

3. Thiết kế CSDL theo MH quan hệ

Xác định các trường trong bảng (cid:1)Xác định các thông tin thuộc tính của một bảng. (cid:1)Một số phương pháp xác định trường:

Xác định các bảng CSDL (cid:1) Bảng (table) là nơi lưu trữ dữ liệu (cid:1)Thiết kế sao cho có thể lưu được đầy đủ dữ liệu cần thiết, tránh việc dư thừa dữ liệu

(cid:1)Mỗi trường chỉ có mối quan hệ trực tiếp đến 1 đối tượng trong bảng, trường nào mô tả thuộc tính của đối tượng khác phải thuộc bảng khác

(cid:1)Không đưa những trường chứa thông tin có thể rút được từ trường khác, hoặc là kết quả có thể tính toán được.

(cid:1)Các trường phải phủ hết thông tin

17 18

3

Quản trị Hệ thống thông tin

3. Thiết kế CSDL theo MH quan hệ

3. Thiết kế CSDL theo MH quan hệ

Khóa chính

Tên trường

Xác lập các mối quan hệ (MH quan hệ) (cid:1) Quan hệ một nhiều (1-n)

CSDL

Mẩu tin

(cid:1) Đây là mối quan hệ phổ biến nhất. (cid:1) Một mẫu tin của bảng bên 1 sẽ có thể có nhiều mẫu tin tương ứng bên bảng nhiều, ngược lại một mẫu tin bên nhiều chỉ ứng với một mẫu tin bên 1.

(cid:1) Để thiết lập mối quan hệ 1- n, ta thêm khóa chính của bên

Trường

1 vào bên n làm khóa ngoại

Thuộc tính của trường Rating

10/30/2011

19 20

3. Thiết kế CSDL theo MH quan hệ

3. Thiết kế CSDL theo MH quan hệ

Xác lập các mối quan hệ (MH quan hệ) (cid:1) Quan hệ nhiều nhiều (n-n)

Xác lập các mối quan hệ (MH quan hệ) (cid:1) Quan hệ một một (1-1)

(cid:1) Ứng với mỗi mẫu tin trong bảng này thì có 1 mẫu

tin bên bảng kia.

(cid:1) Một mẫu tin bên một bảng sẽ ứng với nhiều mẫu tin bên bảng còn lại và ngược lại. Điều này dẫn đến dư thừa dữ liệu.

(cid:1) Ta có thể chuyển khóa chính bên bảng này sang

bảng kia, hoặc ngược lại

(cid:1) Để thiết lập mối quan hệ n-n, ta tạo thêm 1 bảng trung gian sau đó du nhập 2 khóa chính của 2 bảng trên sang bảng trung gian. Lúc này 2 khóa này trở thành khóa chính của bảng trung gian và là khóa ngoại của 2 bảng nhiều trên

22 21

3. Thiết kế CSDL theo MH quan hệ

4. Chuẩn hóa CSDL

Sơ đồ thực thể kết hợp (ERD)

Định nghĩa

Chuẩn hóa (Normalization) là kỹ thuật làm cho cơ sở dữ liệu phức tạp trở nên hiệu quả hơn, dễ được quản lý bởi hệ quản trị cơ sở dữ liệu (DBMS) hơn.

23 24

4

Quản trị Hệ thống thông tin

4. Chuẩn hóa CSDL

4. Chuẩn hóa CSDL

VD: dạng chuẩn 1

Dạng chuẩn 1

Dạng chuẩn 1 (1NF)

Mã HĐ Ngày lập HĐ Mã KH Tên KH Mã SP Tên SP Số lượng mua HD1 28/11/08 KH3 A. Minh SP1 Bút bi 10 SP3 Bút mực 5 SP9 Bút chì 2 HD2 29/11/08 KH2 C. Thu SP3 Bút mực 6 SP4 Vở 2

Dạng chuẩn 1 (1NF) mô tả định dạng bảng dữ liệu • Tất cả các thuộc tính khóa được xác định • Không có các nhóm lặp lại trong bảng • Mỗi giao điểm hàng/cột chứa 1 và chỉ 1 giá trị • Tất cả các thuộc tính phụ thuộc vào khóa chính

HD3 1/12/08 KH3 A. Minh SP5 Bút xóa 3 SP3 Bút mực 1

Không đạt dạng chuẩn 1

25 26

4. Chuẩn hóa CSDL

4. Chuẩn hóa CSDL

VD: dạng chuẩn 1

Dạng chuẩn 2

Mã HĐ Ngày lập HĐ Mã KH Tên KH Mã SP Tên SP Số lượng mua

Dạng chuẩn 2 (2NF)

HD1 28/11/08 KH3 A. Minh SP1 Bút bi 10 HD2 28/11/08 KH3 A. Minh SP3 Bút mực 5 HD3 28/11/08 KH3 A. Minh SP9 Bút chì 2 HD4 29/11/08 KH2 C. Thu SP3 Bút mực 6 HD5 29/11/08 KH2 C. Thu SP4 Vở 2 HD6 1/12/08 KH3 A. Minh SP5 Bút xóa 3 HD7 1/12/08 KH3 A. Minh SP3 Bút mực 1

Một bảng đạt dạng chuẩn 2NF nếu: • Nó đạt dạng chuẩn 1NF Và • Không có thuộc tính nào chỉ phụ thuộc vào một phần của khóa chính

Đạt dạng chuẩn 1

28 27

4. Chuẩn hóa CSDL

4. Chuẩn hóa CSDL

Dạng chuẩn 2

Dạng chuẩn 2

HOADON ( MaHD, NgayLap, MaKH, TenKH )

SANPHAM ( MaSP, TenSP, Donvitinh, Dongia )

CHITIET_HOADON ( MaHD, MaSP, SoLuong, TenSP )

CHITIET_HOADON ( MaHD, MaSP, SoLuong)

Mã HĐ Ngày lập HĐ Mã KH Tên KH Địa chỉ Điện thoại ......... Mã SP Tên SP Đơn vị tính Đơn giá HD1 28/11/08 A. Minh 33 Vĩnh Viễn 0987654320 ------------ SP1 Bút bi Cây 5.000VND KH1 HD2 28/11/08 KH2 A. Hùng Q.8 0987656788 ----------- SP2 Sách Văn 11 Quyển 15.000VND HD3 28/11/08 KH3 C.Thư Q.10 0999764679 ----------- SP3 Bút mực Cây 10.000VND HD4 29/11/08 KH2 A. Hùng Q.8 0987656788 ----------- SP4 Vở Quyển 6.000VND

TenSP phụ thuộc vào MaSP (cid:4) Không đạt dạng chuẩn 2

Các trường phụ thuộc hoàn toàn vào khóa chính (cid:4)(cid:4)(cid:4)(cid:4)Đạt dạng chuẩn 2

Mã HĐ Mã SP Số lượng Mã HĐ Mã SP Số lượng Tên SP HD1 SP1 3 HD1 SP1 3 Bút bi HD1 SP2 6 HD1 SP2 6 Sách Văn 11 HD2 SP1 10 HD2 SP1 10 Bút bi HD2 SP5 4 HD2 SP5 4 Bút xóa 29 30

5

Quản trị Hệ thống thông tin

4. Chuẩn hóa CSDL

4. Chuẩn hóa CSDL

Dạng chuẩn 3

HOADON ( MaHD, NgayLap, MaKH, TenKH )

Dạng chuẩn 3

Mã HĐ Ngày lập HĐ Mã KH Tên KH Địa chỉ Điện thoại .........

Dạng chuẩn 3 (3NF)

- TenKH phụ thuộc vào MaKH - MaKH phụ thuộc vào MaHD

HD1 28/11/08 A. Minh 33 Vĩnh Viễn 0987654320 ------------ KH1 HD2 28/11/08 KH2 A. Hùng Q.8 0987656788 ----------- HD3 28/11/08 KH3 C.Thư Q.10 0999764679 ----------- HD4 29/11/08 KH2 A. Hùng Q.8 0987656788 -----------

Một bảng đạt dạng chuẩn 3NF nếu: 1. Nó đạt dạng chuẩn 2NF Và 2. Không chứa các phụ thuộc bắt cầu

TenKH phụ thuộc bắt cầu vào MaHD (cid:4) Không đạt dạng chuẩn 3

31 32

5. Từ điển dữ liệu

4. Chuẩn hóa CSDL

Dạng chuẩn 3

KHACHHANG ( MaKH, TenKH, DiaChi, DienThoai )

Mã KH Tên KH Địa chỉ Điện thoại KH1 A. Minh 33 Vĩnh Viễn 0987834664

Từ điển dữ liệu (Data Dictionary) (cid:1) Là một tài liệu mô tả thông tin trong CSDL (cid:1) Do người thiết kế CSDL tạo để hỗ trợ truy cập dữ liệu (cid:1) Cung cấp các thông tin về từng thuộc tính của các thực thể

trong CSDL như:

HOADON ( MaHD, NgayLap, MaKH)

(cid:1) Name (cid:1) Key (is it a key or part of a key) (cid:1) Data Type (date, alpha-numeric, numeric, etc.) (cid:1) Valid Value (the format or numbers allowed)

KH2 A. Hùng Q.8 0923687490 KH3 C. Thư Q.10 37335698 KH4 C. Trâm ĐNai 22142318

(cid:4)(cid:4)(cid:4)(cid:4)Đạt dạng chuẩn 3

(cid:1) Có thể sử dụng để đảm bảo các quy tắc nghiệp vụ như ngăn chặn việc nhập các giá trị không hợp lệ hoặc không logic vào CSDL.

Mã HĐ Ngày lập Mã KH HD1 28/11/08 KH1 HD2 28/11/08 KH2 HD3 28/11/08 KH3 HD4 29/11/08 KH2 34 33

5. Từ điển dữ liệu

III. Xu hướng khai thác CSDL

1. Liên kết ứng dụng Web với CSDL

Các trường trong bảng Customer

2. Data Warehouse (Nhà kho dữ liệu)

3. Data Marts (Trung tâm dữ liệu)

4. Data mining (Khai phá dữ liệu)

Các thuộc tính của Trường State

35 36

6

Quản trị Hệ thống thông tin

1. Liên kết ứng dụng Web với CSDL

1. Liên kết ứng dụng Web với CSDL

(cid:1) Xu hướng hiện nay là tạo liên kết giữa các trang

Web và cơ sở dữ liệu của tổ chức.

(cid:1) Nhiều công ty cho phép khách hàng sử dụng trang Web có thể xem mẫu sản phẩm, kiểm tra tồn kho, và đặt hàng (cid:3)Tất cả các hoạt động đó được ghi nhận trong CSDL của công ty.

(cid:1) Ví dụ: Amazon.com

(cid:3) Một trong những cửa hàng sách lớn nhất thế giới (cid:3) Có khoảng 2,5 triệu đầu sách (cid:3) Quản lý cơ sở dữ liệu trực tuyến rất hiệu quả

37 38

2. Data Warehouse

2. Data Warehouse

Kho dữ liệu

(cid:1) Data warehouse (Nhà kho dữ liệu) (cid:1) Tích hợp nhiều cơ sở dữ liệu lớn thành một

Dữ liệu hoạt động nội bộ

kho dữ liệu dùng chung

Data Warehouse

(cid:1) Thích hợp cho việc truy vấn, phân tích và xử

Dữ liệu quá khứ

Các công cụ truy xuất và phân tích dữ liệu

Các công cụ Tích hợp và chuyển đổi dữ liệu

lý dữ liệu trực tiếp

• Truy vấn và các báo cáo

(cid:1) Mục đích: sử dụng thông tin kinh doanh cho

• Tích hợp ứng dụng doanh nghiệp

Dữ liệu bên ngoài

• Kinh doanh điện tử

các nhà quản trị ra quyết định

• Quan hệ khách hàng CRM

39 40

3. Data Marts

4. Data mining (Khai phá dữ liệu)

(cid:1) Data mining là một công cụ phân tích thông tin, tự động tìm ra các các mối quan hệ trong một kho dữ liệu.

(cid:1) Data Marts (Trung tâm dữ liệu) (cid:1) Thay vì tích hợp thành kho dữ liệu (data warehouse), nhiều tổ chức tạo ra các trung tâm dữ liệu (data marts)

(cid:1) Mỗi trung tâm dữ liệu chứa một tập dữ liệu con

về một lĩnh vực nào đó

(cid:1) Ví dụ: dữ liệu tài chính, dữ liệu tồn kho, dữ liệu

nhân sự,[

(cid:1) Mỗi trung tâm dữ liệu được dùng cho các ứng

(cid:1) Data mining dùng những kỹ thuật thống kê cao cấp và bộ máy nghiên cứu để tìm ra các sự kiện trong một CSDL lớn, kể cả CSDL trên Internet. (cid:1) Data mining dùng công cụ phân tích xây dựng sẵn để tự động rút ra các giả thuyết về các khuôn mẫu và những cái bất thường để dự báo hoạt động trong tương lai.

dụng riêng biệt

41 42

7