intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Giáo trình Hệ thống thông tin quản lý: Phần 2 - Trường ĐH Công nghiệp Quảng Ninh

Chia sẻ: Dương Hàn Thiên Băng | Ngày: | Loại File: PDF | Số trang:73

32
lượt xem
14
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Phần 2 của giáo trình "Hệ thống thông tin quản lý" tiếp tục cung cấp cho học viên những nội dung về: các quy tắc của thương mại thông minh - cơ sở dữ liệu và quản trị thông minh; ứng dụng doanh nghiệp; thương mại điện tử - thị trường số, hàng hóa số; xây dựng hệ thống thông tin;... Mời các bạn cùng tham khảo!

Chủ đề:
Lưu

Nội dung Text: Giáo trình Hệ thống thông tin quản lý: Phần 2 - Trường ĐH Công nghiệp Quảng Ninh

  1. Giáo trình Hệ thống thông tin quản lý CHƢƠNG 5. CÁC QUY TẮC CỦA THƢƠNG MẠI THÔNG MINH: CƠ SỞ DỮ LIỆU VÀ QUẢN TRỊ THÔNG MINH 5.1. Sắp xếp dữ liệu trong môi trƣờng tệp truyền thống 5.1.1. Hệ thống quản lý tệp truyền thống Hệ thống quản lý tệp truyền thống thƣờng đƣợc tổ chức riêng rẽ, phục vụ cho một mục đích của một đơn vị hoặc một đơn vị con trực thuộc cụ thể. Hệ thống quản lý tệp truyền thống cho phép ta tạo các tệp, truy cập và xử lý thông tin trong các tệp thông qua các chƣơng trình ứng dụng. Các phần mềm ứng dụng này đƣợc viết bằng các ngôn ngữ lập trình đa năng nhƣ PASCAL, C ... Ƣu điểm: - Việc xây dựng hệ thống các tệp tin riêng tại từng đơn vị quản lý ít tốn thời gian bởi khối lƣợng thông tin cần quản lý và khai thác là nhỏ, không đòi hỏi đầu tƣ vật chất và chất xám nhiều, do đó triển khai ứng dụng nhanh. - Thông tin đƣợc khai thác chỉ phục vụ mục đích hẹp nên khả năng đáp ứng nhanh chóng, kịp thời. Nhƣợc điểm: - Thông tin đƣợc tổ chức riêng rẽ ở nhiều nơi nên việc cập nhật dễ làm mất tính nhất quán dữ liệu. - Hệ thống thông tin đƣợc tổ chức thành các hệ thống file riêng lẻ nên thiếu sự chia sẻ thông tin giữa các nơi. - Có sự dƣ thừa dữ liệu rất lớn qua việc trùng lặp các tệp tin trong các ứng dụng khác nhau. - Không gian đĩa bị lãng phí, khó khăn trong việc bảo trì hệ thống. - Khó khăn trong việc truy xuất dữ liệu. Một ví dụ điển hình về sự trùng lặp dữ liệu nhƣ trong Hệ quản lý nguồn nhân lực bao gồm ba hệ chính: 1. Hệ lương: hệ này duy trì ngày công và lƣơng cho tất cả nhân viên. 2. Hệ nhân sự: hệ này duy trì lý lịch cá nhân, dữ liệu về tổ chức, công việc đào tạo và vị trí thăng tiến. 3. Hệ hưu: hệ này quản trị các qui tắc liên quan đến nghỉ hƣu, loại nghỉ hƣu. Chi tiết về hƣu của từng nhân viên. Vấn đề bất lợi là Hệ quản lý lƣơng thông thƣờng đƣợc quản lý bởi phòng Tài chính, trong khi Hệ quản lý nhân sự và Hệ quản lý hƣu đƣợc quản lý bởi phòng Tổ chức cán bộ. Rõ ràng, có nhiều dữ liệu về nhân viên là chung cho cả ba hệ. Thƣờng những hệ này thực hiện và lƣu trữ riêng biệt nên chúng tạo ra sự trùng lặp dữ liệu. Qua phân tích trên, chúng ta nhận thấy việc tổ chức dữ liệu theo hệ thống tệp hoàn toàn không phù hợp với những hệ thống thông tin lớn. Việc xây dựng một hệ 60
  2. Giáo trình Hệ thống thông tin quản lý thống thông tin đảm bảo đƣợc tính nhất quán dữ liệu, đáp ứng đƣợc nhu cầu khai thác đồng thời của nhiều ngƣời là thực sự cần thiết. 5.1.2. Thiết kế tệp (file) dữ liệu File là một phần nhỏ của bộ nhớ thứ cấp (bộ nhớ ngoài) lƣu các bản ghi một cách độc lập. Một số phần mềm hệ thống cho phép lƣu một file ở một số mảng riêng biệt, nhƣng ngƣời dùng không cảm nhận đƣợc điều đó (hiện tượng này gọi là tính trong suốt). Trong những trƣờng hợp nhƣ vậy, việc lƣu file ở nhiều vị trí khác nhau đối với ngƣời sử dụng không có gì quan trọng, nhƣng lại đƣợc các nhà thiết kế đặc biệt quan tâm.  Các loại file - File dữ liệu: là file chứa dữ liệu nghiệp vụ liên quan đến mô hình dữ liệu logic và vật lý. File này luôn tồn tại, nhƣng nội dung thay đổi. Ví dụ file về khách hàng, về các đơn đặt hàng… - File lấy từ bảng: là danh sách các dữ liệu tham chiếu lấy từ các giá trị đúng của một hay một số file dữ liệu. Những file này thƣờng cố định và đƣợc thiết kế để lấy dữ liệu nhanh từ một số file cụ thể. - File giao dịch: là những file dữ liệu tạm thời phục vụ các hoạt động hàng ngày của một tổ chức. File này thƣờng đƣợc thiết kế phục vụ việc xử lý nhanh. - File làm việc: là file tạm thời để lƣu kết quả trung gian. File này tự động xoá đi mỗi khi không cần thiết. File này đƣợc thiết kế với mục đích dùng tức thời. - File bảo vệ: là file đƣợc thiết kế để lƣu trữ các file khác nhau có nguy cơ bị sai, hỏng trong quá trình làm việc. Các file này cho hình ảnh của file dữ liệu trƣớc và sau những hoạt động nhất định (công nghệ, xử lý, xoá) của hệ thống. - File lịch sử: là file chứa các dữ liệu cũ hiện không cần đƣợc sử dụng, nhƣng có thể vẫn cần thiết để phân tích hay làm một việc gì đó khi cần đến. File này đƣợc thiết kế nhằm sử dụng hiệu quả không gian nhớ, giảm kích thƣớc file sử dụng, tăng tốc độ xử lý. Việc tổ chức các loại file khác nhau không chỉ liên quan đến việc tổ chức lƣu trữ và khai thác dữ liệu, mà còn liên quan đến các hoạt động xử lý dữ liệu trong quá trình hoạt động của hệ thống. Về nguyên tắc, việc dùng càng ít file càng tốt. Tuy nhiên, việc đƣa vào các file là cần thiết cho việc đảm bảo an toàn dữ liệu (file sao lưu), tăng tốc độ truy nhập hay xử lý (file giao dịch, file lấy từ bảng, file làm việc ,…), giảm dung lƣợng bộ nhớ làm việc thƣờng xuyên (file lịch sử). 5.1.3. Sắp xếp dữ liệu (tổ chức file) Một cách tổ chức file là một kỹ thuật để sắp xếp vật lý các bản ghi của một file trên một thiết bị bộ nhớ ngoài. Tổ chức một file cụ thể cần tính đến các yếu tố sau: 1. Lấy dữ liệu nhanh. 2. Thông lƣợng các giao dịch xử lý lớn. 3. Sử dụng hiệu quả không gian bộ nhớ. 4. Tránh đƣợc sai sót và mất dữ liệu. 61
  3. Giáo trình Hệ thống thông tin quản lý 5. Tối ƣu hoá nhu cầu tổ chức file. 6. Đáp ứng đƣợc nhu cầu tăng trƣởng của dữ liệu. 7. An toàn. Các tiêu chuẩn thƣờng có tính đối kháng nhau, việc lựa chọn các tiêu chính nào đều cần phải đảm bảo sự hợp lý và cân đối giữa các tiêu chuẩn đƣợc chọn. Việc chọn tiêu chuẩn nào và sử dụng chúng đến đâu cho việc thiết kế tuỳ thuộc vào kinh nghiệm của các nhà phân tích, các điều kiện cụ thể của tình huống đặt ra. - Tổ chức file tuần tự: các bản ghi đƣợc sắp xếp tuần từ theo giá trị của khoá chính. Để tìm đƣợc một bản ghi, ta cần duyệt lần lƣợt từ bản ghi đầu tiên. Vì vậy, việc xử lý lần lƣợt các bản ghi sẽ rất nhanh. Tuy nhiên, việc thêm, sửa, xoá bản ghi theo các này sẽ yêu cầu file phải đƣợc ghi lại sau mỗi lần thực hiện thao tác. - Tổ chức file chỉ số: các bản ghi có thể đƣợc sắp xếp tuỳ ý. Một file chỉ số đƣợc tạo ra cho phép xây dựng đƣợc vị trí của mỗi bản ghi cụ thể trong file gốc. Giống nhƣ những phích sách trong thƣ viện, một chỉ số là một bảng mà đƣợc sử dụng để xác định vị trí của dòng trong một file thoả mãn điều kiện nào đó. Nhƣ vậy, việc tìm kiếm một hay một số bản ghi đƣợc thông qua file chỉ số. Nhƣợc điểm của phƣơng pháp này là mất thêm thời gian để truy nhập và bảo trì file chỉ số. - Tổ chức file băm: địa chỉ mỗi bản ghi đƣợc xác định nhờ thuật toán băm (hashing). Một thuật toán băm là một quá trình để chuyển một giá trị khoá chính vào một số thứ tự tƣơng ứng với địa chỉ bản ghi. Có một số dạng file băm, nhƣng trong đa số trƣờng hợp của file băm, các bản ghi đƣợc sắp không phải là tuần tự mà theo cách xác định bởi thuật toán băm. 5.2. Phƣơng pháp cơ sở dữ liệu để quản lý dữ liệu 5.2.1. Dữ liệu  Dữ liệu – hiểu đơn giản là tập hợp các thông tin.  Quản lý dữ liệu (QLDL) QLDL hiệu quả vô cùng quan trọng trong việc triển khai các hệ thống CNTT thông qua các ứng dụng kinh doanh, cung cấp thông tin phân tích để thúc đẩy quá trình ra quyết định vận hành và hoạch định chiến lƣợc trong doanh nghiệp. Quy trình QLDL là kết hợp các chức năng khác nhau, nhằm đảm bảo dữ liệu trong các hệ thống doanh nghiệp chính xác, có sẵn và có thể truy cập đƣợc. Tầm quan trọng của QLDL Dữ liệu là tài sản của công ty đƣợc sử dụng để đƣa ra quyết định kinh doanh chính xác, cải thiện chiến dịch tiếp thị, tối ƣu hóa hoạt động kinh doanh. Tất cả nhằm hƣớng tới mục tiêu tăng doanh thu và giảm chi phí. Nếu bộ dữ liệu không nhất quán sẽ làm hạn chế khả năng chạy các ứng dụng phân tích thông minh (BI) và tệ hơn là dẫn đến các kết quả bị lỗi, sai lệch. 62
  4. Giáo trình Hệ thống thông tin quản lý 5.2.2. Cơ sở dữ liệu (CSDL)  Cơ sở dữ liệu (Database) CSDL đơn giản chỉ là tập hợp các thông tin đƣợc tổ chức theo một cấu trúc nhất định giúp dễ dàng đọc thông tin, chỉnh sửa, thêm hoặc xóa dữ liệu. Ví dụ: danh sách khách hàng của công ty gồm ít nhất các trƣờng họ và tên, số điện thoại đƣợc coi là một CSDL. Việc sử dụng hệ thống CSDL này sẽ khắc phục đƣợc những khuyết điểm của cách lƣu trữ dạng file riêng lẻ: - Giảm trùng lặp thông tin, đảm bảo tính nhất quán và toàn vẹn dữ liệu. - Cho phép dữ liệu đƣợc truy xuất theo nhiều cách khác nhau, từ nhiều ngƣời khác nhau và nhiều ứng dụng khác nhau. - Tăng khả năng chia sẻ thông tin. Tuy nhiên việc sử dụng hệ quản trị CSDL lại có những phiền hà không hề nhỏ sau đây: - Đảm bảo tính chủ quyền của dữ liệu, vì khi sử dụng có tính chất chia sẻ cao. - Bảo mật quyền khai thác thông tin. - Bảo đảm vấn đề tranh chấp dữ liệu khi xảy ra. - Đảm bảo an toàn, toàn vẹn của dữ liệu. Trong cuộc sống hằng ngày chắc hẳn bạn có sử dụng qua các hệ thống CSDL nhƣng bạn lại không biết. Chẳng hạn hằng ngày bạn vào đọc bài tin tức từ các trang báo, ở mỗi trang họ có dùng một hệ thống lƣu trữ dữ liệu và khi bạn vào xem hệ thống sẽ trả dữ liệu về màn hình trình duyệt cho bạn xem. Rõ ràng bạn có thể truy cập một lúc nhiều trang và nhiều ngƣời có thể đọc một trang cùng một lúc đƣợc, nhƣng vẫn đảm bảo tính toàn vẹn dữ liệu không bị sai lệch.  Quản lý CSDL Hệ thống quản trị CSDL (Database Management System) là hệ thống đƣợc thiết kế để quản lý CSDL tự động và có trật tự. Các hành động quản lý này bao gồm chỉnh sửa, xóa, lƣu thông tin và tìm kiếm (truy xuất thông tin) trong một nhóm dữ liệu nhất định. Nói một cách dễ hiểu hơn, hệ quản trị CSDL là hệ thống tự động giúp ngƣời dùng có thể kiểm soát các thông tin, tạo, cập nhật và duy trì các CSDL. Trong đó, hai thành phần chính trong một hệ quản trị CSDL là: Bộ xử lý truy vấn (bộ xử lý yêu cầu) và bộ QLDL. 5.2.3. Thiết kế CSDL Đa số các hệ thống thông tin hiện nay đều sử dụng công nghệ CSDL đƣợc gọi là hệ quản trị CSDL (DBMS- Data Base Management System). Hệ quản trị CSDL là một phần mềm nằm trung gian giữa chƣơng trình ứng dụng và hệ điều hành. Nó hƣớng các khả năng của hệ điều hành vào việc tất cả dữ liệu. Có một số hệ quản trị CSDL mà ta thƣờng gặp: Oracle, MsSQL, DB2,… 63
  5. Giáo trình Hệ thống thông tin quản lý Mỗi hệ quản trị CSDL đƣợc xây dựng dựa trên một loại mô hình dữ liệu. Khi thiết kế dữ liệu vật lý, ta phải nắm vững các đặc trƣng của hệ quản trị CSDL đƣợc chọn để thiết kế dữ liệu thích hợp với nó. Thiết kế CSDL vật lý là bƣớc cuối cùng của thiết kế dữ liệu. Quá trình thiết kế CSDL vật lý là quá trình ánh xạ cấu trúc dữ liệu logic đƣợc xây dựng ở bƣớc trƣớc vào bên trong hệ thống. Ba nguồn đầu vào của thiết kế CSDL vật lý là: - Các cấu trúc CSDL logic đã thực hiện trong thiết kế logic. - Khối lƣợng yêu cầu xử lý của ngƣời dùng thu đƣợc khi xác định nhu cầu, bao gồm quy mô, tần suất sử dụng dữ liệu và các yêu cầu về: thời gian đáp ứng, an toàn, ghi tạm, phục hồi và lƣu giữ dữ liệu. - Các đặc tính của hệ quản trị CSDL và các thành phần của môi trƣờng hoạt động của máy tính. Các bƣớc cần cho thiết kế dữ liệu vật lý phụ thuộc vào số lƣợng các yếu tố, bản chất của hệ quản trị CSDL sử dụng, đặc tính môi trƣờng tính toán của tổ chức, việc mở rộng các xử lý phân tán và truyền thông dữ liệu, các loại ứng dụng của tổ chức. Ở đây ta chỉ nhấn mạnh đến những mặt chủ yếu của thiết kế vật lý, nó là chung cho hầu hết các dự án phát triển CSDL. Thiết kế CSDL vật lý bao gồm năm thiết kế sau: 1. Phân tích khối lƣợng dữ liệu và sử dụng dữ liệu. 2. Chiến lƣợc phân tán. 3. Tổ chức file. 4. Lập các chỉ số. 5. Ràng buộc an toàn. 5.2.4. Phƣơng pháp CSDL Công nghệ QLDL tiến bộ cho phép biểu diễn dữ liệu thành các file riêng biệt cho mỗi ứng dụng và tổ chức chúng thành những CSDL dùng chung, một CSDL là một tập các dữ liệu có liên hệ logic với nhau và đƣợc tổ chức làm dễ dàng việc thu thập, lƣu trữ và lấy ra của nhiều ngƣời dùng trong một tổ chức. CSDL bao gồm các phương pháp tổ chức dữ liệu cho phép QLDL một cách tập trung, chuẩn hóa và nhất quán. Nhờ việc tách dữ liệu để tổ chức riêng, ngƣời ta có thể áp dụng các công cụ toán học (lý thuyết tập hợp) để tổ chức dữ liệu một cách tối ƣu cả về phƣơng diện lƣu trữ (tiết kiệm không gian nhớ) cũng nhƣ về mặt sử dụng: giảm dƣ thừa, tìm kiếm thuận lợi, lấy ra nhanh chóng và sử dụng chung. Việc tổ chức dữ liệu nhƣ trên cho phép CSDL đƣợc sử dụng và phục vụ cho nhiều ứng dụng độc lập khác nhau. 64
  6. Giáo trình Hệ thống thông tin quản lý Hình 5.1: Phƣơng pháp QLDL truyền thống Hình 5.2: Sự khác biệt giữa quản lý truyền thống với tiếp cận CSDL Hình 5.3: Phƣơng pháp tiếp cận CSDL 65
  7. Giáo trình Hệ thống thông tin quản lý Hình 5.4: Quản lý CSDL dạng bảng 5.2.5. Hệ quản trị CSDL Hệ quản trị CSDL (Database Management System – DBMS) là một tập hợp chƣơng trình giúp cho ngƣời sử dụng: Tạo ra, khai thác, duy trì CSDL… Hình 5.5: Sử dụng hệ quản trị CSDL 66
  8. Giáo trình Hệ thống thông tin quản lý Hình 5.6: Một số hệ quản trị CSDL phổ biến Hình 5.7: Sự vận hành của hệ quản trị CSDL 67
  9. Giáo trình Hệ thống thông tin quản lý Hình 5.8: Ví dự về sự vận hành của hệ quản trị CSDL Hình 5.9: Năng lực của hệ quản trị CSDL  Dữ liệu đƣợc lƣu trữ trong các bảng dữ liệu nhƣng các bảng có bổ sung thêm các tính năng hƣớng đối tƣợng nhƣ lƣu trữ thêm các hình vẽ, âm thanh, video, hành vi... 68
  10. Giáo trình Hệ thống thông tin quản lý 5.3. Sử dụng cơ sở dữ liệu để cải thiện hiệu suất kinh doanh và ra quyết định Hình 5.10: Hoạt động của doanh nghiệp Hình 5.11: Sử dụng CSDL trong doanh nghiệp 5.3.1. Kinh doanh thông minh (Business Intelligence – BI) Kinh doanh thông minh (BI) là một qui trình và công nghệ mà các doanh nghiệp dùng để kiểm soát khối lƣợng dữ liệu khổng lồ, khai phá tri thức.  Lợi ích của BI: - Giúp cho các doanh nghiệp có thể đƣa các các quyết định hiệu quả hơn. - Tăng khả năng kiểm soát thông tin của doanh nghiệp. - Giúp doanh nghiệp có thể dự đoán về xu hƣớng của giá cả dịch vụ, hành vi khách hàng => phát hiện khách hàng tiềm năng 69
  11. Giáo trình Hệ thống thông tin quản lý Hình 5.12: Chức năng của BI 5.3.2. Kho dữ liệu (Data warehouse) 5.3.2.1. Định nghĩa Kho dữ liệu Kho dữ liệu – “Chiếc dạ dày” của hệ thống BI. Để có thể trình bày đƣợc thông tin trên các báo cáo quản trị (dashboard) thì cần có nguồn cung cấp thông tin đó – đó chính là Kho dữ liệu. Ban đầu Kho dữ liệu đƣợc định nghĩa là một tập dữ liệu đƣợc dùng để hỗ trợ quy trình ra quyết định. Theo quá trình phát triển, Kho dữ liệu đƣợc định nghĩa là một môi trƣờng thông tin (information environment). Vị trí của Kho dữ liệu đƣợc minh họa trong hình sau: Hình 5.13: Kiến trúc mức cao của hệ thống BI  Phía bên phải (hình oval bên phải) là đối tƣợng thụ hƣởng của hệ thống – những ngƣời sẽ phân tích thông tin để đƣa ra các kế hoạch dài hạn hay điều hành ngắn hạn. 70
  12. Giáo trình Hệ thống thông tin quản lý  Để có thể đƣa ra đƣợc các thông tin có tính hệ thống, phù hợp với nghiệp vụ kinh doanh của doanh nghiệp thì cần có đội ngũ nghiệp vụ (hình oval ở giữa), chịu trách nhiệm xây dựng các báo cáo quản trị từ Kho dữ liệu. Cuối cùng để có thể lấy đƣợc dữ liệu và đƣa vào Kho dữ liệu theo nhu cầu nghiệp vụ thì cần có đội ngũ kỹ thuật (hình oval bên trái).  Ngoài ra có thể có các hệ thống thông mình (hình vuông góc dưới bên trái) có thể khai thác dữ liệu từ Kho dữ liệu nhằm hỗ trợ quản lý ra quyết định. 5.3.2.2. Chức năng của Kho dữ liệu  Cung cấp một góc nhìn toàn diện về doanh nghiệp: Cho dù doanh nghiệp có nhiều mảng kinh doanh đƣợc quản lý bởi các hệ thống tác nghiệp khác nhau, nhƣng Kho dữ liệu là nơi đã tập hợp (tích hợp) đƣợc mọi thông tin về các mảng nghiệp vụ khác nhau để cung cấp một góc nhìn toàn diện. Việc tích hợp này còn cung cấp khả năng đánh giá chéo các mảng nghiệp vụ khác nhau để đánh giá sự tƣơng quan giữa chúng.  Cung cấp đầy đủ thông tin hiện tại và lịch sử của doanh nghiệp; sẵn sàng cho việc khai thác, sử dụng cho việc hỗ trợ ra quyết định chiến lƣợc: Từ thông tin ở đây thể hiện dữ liệu ở trong kho không chỉ đơn thuần là dữ liệu thô lấy từ các hệ thống tác nghiệp mà nó đã đƣợc tổng hợp, tính toán thành các độ đo có ý nghĩa phân tích.  Có khả năng cung cấp dữ liệu chi tiết theo nhu cầu mà không phải truy xuất các hệ thống tác nghiệp: Điều này thể hiện trong một số trƣờng hợp có thể nhu cầu phân tích dữ liệu ở mức giao dịch, thì nó cũng sẽ đƣợc lƣu sẵn ở Kho dữ liệu.  Đảm bảo thông tin trong Kho dữ liệu có tính nhất quán: Ví dụ doanh nghiệp có nhiều nghiệp vụ đƣợc quản lý với các hệ thống tác nghiệp khác nhau, nhƣng cần đảm bảo ánh xạ đƣợc một khách hàng xuất hiện ở nhiều hệ thống về 1 ngƣời duy nhất. Điều này áp dụng cho các đối tƣợng dữ liệu khác. Ngoài ra một trƣờng dữ liệu có thể đƣợc biểu diễn bằng nhiều cách khác nhau, ví dụ Tên khách hàng có hệ thống tách họ và tên thành 2 trƣờng khác nhau, có hệ thống chỉ lƣu trong 1 trƣờng. Khi tổng hợp về Kho dữ liệu thì sẽ đƣợc chuyển về 1 dạng thống nhất.  Là nguồn thông tin chiến lƣợc mềm dẻo và có tính tƣơng tác: Chữ mềm dẻo và tƣơng tác ở đây thể hiện ngƣời dùng có thể lấy các thông tin khác nhau của cùng một đối tƣợng. Từ tƣơng tác ở đây thể hiện có thể thực hiện đƣợc nhiều thao tác với các đối tƣợng dữ liệu thay vì trả lại một danh sách tĩnh. Ví dụ có thể lấy dữ liệu tổng hợp theo ngày, theo tuần, theo tháng của cùng 1 đối tƣợng dữ liệu. Tính tƣơng tác thể hiện ngƣời dùng có thể áp dụng các thao tác phân tích dữ liệu, một ví dụ là nền tảng phân tích dữ liệu SQL Server Analysis Services (SSAS) cho phép ngƣời dùng có thể tƣơng tác để phân tích dữ liệu. 71
  13. Giáo trình Hệ thống thông tin quản lý 5.3.2.3. Đặc điểm của Kho dữ liệu Dữ liệu đƣợc lƣu trong Kho dữ liệu không đƣợc tạo ra trực tiếp từ ngƣời dùng mà đƣợc lấy từ các nguồn dữ liệu sẵn có và mục đích là phục vụ tạo ra các báo cáo quản trị do đó nó có các tính chất sau:  Hƣớng chủ đề (subject-oriented): Mục đích của Kho dữ liệu là phục vụ các yêu cầu phân tích, hoặc khai phá cụ thể đƣợc gọi là chủ đề. Ví dụ với chủ đề phân tích nhân sự thì có thể bao gồm các độ đo về doanh thu của từng ngƣời, số ngày nghỉ trong tháng, số dự án tham gia trong tháng, theo các chiều phân tích: thời gian, chi nhánh, sản phẩm, … Một sự so sánh dễ hiểu, giống nhƣ chẩn đoán một bệnh ví dụ bệnh liên quan đến tim, thì bác sỹ cần quan tâm không chỉ một mà một vài chỉ số nhƣ các chỉ số liên quan đến máu, chỉ số về huyết áp, nhịp tim, điện tâm đồ. Ngoài ra còn cần theo dõi theo thời gian (có thể là hàng ngày) để xem xét sự thay đổi mà có phƣơng pháp điều trị kịp thời. Trong trƣờng hợp này thời gian đƣợc gọi là chiều phân tích. Để chẩn đoán đƣợc chính xác thì cần đầy đủ các thông tin về các chỉ số trên, và cũng không cần các chỉ số khác lẫn vào làm nhiễu quá trình chẩn đoán và cũng không cần thiết. Việc tổ chức dữ liệu theo chủ đề này sẽ dẫn đến nhu cầu tổ chức lƣu trữ dữ liệu khác với các CSDL tác nghiệp.  Đƣợc tích hợp (integrated): Tại một bệnh viện, các phòng khác nhau sẽ thực hiện các xét nghiệm khác nhau, do đó để có đƣợc đầy đủ thông tin phục vụ chẩn đoán thì cần thu thập đƣợc kết quả từ nhiêu nguồn. Điều này hoàn toàn tƣơng tự nhƣ tại doanh nghiệp, dữ liệu cần để phân tích có thể nằm rải rác ở nhiều hệ thống tác nghiệp khác nhau, và vì vậy cần tích hợp lại. Việc tổng hợp dữ liệu từ nhiều nguồn vào một kho dữ liệu cho phép chúng ta có thể xem đồng thời nhiều nhóm chỉ tiêu khác nhau (từ nhiều hệ thống nghiệp vụ khác nhau), ví dụ ta có thể xem chỉ tiêu doanh thu ở nhiều mảng nghiệp vụ khác nhau để có thể so sánh đƣợc sự tƣơng quan giữa các mảng nghiệp vụ này. Điều này cũng giống trong chuẩn đoán bệnh ta có thể cần nhiều xét nghiệm (thử máu, thử nước tiếu, siêu âm, …) và kiểm tra khác nhau để có thể đƣa ra kết luận chính xác.  Có gán nhãn thời gian (time variant): Nhƣ đã đề cập, với các chỉ số thay đổi liên tục (như huyết áp, nhịp tim) việc chẩn đoán bệnh sẽ cần dữ liệu của các hôm trƣớc để so sánh phục vụ quá trình điều trị. Do đó hàng ngày cần phải lƣu lại giá trị của các chỉ số này. Hay nói cách khác các chỉ số này khi lƣu sẽ đƣợc gán 1 nhãn thời gian tƣơng ứng. Tƣơng tự nhƣ vậy, dữ liệu lịch sử có tầm quan trọng đặc biệt trong phân tích dữ liệu, cùng một độ đo sẽ có nhiều giá trị khác nhau trong lịch sử có thể dùng để so sánh với nhau để biết đƣợc sự thay đổi là tốt hay xấu. Ví dụ, độ đo doanh thu của một mặt hàng của tháng hiện tại, nếu đem so sánh với doanh thu của mặt hàng đó trong tháng trƣớc, tháng này năm trƣớc thì sẽ có nhiều 72
  14. Giáo trình Hệ thống thông tin quản lý thông tin hơn để đánh giá doanh thu của mặt hàng đó là tốt hay không, trên cơ sở đó sẽ có các quyết định phù hợp. Ngoài ra, dữ liệu lịch sử còn cho phép dự báo đƣợc tƣơng lai khi ứng dụng khai phá dữ liệu.  Bất biến (non-volatile): Khác với các CSDL giao dịch, nơi thông tin của một đối tƣợng có thể đƣợc cập nhật thay đổi hàng ngày, dữ liệu trong Kho dữ liệu có chức năng báo cáo lại các chỉ số về hoạt động kinh doanh thực tế đã xảy ra. Do đó dữ liệu trong Kho dữ liệu không thể cập nhật, thay đổi vì nó sẽ không phản ánh đúng thực tế. Do đó với kho dữ liệu chỉ có 2 thao tác chính là tải dữ liệu vào kho và truy cập (đọc) dữ liệu từ kho. Trƣờng hợp sau khi tổng hợp dữ liệu mà dữ liệu ở trong nguồn bị thay đổi, khi đó một giải pháp xử lý là thực hiện lại quá trình ETL (Extract-Load-Transform: trích xuất – tải – biến đổi) để tải lại dữ liệu từ nguồn vào Kho dữ liệu chứ không cho phép sửa đổi dữ liệu ở trong Kho. Một ý nghĩa khác của tính chất này là dữ liệu lịch sử vẫn đƣợc bảo tồn, vẫn có ý nghĩa chứ không nhƣ dữ liệu tác nghiệp ở các CSDL, dữ liệu cũ (năm trƣớc, hoặc tháng trƣớc) không có ý nghĩa phục vụ hoạt động hằng ngày. Nhƣ vậy, nếu nhƣ CSDL tác nghiệp đƣợc ví nhƣ cái tủ sách cá nhân, nơi ngƣời ta thƣờng xuyên tra cứu, cập nhật, hiệu đính, ghi chú vào lề, thêm mới hoặc chuyển sách đi. Thì Kho dữ liệu lại đƣợc so sánh với thƣ viện quốc gia, nơi các tài liệu kinh điển đƣợc đƣa đến liên tục để lƣu trữ và tham khảo, không ai sửa chữa hoặc chuyển chúng qua chỗ nào khác cả.  Mô hình biểu diễn dữ liệu trong Kho dữ liệu Vì các đặc điểm dữ liệu đƣợc tổ chức hƣớng chủ đề, nên mô hình quan hệ thực thể đƣợc dùng trong thiết kế CSDL tác nghiệp là không còn phù hợp. Trong thực tế, ngƣời ta dùng 2 khái niệm là độ đo (measure) và chiều phân tích (dimension) để biểu diễn dữ liệu trong kho. Áp dụng vào ví dụ ở trên, tập các chỉ số máu, nhịp tim, huyết áp sẽ tƣơng ứng với các độ đo, và thời gian là chiều phân tích. Một số mô hình sau đã đƣợc thiết kế để biểu diễn các độ đo và chiều phân tích. Ngƣời ta vẫn dùng mô hình CSDL quan hệ để biểu diễn, trong đó bảng sự kiện (Fact) sẽ đƣợc tạo ra để chứa các độ đo, và bảng chiều (demension) đƣợc dùng để chứa thông tin về các chiều phân tích, bảng sự kiện sẽ có mối quan hệ với bảng chiều tƣơng ứng. Cụ thể có 3 mô hình biểu diễn quan hệ giữa bảng sự kiện và bảng chiều nhƣ sau:  Mô hình ngôi sao (star schema) Trong mô hình này, một bảng sự kiện sẽ nằm ở trung tâm và xung quanh là các bảng chiều (Hình 5.14 bên trái), vì hình ảnh này giống một ngôi sao đang phát sáng nên ngƣời ta đặt cho nó tên là mô hình ngôi sao (Hình 5.14 bên phải). 73
  15. Giáo trình Hệ thống thông tin quản lý Hình 5.14: Ví dụ về mô hình ngôi sao Ở trong ví dụ trong Hình 5.14, bảng sự kiện chứa thông tin bán hàng với các độ đo: số lƣợng bán đƣợc (unit sold), số tiền thu đƣợc (dollars sold) và trung bình doanh thu (average sale). Bảng sự kiện này có liên kết với 4 bảng chiều: thời gian (time), chi nhánh cửa hàng (branch), mặt hàng (item) và vị trí cửa hàng (location). Đặc điểm của mô hình ngôi sao là chỉ có 1 cấp quan hệ giữa bảng chiều và bảng sự kiện do đó khi truy xuất dữ liệu thì các hệ quản trị CSDL sẽ xử lý nhanh hơn và trả lại kết quả nhanh hơn. Nhƣng nhƣợc điểm của phƣơng pháp này là một số bảng chiều chƣa đƣợc chuẩn hóa. Ví dụ nhƣ bảng chiều vị trí, trong đó nó không đƣợc chuẩn hóa theo mô hình CSDL. Trong bảng này nhiều dữ liệu bị lặp lại ví dụ toàn bộ các trƣờng city, state_or_province, và country sẽ bị lặp trên các dòng có trùng city. Việc dữ liệu không đƣợc chuẩn hóa sẽ không đảm bảo đƣợc sự nhất quán về dữ liệu. Khi dữ liệu thay đổi ví dụ ngƣời ta đổi tên city, có thể quá trình cập nhật sẽ bị sót do rất nhiều dòng cần phải cập nhật. Ngoài ra dữ liệu lặp sẽ làm tăng không gian lƣu trữ, ảnh hƣởng đến tiến trình sao lƣu, đồng bộ dữ liệu. Một chủ đề phân tích có thể đƣợc biểu diễn bằng một hoặc nhiều “ngôi sao”.  Mô hình bông tuyết (snowflake) Mô hình bông tuyết khắc phục nhƣợc điểm của mô hình ngôi sao ở khía cạnh dữ liệu không đƣợc chuẩn hóa. Do đó nó cho phép các bảng chiều đƣợc chuẩn hóa (tùy theo trường hợp mà nó có thể chuẩn hóa đến chuẩn 3 Boyce–Codd). Vì sau khi chuẩn hóa các bảng chiều, nó có hình dạng giống một bông tuyết (Hình 5.15 bên phải), đây là lý do nó có tên nhƣ vậy. 74
  16. Giáo trình Hệ thống thông tin quản lý Hình 5.15: Mô hình bông tuyết Hình 5.15 minh họa mô hình bông tuyết trong đó bảng location đã đƣợc chuẩn hóa, do thiếu không gian nên ở hình này chỉ vẽ đƣợc đến bảng city (trong đó có chứa khóa state_or_province_key) để liên kết với bảng state_or_province, tiếp tục bảng state_or_province lại có quan hệ với bảng country (nếu muốn chuẩn hóa đến chuẩn 3). Tuy nó khắc phục đƣợc nhƣợc điểm của mô hình chòm sao, nhƣng nó lại phá mất ƣu điểm của mô hình ngôi sao là tốc độ xử lý dữ liệu khi nó phải liên kết nhiều bảng với nhau để lấy dữ liệu. Tƣơng tự với mô hình ngôi sao, một chủ đề phân tích có thể đƣợc biểu diễn bằng một hoặc một vài bông tuyết.  Mô hình chòm sao (constellation) Mô hình chòm sao tiếp tục là sự mở rộng mô hình bông tuyết, trong đó nó cho phép các bảng sự kiện có thể sử dụng chung các bảng chiều. Khi đó các bảng sự kiện và bảng chiều sẽ tạo ra mối quan hệ giống nhƣ một đồ thị – và một hình ảnh rất giống với mối quan hệ này là chòm sao (Hình 5.15 bên phải). 75
  17. Giáo trình Hệ thống thông tin quản lý Hình 5.16: Mô hình chòm sao Trong ví dụ ở Hình 5.16, khi bổ sung thêm vào bảng sự kiện Giao hàng (shipping), khi đó bảng sự kiện này sẽ có nhu cầu sử dụng chiều location, item, time. Việc sử dụng chung chiều có ƣu điểm là rút gọn đƣợc số lƣợng bảng chiều. Nhƣng việc làm này sẽ ảnh hƣởng lớn đến quá trình ETL dữ liệu. Giả sử hệ thống quản lý bán hàng là tách biệt với hệ thống quản lý giao hàng, khi đó cần phải lấy thông tin từ cả 2 nguồn dữ liệu để đẩy vào bảng chiều chung là location. Nhƣợc điểm của mô hình chòm sao là phức tạp, khó sử dụng và cần đọc tài liệu hƣớng dẫn thì mới có thể hiểu và lấy đƣợc thông tin cần từ Kho dữ liệu. Các công đoạn khác nhƣ ETL cũng sẽ phức tạp hơn so với các mô hình khác. Vì đặc điểm mô hình này phức tạp nên một số sách có thể không đề cập giới thiệu mô hình này. Với các mô hình biểu diễn sẽ có các ƣu điểm và nhƣợc điểm riêng, nên ngƣời thiết kế phải chịu trách nhiệm lựa chọn mô hình nào phù hợp. 5.3.3. CSDL và Web Web đƣợc sử dụng để cung cấp một vài thông tin trong CSDL nội bộ doanh nghiệp cho khách hàng và các đối tác. Lợi ích của sử dụng Web để truy cập vào CSDL nội bộ của một tổ chức: - Nhân viên yêu cầu đào tạo ít hơn; - Giao diện Web hầu nhƣ ít hoặc không đổi với CSDL nội bộ. 76
  18. Giáo trình Hệ thống thông tin quản lý 5.4. Quản lý nguồn dữ liệu 5.4.1. Thiết lập chính sách thông tin Chính sách về thông tin qui định những nguyên tắc của tổ chức về việc chia sẻ, truyền bá, thu thập, chuẩn hóa, phân loại và lƣu trữ thông tin. 5.4.2. Bảo vệ nguồn dữ liệu Các tổ chức phải bảo vệ nguồn dữ liệu của họ chống lại sự xâm nhập bất hợp pháp và sự phá hỏng dữ liệu. Ba bƣớc chính mà một tổ chức có thể thực hiện để bảo vệ dữ liệu là: 1. Phát triển chiến lƣợc sao lƣu và phục hồi dữ liệu - Sao lưu: Tạo một bản sao chính xác của toàn bộ hệ thống thông tin. - Phục hồi: Khả năng đƣa hệ thống trở về hoạt động lại khi hệ thống bị xâm nhập hoặc bị phá hỏng. 2. Lập kế hoạch khắc phục sự cố - Kế hoạch khắc phục sự cố: Một quy trình chi tiết để phục hồi thông tin hoặc một hệ thống ứng dụng CNTT trong trƣờng hợp xẩy ra sự cố.  Vùng nóng (hot site): Một vùng phƣơng tiện riêng đƣợc trang bị đầy đủ mà công ty có thể ngay lập tức đƣa vào sử dụng sau sự cố.  Vùng lạnh (Cold site): Một vùng tách biệt không trang bị sẵn các thiết bị máy tính, nhƣng là nơi mà nhân viên có thể chuyển tới sau khi xẩy ra sự cố. - Biểu đồ chi phí khắc phục sự cố:  Chi phí mà tổ chức phải chịu nếu không có thông tin và những công nghệ cần thiết.  Chi phí mà tổ chức phải chịu để khắc phục thảm họa. Hình 5.17: Thời gian từ khi sự cố xảy ra cho tới khi khắc phục đƣợc 3. Xây dựng hệ thống kinh doanh có khả năng thích ứng. - Linh hoạt: Hệ thống phải đáp ứng đƣợc những thay đổi trong kinh doanh. - Đo lường được: Hệ thống có thể thích ứng với nhu cầu tăng lên tới mức nào. - Đáng tin cậy: Đảm bảo mọi hệ thống đều thực hiện đúng chức năng và cung cấp thông tin chính xác. 77
  19. Giáo trình Hệ thống thông tin quản lý - Sẵn sàng: Các điểm mà nhân viên, khách hàng, và đối tác có thể tiếp cận hệ thống. - Vận hành: Xác định xem hệ thống có thể thực hiện một quy trình hoặc giao dịch cụ thể nhanh tới mức nào. 5.4.3. Các nguyên tắc quản lý CSDL  Nhu cầu quản lý dữ liệu luôn tồn tại.  Dữ liệu có thể đƣợc trích xuất ở nhiều cấp.  Phần mềm ứng dụng phải đƣợc tách riêng khỏi cơ sở dữ liệu.  Phần mềm ứng dụng nên đƣợc phân loại theo cách mà nó xử lý dữ liệu.  Phần mềm ứng dụng nên đƣợc thiết kế độc lập.  Dữ liệu nên đƣợc nhập vào hệ thống chỉ một lần.  Cần có chuẩn dữ liệu. 78
  20. Giáo trình Hệ thống thông tin quản lý CHƢƠNG 6. ỨNG DỤNG DOANH NGHIỆP 6.1. Các hệ thống doanh nghiệp 6.1.1. Khái niệm về Hệ thống Doanh nghiệp Một hệ thống hoạch định nguồn lực doanh nghiệp (ERP - Enterprise Resource Planning - ERP) của công ty với các tổ chức để tăng cƣờng quản lý và hoạt động kinh doanh trong một cơ sở dữ liệu tập trung. Các cơ quan kết hợp phần mềm ERP để đồng hóa các quy trình kinh doanh, tích lũy dữ liệu hoạt động, cải thiện hiệu quả chuỗi cung ứng, kích thích các chiến lƣợc dựa trên dữ liệu và cải thiện sự hợp tác giữa các bộ phận. Hệ thống ERP hay còn đƣợc gọi bằng tên phổ biến là phần mềm quản trị (nguồn lực) doanh nghiệp, chính là quá trình quản lý tích hợp các chu trình kinh doanh cốt lõi, thƣờng là theo thời gian thực, đƣợc thực hiện với sự trợ giúp trung gian của công nghệ và phần mềm. Các quy trình kinh doanh trong từng chức năng kinh doanh khác nhau và không có khả năng chia sẻ thông tin với nhau. Các nhà quản lý đã gặp khó khăn khi tập hợp dữ liệu bị phân mảnh thành các hệ thống riêng biệt để trình bày một bức tranh tổng thể về hoạt động của tổ chức và đƣa ra các quyết định cho toàn công ty. Ví dụ: tại thời điểm khách hàng đặt hàng, nhân viên bán hàng có thể không thể cho anh ta biết liệu các mặt hàng mong muốn có trong kho hay sắp đƣợc sản xuất hay không. Để khắc phục những khó khăn đó, trong những năm gần đây, nhiều tổ chức đã lựa chọn thay thế một số hệ thống thông tin riêng biệt bằng một hệ thống tích hợp duy nhất có thể hỗ trợ các hoạt động kinh doanh cho các chức năng kinh doanh khác nhau. Hệ thống nhƣ vậy đƣợc gọi là hệ thống doanh nghiệp. Các chu trình kinh doanh cốt lõi thường bao gồm:  Lập kế hoạch sản phẩm, mua hàng;  Kế hoạch sản xuất;  Tiếp thị và bán hàng;  Quản lý hàng tồn kho;  Tài chính và kế toán;  Quản trị nguồn lực. ERP còn thƣờng đƣợc đề cập đến nhƣ một phần mềm quản lý kinh doanh điển hình, đƣợc tích hợp tất cả các công cụ, chức năng chỉ trong một phần mềm nhỏ gọn. Nhờ có ERP, doanh nghiệp có thể dễ dàng hơn trong việc thu thập, lƣu trữ, quản lý thông tin, dữ liệu, hỗ trợ trong quá trình đƣa quyết định chiến lƣợc và đánh giá hiệu quả kinh doanh. Là một phần mềm tích hợp đầy đủ các công năng mà một doanh nghiệp cần đến, liên tục cập nhật các quy trình, hoạt động kinh doanh của các bộ phận 79
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
3=>0