intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Luận văn Thạc sĩ Hệ thống thông tin: Rút trích thông tin từ cơ sở dữ liệu kinh doanh bằng phương pháp trực quan của công ty X

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:72

10
lượt xem
7
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Luận văn "Rút trích thông tin từ cơ sở dữ liệu kinh doanh bằng phương pháp trực quan của công ty X" được hoàn thành với mục tiêu nhằm thực hiện phân tích và biểu diễn trực quan dữ liệu kinh doanh của doanh nghiệp sản xuất và xuất khẩu qua 2 năm 2018 – 2019.

Chủ đề:
Lưu

Nội dung Text: Luận văn Thạc sĩ Hệ thống thông tin: Rút trích thông tin từ cơ sở dữ liệu kinh doanh bằng phương pháp trực quan của công ty X

  1. UBND TỈNH BÌNH DƯƠNG TRƯỜNG ĐẠI HỌC THỦ DẦU MỘT LÊ HUỲNH NAM RÚT TRÍCH THÔNG TIN TỪ CƠ SỞ DỮ LIỆU KINH DOANH BẰNG PHƯƠNG PHÁP TRỰC QUAN CỦA CÔNG TY X CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN MÃ SỐ: 8 48 01 04 LUẬN VĂN THẠC SĨ BÌNH DƯƠNG – 2022
  2. UBND TỈNH BÌNH DƯƠNG TRƯỜNG ĐẠI HỌC THỦ DẦU MỘT LÊ HUỲNH NAM RÚT TRÍCH THÔNG TIN TỪ CƠ SỞ DỮ LIỆU KINH DOANH BẰNG PHƯƠNG PHÁP TRỰC QUAN CỦA CÔNG TY X CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN MÃ SỐ: 8 48 01 04 LUẬN VĂN THẠC SĨ NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS. TS. TRẦN VĨNH PHƯỚC BÌNH DƯƠNG – 2022
  3. LỜI CAM ĐOAN Tôi Lê Huỳnh Nam xin cam đoan: Đề tài “Rút trích thông tin từ cơ sở dữ liệu kinh doanh bằng phương pháp trực quan của công ty X” là kết quả của cả một quá trình nỗ lực, cố gắng của bản thân cùng với sự hướng dẫn nhiệt tình khoa học của PGS.TS. thầy Trần Vĩnh Phước. Các số liệu, kết quả trình bày trong luận văn này là trung thực. Những tư liệu được sử dụng trong luận văn có nguồn gốc và trích dẫn rõ ràng, đầy đủ. Bình Dương, ngày tháng 1 năm 2022 Học viên Lê Huỳnh Nam ii
  4. LỜI CẢM ƠN Tác giả xin gửi lời cảm ơn chân thành đến Ban giám hiệu trường Đại học Thủ Dầu Một tỉnh Bình Dương, phòng Sau đại học, quý thầy cô đã tận tình giảng dạy và tạo mọi điều kiện thuận lợi để các học viên học tập, nghiên cứu và hoàn thành khoá học. Tác giả xin gửi lời cảm ơn sâu sắc nhất đến: ⁃ PGS.TS. Trần Vĩnh Phước: xin cảm ơn thầy vì đã nhận lời hướng dẫn và nhiệt tình giúp đỡ, hỗ trợ về chuyên môn cùng những lời động viên nhắc nhở giúp tác giả thực hiện trọn vẹn luận văn. ⁃ Cô đã tin tưởng và nhiệt tình cung cấp cơ sở dữ liệu kinh doanh của công ty X giúp tác giả có số liệu thực tế khách quan để thực hiện và hoàn thành đề tài luận văn. Cuối cùng, xin cảm ơn gia đình, người thân và bạn bè đã luôn ủng hộ, động viên, giúp đỡ để tác giả có thể hoàn thành tốt luận văn. Bình Dương, ngày tháng 1 năm 2022 Tác giả Lê Huỳnh Nam iii
  5. MỤC LỤC LỜI CAM ĐOAN ................................................................................................. ii LỜI CẢM ƠN ...................................................................................................... iii MỤC LỤC ............................................................................................................ iv DANH MỤC CÁC BẢNG .................................................................................. vi DANH MỤC HÌNH, ĐỒ THỊ ........................................................................... vii MỞ ĐẦU ............................................................................................................... 1 Chương 1. GIỚI THIỆU...................................................................................... 3 1.1. Giới thiệu. ................................................................................................ 3 1.2. Đặt vấn đề. ............................................................................................... 3 1.3. Mục tiêu nghiên cứu. .............................................................................. 4 1.4. Đối tượng nghiên cứu. ............................................................................ 4 1.5. Phạm vi nghiên cứu. ............................................................................... 4 1.6. Nhiệm vụ nghiên cứu. ............................................................................. 4 1.7. Ý nghĩa của đề tài ................................................................................... 5 1.8. Cấu trúc luận văn ................................................................................... 5 Chương 2: TỔNG QUAN VỀ CƠ SỞ LÝ THUYẾT ....................................... 6 2.1. Giới thiệu ................................................................................................. 6 2.2. Dữ liệu ...................................................................................................... 6 2.3. Hệ thị giác của con người ....................................................................... 8 2.4. Tính chất trực quan ................................................................................ 9 2.5. Biến trực quan ...................................................................................... 11 2.5.1. Biến vị trí ............................................................................................ 11 2.5.2. Biến thị giác........................................................................................ 12 2.6. Trực quan hóa dữ liệu. ......................................................................... 13 2.6.1. Hiển trị trực quan. ............................................................................ 13 2.6.2. Phân tích trực quan........................................................................... 14 2.6.3. Các dạng biều đồ, đồ thị dùng trong trực quan hóa: ..................... 14 2.7. Kết luận ................................................................................................. 21 Chương 3: THỰC NGHIỆM ............................................................................ 22 3.1. Phương pháp nghiên cứu. .................................................................... 22 iv
  6. 3.1.1. Lý do chọn phương pháp. ................................................................. 22 3.1.2. Thư viện Matplotlib. ......................................................................... 22 a. Giới thiệu. .............................................................................................. 22 b. Các dạng biểu đồ trong Matplotlib. .................................................... 23 3.1.3. Thư viện Pandas ................................................................................ 23 3.2. Quy trình thực nghiệm ......................................................................... 24 3.2.3. Xử lý dữ liệu bằng câu lệnh trong Pandas. ..................................... 25 3.2.4. Trực quan bằng biểu đồ. .................................................................. 26 3.3. Phân tích trên dữ liệu thực nghiệm .................................................... 28 3.3.1. Xác định các biến mô tả .................................................................... 28 a. Phân loại các biến. ................................................................................ 30 b. Mô tả các biến. ...................................................................................... 30 3.3.2. Phân tích các mối quan hệ giữa các biến. ....................................... 31 3.3.3. Sơ đồ quan hệ giữa các biến. ............................................................ 31 3.3.4. Biểu diễn quan hệ các biến bằng toán học. ..................................... 31 3.3.5. Phân loại câu hỏi. .............................................................................. 32 a. Câu hỏi sơ cấp. ...................................................................................... 32 b. Câu hỏi toàn cục. .................................................................................. 32 c. Câu hỏi quan hệ. ................................................................................... 32 3.4. Thực nghiệm bằng Python. .................................................................. 32 3.4.1. Phân tích bằng phương pháp trực quan hóa. ................................. 33 3.4.2. Phân tích bằng phương pháp thông thường. .................................. 50 KẾT QUẢ NGHIÊN CỨU ................................................................................ 52 KẾT LUẬN VÀ KIẾN NGHỊ ........................................................................... 53 TÀI LIỆU THAM KHẢO ................................................................................. 54 v
  7. DANH MỤC CÁC BẢNG. Bảng 2.1. Bảng phân loại dữ liệu dựa vào thuộc tính Bảng 2.2. Bảng về các biến thị giác Bảng 3.1. Bảng liệt kê các biến và đặt ký hiệu Bảng 3.2. Bảng phân loại các biến Bảng 3.3. Bảng mô tả các biến Bảng 3.4. Bảng mô tả mối quan hệ giữa các biến vi
  8. DANH MỤC HÌNH, ĐỒ THỊ Hình 2.1. Sơ đồ nhận thức thị giác Hình 2.2. Biểu đồ về chiều cao / cân nặng với hình dạng khác nhau Hình 2.3. Biểu đồ về chiều cao / cân nặng của nam và nữ Hình 2.4. Biểu đồ về chiều cao / cân nặng Hình 2.5. Cách tiếp cận để chuyển đổi dữ liệu thành tri thức Hình 2.6. Biểu đồ cột Hình 2.7. Biểu đồ đường Hình 2.8. Biểu đồ đường với các điểm nút Hình 2.9. Biểu đồ Pareto Hình 2.11. Biểu đồ tròn Hình 2.12. Biểu đồ phân tán Hình 2.13. Biểu đồ bong bóng Hình 2.14. Biểu đồ vùng Hình 2.15. Biểu đồ thác nước Hình 2.16. Biểu đồ phễu Hình 2.17. Biểu đồ nhiệt Hình 2.18. Biểu đồ hộp Hình 3.1. Sơ đồ quan hệ giữa các biến Hình 3.2. Biểu diễn đọc dữ liệu trong Python Hình 3.3. Biểu diễn lọc dữ liệu trong Python Hình 3.4. Biểu diễn nhóm và tính tổng trong Python Hình 3.5. Biểu diễn sắp xếp tăng hoặc giảm trong Python vii
  9. Hình 3.6. Biểu đồ cột trong không gian 2 chiều. Hình 3.7. Biểu đồ đường trong không gian 2 chiều. Hình 3.8. Biểu đồ kết hợp trong không gian 2 chiều Hình 3.9. Biểu đồ cột trong không gian 3 chiều Hình 3.10. Phân tích bằng số Hình 3.11. Dữ liệu năm 2018 Hình 3.12. Dữ liệu 12 tháng năm 2018 Hình 3.13. Biểu đồ về kim ngạch theo tháng của năm 2018. Hình 3.14. Biểu đồ về sản phẩm theo tháng trong năm 2018 Hình 3.15. Biểu đồ về thời gian hoạt động theo tháng trong năm 2018 Hình 3.16. Dữ liệu năm 2019 Hình 3.17. Dữ liệu 12 tháng năm 2019 Hình 3.18. Biểu đồ về kim ngạch theo tháng của năm 2019. Hình 3.19. Biểu đồ về sản phẩm theo tháng trong năm 2019 Hình 3.20. Biểu đồ về thời gian hoạt động theo tháng trong năm 2019 Hình 3.21. Biểu đồ kết hợp của kim ngạch theo tháng trong năm 2018 - 2019 Hình 3.22. Biểu đồ kết hợp sản phẩm theo tháng trong năm 2018 – 2019 Hình 3.23. Biểu đồ kết hợp thời gian hoạt động theo tháng năm 2018 - 2019 Hình 3.24. Biểu đồ kết hợp kim ngạch và thời gian hoạt động năm 2018 Hình 3.25. Biểu đồ kết hợp kim ngạch và thời gian hoạt động năm 2019 Hình 3.26. Biểu đồ kim ngạch nhập kho sản xuất tháng 10 năm 2019 Hình 3.27. Biểu đồ kim ngạch nhập kho sản xuất tháng 11 năm 2019 Hình 3.228. Biểu đồ kết hợp kim ngạch và thời gian hoạt động năm 2018 - 2019 Hình 3.29. Biểu đồ kết hợp kim ngạch và sản phẩm năm 2018 viii
  10. Hình 3.30. Biểu đồ kết hợp kim ngạch và sản phẩm năm 2019 Hình 3.31. Biểu đồ kim ngạch nhập kho sản xuất tháng 4 năm 2019 Hình 3.32. Biểu đồ kim ngạch nhập kho sản xuất tháng 6 năm 2019 Hình 3.33. Biểu đồ kết hợp kim ngạch và sản phẩm năm 2018 - 2019 ix
  11. MỞ ĐẦU Hiện nay, trong tiến trình hội nhập của khoa học – kỹ thuật thế giới, cùng với đó là sự không ngừng thay đổi của nền khoa học toàn cầu trong đó có lĩnh vực về khoa học dữ liệu máy tính cũng mang lại nhiều thuận lợi về đơn giản hóa quản lý dữ liệu. Nhưng, ngoài những thuận lợi nêu trên cũng có không ít khó khăn trong việc quản lý, lưu trữ và truy vấn các nguồn dữ liệu cũ. Đối với doanh nghiệp vấn đề dữ liệu luôn được đặt lên hàng đầu, các hoạt động sản xuất, kinh doanh của doanh nghiệp, nhưng đa số dữ liệu các doanh nghiệp hiện nay thì được lưu dưới dạng tài liệu, giấy tờ. Để dễ dàng sử dụng các nguồn dữ liệu đó, doanh nghiệp cần phải quản lý và lưu trữ dữ liệu một cách khoa học. Bên cạnh đó, áp dụng những công cụ khoa học kĩ thuật tiên tiến và các công cụ hỗ trợ quản lý dữ liệu cũng góp phần giúp doanh nghiệp chủ động hơn trong việc sử dụng dữ liệu một cách hiệu quả trên cơ sở tôn trọng các nguyên tắc về sử dụng, lưu trữ dữ liệu và chấp hành luật pháp. Tình hình kinh doanh của mỗi doanh nghiệp không những được quan tâm bởi các nhà quản lý mà còn của rất nhiều đối tượng khác nhau đặc biệt là các nhà đầu tư. Họ quan tâm đến tình hình kinh doanh của doanh nghiệp trên các góc độ khác nhau: đối với chủ doanh nghiệp thì mục đích quan tâm đến tình hình kinh doanh để biết chính xác đến thực trạng kinh doanh của doanh nghiệp mình, từ đó đưa ra các chiến lược kinh doanh cho mỗi doanh nghiệp, đối với các chủ đầu tư là để có thể đưa ra các quyết định đầu tư, đối với các đối tác là có nên hợp tác hay không. Nhưng nhìn chung đều với mục đích muốn biết hiệu quả sản xuất kinh doanh tình hình phát triển và sức cạnh tranh của doanh nghiệp. Để đáp ứng nhu cầu mang tính chiến lược và nắm bắt tình hình kinh doanh của doanh nghiệp, các nhà quản lý, chủ đầu tư cần tham chiếu lại dữ liệu sản xuất kinh doanh các năm trước đó rồi tiến hành phân tích đánh giá tình hình sản xuất kinh doanh để đưa ra quyết định cho các năm sau. Mặt khác bộ não con người tiếp nhận và xử lý thông tin từ dữ liệu hình ảnh hiệu quả hơn từ ngữ [11], cho nên phương pháp trực quan hóa dữ liệu có thể giúp ta biến thông tin thành quyết định kinh doanh, giúp các nhà 1
  12. lãnh đạo doanh nghiệp đánh giá chính xác sức mạnh doanh nghiệp và đưa ra quyết định nhanh chóng, từ đó phát triển những lợi thế và tìm những ra khó khăn để kịp thời khắc phục nhằm nâng cao hiệu quả sản xuất kinh doanh, triển vọng cũng như tránh những rủi ro trong tương lai của doanh nghiệp. Nhận thấy được tầm quan trọng của vấn đề được nêu ở trên, cũng như các ngành về khoa học dữ liệu trên thế giới đang rất phát triển, và Việt Nam lĩnh vực này còn rất mới nên cũng là cơ hội việc làm đối với những người đam mê về phân tích dữ liệu, nên tôi đã quyết định chọn đề tài: “Rút trích thông tin từ cơ sở dữ liệu kinh doanh bằng phương pháp trực quan của công ty X” làm đề tài cho khóa luận của mình. 2
  13. Chương 1. GIỚI THIỆU 1.1. Giới thiệu.  Tổng quan về Bình Dương. Bình Dương đã biến vùng đất thuần nông, khô cằn, kém hiệu quả trở thành những khu, cụm công nghiệp trọng điểm của cả nước. Đến nay, toàn tỉnh có 28 khu công nghiệp và 8 cụm công nghiệp, với tổng diện tích khoảng 10.000ha. Trong đó có những khu công nghiệp tiêu biểu cho cả nước về xây dựng kết cấu hạ tầng hoàn chỉnh, đồng bộ và hiện đại, về tốc độ thu hút đầu tư, quản lý sản xuất và bảo vệ môi trường như VSIP 1, 2, Mỹ Phước, Đồng an, …. Bằng những chính sách phù hợp, đến tháng 10 năm 2014, Bình Dương đã thu hút được 2.356 dự án đầu tư nước ngoài với số vốn là 20 tỷ 200 triệu đô la Mỹ, trên 17.000 doanh nghiệp trong nước. Nhiều khu đô thị và dân cư mới văn minh, hiện đại được hình thành, trong đó tiêu biểu nhất là thành phố mới Bình Dương với điểm nhấn là Trung tâm hành chính tập trung của tỉnh đã chính thức đi vào hoạt động từ ngày 20/02/2014. Chỉ tiêu kinh tế cụ thể của Bình Dương cũng được quan tâm và phát triển. Về cơ cấu kinh tế phát triển và chuyển dịch theo hướng nâng cao tỷ trọng của các ngành công nghiệp, dịch vụ trong tổng GDP. Cơ cấu lao động chuyển dịch cùng với cơ cấu kinh tế theo hướng giảm lao động làm việc trong các ngành có năng suất thấp sang các ngành có năng suất, hiệu quả cao hơn. Kim ngạch xuất khẩu của tỉnh cũng tăng theo các năm từ 8.662 triệu USD (năm 2010) lên 25.000 triệu USD (năm 2020). Cùng với phát triển về kinh tế thì các mục tiêu khác như: văn hóa – xã hội, quá trình đô thị hóa – công nghiệp hóa và hạ tầng kỹ thuật cũng được quan tâm và phát triển nhằm đáp ứng nhu cầu xinh hoạt và di chuyển của người dân cũng như định hướng phát triển của tỉnh trong tương lai. 1.2. Đặt vấn đề. Trong tình hình hiện nay, các doanh nghiệp trong nước nói chung và đặt biệt là tại Bình Dương nói riêng gặp không ít khó khăn như: tình hình giá nguyên liệu, giá các thiết bị chế biến phần lớn được nhập từ nước ngoài hoặc từ các tỉnh 3
  14. thành khác trong cả nước, hay do dịch bệnh cũng khiến quá trình vận chuyển hay xuất khẩu hàng hóa qua các nước cũng gặp khó khăn dẫn đến chi phí tăng theo. Và phần lớn các doanh nghiệp tại Việt Nam có quy mô vừa và nhỏ, nguồn lao động chủ yếu là con người, nên vẫn còn chậm trong sự thay đổi của thị trường thế giới. Vì vậy, tôi hy vọng bài luận văn này có thể giúp các nhà quản lý doanh nghiệp nhìn ra và đánh giá được tình hình phát triển của doanh nghiệp. Từ đó, đưa ra được những quyết định hay định hướng phát triển nhằm tăng năng suất, hiệu quả công việc, đặc biệt tăng doanh thu cho danh nghiệp giúp phát triển kinh tế tỉnh nhà và đất nước. 1.3. Mục tiêu nghiên cứu. Thực hiện phân tích và biểu diễn trực quan dữ liệu kinh doanh của doanh nghiệp sản xuất và xuất khẩu qua 2 năm 2018 – 2019 1.4. Đối tượng nghiên cứu. Đối tượng nghiên cứu trong bài báo cáo này gồm  Bảng số liệu thống kê  Biểu đồ 1.5. Phạm vi nghiên cứu. Dữ liệu được thu thập tại cô ty ở Bình Dương, và được lấy trong khoản thời gian từ tháng 01 năm 2018 đến tháng 12 năm 2019. 1.6. Nhiệm vụ nghiên cứu.  Thu thập dữ liệu: dữ liệu được lấy từ file excel thống kê của một công ty sản xuất tại Bình Dương.  Xác định các biến: biến số lượng nhập kho sản xuất, biến số lượng nhập kho sản xuất, biến thời gian hoạt động, biến tháng.  Xây dựng được câu hỏi phân tích: với góc nhìn là người phân tích, tôi xây dựng số câu hỏi liên quan đến tình hình hoạt động sản xuất của công ty. 4
  15.  Biểu diễn các biến trên khối trực quan: khối trực quan gồm trục biểu diễn tháng, trục biểu diễn thời gian hoạt động, trục biểu diễn kim ngạch nhập kho sản xuất, trục biểu diễn số lượng nhập kho sản xuất.  Tìm ra được những thông tin mới hoặc có ích cho mục đích nghiên cứu hoặc mục đích khác. 1.7. Ý nghĩa của đề tài Ý nghĩa khoa học: áp dụng phương pháp trực quan dữ liệu sản xuất để đánh giá tình hình sản xuất qua từng năm Ý nghĩa thực tiễn: luận văn giúp cho người đọc đánh giá được tình hình sản xuất của công ty, từ đó có thể đưa ra hướng phát triển mới giúp phát triển công ty hơn. 1.8. Cấu trúc luận văn Cấu trúc luận văn gồm các phần sau:  Chương 1. Giới thiệu, đặt vấn đề, mục tiêu, đối tượng nghiên cứu, phạm vi nghiên cứu, nhiệm vụ nghiên cứu, ý nghĩa đề tài, cấu trúc luận văn  Chương 2. Tổng quan về trực quan, dữ liệu, hệ thị giác con người, tính chất trực quan, biến trực quan, trực quan hóa dữ liệu, kết luận  Chương 3. Chương này nói về lý do chọn phương pháp trực quan, quy trình thực hiện trực quan, thực nghiệm trên dữ liệu thực.  Kết quả nghiên cứu  Kết luận và kiến nghị. 5
  16. Chương 2: TỔNG QUAN VỀ CƠ SỞ LÝ THUYẾT 2.1. Giới thiệu Trong triết học, theo quan điểm của phép tư duy biện chứng, hoạt động nhận thức của con người đi từ trực quan sinh động đến tư duy trừu tượng, và từ tư duy trừu tượng đến thực tiễn. Con đường nhận thức đó được thực hiện qua các giai đoạn từ đơn giản đến phức tạp, từ thấp đến cao, từ cụ thể đến trừu tượng, từ hình thức bên ngoài đến bản chất bên trong, như sau:  Nhận thức cảm tính (trực quan sinh động)  Nhận thức lý tính (tư duy trừu tượng) Thực tế con người nhận thức thế giới thực đầu tiên là nhận thức cảm tính, đây là giai đoạn đầu tiên của quá trình nhận thức. Giai đoạn con người sử dụng các giác quan (thị giác, thính giác, xúc giác, khứu giác, vị giác) để tác động vào sự vật nhằm nắm bắt sự vật ấy. Dữ liệu từ thế giới thực thông qua các kênh giác quan được truyền vào não bộ để phân tích, xử lý trích xuất thành thông tin hoặc tri thức. Trong đó, thị giác là kênh giúp con người thu thập được nhiều thông tin và nhanh nhất. Dữ liệu về thực thể từ thế giới thực được kênh thị giác đưa vào mắt người bằng các tia sáng, dẫn lên não bộ để giải mã thành thông tin hoặc tri thức [1]. Theo khảo sát về khả năng tiếp nhận thông tin mới với 5 giác quan, trong đó có 3 phương pháp tiếp nhận thông tin (hình ảnh, âm thanh, vận động) nhận thấy có hơn 65% dân số tiếp nhận thông tin từ dữ liệu hình ảnh, với âm thanh là 30% và vận động là 5% [11]. Nói cách khác, dữ liệu hình ảnh, hoặc dạng hình ảnh như đồ thị được con người cảm nhận được nhiều thông tin hơn những loại dữ liệu khác. Do đó, các loại dữ liệu khác sau khi được thu thập cần được chuyển thành các dạng đồ thị, biểu đồ, gọi là biểu diễn trực quan, để giúp người dùng dễ nhận biết ý nghĩa của dữ liệu [2]. 2.2. Dữ liệu Dữ liệu là các dữ kiện, số liệu thống kê hoặc các mục thông tin riêng lẻ, thường là số. Theo nghĩa kỹ thuật hơn, dữ liệu là một tập hợp các giá trị của các 6
  17. biến định tính hoặc định lượng về một hoặc nhiều người hoặc đối tượng, trong khi dữ liệu (số ít dữ liệu) là một giá trị của một biến duy nhất. Dữ liệu được đo lường, thu thập, báo cáo và phân tích, đồng thời được sử dụng để tạo trực quan hóa dữ liệu như đồ thị, bảng hoặc hình ảnh. Dữ liệu dùng để phân tích nhằm tìm kiếm thông tin hoặc trị tri thức chứa trong đó, dữ liệu được dùng nhiều để giúp con người đưa ra quyết định. Mọi quyết định đưa ra đều được dựa trên thông tin có được từ dữ liệu, dữ liệu càng tốt thì thông tin được đưa ra càng tốt. Dữ liệu còn được mô tả là dầu mới của nền kinh tế kỹ thuật số [12]. Trong phân tích, dữ liệu được phân loại bằng nhiều cách. Tùy vào mục địch sử dụng có thể lựa chọn loại dữ liệu trong thực tiễn. Mỗi loại dữ liệu đều gắn với các thuộc tính khác nhau, có mối quan hệ đối với mỗi tình huống trong thực tế. Các loại dữ liệu thường được sử dụng trong phân tích như: dữ liệu định danh, dữ liệu thứ tự, dữ liệu khoản cách, dữ liệu tỷ lệ.  Dữ liệu định danh (Nominal): là loại dữ liệu dựa vào các thuộc tính mà dữ liệu không có sự hơn kém nhau, chỉ có khác biệt hay bằng nhau về thứ bậc. Các con số trong dữ liệu định danh không có mối quan hệ hơn kém nhau và không thực hiện được các phép tính toán cơ bản như cộng, trừ, nhân, chia. Dữ liệu định dạnh có thể được sử dụng trong các trường hợp như: “Bạn là học sinh hay sinh viên?” – 1 học sinh – 2 sinh viên.  Dữ liệu thứ tự (Ordinal): là loại dữ liệu dựa vào các thuộc tính mà dữ liệu có sự so sánh hơn kém nhau, khác biệt nhau, bằng nhau. Giống như dữ liệu định danh, dữ liệu thứ tự không cho phép thực hiện các phép toán cơ bản như cộng, trừ, nhân, chia. Dữ liệu thứ tự được dùng trong nghiên cứu đo lường thái độ, ý kiến, sở thích, nhận thức và quan điểm, như: “Xếp hạng năm vừa rồi của bạn?” – Xuất sắc – Giỏi – Khá – Trung bình.  Dữ liệu khoảng cách (Interval): là loại dữ liệu dựa vào các thuộc tính mà dữ liệu có thể so sánh sự hơn kém nhau, khác biệt nhau, bằng nhau. Ngoài ra, dữ liệu khoảng cách còn thực hiện được một số phép tính toán 7
  18. cơ bản như cộng, trừ nhưng không thực hiện được các phép tính nhân, chia.  Dữ liệu tỉ lệ (Ratio): là loại dữ liệu mang đầy đủ các tính chất của loại dữ liệu định danh, dữ liệu thứ tự, dữ liệu khoảng cách. Đây là loại dữ liệu thực hiện đầy đủ được các phép tính toán cơ bản như cộng, trừ, nhân, chia, so sánh sự khác biệt, bằng nhau giữa các thuộc tính. Đối với loại dữ liệu này, nó cho phép so sánh sự khác biệt về tỉ lệ giữa các giá trị của dữ liệu, xác định xếp hạng thứ tự, so sánh khoảng cách. Dữ liệu tỉ lệ được sử dụng để tính toán cộng, trừ, nhân, chia, so sánh các điểm số với nhau và được áp dụng trong biến điểm. Bảng 2.1. Bảng phân loại dữ liệu dựa vào thuộc tính Dữ liệu Dữ liệu Dữ liệu Phép toán Dữ liệu tỉ lệ định danh thứ tự khoảng cách cơ bản (Ratio) (Nominal) (Ordinal) (Inteval)                 2.3. Hệ thị giác của con người Thị giác của con người được cấu tạo và hoạt hoạt động như một hệ thống thị giác hay hệ thị giác giúp con người có khả năng phát hiện và xử lý ánh sáng nhìn thấy. Phát hiện và phân tích các thông tin từ quang phổ mà con người có thể cảm nhận được (bước sóng có thể nhìn thấy được 380 – 760 nm) để xây dựng hình ảnh về thực thể đó trong môi trường xung quanh [13]. Trong thế giới thực, mọi thực thể đều có thể tự sinh ra ánh sáng và phát ra ánh sáng của chính thực thể đó, hoặc phản chiếu từ nguồn ánh sáng khác chiếu vào 8
  19. (hình 2.1). Các tia sáng mà dữ liệu mô tả từng vị trí trên thực thể như là sóng mang tín hiệu được điều chế (modulation) đi vào mắt rồi hội tụ tại võng mạc, giải điều chế (demodulation) để tách dữ liệu khỏi tia sáng. Dữ liệu này được dẫn lên não bộ ở hai mức khái quát và chi tiết. Tại mức khái quát, não bộ phân tích song song nhanh những đặc tính nổi trội của thực thể. Tại mức chi tiết, não bộ phân tích nối tiếp để phát hiện và lưu trữ những chi tiết của thực thể. Hình 2.1. Sơ đồ nhận thức thị giác (nguồn [1]). 2.4. Tính chất trực quan Tính chất trực quan là tính hiểu quả của đồ thị trực quan được đánh giá khách quan dựa trên các tính chất trực quan của đồ thị đó. Một đồ thị trực quan cần đảm bảo các tính chất sau: tính liên kết, tính chọn lọc, tính thứ tự, tính định lượng, tính giá trị [3] [4].  Tính liên kết: là tính chất thấp nhất cho phép nhóm tất cả các phần tử của một biến dù các giá trị khác nhau. Hình 2.2 cho thấy cách thể hiện khác của biểu đồ chiều cao / cân nặng, với các phần bổ sung được thể hiện bằng các dấu có hình dạng khác nhau. 9
  20. Hình 2.2. Biểu đồ về chiều cao / cân nặng với hình dạng khác nhau (nguồn [4]).  Tính chọn lọc: là cấp độ cao hơn tính liên kết, là mặt trái của liên kết. Tính chất này cho phép người xem chọn một danh mục của một thành phần, cảm nhận vị trí của đối tượng trong danh mục và bỏ qua những đối tượng khác. Hình 2.3, người xem có thể chọn trực quan chon đực hoặc con cái bằng cách quan sat các vết sáng và tối. Hình 2.3. Biểu đồ về chiều cao / cân nặng của nam và nữ (nguồn [4]).  Tính thứ tự: tính liên kết và chọn lọc chỉ cung cấp phân loại theo thang danh nghĩa. Theo Bertin gợi ý một số biến có thể có tính thứ tự, nên cho phép dữ liệu được xếp hạng theo thứ tự [4]. Hình 2.4, người xem thay vì chỉ thể hiện chiều cao / cân nặng, thì có thể biểu diễn thêm về thai đổi độ sáng của biến để biểu thị cho tuổi tác. 10
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2