ĐẠI HỌC QUỐC GIA HÀ NỘI<br />
VIỆN CÔNG NGHỆ THÔNG TIN<br />
<br />
NGUYỄN MẠNH TUẤN<br />
<br />
GIẢI PHÁP ĐẢM BẢO AN TOÀN DỮ LIỆU<br />
TRÊN NỀN TẢNG ẢO HÓA<br />
Ngành: Công nghệ thông tin<br />
Chuyên ngành: Quản lý hệ thống thông tin<br />
Mã số: Chuyên ngành đào tạo thí điểm<br />
<br />
TÓM TẮT LUẬN VĂN THẠC SĨ<br />
<br />
Hà Nội - 2014<br />
<br />
1<br />
Mở Đầu:<br />
Ngày nay, với sự phát triển mạnh mẽ của công nghệ thông tin, các máy tính ra đời với<br />
hiệu năng vô cùng lớn nhưng một các tổ chức trên thế giới chỉ sử dụng từ 10% đến 30% hiệu<br />
năng của các máy chủ mà họ sở hữu. Điều này đặt ra cho các nhà khoa học một bài toán là làm<br />
thế nào để sử dụng máy chủ hết công suất của chúng, giảm thiểu chi phí về giá thành thiết bị, chi<br />
phí vận hành, chi phí bảo trì hệ thống. Chính vì vậy công nghệ ảo hóa ra đời. Ảo hóa cho phép<br />
chúng ta chạy nhiều máy chủ trên một nền tảng phần cứng duy nhất, điều này làm cho chi phí về<br />
phần cứng, chi phí về điện, chi phí bảo trì hệ thống, không gian lắp đặt máy chủ tại các<br />
datacenter, … đồng thời cũng giúp chúng ta sử dụng hết năng lực của máy chủ vật lý.<br />
Hiện nay, có rất nhiều nhà cung cấp sản phẩm máy chủ và phần mềm đầu tư vào việc<br />
nghiên cứu và phát triển công nghệ ảo hóa và đã có rất nhiều sản phẩm cho phép chúng ta ảo hóa<br />
hệ thống mày chủ của mình như Red Hat, Oracle, IBM, Microsoft, VMware với rất nhiều sản<br />
phẩm đang được ngày một hoàn thiện và chiếm lĩnh thị trường trên toàn thế giới. Trong đó, với<br />
hơn 80% thị phần ảo hóa trên toàn thế giới, VMware đang là hãng đi đầu về triển khai công nghệ<br />
ảo hóa.<br />
Một trong những nỗi lo lắng của người dùng khi sử dụng công nghệ ảo hóa là vấn đề an<br />
toàn dữ liệu. Hầu hết người sử dụng lo lắng về việc dữ liệu của mình khi dùng chung có thể bị<br />
đánh cắp dễ dàng hơn, khả năng khôi phục khi có sự cố hay thảm họa thiên nhiên, khả năng đáp<br />
ứng của hệ thống, và đặc biệt là vì không thể nhìn thấy nơi mà dữ liệu của chúng ta được lưu trữ<br />
và cũng không được trực tiếp sao lưu và phục hồi nên người sử dụng vẫn lo ngại không muốn<br />
chuyển sang dùng ảo hóa.<br />
Trên thế giới đã có nhiều hãng sản xuất phần cứng cũng như phần mềm đầu tư nghiên<br />
cứu để cải thiện khả năng đảm bảo an toàn dữ liệu của hệ thống ảo hóa như Veeam, Vmware,<br />
Microsoft, Trendmicro, Norton, … nhưng hầu hết mới chỉ đảm bảo được một trong những khả<br />
năng phục hồi khi có thảm họa xảy ra, khả năng sao lưu và phục hồi khi cần thiết, khả năng đáp<br />
ứng của hệ thống ảo hóa chứ chưa có một giải pháp tổng thể cho vấn đề an ninh dữ liệu trên nền<br />
tảng ảo hóa. Điều này khiến người dùng trên thế giới e ngại khi ảo hóa máy chủ của doanh<br />
nghiệp, máy tính cá nhân và lưu trữ những thông tin nhạy cảm trên mạng.<br />
Nhận thức được sự cần thiết và khả năng phát triển mạnh mẽ của công nghệ ảo hóa và<br />
yêu cầu cấp thiết của việc phát triển công nghệ nhằm đảm bảo sự an toàn của dữ liệu, Luận văn<br />
“Giải Pháp Đảm Bảo An Toàn Dữ Liệu Trên Nền Tảng Ảo Hóa” của tôi đã phần nào giới thiệu<br />
được cái nhìn tổng quan về công nghệ ảo hóa, tổng quan về an toàn dữ liệu trên môi trường ảo<br />
hóa, đi sâu nghiên cứu về cách thức an toàn dữ liệu trong môi trường ảo hóa của VMware, đồng<br />
thời đưa ra giải pháp cơ bản cho việc an toàn dữ liệu trong môi trường ảo hóa. Bố cục của luận<br />
văn gồm có 5 chương:<br />
<br />
2<br />
Chương 1: Tổng quan về ảo hóa và an toàn dữ liệu: trong chương này tôi sẽ trình bày<br />
định nghĩa về dữ liệu và an toàn dữ liệu, sơ lược về công nghệ ảo hóa cũng như các phương thức<br />
an toàn dữ liệu trên nền tảng ảo hóa trên nền tảng VMware. Đồng thời, trong chương này tôi cũng<br />
sẽ đưa ra những yêu cầu đối với an toàn dữ liệu trên nền tảng ảo hóa.<br />
Chương 2: Giải pháp an toàn dữ liệu trên nền tảng ảo hóa: Trong chơng này tôi sẽ đi sâu<br />
nghiên cứu về các phương pháp sao lưu, phục hồi dữ liệu trên nền tảng ảo hóa, các phương pháp<br />
để phục hồi sau thảm họa. Đồng thời cũng đi sâu tùm hiểu về Vmare vPhere Data Protection để<br />
an toàn cho hệ thống ảo hóa VMware.<br />
Chương 3: Xây Dựng hệ thống ảo hóa an toàn với VMware vSphere Data Protection:<br />
Trong chương này, tôi sẽ đi xây dựng một hệ thống máy chủ chạy trên nền ảo hóa VMware<br />
vSphere và triển khai một số phương thức an toàn dữ liệu VMware vSphere Data Protection.<br />
Chương 4: Đề xuất giải pháp tăng cường an toàn dữ liệu trên nền tảng ảo hóa: trong<br />
chương này tôi sẽ đưa ra những lý thuyết về mã hóa dữ liệu quan trọng, sau đó là giải pháp của<br />
tôi để an toàn dữ liệu trên nền tảng ảo hóa.<br />
Chương 5: Kết luận: trong chương này tôi sẽ đi tổng kết lại những gì đã làm được và<br />
hướng nghiên cứu tiếp theo của tôi trong tương lai.<br />
<br />
3<br />
Chương 1: tổng quan về ảo hóa và an toàn dữ liệu<br />
1.1.<br />
<br />
Dữ liệu là gì?<br />
<br />
1.1.1.<br />
<br />
Định nghĩa thông tin<br />
<br />
Thông tin là một khái niệm cơ bản của khoa học cũng à khái niệm trung tâm của xã hội<br />
trong thời đại của chúng ta. Mọi quan hệ, mọi hoạt động của con người đều dưa trên một hình<br />
thức giao lưu thông tin nào đó. Mọi tri thức đều bắt nguồn bằng một thông tin về những điều đã<br />
diễn ra, về những điều mà người ta đã biết, đã nói, đã làm. Vậy thông tin là tất cả những sự việc,<br />
sự kiện, ý tưởng, phán đoán làm tăng thêm hiểu biết của con người. Thông tin hình thành trong<br />
quá trình giao tiếp giữa người với người, qa các phương tiện thông tin đại chúng, từ các ngân<br />
hang dữ liệu, hoặc từ tất cả các hiện tượng quan sát được trong môi trường xung quanh.<br />
1.1.2.<br />
<br />
Định nghĩa dữ liệu<br />
<br />
Con người tạo ra rất nhiều cách thức để lưu trữ thông tin nhằm truyền lại cho thế hệ sau.<br />
Những thông tin được lưu trữ này được gọi là dữ liệu.<br />
Cùng với sự bùng nổ thông tin ngày nay, con người càng nghĩ ra nhiều công cụ để quản<br />
trị và lưu trữ dữ liệu một cách an toàn để đảm bảo những thông tin được lưu trữ sẵn sang truy cập<br />
với những người được phép, không bị sửa đổi một cách trái phép, không bị truy cập trái phép, ….<br />
1.2.<br />
<br />
Ảo Hóa là gì?<br />
<br />
Ảo hóa không phải là một mốt nhất thời, rất nhiều doanh nghiệp trên toàn thế giới<br />
chuyển sang sử dụng ảo hóa hoặc có ý định chuyển sang sử dụng ảo hóa trong tương lai gần là vì<br />
những lợi ích tuyệt vời mà nó mang lại. Công nghệ ảo hóa trưởng thành với một tốc độ nhanh<br />
chóng, VMware là hãng dẫn đầu về công nghệ này trong gần như tất cả các lĩnh vực với các tính<br />
năng tiên tiến và được phổ biến rộng rãi toàn thế giới. Trong phần này, tôi sẽ đi vào một số khái<br />
niệm quan trọng của ảo hóa, giải thích các loại khác nhau của ảo hóa cũng như đi vào chi tiết các<br />
thành phần của một máy ảo VMware. Tôi sẽ giới thiệu về các loại máy ảo khác nhau được đặt<br />
trên một máy chủ vật lý và tại sao để quản lý các máy ảo cần có một tư duy hoàn toàn khác cũng<br />
như việc sử dụng các công cụ đặc biệt để làm việc với môi trường ảo hóa.<br />
1.2.1.<br />
<br />
Máy Ảo là gì?<br />
<br />
Chúng ta nghe về máy ảo ở bất cứ đâu, làm việc với máy ảo hàng ngày, vậy đã bao giờ bạn tự<br />
hỏi chính xác máy ảo là gì? Nó bao gồm những thành phần nào? Trong khi máy ảo tồn lại trong RAM<br />
của máy chủ vật lý, không có một sự hiện diện vật chất nào. Trong phần này tôi sẽ đi sâu tìm hiểu về<br />
các thành phần để tạo nên một máy ảo.<br />
a. Đóng gói<br />
Một máy ảo được đóng gói vào một tệp tin đĩa cứng ảo duy nhất, điều này làm cho nó có tính<br />
cơ động cao. Nếu chúng ta phải di chuyển một máy chủ vật lý sang một máy chủ vật lý khác, công<br />
việc chúng ta cần làm vô cùng lớn, chúng ta cần phải sao chép tất cả các tệp tin của mình và mang<br />
sang máy chủ mới. Một hệ điều hành khách đang chạy trên máy chủ vật lý có tất cả các tệp tin được<br />
đóng gói vào một tệp tin đĩa cứng ảo duy nhất. Một máy ảo có thể có nhiều ổ đĩa ảo nhưng các ổ đĩa sẽ<br />
<br />
4<br />
được đóng gói thành các tệp tin. Lợi ích của việc đóng gói này là chúng ta có thể dễ dàng sao chép<br />
một máy ảo tới một thiết bị lưi trữ khác thậm trí là một USB nhỏ gọn. Điều này có nghĩa là chúng ta<br />
có thể vận chuyển một máy ảo bằng một thiết bị lưu trữ di động, sao chép nó vào máy chủ vật lý và<br />
khởi động nó một cách bình thường.<br />
b. Phần cứng của máy ảo<br />
Các máy ảo được tạo ra vơi phần cứng giống nhau với bất kì máy chủ vật lý nào, không bị ảnh<br />
hưởng bởi phần cứng vật lý của máy chủ. Khi chúng ta tạo ra một máy ảo và xác định các thành phần<br />
như ổ DVD, ổ cứng, chip, ram … các thành phần này sẽ được nhìn thấy bởi hệ điều hành khách như<br />
các thành phần phần cứng cụ thể.<br />
<br />
Hình 1.1. phần cứng máy ảo<br />
c.<br />
<br />
Các tệp tin máy ảo<br />
<br />
Trong khi phần cứng ảo chỉ được tạo thành trong RAM của máy chủ và hiển thị mỗi khi máy<br />
ảo đó được bật lên, một máy ảo cũng có các tệp tin thực mà tất cả dữ liệu của nó được lưu trữ trong<br />
đó. Những tệp tin này được lưu trữ trong thư mục chính của máy ảo và được lưu trữ trên ổ cứng nội bộ<br />
hoặc một kho dữ liệu chia sẻ được kết nối với máy chủ vật lý.<br />
<br />
Hình 1.2. các thành phần của máy ảo<br />
<br />