intTypePromotion=1

Tóm tắt Luận văn Thạc sĩ Công nghệ thông tin: Phát triển tính năng loại bỏ dữ liệu trùng lặp (data deduplication) cho dữ liệu đính kèm trong hệ thống thư điện tử sử dụng phần mềm hmailserver

Chia sẻ: Nguyễn Văn H | Ngày: | Loại File: PDF | Số trang:31

0
20
lượt xem
1
download

Tóm tắt Luận văn Thạc sĩ Công nghệ thông tin: Phát triển tính năng loại bỏ dữ liệu trùng lặp (data deduplication) cho dữ liệu đính kèm trong hệ thống thư điện tử sử dụng phần mềm hmailserver

Mô tả tài liệu
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Trong luận văn này tác giả đã tiến hành nghiên cứu các phương pháp chống trùng lặp dữ liệu để từ đó ứng dụng trong hệ thống email nhằm mục đích tối giảm sự trùng lặp dữ liệu trong việc gửi/nhận email trong một hệ thống, để từ đó tiết kiệm không gian lưu trữ máy chủ và tăng tốc độ truy xuất dữ liệu cho người dùng. Bố cục của luận văn gồm 3 chương, mời các bạn cùng tìm đọc bản toàn văn của đề tài này.

Chủ đề:
Lưu

Nội dung Text: Tóm tắt Luận văn Thạc sĩ Công nghệ thông tin: Phát triển tính năng loại bỏ dữ liệu trùng lặp (data deduplication) cho dữ liệu đính kèm trong hệ thống thư điện tử sử dụng phần mềm hmailserver

ĐẠI HỌC QUỐC GIA HÀ NỘI<br /> TRƯỜNG ĐẠI HỌC CÔNG NGHỆ<br /> <br /> NGUYỄN ANH TUẤN<br /> <br /> PHÁT TRIỂN TÍNH NĂNG LOẠI BỎ DỮ LIỆU TRÙNG<br /> LẶP (DATA DEDUPLICATION) CHO DỮ LIỆU ĐÍNH<br /> KÈM TRONG HỆ THỐNG THƯ ĐIỆN TỬ SỬ DỤNG<br /> PHẦN MỀM HMAILSERVER<br /> Ngành: Công nghệ thông tin<br /> Chuyên ngành: Truyền dữ liệu và Mạng máy tính<br /> Mã số: Chuyên ngành đào tạo thí điểm<br /> <br /> TÓM TẮT LUẬN VĂN THẠC SĨ<br /> NGÀNH CÔNG NGHỆ THÔNG TIN<br /> <br /> Hà Nội – 2017<br /> <br /> MỤC LỤC<br /> DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT<br /> LỜI MỞ ĐẦU ..................................................................... 1<br /> CHƯƠNG I: TỔNG QUAN VỀ DATA<br /> DEDUPLICATION, HỆ THỐNG EMAIL VÀ MỖI LIÊN<br /> QUAN .................................................................................. 2<br /> 1.1. Giới thiệu về Data Deduplication. ................................ 2<br /> 1.1.1. Data Deduplication là gì? ........................................ 2<br /> 1.1.2. Mục đích của Data Deduplication ............................ 2<br /> 1.1.3. Phân loại Data Deduplication................................... 2<br /> 1.1.4. So sánh các kiểu Data Deduplication ....................... 4<br /> 1.2. Tổng quan về hệ thống Email ....................................... 4<br /> 1.3. Vấn đề Data Deduplication trong các hệ thống Email ... 5<br /> CHƯƠNG II: PHƯƠNG THỨC THỰC HIỆN DATA<br /> DEDUPLICATION VÀ GIẢI PHÁP CHO HỆ THỐNG<br /> EMAIL ................................................................................ 6<br /> 2.1. Phương thức thực hiện Data Deduplication ................... 6<br /> 2.1.1. Source và Target Deduplication ............................... 7<br /> 2.1.2. Inline và Post-process Deduplication ....................... 8<br /> 2.1.3. File và Sub-File Level ............................................. 9<br /> 2.1.4. Fixed-Length Blocks và Variable-Length Data<br /> Segments… ...................................................................... 9<br /> 2.1.5. Thuật toán băm (Hash-based Algorithms) .............. 10<br /> 2.2. Giải pháp chống trùng lặp dữ liệu trong Email ............... 10<br /> 2.3. Đề xuất lựa chọn hMailServer để thực nghiệm............... 11<br /> CHƯƠNG III: TÍCH HỢP TÍNH NĂNG<br /> DEDUPLICATION TRONG HỆ THỐNG<br /> HMAILSERVER ...............................................................13<br /> 3.1. Tổng quan về hMailServer ............................................ 13<br /> 3.2. Xây dựng hệ thống Email với hMailServer .................... 14<br /> 3.2.1. Giới thiệu các thành phần cài đặt và quản trị .......... 14<br /> 3.2.2. Cài đặt và sử dụng hệ thống hMailServer ............... 14<br /> 3.2.3. Nhận xét về khả năng chống trùng lặp dữ liệu của<br /> hMailServer .................................................................... 16<br /> <br /> 3.3. Tích hợp tính năng deduplication trong hMailServer...... 16<br /> 3.3.1. Xây dựng kịch bản triển khai ................................. 17<br /> 3.3.2. Cài đặt kịch bản ..................................................... 17<br /> 3.3.3. Hoạt động của hMailServer trong trường hợp tích<br /> hợp Deduplication ........................................................... 22<br /> 3.4. So sánh kết quả thực nghiệm ......................................... 24<br /> KẾT LUẬN ........................................................................25<br /> TÀI LIỆU THAM KHẢO .................................................26<br /> <br /> DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT<br /> STT<br /> 1<br /> 2<br /> <br /> KÝ HIỆU<br /> <br /> Ý NGHĨA<br /> Data Deduplication<br /> <br /> AGPLv3<br /> <br /> Affero General Public License v3<br /> <br /> API<br /> <br /> Application Programming Interface<br /> <br /> ASCII<br /> <br /> American Standard Code for<br /> Information Interchange<br /> <br /> 5<br /> <br /> COM library<br /> <br /> COM library<br /> <br /> 6<br /> 7<br /> <br /> DNS<br /> <br /> Domain Name System<br /> <br /> Email<br /> <br /> Electronic Mail<br /> <br /> 8<br /> 9<br /> <br /> HTML<br /> <br /> HyperText Markup Language<br /> <br /> IMAP<br /> <br /> Internet Message Access Protocol<br /> <br /> 10<br /> 11<br /> <br /> LAN<br /> <br /> Local Area Network<br /> <br /> MD5<br /> <br /> Message-Digest algorithm 5<br /> <br /> 12<br /> 13<br /> <br /> MDA<br /> <br /> 14<br /> 15<br /> 16<br /> 17<br /> 18<br /> <br /> MTA<br /> MUA<br /> POP3<br /> RFC<br /> <br /> Mail Delivery Agent<br /> Multipurpose Internet Mail<br /> Extensions<br /> Mail Transfer Agent<br /> Mail User Agent<br /> Post Office Protocol Ver3<br /> Request for Comments<br /> <br /> SHA-1<br /> <br /> Secure Hash Algorithm 1<br /> <br /> 19<br /> <br /> SMTP<br /> <br /> Simple Mail Transfer Protocol<br /> <br /> 3<br /> 4<br /> <br /> MIME<br /> <br /> 1<br /> LỜI MỞ ĐẦU<br /> Cùng với sự phát triển chung của toàn xã hội, công nghệ<br /> thông tin đã từng bước được phát triển và được ứng dụng rộng<br /> rãi trong thực tế. Trong số đó, thư điện tử (email) là một dịch<br /> vụ đã và đang trở nên phổ biến hơn bao giờ hết. Email cho phép<br /> chúng ta có thể giao dịch, trao đổi các thông tin qua lại một cách<br /> nhanh chóng, chính xác với độ tin cậy cao. Tuy nhiên, do đặc<br /> thù của một hệ thống email sẽ bao gồm nhiều người dùng và<br /> một người dùng có thể nhận được email từ một hoặc nhiều<br /> người dùng khác. Do vậy, có một vấn đề phát sinh là lượng dữ<br /> liệu trùng lặp (thông điệp thư gửi đi, tệp đính kèm,…) có thể sẽ<br /> được lưu trữ nhiều lần trên cùng một máy chủ email.<br /> Nhận thức được tính cấp thiết của đề tài, tôi đã tiến hành<br /> nghiên cứu các phương pháp chống trùng lặp dữ liệu để từ đó<br /> ứng dụng trong hệ thống email nhằm mục đích tối giảm sự trùng<br /> lặp dữ liệu trong việc gửi / nhận email trong một hệ thống, để<br /> từ đó tiết kiệm không gian lưu trữ máy chủ và tăng tốc độ truy<br /> xuất dữ liệu cho người dùng. Tên đề tài khóa luận của tôi là:<br /> “Phát triển tính năng loại bỏ dữ liệu trùng lặp (Data<br /> Deduplication) cho dữ liệu đính kèm trong hệ thống thư điện<br /> tử sử dụng phần mềm hMailServer”.<br /> Bố cục của Luận văn gồm 3 chương với các nội dung<br /> chính như sau:<br /> -<br /> <br /> Chương 1: Tổng quan về Data Deduplication, Hệ thống<br /> Email và mối liên quan.<br /> Chương 2: Phương thức thực hiện Data Deduplication<br /> và giải pháp cho hệ thống email<br /> Chương 3: Tích hợp tính năng Deduplication trong hệ<br /> thống hMailServer.<br /> <br />
ADSENSE
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2