Khai phá dữ liệu web

Chia sẻ: Nguyen Lan | Ngày: | 8 tài liệu

0
1.317
lượt xem
351
download

Đây là 8 tài liệu chọn lọc bộ sưu tập này vui lòng chọn tài liệu bên dưới để xem và tải về

Đang xem tài liệu 1/8

Khai phá dữ liệu web
Tóm tắt nội dung

  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Khai thác dữ liệu (data mining) là quá trình khám phá các tri thức mới và các tri thức có ích ở dạng tiềm năng trong nguồn dữ liệu đã có.Khai phá dữ liệu là một bước của quá trình khai thác tri thức (Knowledge Discovery Process), bao gồm: Xác định vấn đề và không gian dữ liệu để giải quyết vấn đề (Problem understanding and data understanding). Chuẩn bị dữ liệu (Data preparation), bao gồm các quá trình làm sạch dữ liệu (data cleaning), tích hợp dữ liệu (data integration), chọn dữ liệu (data selection), biến đổi dữ liệu (data transformation).

Lưu

Tài liệu trong BST: Khai phá dữ liệu web

  1. Tiểu luận Phân cụm tập kết quả tìm kiếm web dựa vào tập thô dung sai

    pdf 42p 170 69

    Ngày nay với sự bùng nổ thông tin , Word Wide Web(www) trở thành nguồn tài nguyên khổng lồ và quý giá. Nó cung cấp cho chúng ta thông tin về mọi lĩnh vực đời sống xã hội, khoa học v.v… Tuy nhiên đi đôi với sự thuận lợi ấy có một vấn đề được đặt ra là chúng ta làm thế nào để truy cập và khai phá được nguồn tài nguyên ấy hiệu quả nhất. Từ vấn đề trên người ta đã nghiên cứu và tạo ra Máy truy tìm web(Web search engine)....

  2. LUẬN VĂN:BÀI TOÁN TRÍCH XUẤT TỪ KHOÁ CHO TRANG WEB ÁP DỤNG PHƯƠNG PHÁP PHÂN TÍCH THẺ HTML VÀ ĐỒ THỊ WEB

    pdf 59p 75 22

    Trích xuất từ khoá cho trang web là một bài toán mở rộng của bài toán trích xuất từ khoá cho một văn bản. Ở mức cao hơn, nó là một bài toán con trong hệ thống trích xuất thông tin (Information Retrieval). Trong nhiều năm qua, bài toán này đã được đề cập, quan tâm nhiều ở các hội nghị quốc tế và các công ty lớn. Bài toán trích xuất từ khoá cho trang web là việc kết hợp giữa trích xuất từ khóa trong văn bản nội dung trang web và việc khai phá, đánh giá từ...

  3. LUẬN VĂN:GIẢI PHÁP MỞ RỘNG THÔNG TIN NGỮ CẢNH PHIÊN DUYỆT WEB NGƯỜI DÙNG NHẰM NÂNG CAO CHẤT LƯỢNG TƯ VẤN TRONG HỆ THỐNG TƯ VẤN TIN TỨC

    pdf 59p 66 21

    Tham khảo luận văn - đề án 'luận văn:giải pháp mở rộng thông tin ngữ cảnh phiên duyệt web người dùng nhằm nâng cao chất lượng tư vấn trong hệ thống tư vấn tin tức', luận văn - báo cáo, công nghệ thông tin phục vụ nhu cầu học tập, nghiên cứu và làm việc hiệu quả

  4. LUẬN VĂN: SỬ DỤNG PHƯƠNG PHÁP XẾP HẠNG TRONG BÀI TOÁN PHÂN CỤM TIẾNG VIỆT

    pdf 55p 139 44

    Cùng với sự gia tăng nhanh chóng về số lượng các trang Web thì nhu cầu về khai phá dữ liệu Web ngày càng nhận được sự quan tâm của các nhà khoa học và các nhóm nghiên cứu. Trong lĩnh vực khai phá Web thì phân cụm Web là một trong những bài toán cơ bản và quan trọng. Đây cũng là thành phần chịu nhiều ảnh hưởng của các đặc trưng ngôn ngữ. Khóa luận này tập trung nghiên cứu về bài toán phân cụm Web sử dụng phương pháp xếp hạng. Trên cơ sở lý thuyết phân...

  5. LUẬN VĂN:KHAI PHÁ DỮ LIỆU SONG NGỮ TỪ WEB

    pdf 40p 151 69

    Cơ sở dữ liệu song ngữ, bao gồm các cặp văn bản song ngữ hay các cặp câu song ngữ, đóng một vai trò rất quan trọng trong nhiều ứng dụng ngôn ngữ tự nhiên, như dịch máy thống kê, xây dựng từ điển song ngữ, tìm kiếm đa ngôn ngữ. Việc xây dựng cơ sở dữ liệu này bằng tay là một việc tốn nhiều chi phí và thời gian. May mắn thay là có rất nhiều dữ liệu song ngữ ở các dạng khác nhau trên Internet. Việc khai phá ra các thành phần tương đương (song ngữ)...

  6. Bài giảng Nhập môn khai phá dữ liệu (PGS.TS. Hà Quang Thụy) - Chương 6. Phân cụm dữ liệu

    ppt 22p 131 43

    Hướng dẫn phân cụm các dữ liệu thuộc D thành các cụm,Các dữ liệu trong một cụm: “tương tự” nhau , Dữ liệu hai cụm: “không tương tự” nhau .Tiên đề phân cụm: Nếu người dùng lựa chọn một đối tượng d thì họ cũng lựa chọn các đối tượng cùng cụm . Với các cách sau đây bạn dễ dàng phân cụm theo các chức năng khác nhau, chúc các bạn thành công!

  7. 10 ‘đại diện’ tiêu biểu của Web 2.0

    pdf 3p 26 4

    Filckr là một trong những trang chia sẻ ảnh trực tuyến xuất sắc nhất hiện nay. Site có bố cục sáng sủa và được trang bị những công cụ dễ dùng như gắn thẻ (tag) để phân loại ảnh, chọn ảnh cùng nội dung và tìm kiếm về sau. Flickr sử dụng tổ hợp công nghệ AJAX, do đó người dùng có thể vừa đặt các tag vừa viết bình luận mà không phải chờ tải lại trang (refresh). Ngoài ra, dịch vụ còn hỗ trợ tạo danh sách liên lạc (contact list) để trao đổi thông tin với bạn...

Đồng bộ tài khoản