Trang chủ » Công Nghệ Thông Tin » Mạng máy tính và truyền thông

3 trang

86 lượt xem

7

0

5 thách thức lớn của công nghệ tìm kiếm kế tiếp

Nhu cầu hiện hữu hoặc chưa hiện hữu. Ngày nay, chúng ta khá thỏa mãn với những gì mà Google mang lại. Nhưng chưa chắc cảm giác này còn tồn tại ở tương lai. Ngay cả với cha đẻ Google, Search Engine do họ tạo ra sẽ không dừng ở khả năng hiện tại bởi những nhu cầu sắp tới, sự cạnh tranh dữ dội từ đối thủ và thách thức phát triển của Internet. Bằng hiểu biết hạn hẹp, người viết xin được đưa ra 5 vấn đề lớn mà các máy tìm kiếm đã, đang và sẽ cần...

Chủ đề:

Mạng thế hệ mới

/

3

5 thách thức lớn của công nghệ tìm kiếm kế tiếp

Nhu cầu hiện hữu hoặc chưa hiện hữu. Ngày nay, chúng ta khá thỏa mãn với

những gì mà Google mang lại. Nhưng chưa chắc cảm giác này còn tồn tại ở

tương lai. Ngay cả với cha đẻ Google, Search Engine do họ tạo ra sẽ không

dừng ở khả năng hiện tại bởi những nhu cầu sắp tới, sự cạnh tranh dữ dội từ

đối thủ và thách thức phát triển của Internet. Bằng hiểu biết hạn hẹp, người

viết xin được đưa ra 5 vấn đề lớn mà các máy tìm kiếm đã, đang và sẽ cần

giải quyết trong tương lai gần.

Thách thức thứ nhất: Dữ liệu Web 2.0

Không cần phải đề cập nhiều, sự bùng nổ của Web 2.0 kéo theo trào lưu

người dùng tham gia tạo nội dung trên Internet. Sự bùng nổ này là một thách

thức lớn với việc xử lý dữ liệu trong hệ thống máy tìm kiếm.

Khoảng 5 năm trở lại đây, dữ liệu gia tăng đột biến về lượng. Lượng dữ liệu

này tồn tại trên các diễn đàn, blog, wiki, social network, multimedia

service,... cùng với một lượng dữ liệu rác khổng lồ đang được tạo ra hàng

ngày. Bằng giải pháp lưu trữ và xử lý phân tán, máy tìm kiếm hiện tại giải

quyết khá hoàn hảo nhiệm vụ này. Tuy nhiên, tốc độ tăng trưởng dữ liệu

chẳng những không ngừng mà thậm chí còn mạnh hơn. Đồng nghĩa với nó,

chi phí băng thông, phần cứng lưu trữ, năng lực phần mềm, năng lượng,...

duy trì trung tâm dữ liệu sẽ tăng lên đặt ra những thách thức về giá: giá phát

triển và giá vận hành hệ thống search engine.

Không phải bất cứ nhà quản trị nào cũng muốn Google đánh chỉ mục

Website của họ. Và cũng có rất nhiều trang bắt người dùng đăng ký thành

viên mới cho phép xem nội dung. Mỗi khi Crawler ghé thăm site là một lần

trang Web bị ngốn băng thông rất lớn, có thể vượt xa với lượng người vào

trang mỗi ngày.

Dịch vụ mạng 2.0 bùng nổ, dữ liệu cá nhân được sinh ra và tồn tại trên

Internet ngày càng nhiều. Chúng có thể được bảo vệ bởi sự riêng tư hoặc rất

khó truy vấn theo phương pháp lần liên kết (link) thông thường. Hơn nữa,

nhiều Web 2.0 sử dụng script để sinh URL hoặc chọn phương thức Post

(HTTP Post) khi truy vấn dữ liệu. Vậy làm sao để máy tìm kiếm có thể quét

hết dữ liệu trên Internet? Đây là một thách thức khó khăn đặt ra cho Crawler

của các Search Engine. Dĩ nhiên, không phải đến thời 2.0, Search Engine

mới phải đối mặt với Invisible Web (Web ẩn) nhưng khi mạng dịch vụ dữ

liệu bùng nổ, Invisible web trở nên phức tạp và và rắc rối hơn nhiều.

Cập nhật dữ liệu thời gian thực cũng là một nhu cầu. Bài báo đăng tải trên

CNN có thể dễ dàng tìm thấy ngay khi có truy vấn gửi tới Google. Cập nhật

thời gian thực với một lượng nhỏ dữ liệu thì không quá khó khăn, nhưng các

máy tìm kiếm phải xử lý đến hàng tỉ loại dữ liệu trong một ngày. Đây là

thách thức đặt ra cho việc đánh chỉ mục trong các hệ thống Search Engine.

Thách thức thứ hai: Lọc bỏ dữ liệu rác và trùng lặp

Như đã đề cập ở phần trên, chi phí về mặt lưu trữ phải được tính toán sao

cho rẻ nhất. Do đó, càng ít dữ liệu nháp, ít dữ liệu trùng lặp càng tốt. Những

dữ liệu kiểu này còn ảnh hưởng đến tốc độ tiếp cận và chất lượng kết quả

search trả về cho người dùng. Trong khi vấn nạn thư rác đang hoành hoành

thì vấn nạn dữ liệu rác cũng làm đau đầu các công cụ tìm kiếm

Tài liệu liên quan

Bài giảng SDN và NFV: Mạng định nghĩa bằng phần mềm và ảo hóa chức năng mạng

Bài giảng Mạng định nghĩa bằng phần mềm và ảo hóa chức năng mạng (SDN và NFV)

Đề thi Nhập môn hệ thống nhúng học kì 3 năm 2023-2024

Đề thi kết thúc học phần học kì 3 môn Nhập môn hệ thống nhúng năm 2023-2024

Đánh giá hiệu suất mô hình kết hợp chuyển giao trong mạng 5G HetNet kiến trúc kết nối kép

Đánh giá hiệu suất mô hình kết hợp chuyển giao trong mạng 5G HetNet với kiến trúc kết nối kép

Blockchain: Khởi nguồn nền kinh tế mới - Lời mở đầu

Blockchain – khởi nguồn của một nền kinh tế mới: lời mở đầu

Bài giảng Mạng thế hệ mới [chuẩn SEO]

Bài giảng Mạng thế hệ mới

Công nghệ làm thay đổi thế giới Web: Top những công nghệ mới nhất

Những công nghệ làm thay đổi thế giới Web

Bài giảng Mạng thế hệ mới Lương Ánh Hoàng [Chuẩn SEO]

Bài giảng Mạng thế hệ mới - Lương Ánh Hoàng

Bài giảng Sự kế thừa [chuẩn SEO]

Bài giảng Sự kế thừa

Thủ thuật SEO tên miền mới chiến thắng tên miền cũ: Kinh nghiệm thực tế

Thủ thuật seo cho tên miền mới chiến thắng tên miền cũ

So sánh kỹ thuật SEO ngày xưa và hiện tại: Kinh nghiệm và phân tích

So sánh một số kỹ thuật SEO ngày xưa và hiện tại

Tài liêu mới

Bài giảng Internet và giao thức TS. Hoàng Trọng Minh: Kinh nghiệm và kiến thức

Bài giảng Internet và giao thức - TS. Hoàng Trọng Minh

Bài giảng Internet và giao thức TS. Phạm Anh Thư chuẩn nhất

Bài giảng Internet và giao thức - TS. Phạm Anh Thư

Bài giảng Quản trị mạng Windows 2000 nâng cao: GV. Nguyễn Văn Tẩn (Chi tiết)

Bài giảng Quản trị mạng Windows 2000 (Nâng cao) - GV. Nguyễn Văn Tẩn

Câu hỏi trắc nghiệm Mạng máy tính: Tổng hợp [mới nhất]

Câu hỏi trắc nghiệm môn học Mạng máy tính

Câu hỏi ôn tập An toàn mạng môn học: Tổng hợp [mới nhất]

Câu hỏi ôn tập môn An toàn mạng

Câu hỏi trắc nghiệm Mạng máy tính: Tổng hợp đầy đủ nhất

Câu hỏi trắc nghiệm môn Mạng máy tính

Câu hỏi và bài tập An ninh mạng: Tổng hợp đầy đủ nhất

Câu hỏi và bài tập An ninh mạng

Giáo trình Mạng máy tính Quản trị mạng Cao đẳng - Trường Cao đẳng Thủ Thiêm (Chuẩn Nhất)

Giáo trình Mạng máy tính (Nghề: Quản trị mạng máy tính - Trình độ: Cao đẳng) - Trường Cao đẳng Thủ Thiêm

Giáo trình Vẽ đồ họa Quản trị mạng máy tính Cao đẳng - Trường Cao đẳng Thủ Thiêm

Giáo trình Vẽ đồ họa (Nghề: Quản trị mạng máy tính - Trình độ: Cao đẳng) - Trường Cao đẳng Thủ Thiêm

Giáo trình Lắp ráp và cài đặt máy tính (Cao đẳng) - Quản trị mạng máy tính - Trường Cao đẳng Thủ Thiêm

Giáo trình Lắp ráp và cài đặt máy tính (Nghề: Quản trị mạng máy tính - Trình độ: Cao đẳng) - Trường Cao đẳng Thủ Thiêm

Giáo trình Bảo trì hệ thống mạng (Nghề Quản trị mạng máy tính Cao đẳng) - Trường Cao đẳng Thủ Thiêm

Giáo trình Bảo trì hệ thống mạng (Nghề: Quản trị mạng máy tính - Trình độ: Cao đẳng) - Trường Cao đẳng Thủ Thiêm

Giáo trình Công nghệ mạng không dây (Nghề Quản trị mạng máy tính, Trình độ Cao đẳng) - Trường Cao đẳng Thủ Thiêm [Mới nhất]

Giáo trình Công nghệ mạng không dây (Nghề: Quản trị mạng máy tính - Trình độ: Cao đẳng) - Trường Cao đẳng Thủ Thiêm

Giáo trình Cấu hình và Quản trị Thiết bị Mạng (Nghề Quản trị Mạng Máy tính, Trình độ Cao đẳng) - Trường Cao đẳng Thủ Thiêm

Giáo trình Cấu hình và quản trị thiết bị mạng (Nghề: Quản trị mạng máy tính - Trình độ: Cao đẳng) - Trường Cao đẳng Thủ Thiêm

Giáo trình Quản trị Webserver, Mailserver (Cao đẳng) - Trường Cao đẳng Thủ Thiêm

Giáo trình Quản trị hệ thống Webserver và Mailserver (Nghề: Quản trị mạng máy tính - Trình độ: Cao đẳng) - Trường Cao đẳng Thủ Thiêm

Giáo trình Thiết kế, Xây dựng Mạng LAN (Nghề Quản trị Mạng Máy tính, Trình độ Cao đẳng) - Trường Cao đẳng Thủ Thiêm

Giáo trình Thiết kế, xây dựng mạng LAN (Nghề: Quản trị mạng máy tính - Trình độ: Cao đẳng) - Trường Cao đẳng Thủ Thiêm

Giới thiệu

Về chúng tôi

Việc làm

Quảng cáo

Liên hệ

Chính sách

Thoả thuận sử dụng

Chính sách bảo mật

Chính sách hoàn tiền

DMCA

Hỗ trợ

Hướng dẫn sử dụng

Đăng ký tài khoản VIP

Zalo/Tel:

093 303 0098

Email:

support@tailieu.vn

Phương thức thanh toán

Theo dõi chúng tôi

Facebook

Youtube

TikTok

chứng nhận

Chịu trách nhiệm nội dung: Nguyễn Công Hà. ©2025 Công ty TNHH Tài Liệu trực tuyến Vi Na.

Địa chỉ: 54A Nơ Trang Long, P. Bình Thạnh, TP.HCM - Điện thoại: 0283 5102 888 - Email: info@tailieu.vn

Giấy phép Mạng Xã Hội số: 670/GP-BTTTT cấp ngày 30/11/2015