intTypePromotion=1
zunia.vn Tuyển sinh 2024 dành cho Gen-Z zunia.vn zunia.vn
ADSENSE

Vai trò của việc phân tích hành vi thông tin của người dùng tin trong môi trường dữ liệu lớn

Chia sẻ: _ _ | Ngày: | Loại File: PDF | Số trang:15

30
lượt xem
2
download
 
  Download Vui lòng tải xuống để xem tài liệu đầy đủ

Bài viết giới thiệu định nghĩa về hành vi thông tin, giải thích sự cần thiết và vai trò của phân tích hành vi thông tin của người dùng tin trong môi trường dữ liệu lớn. Trên cơ sở đó, bài viết đề xuất kế hoạch phân tích hành vi thông tin của người dùng tin trong môi trường dữ liệu lớn tại các thư viện ở Việt Nam.

Chủ đề:
Lưu

Nội dung Text: Vai trò của việc phân tích hành vi thông tin của người dùng tin trong môi trường dữ liệu lớn

  1. VAI TRÒ CỦA VIỆC PHÂN TÍCH HÀNH VI THÔNG TIN CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG DỮ LIỆU LỚN Bùi Thị Thanh Diệu* 1 Tóm tắt: Sự phát triển nhanh chóng của công nghệ dữ liệu lớn, trí tuệ nhân tạo và vạn vật kết nối đã đem đến nhiều thay đổi trong cách thức tiếp cận nguồn tin và phục vụ thông tin tại các thư viện. Tăng cường khả năng nhận biết nhu cầu tin của người dùng tin thông qua việc phân tích HVTT trong môi trường dữ liệu lớn là vô cùng quan trọng để cải tiến chất lượng phục vụ thông tin tại các thư viện. Vì vậy, bài viết giới thiệu định nghĩa về hành vi thông tin, giải thích sự cần thiết và vai trò của phân tích hành vi thông tin của người dùng tin trong môi trường dữ liệu lớn. Trên cơ sở đó, bài viết đề xuất kế hoạch phân tích hành vi thông tin của người dùng tin trong môi trường dữ liệu lớn tại các thư viện ở Việt Nam. Từ khóa: Hành vi thông tin; Phân tích hành vi thông tin; Dữ liệu lớn; Người dùng tin; Nhu cầu tin; Thông tin – thư viện. MỞ ĐẦU Trong những năm gần đây, sự phát triển của công nghệ thông tin, sự kết nối của mạng viễn thông toàn cầu và công nghệ lưu trữ điện toán đám mây đã thúc đẩy nhanh quá trình sản xuất dữ liệu lớn dẫn tới khối lượng dữ liệu, đặc biệt là dữ liệu điện tử tại các thư viện không ngừng gia tăng. Theo đó, dữ liệu hành vi thông tin (HVTT) có cấu trúc và phi cấu trúc cũng tăng trưởng không ngừng khiến lý thuyết về HVTT và nghiên cứu phân tích HVTT trở nên đặc biệt quan trọng. Vì thế phân tích HVTT của người dùng tin thông qua dữ liệu lớn đang là * Tiến sĩ, Trường Đại học Khánh Hòa.
  2. PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM 490 bài toán đầy thách thức cho các thư viện trong bối cảnh xã hội thông tin. Thông qua việc phân tích những dữ liệu HVTT, thư viện có thể phân tích, khai thác sâu về nhu cầu, ý định và tâm lý của người dùng tiềm năng, đồng thời đưa ra những sản phẩm, dịch vụ thông tin dự kiến có giá trị, cung cấp “đúng” và “trúng” nhu cầu tin của người dùng tin. Rõ ràng phân tích HVTT trong môi trường dữ liệu lớn đóng một vai trò quan trọng, định hướng sự phát triển của các thư viện trong tương lai. Chính vì vậy, bài viết này xem xét vai trò của việc phân tích HVTT của người dùng tin trong môi trường dữ liệu lớn một cách hệ thống và đề xuất xây dựng kế hoạch chiến lược phân tích HVTT trong các thư viện ở Việt Nam. 1. HIỂU VỀ PHÂN TÍCH HÀNH VI THÔNG TIN CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG DỮ LIỆU LỚN CỦA THỜI ĐẠI CHUYỂN ĐỔI SỐ 1.1. Khái niệm "hành vi thông tin" "Hành vi thông tin" là thuật ngữ dùng để mô tả cách thức con người tương tác với thông tin, từ cách con người tìm kiếm, khai thác, chọn lọc, sử dụng, chia sẻ và tái tạo thông tin. HVTT là toàn bộ hành vi con người liên quan đến thông tin, bao gồm hành vi thụ động và vô ý như ngẫu nhiên gặp thông tin, cũng như hành vi có mục đích mà không liên quan đến tìm kiếm, như chủ động tránh thông tin [1]. Như vậy, HVTT là một thuật ngữ với nghĩa rộng bao trùm các khía cạnh khác nhau của hành vi con người liên quan đến thông tin. Có thể hiểu HVTT đề cập đến một loạt hoạt động của người dùng tin như: nhấp, tìm kiếm, duyệt, sao chép, lưu trữ, nhận xét, phản hồi,… trong khi truy cập trang Web hoặc sử dụng dịch vụ tìm kiếm thông tin tại thư viện, thậm chí bao gồm đánh giá liên quan, đánh giá người tham gia và tương tác với bạn bè trong các trang Web của các tổ chức bên ngoài. Nghiên cứu HVTT bắt nguồn từ những nghiên cứu ban đầu về hành vi người tiêu dùng. Đó là một ngành khoa học liên ngành và mới nổi, được phát triển vào những năm 1960. Các nguồn thông tin chính để nghiên cứu đến từ kinh tế học, tâm lý học, xã hội học, nhân chủng học và trí tuệ nhân tạo. Đồng thời, các công cụ được sử dụng để
  3. VAI TRÒ CỦA VIỆC PHÂN TÍCH HÀNH VI THÔNG TIN CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG DỮ LIỆU LỚN 491 nghiên cứu hành vi của người dùng đã phát triển và ngày nay cơ sở dữ liệu được đưa vào nghiên cứu hành vi của người tiêu dùng. Dữ liệu nghiên cứu hành vi người tiêu dùng chủ yếu đến từ thông tin nhật ký người dùng, thông tin chủ thể người dùng và thông tin môi trường bên ngoài. Trong quá trình phát triển, nhiều mô hình nghiên cứu về hành vi người tiêu dùng đã được phát triển, đầu tiên là để phân tích và sau đó là để dự đoán hành vi của người tiêu dùng. Kết quả là, khái niệm “dữ liệu lớn” (big data) được phát triển và bằng cách áp dụng nó hiện nay, các công ty đang cố gắng hiểu và dự đoán hành vi của người tiêu dùng của họ. Cùng với các nghiên cứu về hành vi của người tiêu dùng thì nghiên cứu HVTT trong môi trường thư viện được bắt đầu từ rất sớm với những công trình nghiên cứu về “tìm kiếm và thu thập thông tin” hoặc về “nhu cầu tin và sử dụng thông tin”. Dần dần thuật ngữ nghiên cứu việc “tìm tin” hay “hành vi tìm tin” được sử dụng để chỉ tất cả các nghiên cứu về sự tương tác của con người với thông tin. Tuy nhiên, sau đó một số nhà nghiên cứu nhận thấy rằng thuật ngữ “hành vi tìm tin” chỉ đề cập những nỗ lực tìm kiếm thông tin và không bao gồm những cách tương tác khác giữa con người với thông tin. Đến những năm 1990, thuật ngữ “hành vi thông tin” bắt đầu được sử dụng rộng rãi để thay thế cho thuật ngữ “hành vi tìm tin” và trở thành thuật ngữ thông dụng nhất hiện nay [7]. 1.2. Dữ liệu lớn và mối quan hệ giữa phân tích hành vi thông tin của người dùng tin với dữ liệu lớn Theo định nghĩa Tổ chức Tư vấn công nghệ Gartner, “dữ liệu lớn” (big data) là tài sản thông tin mà những thông tin này có khối lượng dữ liệu lớn, tốc độ cao và dữ liệu đa dạng, đòi hỏi phải có công nghệ mới để xử lý hiệu quả nhằm đưa ra được những quyết định hiệu quả, khám phá được các yếu tố ẩn sâu trong dữ liệu và tối ưu hoá được quá trình xử lý dữ liệu. Như vậy, ba khía cạnh quan trọng của dữ liệu lớn đó là: - Khối lượng (volume): Dữ liệu có khối lượng lớn có thể lên đến hàng ngàn tỉ Gigabyte hoặc thậm chí lớn hơn.
  4. PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM 492 - Tốc độ xử lý (velocity): Dữ liệu đảm bảo xử lý các thao tác như truy xuất, cập nhật, chỉnh sửa, chia sẻ,… với tốc độ nhanh. - Sự đa dạng (variety): Dữ liệu không cần tuân theo một cấu trúc và có thể lưu trữ nhiều định dạng khác nhau như văn bản, hình ảnh,… Sự khác biệt của dữ liệu truyền thống với dữ liệu lớn thể hiện rõ qua ba khía cạnh có thể được hình ảnh hoá như sau (xem hình 1): Hình 1. Sự khác biệt giữa dữ liệu lớn và dữ liệu truyền thống Có thể thấy dữ liệu lớn là thuật ngữ chỉ tập hợp các tập dữ liệu lớn và phức tạp đến mức khó xử lý bằng các công cụ và kỹ thuật khai thác dữ liệu thông thường. Gần đây, tầm quan trọng của việc phân tích dữ liệu lớn đã thu hút sự chú ý của các nhà khoa học vì nó mang lại cho các doanh nghiệp/tổ chức những thông tin hữu ích và cái nhìn sâu sắc hơn về cả dữ liệu có cấu trúc và không có cấu trúc, có thể dẫn đến việc ra quyết định sáng suốt hơn. Mục tiêu chung của phân tích dữ liệu lớn là trích xuất thông tin hữu ích từ một tập dữ liệu khổng lồ và chuyển nó thành một cấu trúc dễ hiểu để sử dụng thêm. Các quy trình chính của dữ liệu lớn bao gồm thu thập, quản lý, lưu trữ, tìm kiếm, chia sẻ, chuyển giao, phân tích và trực quan hóa.
  5. VAI TRÒ CỦA VIỆC PHÂN TÍCH HÀNH VI THÔNG TIN CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG DỮ LIỆU LỚN 493 Trong bối cảnh kinh doanh, phân tích dữ liệu lớn là quá trình kiểm tra các tập hợp “dữ liệu lớn” để phát hiện ra các mẫu ẩn, mối tương quan chưa biết, xu hướng thị trường, sở thích của khách hàng và các thông tin kinh doanh hữu ích khác. Trong môi trường thư viện, phân tích HVTT của người dùng tin tại các thư viện thông qua dữ liệu lớn đã và đang giúp các thư viện xây dựng chế độ xem thông tin người dùng và tìm ra các quy tắc về HVTT của người dùng từ dữ liệu hành vi lớn của người dùng tin. Nó giúp thư viện hiểu rõ hơn về sở thích của người dùng tin, phát triển giá trị của người dùng và cuối cùng là mang lại nhiều hiệu quả cao cho hoạt động cung cấp thông tin của thư viện. Một ví dụ điển hình cho tính hiệu quả của việc phân tích HVTT của người dùng tin trong môi trường dữ liệu lớn là thành công của hệ thống bán lẻ Amazon. Lý do mà Amazon có thể giành được lợi thế trong ngành sách là nó khai thác và phân tích rất sâu thông tin về hành vi của người dùng. Phân tích HVTT của người dùng giúp Amazon tìm hiểu thêm về sở thích của người dùng và cung cấp nhiều dịch vụ được nhắm mục tiêu hơn. Chính điều này đã tạo nên sự tin tưởng của khách hàng đối với các sản phẩm, dịch vụ mà Amazon cung cấp, dẫn đến sự quay lại và trung thành của khách hàng gia tăng [4]. 2. VAI TRÒ CỦA VIỆC PHÂN TÍCH HÀNH VI THÔNG TIN CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG DỮ LIỆU LỚN HVTT của người dùng tin đang thay đổi khi nhu cầu tin của người dùng tin tại các thư viện ngày càng chuyên sâu và hướng đến sản phẩm và dịch vụ thư viện có giá trị cao hơn. Phân tích HVTT của người dùng tin tại các thư viện thông qua dữ liệu lớn giúp thư viện có thể hiểu rõ hơn sở thích của người dùng thông qua việc theo dõi và tìm hiểu hành vi của người dùng và sau đó họ có thể hình thành các giải pháp tương ứng để phân phối tốc độ dòng chảy thông tin hợp lý hơn và cung cấp nội dung phù hợp hơn. Hơn nữa, yêu cầu của người dùng tin đối với chất lượng dịch vụ của thư viện ngày càng cao, vì vậy cần phải phân tích đặc điểm của nhóm người dùng và các sở thích khác nhau của người dùng tin. Do đó, việc phân tích và nghiên cứu HVTT trong môi trường dữ liệu lớn tại các thư viện ngày càng trở nên quan trọng hơn.
  6. PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM 494 2.1. Phân tích hành vi thông tin của người dùng tin thông qua dữ liệu lớn giúp thư viện tự động điều chỉnh chế độ dịch vụ và hỗ trợ ra quyết định Trong môi trường dữ liệu lớn, bằng cách phân tích dữ liệu lịch sử về thói quen sử dụng thông tin của người dùng tin, sở thích, mối quan hệ xã hội, nền tảng kỷ luật và thời gian hoạt động trực tuyến,… thư viện có thể khám phá được các sở thích tin, yêu cầu tin của người dùng tin và mô tả các khía cạnh khác nhau của nhu cầu của người dùng tin, từ đó thư viện có thể điều chỉnh và tối ưu hóa chế độ phục vụ thông tin một cách linh hoạt và kịp thời. Đồng thời, dựa theo đặc điểm cá nhân, lòng trung thành và nhu cầu cá nhân, thư viện có thể phân chia người dùng tin thành các nhóm người dùng khác nhau, trên cơ sở đó có thể đề xuất chính xác nội dung thông tin dựa trên HVTT của người dùng mục tiêu. Hơn nữa, các thư viện thường triển khai một không gian ảo cá nhân như “thư viện của tôi” (my library) để lưu trữ những thay đổi động này của dữ liệu HVTT của người dùng tin, nó có thể cung cấp cơ sở ra quyết định cho mô hình dịch vụ thông tin của thư viện. Ngoài ra, đối với việc sử dụng và biến động đột ngột của các tài nguyên khác nhau (tài nguyên phần cứng và phần mềm, tài nguyên kỹ thuật số, tài nguyên dịch vụ và tài nguyên tri thức,…) chẳng hạn như các cuộc tấn công mạng, vi rút, lọc rác và các rào cản yêu cầu dịch vụ thông tin,… với kết quả phân tích HVTT của người dùng thông qua dữ liệu lớn, thư viện có thể đưa ra các chiến lược đối phó hợp lý mà không bị chậm trễ. 2.2. Phân tích hành vi thông tin của người dùng tin thông qua dữ liệu lớn giúp thư viện tránh sự gián đoạn của người dùng và gia tăng lợi thế cạnh tranh Trong môi trường dữ liệu lớn thường lưu trữ lại các dấu vết HVTT của người dùng vô cùng đa dạng. Việc phân tích các dấu vết HVTT này từ nguồn dữ liệu lớn về thói quen tìm kiếm, sử dụng, khai thác, chia sẻ thông tin,… giúp các thư viện có thể dự đoán được tại từng nhóm đối tượng người dùng tin khác nhau, sản phẩm, dịch vụ thư viện nào sẽ có nhu cầu cao trong thời gian tới, chuẩn bị thông tin, tài liệu ngay từ khi người dùng còn chưa có ý định sử dụng và tạo thế chủ động cho mình trong các chiến dịch cạnh tranh với các tổ chức cung cấp thông tin bên ngoài.
  7. VAI TRÒ CỦA VIỆC PHÂN TÍCH HÀNH VI THÔNG TIN CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG DỮ LIỆU LỚN 495 Hiện nay thư viện đang đối mặt với một loạt các vấn đề lớn như: câu hỏi về giá trị thông tin, chất lượng dịch vụ thư viện, các rào cản kỹ thuật và nhân viên không thích ứng được với những thách thức trong thời đại chuyển đổi số. Điều này làm ảnh hưởng nghiêm trọng đến sự phát triển của thư viện, dần dần làm suy yếu giá trị tồn tại của thư viện, khiến người sử dụng mất dần đi niềm tin vào các giá trị thông tin, tri thức mà thư viện cung cấp [5]. Chính vì vậy, trong thời đại dữ liệu lớn, thư viện cần tập trung phân tích và khai thác dữ liệu người dùng, nắm vững thời gian thực về phân phối thông tin tới người dùng, ý định của người dùng, nhu cầu kinh doanh, khả năng đáp ứng thông tin và chất lượng dịch vụ thông tin,… Hơn nữa, thư viện nên tận dụng công nghệ dữ liệu lớn để phân tích tổn thất và giá trị của người dùng, tìm ra nguyên nhân thực sự của việc mất người dùng tin và đưa ra các biện pháp khắc phục khả thi, tránh mất đi sự tin cậy và trung thành người dùng trong quá trình chuyển giao các giá trị thông tin, tri thức của thư viện. 2.3. Phân tích hành vi thông tin của người dùng tin thông qua dữ liệu lớn giúp thư viện xác định danh tính và giám sát hành vi của người dùng theo thời gian thực Giám sát HVTT của người dùng tin là một loại giám sát đối với hành vi truy cập nguồn, duyệt, truy cập trở lại và sử dụng các trang Web khác của người dùng, để có được các dữ liệu cơ bản khác nhau về lưu lượng truy cập trang Web. Sau khi phân tích hành vi của cá nhân người dùng, thư viện có thể xác định chính xác tính toàn vẹn và bảo mật của hành vi đọc của độc giả, đồng thời phát hiện kịp thời hành vi lừa dối, phá hoại và tấn công của người dùng bất hợp pháp trong quá trình đọc, đảm bảo an toàn cho tài nguyên cơ sở hạ tầng của thư viện, hệ thống dịch vụ và quy trình dịch vụ [6]. Ví dụ, thông qua dữ liệu lớn, thư viện phân tích hành vi trực tuyến hàng ngày của người dùng, từ đó có thể xác định và theo dõi lưu lượng truy cập bất thường trong thời gian thực. Sau đó, mô hình người dùng bình thường được tổng hợp, và các cuộc tấn công nguy hiểm, truy cập bất thường và hành vi tải xuống bất hợp pháp được lọc hoặc chặn. Ngoài ra, thư viện có thể theo dõi hành vi của người dùng theo thời gian thực thông qua dữ liệu lớn,
  8. PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM 496 đồng thời khám phá và theo dõi các mối quan tâm của người dùng tin từ đó cung cấp giới thiệu về các chủ đề liên quan mới nhất và các dòng thông tin cập nhật cho người dùng, giúp họ có được hướng nghiên cứu mới nhất và công nghệ tiên tiến nhất của các ngành liên quan một cách nhanh chóng và hiệu quả (xem hình 2)[9]. Hình 2: Cải thiện trải nghiệm của người tiêu dùng (Cá nhân hóa thời gian thực sử dụng dữ liệu lớn) Ngoài ra, bằng cách cung cấp dữ liệu thời gian thực, dữ liệu lớn có thể được sử dụng để cải thiện thời gian phản hồi của người dùng tin cuối cùng và sẽ làm tăng sự hài lòng của khách hàng, giành được lòng trung thành của khách hàng và nhận được mức độ quay lại của người dùng tin cao hơn. 2.4. Phân tích hành vi thông tin của người dùng tin thông qua dữ liệu lớn giúp thư viện xây dựng kế hoạch tiếp thị thông tin hiệu quả Hiện nay, yếu tố quan trọng nhất để thu hút người dùng tin tìm đến các Website và dịch vụ thông tin của thư viện là thư phải thường xuyên có những nguồn tài nguyên thông tin mới, đa dạng và phù hợp với nhu cầu sử dụng của người dùng. Bên cạnh đó, thư viện cũng phải luôn xây dựng những kế hoạch truyền thông cho các sản phẩm dịch vụ thông tin thư viện của mình để người dùng tin biết đến và sử dụng. Thông thường, người dùng tin thích những nguồn tin đáng tin cậy và dễ dàng truy cập sử dụng một cách miễn phí. Vì vậy, thư viện sẽ phân tích HVTT của người dùng tin thông qua nguồn dữ liệu lớn để có thể
  9. VAI TRÒ CỦA VIỆC PHÂN TÍCH HÀNH VI THÔNG TIN CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG DỮ LIỆU LỚN 497 phân tích, so sánh các số liệu trong quá khứ, so sánh với các trang cung cấp thông tin bên ngoài để đưa đến cho người dùng sự trải nghiệm tuyệt vời ngay từ lần đầu. Trên cơ sở đó, thư viện có thể xây dựng các chính sách ưu đãi, lên kế hoạch quảng cáo hiệu quả với từng nhóm đối tượng người dùng. Đây chính là yếu tố quan trọng quyết định tới sự trung thành của người sử dụng các sản phẩm và dịch vụ thư viện trong bối cảnh tràn ngập các nguồn tin trong xã hội thông tin hiện nay. Với những vai trò quan trọng như trên, việc phân tích HVTT của người dùng tin trong môi trường dữ liệu lớn tại các thư viện cần được xây dựng thành các quy trình, ứng dụng các phương pháp, công nghệ giúp thư viện nắm bắt, trích xuất những kiến thức, thông tin hữu ích tiềm ẩn trong nguồn dữ liệu về HVTT. Mục đích chính của phân tích HVTT là tạo ra cái nhìn chi tiết và chính xác về người dùng tin, từ đó thư viện có thể đề xuất ra các sản phẩm, dịch vụ thông tin phù hợp, các quyết định chính xác về nội dung thông tin, các chiến lược tiếp thị hiệu quả để thu hút người dùng tin và “giữ chân” họ lâu dài trước sự cạnh tranh của các tổ chức cung cấp thông tin bên ngoài thị trường. 3. ĐỀ XUẤT XÂY DỰNG KẾ HOẠCH PHÂN TÍCH HÀNH VI THÔNG TIN CỦA NGƯỜI DÙNG TIN TẠI CÁC THƯ VIỆN Ở VIỆT NAM Phân tích HVTT của người dùng tin là tâm điểm của cuộc cách mạng dữ liệu lớn. Xây dựng kế hoạch phân tích HVTT của người dùng tin tại các thư viện cần được tiến hành qua các quy trình sau: (1) Quy trình thu thập và lưu trữ HVTT của người dùng tin trong môi trường dữ liệu lớn. (2) Quy trình phân tích, trích xuất HVTT của người dùng tin từ dữ liệu lớn tiến tới phân khúc người dùng tin. (3) Quy trình xây dựng chiến dịch marketing và sản phẩm mục tiêu hướng tới từng đối tượng người dùng tin thông qua phân tích HVTT trong môi trường dữ liệu lớn. Có thể hiểu cụ thể các quy trình đó như sau:
  10. PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM 498 3.1. Quy trình thu thập và lưu trữ HVTT của người dùng tin Trước khi phân tích HVTT của người dùng tin, trước tiên thư viện phải thu thập tất cả dữ liệu do người dùng tạo ra trong quá trình sử dụng thư viện và các dữ liệu liên quan khác có thể suy ra nhu cầu của người dùng đối với thư viện. Mục đích chính là để dự đoán những gì sẽ xảy ra trong tương lai hoặc nhu cầu tiềm năng của người dùng bằng cách biết những gì người dùng đã làm trong quá khứ. Sau đó, dữ liệu thu thập được phân loại hợp lý, định nghĩa hành vi và đối sánh nhân tạo được sử dụng để xây dựng cơ sở dữ liệu lưu trữ dữ liệu HVTT người dùng lớn với chức năng lưu trữ hàng loạt, quản lý và truy xuất hiệu quả. Trong thời đại dữ liệu lớn, phạm vi thu thập dữ liệu HVTT của người dùng tin thường là các gói dữ liệu mạng khổng lồ được tạo bởi tất cả người dùng trong vùng phủ sóng của nền tảng, tệp nhật ký được tạo bởi máy chủ, thông tin chính của người dùng và thông tin môi trường bên ngoài. Thường có hai cách thu thập dữ liệu: - Truy cập vào các tệp nhật ký máy chủ. Tệp nhật ký máy chủ thư viện có thể ghi lại tất cả các yêu cầu được máy chủ Web thu nhận: địa chỉ IP của khách hàng, thời gian đăng nhập, thời gian cư trú, trang truy cập, loại trình duyệt của người dùng,… - Việc thu được nhận thức về hành vi của người dùng tin. Nhận thức hành vi của người dùng liên quan đến sự tương tác giữa con người với con người, con người và công nghệ tương tác với nhau trên nhiều khía cạnh, những yếu tố này ảnh hưởng đến nhu cầu dịch vụ và nhận thức hành vi của người dùng. Nó có thể được chia thành bốn cấp độ: nhận thức về tư thế cơ thể cá nhân, hành động và hành vi cảm xúc khác; nhận thức về hành vi của quỹ đạo trong một chiều thời gian và chiều không gian nhất định để định vị chính xác không gian - thời gian; nhận thức về hành vi học tập, nghiên cứu khoa học, công việc và cuộc sống trong không gian vật chất và không gian ảo nhất định; nhận thức hành vi xã hội của mạng kết hợp với trạng thái tình huống của người dùng. Hiện tại, việc thu thập dữ liệu HVTT của người dùng tin chủ yếu được lấy từ việc nhấp chuột, duyệt, tìm kiếm và tải xuống máy tính hoặc
  11. VAI TRÒ CỦA VIỆC PHÂN TÍCH HÀNH VI THÔNG TIN CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG DỮ LIỆU LỚN 499 thiết bị đầu cuối di động. Với việc các thiết bị công nghệ thông minh và cảm biến ngày càng tiếp xúc gần với cơ thể con người, nhận thức hành vi của người dùng sẽ phong phú và có chiều sâu hơn. Việc tích hợp nhiều dữ liệu trong lớp dữ liệu, lớp tính năng hoặc lớp quyết định được thực hiện bằng công nghệ tương tác ba yếu tố, đó là toàn thời gian và không gian và đa kênh, để những người dùng riêng lẻ là trung tâm của các dữ liệu khác nhau bổ sung cho nhau và hoàn thiện liên tục, tăng độ tin cậy và uy tín của việc thu thập dữ liệu HVTT của người dùng tin. 3.2. Quy trình phân tích, trích xuất hành vi thông tin của người dùng tin Cái gọi là phương pháp phân tích quỹ đạo hành vi của người dùng, đề cập đến một loạt theo dõi HVTT mà người dùng tin để lại khi sử dụng các sản phẩm, dịch vụ của thư viện, theo dõi này về cơ bản phản ánh nhu cầu cốt lõi của người dùng. Trong thời đại của dữ liệu lớn, thư viện chủ yếu thông qua các quy tắc và phân tích đặc điểm lưu thông của người dùng trên trang Web và phần mềm quản trị, để tìm chế độ đường dẫn truy cập thường xuyên, tinh chỉnh đường dẫn chính của các nhóm người dùng cụ thể, dự đoán nhu cầu của người dùng, để mô tả các tính năng duyệt nhóm cụ thể,… để cung cấp dữ liệu đầu tay cho việc tối ưu hóa trang Web thư viện và điều chỉnh dịch vụ tri thức. Ví dụ: trong dữ liệu hành vi nhật ký của trang Web thư viện, thư viện phân tách theo dõi hành vi của người dùng phù hợp với nhấp chuột, duyệt, tải lên, tải xuống, đăng ký, chú thích, tin nhắn, cung cấp tài liệu,… và sau đó phân loại người dùng tin (được chia thành danh mục duyệt, danh mục tương tác,…). Dựa trên phân tích thống kê về quỹ đạo HVTT cơ bản, chúng ta có thể nhận được tổng dữ liệu của từng loại hành vi và tổng dữ liệu liên quan về HVTT của người dùng tin. Những tổng hợp dữ liệu về HVTT của người dùng tin được trích xuất ra sẽ trả lời cho các câu hỏi: Lý do người dùng tin sử dụng thư viện, tần suất sử dụng thư viện? thời điểm sử dụng thư viện, khối lượng thông tin người dùng tin tiếp cận được, thời gian quay trở lại sử dụng thư viện,… Kết quả của các phân tích HVTT này sẽ giúp thư viện phát hiện ra dữ liệu tâm lý (tính cách)
  12. PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM 500 của người dùng tin như: yêu thích, hài lòng, thận trọng, tin tưởng, tẩy chay,… Những dữ liệu về tâm lý của người sử dụng thông tin sẽ là thông tin cần thiết để thư viện phát triển các hoạt động tiếp thị, ví dụ quảng cáo đánh vào tâm lý sử dụng thư viện, đặc biệt là cơ sở để thư viện có thể tìm hiểu sâu hơn về nhu cầu, mong muốn bên trong của người sử dụng. Trong môi trường dữ liệu lớn, chỉ cần nắm bắt được nhu cầu và tâm lý của người sử dụng thì thư viện mới thực sự phát triển bền vững và có sức sống mới. Do đó, trong phân tích HVTT, thư viện cần phân tích sâu hơn thông qua việc nghiên cứu các đặc điểm của những người dùng tin tích cực nhất, chẳng hạn như các thuộc tính cơ bản, thói quen lướt Web của người dùng, nền tảng học vấn, hướng nghiên cứu, hành vi của người dùng trang Web,… thư viện phân tích đặc điểm nhóm của người dùng tích cực trang Web, để cung cấp dữ liệu quan trọng nhằm tối ưu hóa các dịch vụ thư viện. 3.3. Quy trình xây dựng chiến dịch marketing và sản phẩm mục tiêu hướng tới từng đối tượng người dùng tin Để xây dựng các chiến lược tiếp thị nhắm trúng khách hàng mục tiêu, thư viện cần phải phân khúc nhóm đối tượng người dùng tin. Sử dụng các thông tin mô tả về đặc điểm HVTT của từng nhóm đối tượng người dùng một cách hợp lý để đề xuất các quyết định phát triển. Để làm được điều này trong môi trường dữ liệu lớn, trước hết thư viện cần thu thập và phân tích dữ liệu nhân khẩu học (demographic analysis) như: độ tuổi, giới tính, trình độ, nghề nghiệp,… của người dùng tin. Sau khi thu thập và phân tích các dữ liệu nhân khẩu học thì có thể tiến hành phân khúc người dùng tin thành các nhóm khác nhau theo từng đặc điểm nhân khẩu học, ví dụ: nhóm người dùng tin là sinh viên, nhóm người dùng tin là giảng viên, nhóm người dùng tin là nhà nghiên cứu,… Bước cuối cùng là xác định các chiến dịch marketing, chiến lược sản phẩm, dịch vụ thông tin nhắm mục tiêu chính xác đến từng nhóm người dùng tin, sau đó kiểm tra xem thông tin đã thoả mãn từng nhóm người dùng tin thế nào? Nếu người dùng tin không hài lòng thì cần đưa ra giải pháp gì? Ví dụ thu thập, phân tích dữ liệu về
  13. VAI TRÒ CỦA VIỆC PHÂN TÍCH HÀNH VI THÔNG TIN CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG DỮ LIỆU LỚN 501 lượt truy cập trang Web, fanpage thư viện của người dùng tin sau khi giao dịch lần đầu để tìm hiểu khả năng họ có quay lại tìm kiếm thông tin nữa hay không. Quy trình này đóng một vai trò hết sức quan trọng bởi nếu không có chiến lược tiếp thị thông tin hiệu quả thư viện sẽ mất đi người dùng tin và cơ hội truyền thông, quảng bá hình ảnh của thư viện thông qua các chia sẻ của người dùng tin sẽ không được tạo lập. Nếu quy trình này làm tốt, thư viện sẽ xác định được kênh nào tiếp thị, truyền thông thu hút người dùng nhất; nhóm người dùng tin nào đánh giá tốt nhất về giá trị và hiệu quả sử dụng thư viện; những tính năng nào của sản phẩm, dịch vụ thư viện đem đến trải nghiệm cho người dùng tin một cách tốt nhất; người dùng tin có trung thành với các dịch vụ mà thư viện cung cấp hay không,… Trong phân tích HVTT thông qua dữ liệu lớn, thư viện có thể nhận ra mối liên hệ kiến ​​thức về thói quen sử dụng của người dùng và thói quen của người dùng khác; mối quan hệ giữa thói quen đọc của người dùng và thói quen sử dụng mạng hoặc các thuộc tính tự nhiên của người dùng như tuổi, giới tính, nghề nghiệp và thói quen sử dụng mạng đã được phân tích liên kết. Ví dụ, thông qua phân tích liên kết kiến ​​thức về dữ liệu hành vi đọc tiềm ẩn của độc giả (nhu cầu đọc, điểm hấp dẫn đọc, mức độ liên quan đến hành vi đọc, v.v.), thư viện có thể tìm ra mối quan hệ giữa các hành vi khác nhau của độc giả trong thời gian thực và thói quen đọc của độc giả và các yêu cầu dịch vụ. Dữ liệu này có tầm quan trọng lớn đối với sự phát triển của các dịch vụ cá nhân hóa và chính xác trong các thư viện. Điều này được gọi là phân tích liên kết tri thức là khám phá mức độ liên quan hoặc mối tương quan tồn tại trong một số lượng lớn các tập dữ liệu từ dữ liệu khổng lồ mô tả các quy tắc và mẫu của sự xuất hiện đồng thời của các thuộc tính nhất định trong một sự vật. KẾT LUẬN Thư viện luôn là trung tâm của việc ứng dụng công nghệ mới và thời đại dữ liệu lớn cũng không ngoại lệ. Là trung tâm cung cấp thông tin tư liệu và nguồn dữ liệu, các thư viện phải đối mặt với áp lực của những thay đổi bên trong và bên ngoài. Các thư viện phải thích ứng với yêu cầu của
  14. PHÁT TRIỂN MÔ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM 502 người dùng và cải thiện khả năng cung cấp nội dung, tính dễ sử dụng và khả năng đáp ứng của các sản phẩm, dịch vụ. Các nghiên cứu phản ánh rằng sau năm 2017, kỹ thuật phân tích dữ liệu HVTT sẽ là nhu cầu cạnh tranh cần thiết, vì vậy các thư viện cần bắt đầu thích ứng với xu hướng để tồn tại trong thị trường năng động và số hóa. Phân tích HVTT trên nền tảng dữ liệu lớn là một phương pháp phân tích dữ liệu được nghiên cứu và ứng dụng trong nhiều lĩnh vực có ứng dụng nền tảng công nghệ thông tin và truyền thông xã hội. Hay nói cách khác dữ liệu lớn là công cụ hoàn hảo để nghiên cứu HVTT của người dùng tin trong thời đại số. Tuy nhiên, kỷ nguyên dữ liệu lớn đã dẫn đến những thách thức mới cho quá trình phân tích dữ liệu HVTT tại các thư viện số. Phân tích HVTT trên nền tảng dữ liệu lớn đòi hỏi đầu tư lớn về mặt công nghệ khiến chi phí áp dụng công nghệ phân tích dữ liệu lớn không phù hợp với nhiều thư viện vừa và nhỏ. Hơn nữa các quy trình phân tích HVTT trong môi trường dữ liệu lớn cũng đặt ra những yêu cầu cao về trình độ đội ngũ cán bộ thư viện, sự am hiểu về các ứng dụng phân tích dữ liệu, khả năng hoạch định và xây dựng chiến lược tiếp thị nội dung,… bài toán này đòi hỏi các thư viện cần có sự chuẩn bị kỹ lưỡng để có thể triển khai hiệu quả quá trình phân tích HVTT trong môi trường dữ liệu lớn, đáp ứng tốt hơn những yêu cầu tin ngày càng cao của người dùng tin. TÀI LIỆU THAM KHẢO 1. Case, D. O. (2007), Looking for information: A survey of research on information seeking, needs, and behavior, San Diego: Academic Press. 2. Cristina, S. (2015), Big Data, the perfect instrument to study today’ s consumer behavior, Database Systems Journal vol. VI, no. 3/2015. 3. Danielle, C. M., Ashley C. Adiel T. A., R, V. (2019), Group Decision and Negotiation: Behavior, Models, and Support, 19th International Conference, Loughborough, UK, June 11–15, 2019, Proceedings. 4. Duy, N. A., Như, N. P. Q. (2019), Dữ liệu lớn: cách thức khai thác cơ hội từ dữ liệu? trường hợp Amazon. Truy cập tại: https://user-cdn.uef.edu.vn/ newsimg/tap-chi-uef/2019-05-06-46/9.pdf. 5. Fan, W., Li, C., Zhang, X. (2012), What kind of Big Data Do Libraries Need? Library Magazine, 2012 (11):63-68, 77.
  15. VAI TRÒ CỦA VIỆC PHÂN TÍCH HÀNH VI THÔNG TIN CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG DỮ LIỆU LỚN 503 6. Lu, J. (2014), Review and Prospect of Library Big Data Research in China, Library Journal, (1):20-25. 7. Thảo, N. T. (2014), "Nghiên cứu hành vi thông tin: thực trạng và xu hướng", Tạp chí Thư viện Việt Nam, Số 6, tr. 26-29. 8. Ying, G., (2017), Research on Library Users’ Information Behavior in Big Data Environment, 3rd International Symposium on Mechatronics and Industrial Informatics (ISMII 2017) ISBN: 978-1-60595-501-8. 9. Ying, X., Sun, J. (2014), Research on Users’ Retrieval Behavior Based on Big Data, Journal of Intelligence, (2):140-143, 176.
ADSENSE

CÓ THỂ BẠN MUỐN DOWNLOAD

 

Đồng bộ tài khoản
2=>2