RobotVN 1.0 – Lấy tin tự động từ báo VnExpress và

TuoiTre

Bạn muốn làm một website tin tức mà ko muốn mất

nhiều thời gian đi sưu tầm các bài viết từ các trang báo điện

tử, nhất là Vnexpress và TuoiTre. Plugin RobotVN sẽ giúp

bạn làm việc này một cách dễ dàng và hoàn toàn tự động.

Về tính năng và cách sử dụng mình xin trích nguyên văn

của tác giả tại website vnwebmaster.com như sau:

RobotVN có thể làm gì cho bạn

Nhiệm vụ chính của RobotVN là tổng hợp các bài viết dựa

theo những từ khóa do bạn lựa chọn và tìm kiếm các bài

viết liên quan đến các từ khóa đó từ các website và đăng lại

các bài viết đó trên website sử dụng WordPress của bạn.

Nhiều bạn cho rằng sử dụng plugin AutoBlogged cũng đáp

ứng được việc này nhưng theo mình tìm hiểu thì cơ chế lấy

tin và bài của AutoBlogged là lấy RSS và không thể lấy

được toàn bộ nội dung bài viết trừ khi phía nguồn cung cấp

Full RSS. Plugin RobotVN được sinh ra để giải quyết

chuyện đó.

RobotVN – những điểm nổi bật

Lấy tin tự động theo từ khóa và chuyên mục bạn cung

cấp. Dĩ nhiên rồi !!!

Điểm đầu tiên mình lưu ý khi thực hiện plugin này là

nhiều bạn có góp ý với mình về vấn đề ngồn resource. Do

bản chất của việc lấy tin là bóc tách và xử lý dữ liệu nên

mỗi lần bóc tách dữ liệu là mỗi lần hệ thống phải truy cập

đến site nguồn để tìm kiếm. Hiện Plugin RobotVN tiêu hao

resource ít hơn so với Plugin WPRobot khoảng một nửa.

Cập nhật và nâng cấp dễ dàng: do mình không có chủ

ý đưa plugin này lên WordPress.ORG nên việc cập nhật hệ

thống không làm thông qua WordPress.ORG. Tuy nhiên,

mỗi khi nâng cấp phiên bản, hệ thống sẽ thông báo cho bạn

ngay

Quản lý đơn giản, dễ sử dụng. Bạn hãy nhìn sreenshot

bên dưới sẽ thấy ngay.

Cách sử dụng:

1. Download RobotVN và cài đặt Plugin RobotVN

Việc cài đặt tương đối đơn giản, bạn chỉ việc active plugin

này giống như các plugin khác. Sau khi active sẽ có một

menu RobotVN để bạn quản lý.

2. Cấu hình RobotVN để sử dụng.

Cấu hình RobotVN được mô tả như hình bên dưới:

Diễn giải:

Trạng thái đăng bài viết: bạn có 2 dạng cấu hình cho

bài viết. Hoặc lưu nó ở dạng draft để biên tập lại hoặc

published bài viết mà không cần phải biên tập lại.

Reset Post Count: tự động reset lại số bài viết theo số

lượng bài viết bạn mặc định cho keyword.

Tự động random bài: cho phép bạn random bài giữa

một khoản thời gian nhất định nào đó.

Tự động tạo tag: hệ thống sẽ tự động tạo các tag theo

tiêu đề của bài viết.

Bỏ qua các tag: trường hợp có một số từ ngữ bạn

không muốn dùng làm tag, bạn có thể điền chúng vào đây.

Lúc đó, hệ thống sẽ loại bỏ các từ này khi tạo tag.

Hiển thị nguồn: đề phòng trường hợp bản quyền, bạn

có thể lựa chọn đăng nguồn bài viết (link gốc) hay không.

Hiển thị nguồn dạng liên kết: bạn có 2 cách hiển thị

nguồn. Hoặc text đơn giản hoặc chèn thêm liên kết vào

nguồn.

Sử dụng mặc định: Mình đã cấu hình sẵn phần mặc

định, trong trường hợp cần reset lại cấu hình theo cấu hình

mặc định, bạn có thể nhấn vào nút này để reset lại cấu hình.

3. Thêm từ khóa

Hình dưới đây mô tả khung bổ sung keyword:

Bạn cần chọn các thiết lập cần thiết cho từ khóa của mình

như keyword, thời gian đăng, category sẽ chứa bài viết,

nguồn bài viết, lấy từ danh mục nào. Những giá trị này sẽ

quyết định giải thuật tìm kiếm của RobotVN khi kết nối với

trang nguồn. Phần này mình sẽ không giải thích vì tương

đối rõ ràng.

4. Danh sách các keyword đã thêm

Danh sách các keyword bạn đã cho phép lấy. Danh sách sẽ

cho bạn thấy các keyword đã được dùng để tìm kiếm cùng

với số bài viết mà RobotVN đã tìm kiếm và bổ sung cho

các keyword này. Bạn có thể xóa hoặc sửa chữa các

keyword này nếu muốn.

Ngoài ra, bạn có thể đăng bài ngay cho các keyword đã

chọn bằng cách chọn các keyword cần đăng bài rồi click

vào nút Đăng bài ngay. Nếu không, đúng thời điểm đăng

bài tiếp theo hệ thống mới tự đăng bài.

5. Cập nhật phiên bản

Phần thông tin này sẽ giúp bạn cập nhật phiên bản dễ dàng

hơn do có liên kết với version từ hệ thống. Khi RobotVN

có phiên bản mới, hệ thống sẽ hiển thị phiên bản mới để

nhắc nhở bạn cập nhật.

6. Tối ưu hóa RobotVN

Nhiều bạn cho mình biết tình trạng ngốn resource của hệ

thống. Đó là do các bạn chưa tìm được cách tối ưu hóa

keyword. Bạn cứ tưởng tượng hệ thống của bạn gồm 10

keyword cùng hoạt động và lấy tin vào cùng một thời điểm

thì thử hỏi tại sao không hệ thống không ngốn resource cho

được

Bạn hãy chia nhỏ thời điểm lấy tin sao cho các thời điểm

lấy tin rải đều trong ngày và tối ưu hóa sao cho keyword

chính xác nhất nhu cầu của mình để hạn chế các bài viết

không đúng với nhu cầu.

Thêm vào đó, mình nghĩ trong giai đoạn thử nghiệm nên

cấu hình bài viết ở dạng draft sẽ thuận tiện hơn để chỉnh

sửa và biên tập