RobotVN 1.0 – Lấy tin tự động từ báo VnExpress và
TuoiTre
Bạn muốn làm một website tin tức mà ko muốn mất
nhiều thời gian đi sưu tầm các bài viết từ các trang báo điện
tử, nhất là Vnexpress và TuoiTre. Plugin RobotVN sẽ giúp
bạn làm việc này một cách dễ dàng và hoàn toàn tự động.
Về tính năng và cách sử dụng mình xin trích nguyên văn
của tác giả tại website vnwebmaster.com như sau:
RobotVN có thể làm gì cho bạn
Nhiệm vụ chính của RobotVN là tổng hợp các bài viết dựa
theo những từ khóa do bạn lựa chọn và tìm kiếm các bài
viết liên quan đến các từ khóa đó từ các website và đăng lại
các bài viết đó trên website sử dụng WordPress của bạn.
Nhiều bạn cho rằng sử dụng plugin AutoBlogged cũng đáp
ứng được việc này nhưng theo mình tìm hiểu thì cơ chế lấy
tin và bài của AutoBlogged là lấy RSS và không thể lấy
được toàn bộ nội dung bài viết trừ khi phía nguồn cung cấp
Full RSS. Plugin RobotVN được sinh ra để giải quyết
chuyện đó.
RobotVN – những điểm nổi bật
•
Lấy tin tự động theo từ khóa và chuyên mục bạn cung
cấp. Dĩ nhiên rồi !!!
•
Điểm đầu tiên mình lưu ý khi thực hiện plugin này là
nhiều bạn có góp ý với mình về vấn đề ngồn resource. Do
bản chất của việc lấy tin là bóc tách và xử lý dữ liệu nên
mỗi lần bóc tách dữ liệu là mỗi lần hệ thống phải truy cập
đến site nguồn để tìm kiếm. Hiện Plugin RobotVN tiêu hao
resource ít hơn so với Plugin WPRobot khoảng một nửa.
•
Cập nhật và nâng cấp dễ dàng: do mình không có chủ
ý đưa plugin này lên WordPress.ORG nên việc cập nhật hệ
thống không làm thông qua WordPress.ORG. Tuy nhiên,
mỗi khi nâng cấp phiên bản, hệ thống sẽ thông báo cho bạn
ngay
•
Quản lý đơn giản, dễ sử dụng. Bạn hãy nhìn sreenshot
bên dưới sẽ thấy ngay.
Cách sử dụng:
1. Download RobotVN và cài đặt Plugin RobotVN
Việc cài đặt tương đối đơn giản, bạn chỉ việc active plugin
này giống như các plugin khác. Sau khi active sẽ có một
menu RobotVN để bạn quản lý.
2. Cấu hình RobotVN để sử dụng.
Cấu hình RobotVN được mô tả như hình bên dưới:
Diễn giải:
•
Trạng thái đăng bài viết: bạn có 2 dạng cấu hình cho
bài viết. Hoặc lưu nó ở dạng draft để biên tập lại hoặc
published bài viết mà không cần phải biên tập lại.
•
Reset Post Count: tự động reset lại số bài viết theo số
lượng bài viết bạn mặc định cho keyword.
•
Tự động random bài: cho phép bạn random bài giữa
một khoản thời gian nhất định nào đó.
•
Tự động tạo tag: hệ thống sẽ tự động tạo các tag theo
tiêu đề của bài viết.
•
Bỏ qua các tag: trường hợp có một số từ ngữ bạn
không muốn dùng làm tag, bạn có thể điền chúng vào đây.
Lúc đó, hệ thống sẽ loại bỏ các từ này khi tạo tag.
•
Hiển thị nguồn: đề phòng trường hợp bản quyền, bạn
có thể lựa chọn đăng nguồn bài viết (link gốc) hay không.
•
Hiển thị nguồn dạng liên kết: bạn có 2 cách hiển thị
nguồn. Hoặc text đơn giản hoặc chèn thêm liên kết vào
nguồn.
•
Sử dụng mặc định: Mình đã cấu hình sẵn phần mặc
định, trong trường hợp cần reset lại cấu hình theo cấu hình
mặc định, bạn có thể nhấn vào nút này để reset lại cấu hình.
3. Thêm từ khóa
Hình dưới đây mô tả khung bổ sung keyword:
Bạn cần chọn các thiết lập cần thiết cho từ khóa của mình
như keyword, thời gian đăng, category sẽ chứa bài viết,
nguồn bài viết, lấy từ danh mục nào. Những giá trị này sẽ
quyết định giải thuật tìm kiếm của RobotVN khi kết nối với
trang nguồn. Phần này mình sẽ không giải thích vì tương
đối rõ ràng.
4. Danh sách các keyword đã thêm
Danh sách các keyword bạn đã cho phép lấy. Danh sách sẽ
cho bạn thấy các keyword đã được dùng để tìm kiếm cùng
với số bài viết mà RobotVN đã tìm kiếm và bổ sung cho
các keyword này. Bạn có thể xóa hoặc sửa chữa các
keyword này nếu muốn.
Ngoài ra, bạn có thể đăng bài ngay cho các keyword đã
chọn bằng cách chọn các keyword cần đăng bài rồi click
vào nút Đăng bài ngay. Nếu không, đúng thời điểm đăng
bài tiếp theo hệ thống mới tự đăng bài.
5. Cập nhật phiên bản
Phần thông tin này sẽ giúp bạn cập nhật phiên bản dễ dàng
hơn do có liên kết với version từ hệ thống. Khi RobotVN
có phiên bản mới, hệ thống sẽ hiển thị phiên bản mới để
nhắc nhở bạn cập nhật.
6. Tối ưu hóa RobotVN
Nhiều bạn cho mình biết tình trạng ngốn resource của hệ
thống. Đó là do các bạn chưa tìm được cách tối ưu hóa
keyword. Bạn cứ tưởng tượng hệ thống của bạn gồm 10
keyword cùng hoạt động và lấy tin vào cùng một thời điểm
thì thử hỏi tại sao không hệ thống không ngốn resource cho
được
Bạn hãy chia nhỏ thời điểm lấy tin sao cho các thời điểm
lấy tin rải đều trong ngày và tối ưu hóa sao cho keyword
chính xác nhất nhu cầu của mình để hạn chế các bài viết
không đúng với nhu cầu.
Thêm vào đó, mình nghĩ trong giai đoạn thử nghiệm nên
cấu hình bài viết ở dạng draft sẽ thuận tiện hơn để chỉnh
sửa và biên tập