WordPress Content Crawler là một plugin WordPress có thể thu thập nội dung từ hầu hết các trang web hiện có trên Internet. Bạn có thể sử dụng plugin này để tạo một trang web cá nhân tổng hợp tin tức, bài viết, sản phẩm, ảnh, video, game, hoặc bất cứ nội dung nào bạn quan tâm từ các nguồn khác nhau. Bạn cũng có thể sử dụng plugin này để kiếm tiền từ các chương trình liên kết hoặc tạo một môi trường thử nghiệm cho plugin hoặc theme của bạn.
WordPress Content Crawler có nhiều tính năng hữu ích cho bạn để thu thập và quản lý nội dung từ các trang web khác. Dưới đây là một số tính năng nổi bật của plugin:
Ngoài ra, plugin còn có nhiều tính năng khác như: advanced text manipulations, save videos and audios, save games and iframes, save custom post meta and taxonomies, use proxies and cookies, use templates and categories, use formulas and filters, use notifications and logs, và nhiều hơn nữa.
Thời gian cần thiết: 5 phút
Để sử dụng WordPress Content Crawler, bạn cần làm theo các bước sau:
Một site setting là một bộ cấu hình cho một trang web nguồn mà bạn muốn thu thập nội dung từ đó. Bạn có thể tạo nhiều site setting khác nhau cho nhiều trang web nguồn khác nhau.
Để tạo một site setting mới, bạn nhấp vào menu WP Content Crawler > Add New. Bạn sẽ thấy một giao diện giống như khi bạn tạo một bài viết mới. Bạn nhập tên của site setting vào ô Enter title here. Tên này chỉ dùng để phân biệt các site setting với nhau và không ảnh hưởng đến nội dung của bài viết.
Sau khi nhập tên, bạn nhấp vào Publish để lưu site setting. Bạn sẽ thấy một số tab hiện ra bên dưới ô tiêu đề. Mỗi tab chứa các tùy chọn cấu hình cho site setting. Bạn cần điền các thông tin cần thiết vào các tab này để plugin có thể thu thập nội dung từ trang web:
– Tab Main: Tab này chứa các thông tin cơ bản về trang web nguồn, như URL, tiêu đề, favicon, và các thông tin khác. Bạn cần điền ít nhất URL của trang web nguồn vào ô Main URL. Bạn cũng có thể điền các thông tin khác nếu bạn muốn. Bạn có thể sử dụng các short code để hiển thị các thông tin này trong bài viết.
– Tab Category URLs: Tab này cho phép bạn nhập các URL của các trang chuyên mục mà bạn muốn thu thập bài viết từ đó. Bạn có thể nhập nhiều URL, mỗi URL trên một dòng. Bạn cũng có thể sử dụng các ký tự đại diện (*, ?, [abc], [a-z], etc.) để nhập các URL một cách nhanh chóng. Ví dụ: https://example.com/category/[a-z]+ sẽ tương ứng với tất cả các URL có dạng https://example.com/category/xyz, trong đó xyz là bất kỳ chuỗi nào chỉ chứa các ký tự từ a đến z.
– Tab Post URLs: Tab này cho phép bạn nhập các URL của các bài viết cụ thể mà bạn muốn thu thập. Bạn có thể nhập nhiều URL, mỗi URL trên một dòng. Bạn cũng có thể sử dụng các ký tự đại diện như ở tab Category URLs. Ngoài ra, bạn cũng có thể sử dụng CSS selector để tìm các URL của bài viết trong trang web nguồn. Bạn chỉ cần nhập CSS selector vào ô Post URL selectors và plugin sẽ tìm và lấy các URL tương ứng.
– Tab Post: Tab này cho phép bạn cấu hình các thông tin về bài viết, như tiêu đề, nội dung, hình ảnh đại diện, ngày đăng, tác giả, thẻ, danh mục, và nhiều hơn nữa. Bạn cần sử dụng CSS selector để chỉ định phần tử chứa thông tin cần lấy trong trang web nguồn. Bạn có thể sử dụng Visual Inspector để tìm CSS selector một cách dễ dàng. Bạn cũng có thể sử dụng các tùy chọn khác như find and replace, manipulate HTML, advanced text manipulations để chỉnh sửa nội dung theo ý muốn.
– Tab Templates: Tab này cho phép bạn thiết lập mẫu cho bài viết. Bạn có thể sử dụng các short code để đặt bất kỳ thông tin nào từ trang web nguồn vào bài viết của bạn. Bạn có thể thiết lập mẫu cho tiêu đề, nội dung, và phần cuối bài viết. Bạn cũng có thể thiết lập mẫu cho từng danh mục hoặc từng bài viết riêng biệt.
– Tab General Settings: Tab này cho phép bạn thiết lập các tùy chọn chung cho site setting, như số lượng bài viết tối đa, khoảng thời gian giữa các lần lưu hoặc cập nhật bài viết, trạng thái của bài viết khi được lưu, loại bài viết (post, page, product, etc.), và nhiều hơn nữa.
– Tab Advanced Settings: Tab này cho phép bạn thiết lập các tùy chọn nâng cao cho site setting, như sử dụng proxy hoặc cookie để truy cập trang web nguồn, sử dụng công thức hoặc lệnh lọc để xử lý nội dung, sử dụng thông báo hoặc nhật ký để theo dõi quá trình thu thập nội dung, và nhiều hơn nữa.
Sau khi điền các thông tin cần thiết vào các tab, bạn nhấp vào Update để lưu lại site setting. Bạn có thể tạo nhiều site setting khác nhau cho nhiều trang web nguồn khác nhau.
Kiểm tra kết quả của site setting, bạn có thể sử dụng các công cụ sau:
Quick Test: Bạn có thể nhấp vào biểu tượng kính lúp ở bên cạnh mỗi tùy chọn để kiểm tra kết quả của tùy chọn đó. Bạn có thể kiểm tra CSS selector, find and replace, formula, filter, và nhiều hơn nữa. Bạn cũng có thể bật chế độ cache để làm cho việc kiểm tra nhanh hơn.
Warnings: Bạn có thể nhìn vào biểu tượng cảnh báo màu đỏ ở bên cạnh mỗi tùy chọn để xem có lỗi gì không. Nếu có lỗi, bạn sẽ thấy một thông báo giải thích lỗi đó và cách khắc phục.
Site Tester: Bạn có thể nhấp vào menu WP Content Crawler > Site Tester để kiểm tra toàn bộ site setting. Bạn chỉ cần nhập một URL của một trang chuyên mục hoặc một bài viết trong trang web nguồn và nhấp vào Test. Bạn sẽ thấy kết quả của việc thu thập nội dung từ URL đó theo site setting của bạn.
Để khắc phục các lỗi thường gặp khi sử dụng plugin, bạn có thể tham khảo các hướng dẫn sau:
WordPress Content Crawler có một số yêu cầu như sau:
– WordPress phiên bản 4.8 hoặc cao hơn
– PHP phiên bản 7.0 hoặc cao hơn
– WP-Cron hoạt động bình thường
– Một license code hợp lệ
WordPress Content Crawler có thể thu thập nội dung từ hầu hết các trang web hiện có trên Internet, miễn là chúng có cấu trúc HTML rõ ràng và không sử dụng JavaScript quá nhiều để tạo nội dung động.
Tuy nhiên, bạn cũng cần kiểm tra kỹ các điều khoản và điều kiện của các trang web nguồn trước khi sử dụng plugin và tôn trọng quyền sở hữu của họ. Nếu bạn không chắc chắn plugin có thể thu thập nội dung từ một trang web cụ thể hay không, bạn có thể hỏi chúng tôi trong phần bình luận của plugin.
WordPress Content Crawler cũng có nhiều tính năng hữu ích để bạn có thể điều chỉnh và quản lý nội dung theo ý muốn. Bạn có thể sử dụng Visual Inspector để tìm CSS selector một cách dễ dàng, sử dụng manipulate HTML để thay đổi HTML của trang web nguồn, sử dụng find and replace để tìm và thay thế bất kỳ chuỗi nào trong nội dung, sử dụng short code để đặt bất kỳ thông tin nào ở bất kỳ đâu trong bài viết, sử dụng save images để lưu các hình ảnh từ trang web nguồn, và nhiều hơn nữa.
Tuy nhiên, WordPress Content Crawler cũng có một số điểm yếu mà bạn cần lưu ý khi sử dụng. Một số điểm yếu là:
Ngoài WordPress Content Crawler, bạn cũng có thể tham khảo một số plugin tương tự hoặc bổ sung cho plugin này như:
WordPress Content Crawler là một plugin WordPress đáng để bạn thử nghiệm nếu bạn muốn thu thập nội dung từ các trang web khác vào trang web của bạn. Plugin này có nhiều tính năng mạnh mẽ và linh hoạt để bạn có thể điều chỉnh và quản lý nội dung theo ý muốn. Tuy nhiên, bạn cũng cần lưu ý một số điểm yếu và rủi ro khi sử dụng plugin này. Bạn cũng có thể tham khảo một số plugin tương tự hoặc bổ sung cho plugin này để có thêm lựa chọn cho nhu cầu của bạn. Chúc bạn thành công với WordPress Content Crawler!