1. Cài Đặt & Khởi Tạo
openclaw install
Cài đặt công cụ OpenClaw CLI trên hệ thống của bạn. Đảm bảo bạn có Node.js hoặc Python đã cài đặt.
Sử dụng `--global` nếu cần cài đặt cho toàn bộ hệ thống.
openclaw init
Khởi tạo một dự án OpenClaw mới với cấu trúc thư mục và tệp cấu hình cơ bản.
Đặt tên dự án rõ ràng để dễ quản lý các tác vụ scraping khác nhau.
openclaw login
Đăng nhập vào tài khoản OpenClaw của bạn để truy cập các tính năng cao cấp và đồng bộ hóa đám mây.
Sử dụng token API nếu bạn đang tự động hóa trong môi trường CI/CD.
openclaw config set
Thiết lập hoặc cập nhật các tùy chọn cấu hình cho dự án hiện tại hoặc toàn cục.
Cấu hình proxy mặc định hoặc thông tin xác thực API tại đây.
2. Điều Hướng & Chọn Lọc
openclaw visit
Truy cập một URL cụ thể. Đây là bước đầu tiên để bắt đầu scraping một trang web.
Sử dụng URL đầy đủ bao gồm giao thức (http/https).
openclaw find
Tìm kiếm các phần tử trên trang web bằng bộ chọn CSS. Trả về danh sách các phần tử khớp.
Sử dụng các công cụ nhà phát triển của trình duyệt để tìm bộ chọn CSS chính xác.
openclaw find --xpath
Tìm kiếm các phần tử bằng biểu thức XPath, hữu ích cho các cấu trúc phức tạp hoặc khi CSS không đủ.
XPath mạnh mẽ hơn cho các trường hợp đặc biệt nhưng có thể khó viết hơn.
openclaw click
Thực hiện hành động nhấp chuột vào phần tử được chỉ định bởi bộ chọn.
Sử dụng lệnh này để tương tác với nút, liên kết hoặc các phần tử tương tác khác.
openclaw scroll
Cuộn trang theo hướng chỉ định (ví dụ: 'down', 'up', 'bottom', 'top') để tải nội dung động.
Cuộn xuống đáy trang thường cần thiết cho các trang web tải vô hạn (infinite scroll).
3. Trích Xuất Dữ Liệu
openclaw extract text
Trích xuất văn bản hiển thị từ phần tử được chọn.
Sử dụng kết hợp với `find` để nhắm mục tiêu chính xác.
openclaw extract attr
Trích xuất giá trị của một thuộc tính HTML (ví dụ: 'href', 'src', 'alt') từ phần tử được chọn.
Rất hữu ích để lấy URL hình ảnh hoặc liên kết.
openclaw extract image --save-to
Trích xuất và tải xuống hình ảnh từ các phần tử được chọn, lưu vào đường dẫn cục bộ.
Tạo một thư mục riêng để lưu trữ hình ảnh đã tải xuống.
openclaw extract table --format
Trích xuất toàn bộ bảng HTML thành định dạng CSV hoặc JSON.
Đảm bảo bộ chọn nhắm mục tiêu đúng thẻ `