Ultimate Reference

OpenClaw CLI: Hướng Dẫn Toàn Diện

Công cụ AI mạnh mẽ cho Web Scraping & Tự Động Hóa Dữ Liệu

1. Cài Đặt & Khởi Tạo

openclaw install
Copied!

Cài đặt công cụ OpenClaw CLI trên hệ thống của bạn. Đảm bảo bạn có Node.js hoặc Python đã cài đặt.

Sử dụng `--global` nếu cần cài đặt cho toàn bộ hệ thống.

openclaw init
Copied!

Khởi tạo một dự án OpenClaw mới với cấu trúc thư mục và tệp cấu hình cơ bản.

Đặt tên dự án rõ ràng để dễ quản lý các tác vụ scraping khác nhau.

openclaw login
Copied!

Đăng nhập vào tài khoản OpenClaw của bạn để truy cập các tính năng cao cấp và đồng bộ hóa đám mây.

Sử dụng token API nếu bạn đang tự động hóa trong môi trường CI/CD.

openclaw config set
Copied!

Thiết lập hoặc cập nhật các tùy chọn cấu hình cho dự án hiện tại hoặc toàn cục.

Cấu hình proxy mặc định hoặc thông tin xác thực API tại đây.

2. Điều Hướng & Chọn Lọc

openclaw visit
Copied!

Truy cập một URL cụ thể. Đây là bước đầu tiên để bắt đầu scraping một trang web.

Sử dụng URL đầy đủ bao gồm giao thức (http/https).

openclaw find
Copied!

Tìm kiếm các phần tử trên trang web bằng bộ chọn CSS. Trả về danh sách các phần tử khớp.

Sử dụng các công cụ nhà phát triển của trình duyệt để tìm bộ chọn CSS chính xác.

openclaw find --xpath
Copied!

Tìm kiếm các phần tử bằng biểu thức XPath, hữu ích cho các cấu trúc phức tạp hoặc khi CSS không đủ.

XPath mạnh mẽ hơn cho các trường hợp đặc biệt nhưng có thể khó viết hơn.

openclaw click
Copied!

Thực hiện hành động nhấp chuột vào phần tử được chỉ định bởi bộ chọn.

Sử dụng lệnh này để tương tác với nút, liên kết hoặc các phần tử tương tác khác.

openclaw scroll
Copied!

Cuộn trang theo hướng chỉ định (ví dụ: 'down', 'up', 'bottom', 'top') để tải nội dung động.

Cuộn xuống đáy trang thường cần thiết cho các trang web tải vô hạn (infinite scroll).

3. Trích Xuất Dữ Liệu

openclaw extract text
Copied!

Trích xuất văn bản hiển thị từ phần tử được chọn.

Sử dụng kết hợp với `find` để nhắm mục tiêu chính xác.

openclaw extract attr
Copied!

Trích xuất giá trị của một thuộc tính HTML (ví dụ: 'href', 'src', 'alt') từ phần tử được chọn.

Rất hữu ích để lấy URL hình ảnh hoặc liên kết.

openclaw extract image --save-to
Copied!

Trích xuất và tải xuống hình ảnh từ các phần tử được chọn, lưu vào đường dẫn cục bộ.

Tạo một thư mục riêng để lưu trữ hình ảnh đã tải xuống.

openclaw extract table --format
Copied!

Trích xuất toàn bộ bảng HTML thành định dạng CSV hoặc JSON.

Đảm bảo bộ chọn nhắm mục tiêu đúng thẻ `

`.

openclaw extract ai --context
Copied!

Sử dụng AI để trích xuất thông tin cụ thể dựa trên một lời nhắc (prompt) từ ngữ cảnh được chọn.

Lời nhắc càng chi tiết, kết quả trích xuất của AI càng chính xác.

4. Tương Tác Nâng Cao

openclaw type
Copied!

Nhập văn bản vào trường nhập liệu hoặc textarea được chỉ định bởi bộ chọn.

Có thể mô phỏng nhập liệu người dùng vào các biểu mẫu.

openclaw submit
Copied!

Gửi một biểu mẫu HTML. Bộ chọn có thể là biểu mẫu hoặc nút gửi của biểu mẫu.

Sử dụng sau khi đã điền đầy đủ thông tin vào biểu mẫu.

openclaw wait --timeout
Copied!

Chờ đợi một phần tử xuất hiện trên trang trước khi tiếp tục các lệnh khác.

Thiết lập thời gian chờ hợp lý để tránh lỗi do tải trang chậm.

openclaw screenshot
Copied!

Chụp ảnh màn hình của trang web hiện tại và lưu vào tệp.

Hữu ích cho gỡ lỗi hoặc ghi lại trạng thái trang.

openclaw evaluate "JS_CODE"
Copied!

Thực thi đoạn mã JavaScript tùy chỉnh trong ngữ cảnh của trình duyệt.

Sử dụng để tương tác với các hàm JavaScript hoặc lấy dữ liệu từ biến JS.

openclaw proxy use
Copied!

Cấu hình OpenClaw sử dụng một máy chủ proxy cho tất cả các yêu cầu mạng.

Quan trọng để tránh bị chặn IP khi thực hiện scraping quy mô lớn.

5. Quản Lý & Xuất Dữ Liệu

openclaw export json
Copied!

Xuất tất cả dữ liệu đã trích xuất trong phiên hiện tại sang tệp JSON.

Đảm bảo dữ liệu có cấu trúc tốt để dễ dàng phân tích cú pháp JSON.

openclaw export csv
Copied!

Xuất tất cả dữ liệu đã trích xuất sang định dạng CSV, phù hợp cho bảng tính.

Kiểm tra mã hóa (encoding) tệp CSV để tránh lỗi hiển thị ký tự đặc biệt.

openclaw export db
Copied!

Xuất dữ liệu trực tiếp vào cơ sở dữ liệu (ví dụ: MySQL, PostgreSQL, MongoDB) thông qua chuỗi kết nối.

Đảm bảo bạn có quyền ghi vào cơ sở dữ liệu được chỉ định.

openclaw data view
Copied!

Hiển thị dữ liệu đã được OpenClaw trích xuất trong phiên hiện tại trên terminal.

Hữu ích để kiểm tra nhanh dữ liệu trước khi xuất.

openclaw data clear
Copied!

Xóa tất cả dữ liệu tạm thời đã được trích xuất trong phiên hiện tại.

Thực hiện sau khi đã xuất dữ liệu thành công hoặc khi bắt đầu một tác vụ mới.

6. Tối Ưu Hóa & Gỡ Lỗi

openclaw debug on
Copied!

Bật chế độ gỡ lỗi để nhận thông tin chi tiết hơn về các hành động và lỗi của OpenClaw.

Sử dụng khi gặp sự cố để tìm ra nguyên nhân gốc rễ.

openclaw log level
Copied!

Thiết lập cấp độ ghi nhật ký cho đầu ra của OpenClaw.

Đặt 'error' để chỉ xem các thông báo lỗi quan trọng.

openclaw profile run
Copied!

Chạy một script OpenClaw và thu thập dữ liệu hiệu suất để tối ưu hóa.

Phân tích báo cáo hiệu suất để xác định các điểm nghẽn.

openclaw dry-run
Copied!

Chạy thử một script mà không thực sự lưu trữ hoặc xuất dữ liệu.

Kiểm tra logic script trước khi chạy chính thức để tránh sai sót.

openclaw retry --attempts
Copied!

Thực hiện lại một lệnh cụ thể nếu nó thất bại, với số lần thử lại tối đa.

Hữu ích cho các yêu cầu mạng không ổn định hoặc lỗi tạm thời.

openclaw headless off
Copied!

Tắt chế độ headless của trình duyệt, cho phép bạn xem trình duyệt thực thi các lệnh.

Tuyệt vời để gỡ lỗi trực quan và hiểu cách OpenClaw tương tác với trang.

Câu Hỏi Thường Gặp về OpenClaw CLI

OpenClaw là gì?

OpenClaw là một công cụ dòng lệnh (CLI) tiên tiến sử dụng AI để tự động hóa quá trình web scraping và trích xuất dữ liệu từ các trang web.

Làm thế nào để cài đặt OpenClaw?

Bạn có thể cài đặt OpenClaw bằng lệnh `openclaw install`. Hãy đảm bảo bạn có môi trường Node.js hoặc Python (tùy thuộc vào phiên bản OpenClaw) đã được thiết lập.

OpenClaw có hỗ trợ JavaScript không?

Có, OpenClaw có khả năng thực thi JavaScript trực tiếp trên trang web thông qua lệnh `openclaw evaluate "JS_CODE"`, cho phép tương tác với các nội dung động.

Làm thế nào để trích xuất dữ liệu từ các trang web có cấu trúc phức tạp?

OpenClaw cung cấp các bộ chọn mạnh mẽ như CSS và XPath, cùng với khả năng trích xuất thông minh bằng AI (`openclaw extract ai`) để xử lý các cấu trúc phức tạp một cách hiệu quả.

2026 © Bản quyền © 2023 OpenClaw. Tất cả quyền được bảo lưu. Hướng dẫn này chỉ mang tính chất tham khảo.

© 2026 TENZAA.com