Permulaan & Konfigurasi Asas
openclaw --version
Semak versi OpenClaw CLI yang sedang dipasang pada sistem anda.
Pastikan anda menggunakan versi terkini untuk ciri dan pembetulan pepijat terbaik.
openclaw init
Sediakan projek OpenClaw baharu dalam direktori semasa, menjana fail konfigurasi dan struktur asas.
Jalankan ini di permulaan setiap projek scraping baharu untuk organisasi yang lebih baik.
openclaw config set
Tetapkan nilai konfigurasi global atau projek (cth. `openclaw config set user.agent 'MyScraper/1.0'`).
Gunakan ini untuk menyesuaikan tingkah laku OpenClaw seperti agen pengguna atau had kadar.
openclaw config get
Dapatkan nilai konfigurasi yang disimpan untuk kunci yang diberikan.
Berguna untuk mengesahkan tetapan semasa anda atau mencari nilai yang telah anda tetapkan.
openclaw login
Log masuk ke perkhidmatan web yang disokong secara interaktif untuk menyimpan kuki autentikasi.
Sangat berguna untuk mengakses laman web yang memerlukan log masuk sebelum scraping.
Web Scraping Asas
openclaw scrape
Lakukan scraping asas pada URL yang diberikan, mengambil kandungan HTML penuh.
Perintah permulaan yang baik untuk melihat apa yang dapat diambil dari suatu halaman.
openclaw fetch --selector "css|xpath"
Ambil kandungan dari URL dan tapis serta ekstrak elemen menggunakan pemilih CSS atau XPath.
Gunakan ini untuk mengambil bahagian tertentu dari halaman dan bukannya keseluruhan halaman.
openclaw crawl --depth
Mula merangkak dari URL permulaan, mengikuti pautan hingga kedalaman tertentu.
Berhati-hati dengan kedalaman tinggi kerana ia boleh menjana banyak permintaan.
openclaw browse
Buka pelayar tanpa kepala (headless browser) untuk interaksi manual, debugging, atau melihat halaman seperti pengguna sebenar.
Penting untuk debugging visual dan memahami bagaimana JavaScript memuatkan kandungan.
openclaw follow --links "css|xpath"
Ikut pautan tertentu dari URL dan teruskan proses scraping pada setiap pautan yang ditemui.
Sesuai untuk menavigasi halaman paginasi atau senarai item.
Pengekstrakan & Penapisan Data
openclaw extract --json '{ "title": "h1", "price": ".product-price" }'
Ekstrak data berstruktur dari URL menggunakan peta JSON pemilih CSS atau XPath.
Tentukan struktur output yang anda inginkan terus dalam perintah.
openclaw filter --input --query "jq_expression"
Tapis dan ubah data JSON dari fail menggunakan ekspresi JQ yang berkuasa.
JQ sangat fleksibel untuk manipulasi data JSON selepas scraping.
openclaw parse --selector "css_selector" --attribute "text|href"
Huraikan fail HTML tempatan dan ekstrak elemen tertentu berdasarkan pemilih dan atribut.
Berguna untuk memproses fail HTML yang telah disimpan secara tempatan.
openclaw list --item-selector ".product" --data '{ "name": ".name", "url": "a@href" }'
Ekstrak senarai item dari halaman, setiap satu dengan struktur data yang ditentukan.
Ideal untuk mengekstrak produk dari halaman kategori atau senarai blog.
openclaw regex --pattern ""
Ekstrak data menggunakan corak regex dari kandungan halaman URL yang diberikan.
Gunakan regex untuk pola data yang tidak dapat ditangkap dengan mudah oleh pemilih CSS/XPath.
Pengurusan Sesi & Interaksi
openclaw session new --name
Mula sesi baharu untuk mengekalkan kuki, penyimpanan tempatan, dan keadaan pelayar antara permintaan.
Gunakan ini apabila anda perlu mengekalkan keadaan log masuk atau sesi pengguna.
openclaw session use
Gunakan sesi yang sedia ada untuk perintah OpenClaw seterusnya, memuatkan kembali keadaan sesi.
Membolehkan anda menyambung semula kerja atau melakukan beberapa operasi dalam sesi yang sama.
openclaw form fill --data '{"#username": "user", "#password": "pass"}' --submit "#submit-btn"
Isi medan borang dan hantar borang pada URL yang diberikan.
Sangat berkesan untuk log masuk automatik atau mengisi borang carian.
openclaw click --selector "#button-id"
Simulasi klik pada elemen yang ditentukan (cth. butang, pautan) pada halaman.
Berguna untuk mencetuskan tindakan JavaScript atau menavigasi halaman secara interaktif.
openclaw wait --for-selector ".loaded-content"
Muat URL dan tunggu sehingga elemen tertentu muncul sebelum meneruskan, berguna untuk halaman dinamik.
Penting untuk scraping laman web yang memuatkan kandungan secara asynchronous (AJAX).
Automasi & Aliran Kerja
openclaw macro record
Mula merekod urutan tindakan pelayar untuk makro yang boleh dimainkan semula.
Rekod proses manual sekali dan mainkan semula berkali-kali untuk automasi.
openclaw macro run
Jalankan makro yang telah direkodkan sebelum ini.
Automasi tugas berulang dengan menjalankan makro yang telah anda cipta.
openclaw schedule add --name --interval "hourly" --cmd "openclaw scrape "
Tambah tugas berjadual untuk menjalankan perintah OpenClaw secara berkala.
Ideal untuk memantau perubahan laman web atau mengumpul data secara berterusan.
openclaw pipeline create --steps 'scrape,extract,export'
Buat saluran paip (pipeline) automasi yang menggabungkan beberapa langkah OpenClaw.
Susun aliran kerja scraping kompleks menjadi langkah-langkah yang boleh diurus.
openclaw run
Jalankan skrip OpenClaw tersuai yang ditulis dalam JavaScript untuk automasi yang lebih kompleks.
Untuk logik scraping yang sangat khusus atau integrasi dengan API lain.
Debugging & Eksport Data
openclaw debug --show-browser
Muat URL dalam pelayar tanpa kepala dan biarkan ia dibuka untuk debugging visual dan interaksi.
Alat yang tidak ternilai untuk memahami tingkah laku laman web dan memilih pemilih yang betul.
openclaw logs --level "error"
Paparkan log OpenClaw dengan tahap tertentu (cth. info, warn, error) untuk mencari masalah.
Semak log untuk diagnosis masalah scraping atau ralat konfigurasi.
openclaw export --format "csv" --input --output
Eksport data dari fail JSON ke format lain seperti CSV, XLSX, atau SQL.
Ubahkan data yang diekstrak ke format yang sesuai untuk analisis atau penyimpanan.
openclaw validate --data
Sahkan struktur dan jenis data dalam fail input JSON terhadap skema JSON yang diberikan.
Pastikan data yang diekstrak mematuhi format yang dijangka.
openclaw report generate --type "summary" --input
Jana laporan ringkasan atau laporan lain dari hasil scraping.
Dapatkan gambaran keseluruhan pantas tentang operasi scraping anda.