Rujukan Ultimate

OpenClaw CLI Cheat Sheet: Panduan Ultimate untuk Web Scraping & Automasi Data

Kuasai OpenClaw dengan perintah-perintah penting dalam Bahasa Melayu. Rujukan pantas untuk pengekstrakan data yang cekap dan automasi tugas web.

Permulaan & Konfigurasi Asas

openclaw --version
Copied!

Semak versi OpenClaw CLI yang sedang dipasang pada sistem anda.

Pastikan anda menggunakan versi terkini untuk ciri dan pembetulan pepijat terbaik.

openclaw init
Copied!

Sediakan projek OpenClaw baharu dalam direktori semasa, menjana fail konfigurasi dan struktur asas.

Jalankan ini di permulaan setiap projek scraping baharu untuk organisasi yang lebih baik.

openclaw config set
Copied!

Tetapkan nilai konfigurasi global atau projek (cth. `openclaw config set user.agent 'MyScraper/1.0'`).

Gunakan ini untuk menyesuaikan tingkah laku OpenClaw seperti agen pengguna atau had kadar.

openclaw config get
Copied!

Dapatkan nilai konfigurasi yang disimpan untuk kunci yang diberikan.

Berguna untuk mengesahkan tetapan semasa anda atau mencari nilai yang telah anda tetapkan.

openclaw login
Copied!

Log masuk ke perkhidmatan web yang disokong secara interaktif untuk menyimpan kuki autentikasi.

Sangat berguna untuk mengakses laman web yang memerlukan log masuk sebelum scraping.

Web Scraping Asas

openclaw scrape
Copied!

Lakukan scraping asas pada URL yang diberikan, mengambil kandungan HTML penuh.

Perintah permulaan yang baik untuk melihat apa yang dapat diambil dari suatu halaman.

openclaw fetch --selector "css|xpath"
Copied!

Ambil kandungan dari URL dan tapis serta ekstrak elemen menggunakan pemilih CSS atau XPath.

Gunakan ini untuk mengambil bahagian tertentu dari halaman dan bukannya keseluruhan halaman.

openclaw crawl --depth
Copied!

Mula merangkak dari URL permulaan, mengikuti pautan hingga kedalaman tertentu.

Berhati-hati dengan kedalaman tinggi kerana ia boleh menjana banyak permintaan.

openclaw browse
Copied!

Buka pelayar tanpa kepala (headless browser) untuk interaksi manual, debugging, atau melihat halaman seperti pengguna sebenar.

Penting untuk debugging visual dan memahami bagaimana JavaScript memuatkan kandungan.

openclaw follow --links "css|xpath"
Copied!

Ikut pautan tertentu dari URL dan teruskan proses scraping pada setiap pautan yang ditemui.

Sesuai untuk menavigasi halaman paginasi atau senarai item.

Pengekstrakan & Penapisan Data

openclaw extract --json '{ "title": "h1", "price": ".product-price" }'
Copied!

Ekstrak data berstruktur dari URL menggunakan peta JSON pemilih CSS atau XPath.

Tentukan struktur output yang anda inginkan terus dalam perintah.

openclaw filter --input --query "jq_expression"
Copied!

Tapis dan ubah data JSON dari fail menggunakan ekspresi JQ yang berkuasa.

JQ sangat fleksibel untuk manipulasi data JSON selepas scraping.

openclaw parse --selector "css_selector" --attribute "text|href"
Copied!

Huraikan fail HTML tempatan dan ekstrak elemen tertentu berdasarkan pemilih dan atribut.

Berguna untuk memproses fail HTML yang telah disimpan secara tempatan.

openclaw list --item-selector ".product" --data '{ "name": ".name", "url": "a@href" }'
Copied!

Ekstrak senarai item dari halaman, setiap satu dengan struktur data yang ditentukan.

Ideal untuk mengekstrak produk dari halaman kategori atau senarai blog.

openclaw regex --pattern ""
Copied!

Ekstrak data menggunakan corak regex dari kandungan halaman URL yang diberikan.

Gunakan regex untuk pola data yang tidak dapat ditangkap dengan mudah oleh pemilih CSS/XPath.

Pengurusan Sesi & Interaksi

openclaw session new --name
Copied!

Mula sesi baharu untuk mengekalkan kuki, penyimpanan tempatan, dan keadaan pelayar antara permintaan.

Gunakan ini apabila anda perlu mengekalkan keadaan log masuk atau sesi pengguna.

openclaw session use
Copied!

Gunakan sesi yang sedia ada untuk perintah OpenClaw seterusnya, memuatkan kembali keadaan sesi.

Membolehkan anda menyambung semula kerja atau melakukan beberapa operasi dalam sesi yang sama.

openclaw form fill --data '{"#username": "user", "#password": "pass"}' --submit "#submit-btn"
Copied!

Isi medan borang dan hantar borang pada URL yang diberikan.

Sangat berkesan untuk log masuk automatik atau mengisi borang carian.

openclaw click --selector "#button-id"
Copied!

Simulasi klik pada elemen yang ditentukan (cth. butang, pautan) pada halaman.

Berguna untuk mencetuskan tindakan JavaScript atau menavigasi halaman secara interaktif.

openclaw wait --for-selector ".loaded-content"
Copied!

Muat URL dan tunggu sehingga elemen tertentu muncul sebelum meneruskan, berguna untuk halaman dinamik.

Penting untuk scraping laman web yang memuatkan kandungan secara asynchronous (AJAX).

Automasi & Aliran Kerja

openclaw macro record
Copied!

Mula merekod urutan tindakan pelayar untuk makro yang boleh dimainkan semula.

Rekod proses manual sekali dan mainkan semula berkali-kali untuk automasi.

openclaw macro run
Copied!

Jalankan makro yang telah direkodkan sebelum ini.

Automasi tugas berulang dengan menjalankan makro yang telah anda cipta.

openclaw schedule add --name --interval "hourly" --cmd "openclaw scrape "
Copied!

Tambah tugas berjadual untuk menjalankan perintah OpenClaw secara berkala.

Ideal untuk memantau perubahan laman web atau mengumpul data secara berterusan.

openclaw pipeline create --steps 'scrape,extract,export'
Copied!

Buat saluran paip (pipeline) automasi yang menggabungkan beberapa langkah OpenClaw.

Susun aliran kerja scraping kompleks menjadi langkah-langkah yang boleh diurus.

openclaw run
Copied!

Jalankan skrip OpenClaw tersuai yang ditulis dalam JavaScript untuk automasi yang lebih kompleks.

Untuk logik scraping yang sangat khusus atau integrasi dengan API lain.

Debugging & Eksport Data

openclaw debug --show-browser
Copied!

Muat URL dalam pelayar tanpa kepala dan biarkan ia dibuka untuk debugging visual dan interaksi.

Alat yang tidak ternilai untuk memahami tingkah laku laman web dan memilih pemilih yang betul.

openclaw logs --level "error"
Copied!

Paparkan log OpenClaw dengan tahap tertentu (cth. info, warn, error) untuk mencari masalah.

Semak log untuk diagnosis masalah scraping atau ralat konfigurasi.

openclaw export --format "csv" --input --output
Copied!

Eksport data dari fail JSON ke format lain seperti CSV, XLSX, atau SQL.

Ubahkan data yang diekstrak ke format yang sesuai untuk analisis atau penyimpanan.

openclaw validate --data
Copied!

Sahkan struktur dan jenis data dalam fail input JSON terhadap skema JSON yang diberikan.

Pastikan data yang diekstrak mematuhi format yang dijangka.

openclaw report generate --type "summary" --input
Copied!

Jana laporan ringkasan atau laporan lain dari hasil scraping.

Dapatkan gambaran keseluruhan pantas tentang operasi scraping anda.

Soalan Lazim OpenClaw (FAQ)

Apa itu OpenClaw?

OpenClaw adalah alat CLI AI yang canggih untuk web scraping, pengekstrakan data, dan automasi proses web dengan cekap. Ia direka untuk memudahkan tugas-tugas yang kompleks.

Adakah OpenClaw menyokong JavaScript rendering?

Ya, OpenClaw mempunyai pelayar tanpa kepala terbina dalam yang boleh mengendalikan JavaScript rendering dengan sempurna, membolehkan anda scrap laman web dinamik dan aplikasi web moden.

Bagaimana saya boleh menguruskan kuki dan sesi?

Anda boleh menggunakan perintah `openclaw session new ` dan `openclaw session use ` untuk menguruskan kuki dan mengekalkan keadaan sesi antara permintaan, sangat berguna untuk laman web yang memerlukan log masuk.

Bolehkah OpenClaw mengeksport data ke format yang berbeza?

Ya, OpenClaw menyokong eksport data ke pelbagai format popular seperti CSV, JSON, XLSX (Excel), dan SQL menggunakan perintah `openclaw export` yang serba boleh.

Adakah OpenClaw sesuai untuk projek besar?

Sama sekali. OpenClaw direka untuk skalabiliti, menyokong automasi melalui makro, saluran paip, dan penjadualan, menjadikannya sesuai untuk projek scraping data berskala besar dan berterusan.