1. Osnovno Uporabo in Namestitev
openclaw --version
Preveri nameščeno različico OpenClaw orodja.
Hitra potrditev uspešne namestitve.
openclaw --help
Prikaže splošno pomoč in seznam vseh razpoložljivih ukazov ter možnosti.
Za takojšnjo pomoč pri uporabi orodja.
pip install openclaw
Namesti ali posodobi OpenClaw preko Pythonovega upravitelja paketov pip.
Vedno uporabite za najnovejšo stabilno različico.
openclaw init
Inicializira nov OpenClaw projekt v določenem direktoriju in ustvari osnovno strukturo datotek.
Za organizirano delo na kompleksnih projektih.
openclaw config view
Prikaže trenutno aktivno konfiguracijo OpenClaw, vključno z globalnimi nastavitvami.
Za pregled in odpravljanje napak v konfiguraciji.
2. Ekstrakcija Podatkov
openclaw scrape --selector "h1.title"
Izloči besedilo iz elementa, določenega z CSS selektorjem. To je pogost način za ciljano ekstrakcijo.
Uporabno za specifične naslove, opise ali druge elemente.
openclaw scrape --xpath "//div[@id='content']/p"
Izloči besedilo iz elementa, določenega z XPath selektorjem, ki omogoča kompleksnejše izbire.
Za robustno izbiro elementov, kjer CSS selektor ni dovolj močan.
openclaw scrape --ai-extract "cene izdelkov"
Uporabi umetno inteligenco za inteligentno ekstrakcijo podatkov, kot so cene izdelkov, brez specifičnih selektorjev.
Idealno za strani z nestrukturirano vsebino ali spremenljivo postavitvijo.
openclaw scrape --json-path "$.products[0].name"
Ekstrahira specifične podatke iz JSON API odziva z uporabo JSONPath izraza.
Nepogrešljivo pri delu z API-ji, ki vračajo JSON podatke.
openclaw scrape --table-extract
Avtomatsko prepozna in ekstrahira vse podatke iz HTML tabel na določeni spletni strani.
Prihrani čas pri delu s tabelaričnimi podatki.
3. Avtomatizacija in Interakcija
openclaw browse --click "button.next"
Obišče URL in simulira klik na določen gumb ali element, da sproži dogodek.
Za navigacijo med stranmi, odpiranje modalnih oken ali sprožanje JS funkcij.
openclaw browse --fill "#username=user123 #password=passxyz" --submit "form#login"
Izpolni določena polja v spletnem obrazcu in ga nato odda.
Nujno za prijavo na spletne strani ali interakcijo z iskalnimi obrazci.
openclaw follow --links "a.product-link" --depth 2
Sledi povezavam, ki ustrezajo določenemu selektorju, do določene globine in ekstrahira podatke z vsake strani.
Za strganje večih povezanih strani, npr. katalogov izdelkov.
openclaw script run
Izvede kompleksno avtomatizacijo, napisano v Python skripti, ki uporablja OpenClaw API.
Za zelo specifične in kompleksne scenarije, ki presegajo CLI možnosti.
openclaw scrape --scroll-to-bottom --extract "div.item"
Pomika se do dna strani, da naloži vso vsebino (npr. 'neskončno pomikanje'), nato ekstrahira elemente.
Za strani, ki nalagajo vsebino dinamično ob pomikanju.
4. Filtriranje in Predelava
openclaw scrape --selector "p" --filter "regex:'\d{4}'"
Ekstrahira paragrafe in jih nato filtrira z uporabo regularnega izraza, da zajame le določene vzorce.
Idealno za ekstrakcijo specifičnih vzorcev, kot so letnice, poštne številke ali telefonske številke.
openclaw scrape --ai-filter "samo pomembne novice"
Uporabi umetno inteligenco za inteligentno filtriranje ekstrahiranih podatkov glede na podan kontekst ali pomen.
Za odstranjevanje irelevantne vsebine in osredotočanje na ključne informacije.
openclaw scrape --post-process "trim,normalize_whitespace"
Uporabi eno ali več post-procesnih funkcij za čiščenje ekstrahiranega besedila (npr. odstranjevanje presledkov).
Za pripravo podatkov za nadaljnjo analizo ali shranjevanje.
openclaw scrape --deduplicate "url"
Odstrani podvojene rezultate na podlagi določenega polja, npr. URL-ja, da zagotovi edinstvene vnose.
Pomembno za kakovost in integriteto zbranih podatkov.
5. Izhodni Formati in Shranjevanje
openclaw scrape --output results.json
Shrani vse ekstrahirane podatke v JSON datoteko, ki je primerna za strukturirane podatke.
Standardni izhod za strukturirane podatke, enostaven za programsko obdelavo.
openclaw scrape --output results.csv --format csv
Shrani ekstrahirane podatke v CSV datoteko, ločeno z vejicami, idealno za preglednice.
Odlično za uvoz v Excel ali druge programske pakete za analizo podatkov.
openclaw scrape --output-db "sqlite:///data.db" --table "products"
Shrani podatke neposredno v SQLite bazo podatkov v določeno tabelo.
Za trajno shranjevanje in enostavno poizvedovanje po podatkih.
openclaw scrape --output-format yaml
Prikaže ekstrahirane rezultate v YAML formatu na standardni izhod, primerno za konfiguracije.
Alternativa JSON-u, še posebej priročna za človeško berljive izhode.
openclaw scrape --append-output new_data.json
Doda nove rezultate k obstoječi datoteki, namesto da bi jo prepisal.
Za zbiranje podatkov iz več virov v eno datoteko.
6. Konfiguracija in Napredne Možnosti
openclaw scrape --headless
Izvede strganje v načinu brez glave brskalnika (brez grafičnega uporabniškega vmesnika), kar je hitreje.
Nujno za strežniška okolja in hitrejše, tiho strganje.
openclaw scrape --proxy "http://user:[email protected]:8080"
Uporabi določen proxy strežnik za vse odhodne zahteve, za anonimnost ali obhod geografskih omejitev.
Za preprečevanje blokad IP-ja in simulacijo dostopa iz različnih lokacij.
openclaw scrape --user-agent "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36"
Nastavi specifičen User-Agent niz, da posnema določen brskalnik ali napravo.
Za obhod enostavnih preverjanj User-Agenta in bolj naravno interakcijo.
openclaw scrape --delay 5
Nastavi zakasnitev 5 sekund med zaporednimi zahtevami za preprečevanje blokade s strani spletnega mesta.
Pomaga pri izogibanju detekciji kot bot in zmanjšuje obremenitev strežnika.
openclaw scrape --max-retries 3 --retry-delay 10
Ponovi neuspešne zahteve do 3-krat z zakasnitvijo 10 sekund med poskusi.
Poveča robustnost strganja pri nestabilnih omrežnih pogojih ali občasnih napakah.