Ultimate Reference

OpenClaw CLI: Ultimativni Priročnik za Spletno Strganje

Vaš celovit vodnik za obvladovanje OpenClaw ukazov za učinkovito ekstrakcijo in avtomatizacijo podatkov.

1. Osnovno Uporabo in Namestitev

openclaw --version
Copied!

Preveri nameščeno različico OpenClaw orodja.

Hitra potrditev uspešne namestitve.

openclaw --help
Copied!

Prikaže splošno pomoč in seznam vseh razpoložljivih ukazov ter možnosti.

Za takojšnjo pomoč pri uporabi orodja.

pip install openclaw
Copied!

Namesti ali posodobi OpenClaw preko Pythonovega upravitelja paketov pip.

Vedno uporabite za najnovejšo stabilno različico.

openclaw init
Copied!

Inicializira nov OpenClaw projekt v določenem direktoriju in ustvari osnovno strukturo datotek.

Za organizirano delo na kompleksnih projektih.

openclaw config view
Copied!

Prikaže trenutno aktivno konfiguracijo OpenClaw, vključno z globalnimi nastavitvami.

Za pregled in odpravljanje napak v konfiguraciji.

2. Ekstrakcija Podatkov

openclaw scrape --selector "h1.title"
Copied!

Izloči besedilo iz elementa, določenega z CSS selektorjem. To je pogost način za ciljano ekstrakcijo.

Uporabno za specifične naslove, opise ali druge elemente.

openclaw scrape --xpath "//div[@id='content']/p"
Copied!

Izloči besedilo iz elementa, določenega z XPath selektorjem, ki omogoča kompleksnejše izbire.

Za robustno izbiro elementov, kjer CSS selektor ni dovolj močan.

openclaw scrape --ai-extract "cene izdelkov"
Copied!

Uporabi umetno inteligenco za inteligentno ekstrakcijo podatkov, kot so cene izdelkov, brez specifičnih selektorjev.

Idealno za strani z nestrukturirano vsebino ali spremenljivo postavitvijo.

openclaw scrape --json-path "$.products[0].name"
Copied!

Ekstrahira specifične podatke iz JSON API odziva z uporabo JSONPath izraza.

Nepogrešljivo pri delu z API-ji, ki vračajo JSON podatke.

openclaw scrape --table-extract
Copied!

Avtomatsko prepozna in ekstrahira vse podatke iz HTML tabel na določeni spletni strani.

Prihrani čas pri delu s tabelaričnimi podatki.

3. Avtomatizacija in Interakcija

openclaw browse --click "button.next"
Copied!

Obišče URL in simulira klik na določen gumb ali element, da sproži dogodek.

Za navigacijo med stranmi, odpiranje modalnih oken ali sprožanje JS funkcij.

openclaw browse --fill "#username=user123 #password=passxyz" --submit "form#login"
Copied!

Izpolni določena polja v spletnem obrazcu in ga nato odda.

Nujno za prijavo na spletne strani ali interakcijo z iskalnimi obrazci.

openclaw follow --links "a.product-link" --depth 2
Copied!

Sledi povezavam, ki ustrezajo določenemu selektorju, do določene globine in ekstrahira podatke z vsake strani.

Za strganje večih povezanih strani, npr. katalogov izdelkov.

openclaw script run
Copied!

Izvede kompleksno avtomatizacijo, napisano v Python skripti, ki uporablja OpenClaw API.

Za zelo specifične in kompleksne scenarije, ki presegajo CLI možnosti.

openclaw scrape --scroll-to-bottom --extract "div.item"
Copied!

Pomika se do dna strani, da naloži vso vsebino (npr. 'neskončno pomikanje'), nato ekstrahira elemente.

Za strani, ki nalagajo vsebino dinamično ob pomikanju.

4. Filtriranje in Predelava

openclaw scrape --selector "p" --filter "regex:'\d{4}'"
Copied!

Ekstrahira paragrafe in jih nato filtrira z uporabo regularnega izraza, da zajame le določene vzorce.

Idealno za ekstrakcijo specifičnih vzorcev, kot so letnice, poštne številke ali telefonske številke.

openclaw scrape --ai-filter "samo pomembne novice"
Copied!

Uporabi umetno inteligenco za inteligentno filtriranje ekstrahiranih podatkov glede na podan kontekst ali pomen.

Za odstranjevanje irelevantne vsebine in osredotočanje na ključne informacije.

openclaw scrape --post-process "trim,normalize_whitespace"
Copied!

Uporabi eno ali več post-procesnih funkcij za čiščenje ekstrahiranega besedila (npr. odstranjevanje presledkov).

Za pripravo podatkov za nadaljnjo analizo ali shranjevanje.

openclaw scrape --deduplicate "url"
Copied!

Odstrani podvojene rezultate na podlagi določenega polja, npr. URL-ja, da zagotovi edinstvene vnose.

Pomembno za kakovost in integriteto zbranih podatkov.

5. Izhodni Formati in Shranjevanje

openclaw scrape --output results.json
Copied!

Shrani vse ekstrahirane podatke v JSON datoteko, ki je primerna za strukturirane podatke.

Standardni izhod za strukturirane podatke, enostaven za programsko obdelavo.

openclaw scrape --output results.csv --format csv
Copied!

Shrani ekstrahirane podatke v CSV datoteko, ločeno z vejicami, idealno za preglednice.

Odlično za uvoz v Excel ali druge programske pakete za analizo podatkov.

openclaw scrape --output-db "sqlite:///data.db" --table "products"
Copied!

Shrani podatke neposredno v SQLite bazo podatkov v določeno tabelo.

Za trajno shranjevanje in enostavno poizvedovanje po podatkih.

openclaw scrape --output-format yaml
Copied!

Prikaže ekstrahirane rezultate v YAML formatu na standardni izhod, primerno za konfiguracije.

Alternativa JSON-u, še posebej priročna za človeško berljive izhode.

openclaw scrape --append-output new_data.json
Copied!

Doda nove rezultate k obstoječi datoteki, namesto da bi jo prepisal.

Za zbiranje podatkov iz več virov v eno datoteko.

6. Konfiguracija in Napredne Možnosti

openclaw scrape --headless
Copied!

Izvede strganje v načinu brez glave brskalnika (brez grafičnega uporabniškega vmesnika), kar je hitreje.

Nujno za strežniška okolja in hitrejše, tiho strganje.

openclaw scrape --proxy "http://user:[email protected]:8080"
Copied!

Uporabi določen proxy strežnik za vse odhodne zahteve, za anonimnost ali obhod geografskih omejitev.

Za preprečevanje blokad IP-ja in simulacijo dostopa iz različnih lokacij.

openclaw scrape --user-agent "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36"
Copied!

Nastavi specifičen User-Agent niz, da posnema določen brskalnik ali napravo.

Za obhod enostavnih preverjanj User-Agenta in bolj naravno interakcijo.

openclaw scrape --delay 5
Copied!

Nastavi zakasnitev 5 sekund med zaporednimi zahtevami za preprečevanje blokade s strani spletnega mesta.

Pomaga pri izogibanju detekciji kot bot in zmanjšuje obremenitev strežnika.

openclaw scrape --max-retries 3 --retry-delay 10
Copied!

Ponovi neuspešne zahteve do 3-krat z zakasnitvijo 10 sekund med poskusi.

Poveča robustnost strganja pri nestabilnih omrežnih pogojih ali občasnih napakah.

Pogosto Zastavljena Vprašanja (FAQ)

Kaj je OpenClaw in za kaj se uporablja?

OpenClaw je napredno orodje ukazne vrstice (CLI), zasnovano za spletno strganje in ekstrakcijo podatkov. Uporablja se za avtomatizacijo zbiranja strukturiranih in nestrukturiranih podatkov iz spletnih strani.

Ali OpenClaw podpira JavaScript strani?

Da, OpenClaw vključuje zmožnosti brskalnika brez glave, kar mu omogoča upodabljanje in interakcijo s spletnimi stranmi, ki se zanašajo na JavaScript za nalaganje vsebine.

Kako lahko obidem blokade IP-ja?

Za obhod blokad IP-ja lahko uporabite možnost `--proxy` za rotacijo IP naslovov in `--user-agent` za spreminjanje identifikacije brskalnika. Prav tako je priporočljivo nastaviti `--delay` med zahtevami za bolj naravno vedenje.

Ali lahko OpenClaw ekstrahira podatke iz prijavljenih strani?

Da, z ukazom `openclaw browse` lahko izpolnite prijavne obrazce in vzdržujete sejo, kar vam omogoča ekstrakcijo podatkov iz zaščitenih, prijavljenih strani.