2. Ekstrakcija Podatkov
openclaw scrape --selector
Izvede osnovno strganje spletne strani in ekstrahira podatke na podlagi podanega CSS selektorja.
Za kompleksnejše ekstrakcije uporabite več selektorjev ali kombinirajte z 'ai-parse'.
openclaw extract --pattern "" --from
Ekstrahira podatke iz tekstovnega vira (datoteke, URL ali prejšnji izhod) z uporabo regularnega izraza.
Odličen za strganje specifičnih vzorcev, ki jih CSS selektorji ne morejo zajeti.
openclaw ai-parse --schema
Uporabi AI za inteligentno analizo spletne strani in ekstrakcijo podatkov v skladu z določeno JSON shemo.
To je zmogljiva funkcija za nestrukturirane spletne strani, kjer so tradicionalni selektorji neučinkoviti.
openclaw follow-links --depth --filter
Sledi povezavam na spletni strani do določene globine in ekstrahira podatke iz najdenih strani, po želji filtrira URL-je.
Uporabite filter za omejitev strganja na določene dele spletnega mesta (npr. samo produktne strani).
openclaw tables --output
Samodejno zazna in ekstrahira vse tabele iz določene spletne strani ter jih shrani v CSV format.
Zelo uporabno za hitro pridobivanje tabelarnih podatkov brez ročnega določanja selektorjev.
3. Navigacija in Interakcija
openclaw navigate --click
Naloži spletno stran in simulira klik na element, določen z CSS selektorjem. Uporabno za spletne strani z dinamično vsebino.
Za interakcijo z gumbi, meniji ali zavihki, ki razkrivajo novo vsebino.
openclaw form fill --fields '{"ime":"vrednost"}' --submit
Naloži obrazec na spletni strani, izpolni določena polja in ga pošlje.
Uporabno za prijavo, iskalne obrazce ali oddajo podatkov.
openclaw scroll --to bottom --delay
Naloži spletno stran in simulira pomikanje (npr. do dna) za nalaganje dinamične vsebine.
Nepogrešljivo za spletne strani, ki vsebino nalagajo ob pomikanju (infinite scroll).
openclaw screenshot --output --full-page
Zajame posnetek zaslona spletne strani. Možnost zajema celotne strani ali samo vidnega dela.
Uporabno za vizualno preverjanje vsebine ali arhiviranje vizualnega stanja spletne strani.
4. Obdelava in Shranjevanje Podatkov
openclaw process --input --transform
Obdeluje ekstrahirane podatke iz vhodne datoteke z uporabo podane transformacijske skripte (npr. JavaScript).
Skripta lahko čisti, preoblikuje ali agregira podatke pred shranjevanjem.
openclaw export --format json --output --from
Izvozi obdelane podatke v določen format (JSON, CSV, XML) v izhodno datoteko.
Vedno izvozite v format, ki je najbolj primeren za nadaljnjo analizo ali uvoz v bazo podatkov.
openclaw store --database --collection --data
Shrani ekstrahirane podatke neposredno v določeno bazo podatkov (npr. MongoDB, PostgreSQL).
Za dolgoročno shranjevanje in enostaven dostop do strganih podatkov.
openclaw deduplicate --input --key
Odstrani podvojene zapise iz podatkovne zbirke na podlagi določenega ključa.
Pomembno za zagotavljanje kakovosti podatkov in preprečevanje redundantnosti.
5. Napredne Funkcije
openclaw schedule --task --interval "dnevno"
Načrtuje avtomatsko izvajanje OpenClaw skript (npr. strganje) v določenih intervalih (dnevno, tedensko, mesečno).
Avtomatizirajte redno zbiranje podatkov brez ročnega posredovanja.
openclaw proxy use --auth
Konfigurira OpenClaw za uporabo proxy strežnika za anonimno strganje ali obhod omejitev IP naslovov.
Ključno za obsežno strganje, da preprečite blokiranje vašega IP naslova.
openclaw headless --script
Zažene brskalnik brez grafičnega vmesnika (headless mode) za izvajanje kompleksnih JavaScript interakcij.
Uporabno za spletne strani, ki močno temeljijo na JavaScriptu in zahtevajo dinamično nalaganje.
openclaw distributed run --nodes <število>
Razdeli nalogo strganja med več vozli/strežniki za hitrejše in obsežnejše zbiranje podatkov.
Za zelo velike projekte strganja, kjer je pomembna hitrost in skalabilnost.
6. Odpravljanje Težav in Diagnostika
openclaw debug --verbose --output
Izvede podrobno diagnostiko strganja za določeno URL. Pokaže podrobne informacije o omrežnih zahtevah, selektorjih in morebitnih napakah.
Nepogrešljivo orodje za ugotavljanje, zakaj strganje ne deluje pravilno.
openclaw log view --level error --last
Prikaže zadnje 'n' vnose v dnevnik (log) z določeno stopnjo resnosti (npr. samo napake).
Redno pregledujte dnevnike za zgodnje odkrivanje težav in optimizacijo skript.
openclaw test selectors --selectors ","
Preizkusi veljavnost in izhod določenih CSS selektorjev na dani URL, ne da bi izvedel celotno strganje.
Hitro preverite, ali vaši selektorji pravilno zajemajo želene elemente.
openclaw analyze performance --iterations
Analizira uspešnost izvajanja OpenClaw skripte, meri čas in porabo virov.
Uporabite za optimizacijo skript in zmanjšanje obremenitve strežnika.