Komandat Themelore të Iniciimit
openclaw init
Inicializon një projekt të ri OpenClaw në drejtorinë aktuale, duke krijuar strukturën e nevojshme të skedarëve.
Përdoreni këtë komandë për të filluar çdo projekt të ri scraping-u. Zëvendësoni '
openclaw start
Nis një sesion të ri shfletimi dhe hap URL-në e specifikuar, duke e bërë atë gati për ndërveprim.
Kjo është pika e fillimit për të gjitha operacionet e scraping-ut. Sigurohuni që URL-ja të jetë e saktë.
openclaw login --user --pass
Kryen një hyrje të automatizuar në një faqe interneti duke përdorur kredencialet e dhëna.
Përdorni këtë për faqet që kërkojnë autentifikim. Mund të përdorni edhe variabla mjedisi për siguri më të mirë.
openclaw config view
Shfaq konfigurimin aktual të OpenClaw, duke përfshirë parametrat globalë dhe specifikë të projektit.
Kontrolloni konfigurimin për të parë vlerat e timeout-it, opsionet e proxy-t dhe cilësime të tjera.
openclaw help
Shfaq një përshkrim të detajuar dhe opsionet e disponueshme për një komandë specifike të OpenClaw.
Përdoreni këtë për të marrë ndihmë të shpejtë për çdo komandë në terminal, pa pasur nevojë të hapni dokumentacionin.
Ekstraktimi i të Dhënave dhe Përzgjedhësit
openclaw extract css ''
Ekstrakton tekstin ose atributet nga elementet HTML që përputhen me selektorin CSS të dhënë.
Përdorni selektorë CSS të saktë. Për atributet, shtoni '::
openclaw extract xpath ''
Ekstrakton të dhëna duke përdorur shprehje XPath, duke ofruar fleksibilitet të lartë në përzgjedhjen e elementeve.
XPath është i fuqishëm për elemente komplekse ose navigim në DOM. Mësoni bazat e XPath për rezultate më të mira.
openclaw extract json ''
Ekstrakton të dhëna nga përmbajtja JSON e gjetur në faqe ose nga një API response.
E dobishme kur faqet përdorin JSON in-line ose kur keni të bëni me API-të. Përdorni notacionin me pika ose kllapa.
openclaw extract text --regex ''
Ekstrakton tekstin që përputhet me një shprehje të rregullt nga përmbajtja aktuale e faqes.
Ideal për të nxjerrë modele specifike teksti që nuk mund të arrihen lehtë me CSS ose XPath.
openclaw scrape --url --selector 'h1,p' --output data.json
Një komandë e gjithanshme për të nisur scraping-un direkt nga terminali, duke specifikuar URL-në, selektorët dhe formatin e daljes.
Kjo komandë është e shkurtër për operacione të shpejta. Mund të shtoni shumë selektorë dhe formate daljesh.
Navigimi dhe Ndërveprimi
openclaw click ''
Kryen një klikim simulues mbi elementin që përputhet me selektorin CSS të dhënë.
Përdoreni këtë për të ndërvepruar me butona, lidhje ose elemente të tjera klikuese në faqe.
openclaw type '' ''
Shkruan tekstin e specifikuar në një fushë inputi ose textarea të identifikuar nga selektori CSS.
E domosdoshme për plotësimin e formularëve, fushave të kërkimit ose fushave të hyrjes.
openclaw go
Navigon në një URL të re brenda të njëjtit sesion të hapur të shfletuesit.
Përdoreni për të lëvizur midis faqeve të lidhura pa mbyllur dhe rihapur sesionin e shfletuesit.
openclaw scroll --to 'bottom'
Lëviz faqen në një pozicion specifik, si fundi, fillimi, ose një sasi pikselësh.
E dobishme për faqet me ngarkim të përmbajtjes dinamike (infinity scroll) ose për të siguruar që të gjithë elementët të jenë të dukshëm.
openclaw wait --selector '' --timeout 10
Pret që një element i identifikuar nga selektori CSS të shfaqet në DOM brenda një kohe të caktuar.
Kjo parandalon gabimet kur elementet ngarkohen në mënyrë asinkrone. Rregulloni timeout-in sipas nevojës.
Menaxhimi i Seksionit dhe Shfletimit
openclaw session save
Ruaj gjendjen aktuale të sesionit të shfletuesit, duke përfshirë cookies, hapësirën ruajtëse lokale dhe historinë.
E dobishme për të rifilluar scraping-un më vonë pa humbur progresin ose autentifikimin.
openclaw session load
Ngarkon një sesion të ruajtur më parë, duke rivendosur shfletuesin në gjendjen e tij të mëparshme.
Përdoreni këtë për të vazhduar punën nga ku e keni lënë, veçanërisht pas një ndërprerjeje.
openclaw close
Mbyll sesionin aktual të shfletimit dhe liron burimet e sistemit.
Gjithmonë mbyllni sesionet pas përdorimit për të shmangur mbipërdorimin e burimeve.
openclaw screenshot .png
Krijon një pamje të ekranit të faqes aktuale të shfletuesit dhe e ruan atë si një skedar imazhi.
E dobishme për debugim, për të verifikuar vizualisht çfarë shikon OpenClaw, ose për të dokumentuar procesin.
openclaw proxy use
Konfiguron një proxy për sesionin aktual të shfletimit, duke maskuar adresën IP origjinale.
Përdoreni për të shmangur bllokimin e IP-së ose për të simuluar trafikun nga rajone të ndryshme gjeografike.
Përpunimi dhe Filtërimi i të Dhënave
openclaw pipe 'extract css "h1"' 'filter --contains "Hello"'
Zinxhiron komandat, ku dalja e njërës komandë bëhet hyrje për tjetrën, duke mundësuar përpunim kompleks.
Ky funksion është thelbësor për punë me shumë faza, si ekstraktimi dhe më pas filtrimin ose transformimin.
openclaw filter --regex '' --field ''
Filtëron të dhënat e ekstraktuara bazuar në një shprehje të rregullt në një fushë specifike.
Përdoreni për të pastruar të dhënat ose për të zgjedhur vetëm ato që plotësojnë kritere specifike.
openclaw transform --field '' --action 'uppercase'
Transformon vlerat e fushave të ekstraktuara duke aplikuar veprime si shkronja të mëdha, të vogla ose truncate.
Përmirëson cilësinë dhe konsistencën e të dhënave tuaja para se t'i eksportoni.
openclaw merge
Bashkon skedarë të shumtë të dhënash (p.sh., JSON) në një skedar të vetëm.
I dobishëm kur keni kryer scraping në faza dhe dëshironi të kombinoni të gjitha rezultatet.
openclaw deduplicate --field ''
Heq rreshtat dublikatë nga të dhënat e ekstraktuara bazuar në vlerat e një fushe specifike.
Siguron që të dhënat tuaja të jenë unike, duke shmangur të dhënat e tepërta.
Eksportimi dhe Raportimi
openclaw export json
Eksporton të dhënat e ekstraktuara në format JSON në skedarin e specifikuar.
JSON është një format standard për shkëmbimin e të dhënave, i lehtë për t'u punuar me shumë aplikacione.
openclaw export csv --delimiter ','
Eksporton të dhënat e ekstraktuara në format CSV, me opsionin për të specifikuar ndarësin.
CSV është ideal për analiza të dhënash në spreadsheets ose import në baza të dhënash relacionale.
openclaw report generate --template 'summary.html'
Gjeneron raporte vizuale bazuar në të dhënat e ekstraktuara dhe një shabllon të dhënë.
Krijoni raporte të personalizuara për të prezantuar rezultatet e scraping-ut në një format të lexueshëm.
openclaw output table
Shfaq të dhënat e ekstraktuara në format tabele në terminal, për një pasqyrë të shpejtë.
E dobishme për debugim dhe për të verifikuar shpejt saktësinë e të dhënave të ekstraktuara.
openclaw store --database 'sqlite.db' --table 'data'
Ruaj të dhënat e ekstraktuara direkt në një bazë të dhënash (p.sh., SQLite) në një tabelë specifike.
Për integrim të drejtpërdrejtë të të dhënave në aplikacionet tuaja ose për ruajtje afatgjatë.
Konfigurimi i Përparuar dhe Debugimi
openclaw debug enable
Aktivizon modalitetin e debugimit, duke ofruar informacione më të detajuara rreth ekzekutimit të komandave.
Përdoreni kur përballeni me probleme ose dëshironi të kuptoni më mirë se si funksionon OpenClaw.
openclaw logs view --level 'error'
Shfaq regjistrat (logs) e sesionit aktual ose të mëparshëm, të filtruar sipas nivelit të specifikuar.
Kontrolloni regjistrat për gabime, paralajmërime ose informacione thelbësore gjatë procesit të scraping-ut.
openclaw config set 'timeout' 30
Vendos një vlerë specifike konfigurimi, si p.sh., kohëzgjatja maksimale e pritjes (timeout) për operacione.
Rregulloni parametrat e konfigurimit për të përshtatur OpenClaw me kërkesat specifike të faqes që po shkrepni.
openclaw script run
Ekzekuton një skript JavaScript të personalizuar brenda kontekstit të shfletuesit.
Për ndërveprime komplekse, manipulim të DOM-it ose për të shkaktuar funksionalitete specifike të faqes.
openclaw env set 'API_KEY' 'your_key'
Vendos një variabël mjedisi për sesionin aktual, e dobishme për ruajtjen e kredencialeve ose çelësave API.
Përdorni variablat e mjedisit për të ruajtur informacione të ndjeshme në mënyrë të sigurt dhe për të shmangur kodimin e tyre direkt në skripte.