Alapvető Műveletek
openclaw init
Új OpenClaw projekt inicializálása a megadott névvel. Létrehozza a szükséges fájlstruktúrát a rendszerezett munkához.
Mindig kezdjen egy új projekttel a rendszerezett munkához.
openclaw fetch
Letölti a megadott URL tartalmát. Ez az első lépés a legtöbb scraping feladatnál.
Használja a `-o` vagy `--output` flag-et a tartalom fájlba mentéséhez.
openclaw config set <érték>
Globális vagy projekt-specifikus konfigurációs beállítások módosítása. Például alapértelmezett user-agent beállítása.
A `openclaw config list` paranccsal megtekintheti az aktuális beállításokat.
openclaw help
Részletes súgót jelenít meg egy adott OpenClaw parancshoz, beleértve a paramétereket és példákat.
Használja, ha nem biztos egy parancs paramétereiben vagy működésében.
Adatkinyerés és Szelekció
openclaw extract css "selector" --url
CSS szelektorral kinyeri az elemeket a megadott URL-ről vagy a legutóbb letöltött oldalról.
Kísérletezzen a szelektorokkal az OpenClaw interaktív shelljében a pontos találatokért.
openclaw extract xpath "//xpath/expression"
XPath kifejezéssel vonja ki az adatokat. Különösen hasznos komplex DOM struktúrák esetén, ahol a CSS korlátozott lehet.
Az XPath robusztusabb lehet, mint a CSS szelektorok bizonyos esetekben.
openclaw extract regex "/pattern/" --group
Reguláris kifejezéssel keres és von ki szöveges mintákat a letöltött tartalomból.
Tökéletes strukturálatlan szövegből való adatok, például dátumok vagy árak kinyerésére.
openclaw paginate --next "selector"
Kezeli a többoldalas weboldalak lapozását, automatikusan követve a 'következő' linkeket vagy gombokat.
A `URL_minta` helyére tehet `*` karaktert a dinamikus URL-ekhez, pl. `example.com/page/*`.
openclaw select element "css-selector" --attribute "href"
Kiválaszt egy elemet CSS szelektor alapján, és kinyeri annak egy attribútumát, például egy linket.
Használja specifikus attribútumok, mint az `src` képekhez vagy `value` űrlapmezőkhöz, kinyerésére.
Adatfeldolgozás és Tisztítás
openclaw transform json --jq ".path"
JSON adatok átalakítása `jq` szintaxissal, lehetővé téve a szűrést, formázást és szerkezetátalakítást.
Használja komplex JSON adatok szűrésére és formázására, például felesleges mezők eltávolítására.
openclaw clean text --remove-html --strip-whitespace
Szöveges adatok tisztítása HTML tagek eltávolításával és felesleges szóközök törlésével.
Javítja az adatok minőségét a további elemzéshez, eltávolítva a vizuális elemeket.
openclaw deduplicate --key "field"
Eltávolítja az ismétlődő bejegyzéseket egy megadott mező alapján, biztosítva az adatok egyediségét.
Hasznos nagy adatállományok egységesítéséhez és a redundancia elkerüléséhez.
openclaw merge --on "id_field"
Két adatfájlt egyesít egy közös azonosító mező alapján, összekapcsolva a releváns információkat.
Több forrásból származó adatok konszolidálásához vagy kiegészítő információk hozzáadásához.
Haladó Hálózati Beállítások
openclaw proxy set --auth "user:pass"
HTTP/S vagy SOCKS proxyt állít be a kérésekhez. Támogatja az autentikált proxykat is.
Használja IP-blokkolás elkerülésére, anonimitás biztosítására vagy geolokációs korlátozások megkerülésére.
openclaw headers add "User-Agent: custom-agent" --persistent
Egyedi HTTP fejlécet ad hozzá a kérésekhez. A `--persistent` flag-gel az összes további kérésre érvényes.
Emuláljon különböző böngészőket vagy egyedi azonosítókat a blokkolás elkerülése érdekében.
openclaw cookies import --domain
Cookie-kat importál egy fájlból, szimulálva a bejelentkezett munkameneteket vagy felhasználói állapotokat.
Ideális bejelentkezés mögötti oldalak scrapingjéhez vagy személyre szabott tartalmak eléréséhez.
openclaw render javascript --url --wait
Rendereli az oldalt JavaScript végrehajtással (pl. headless böngészővel), mielőtt kinyeri az adatokat.
Kötelező dinamikusan generált tartalmak kinyeréséhez, mint például SPA (Single Page Application) oldalak.
Hibakeresés és Naplózás
openclaw log level
Beállítja a naplózás részletességi szintjét, befolyásolva a konzolon megjelenő üzenetek mennyiségét.
`debug` szinten részletesebb információkat kap a hibakereséshez, míg az `error` csak a kritikus hibákat mutatja.
openclaw debug page --selector "css"
Interaktív hibakereső módot indít egy adott URL-en, lehetővé téve a szelektorok valós idejű tesztelését.
Gyorsan azonosíthatja a rossz vagy nem működő szelektorokat anélkül, hogy újra kellene futtatnia a teljes scriptet.
openclaw trace request
Megjeleníti a HTTP kérések és válaszok teljes folyamatát, beleértve a fejléceket, státuszkódokat és átirányításokat.
Elengedhetetlen a hálózati problémák, például blokkolások vagy hibás átirányítások diagnosztizálásához.
openclaw export errors
Exportálja az összes rögzített hibát egy fájlba, a későbbi elemzés és jelentéskészítés céljából.
Segít azonosítani a scraping folyamat gyenge pontjait és javítani a megbízhatóságot.
Automatizálás és Ütemezés
openclaw schedule job "*/5 * * * *" "openclaw fetch example.com -o data.json"
Ütemez egy OpenClaw parancsot, hogy rendszeres időközönként fusson (cron szintaxis használatával).
Rendszeres adatfrissítésekhez, monitoringhoz vagy napi jelentések generálásához.
openclaw workflow run
Futtat egy előre definiált munkafolyamatot egy YAML konfigurációs fájlból, amely több lépést is tartalmazhat.
Komplex, többlépéses scraping feladatok szervezéséhez, például adatok letöltése, tisztítása és mentése.
openclaw monitor changes --selector "css" --notify-webhook
Figyeli egy weboldal változásait egy adott szelektoron belül, és értesítést küld egy webhook URL-re.
Árfigyelésre, tartalomfrissítések követésére vagy versenytársak weboldalainak nyomon követésére.
openclaw webhook listen --trigger "command"
Elindít egy webhook listenert, amely egy adott porton vár bejövő kéréseket, és azokra válaszul futtat egy parancsot.
Külső rendszerekkel való integrációhoz és valós idejű triggereléshez, például CI/CD pipeline-okba.