1. Základní Spuštění a Konfigurace
openclaw init
Inicializuje nový OpenClaw projekt v aktuálním adresáři. Vytvoří potřebné konfigurační soubory a strukturu.
Vždy začněte s 'init' pro správné nastavení prostředí projektu.
openclaw config set
Nastaví nebo aktualizuje konfigurační hodnotu pro váš projekt. Může se jednat o uživatelské agenty, timeouty nebo proxy.
Použijte 'openclaw config list' pro zobrazení aktuální konfigurace.
openclaw run
Spustí definovaný scraping projekt nebo úlohu z YAML souboru.
Ujistěte se, že váš YAML soubor je validní a správně strukturovaný.
openclaw help
Zobrazí podrobnou nápovědu pro konkrétní OpenClaw příkaz, včetně jeho použití a dostupných možností.
Vždy se podívejte do nápovědy, pokud si nejste jisti syntaxí nebo parametry příkazu.
2. Extrakce Dat
openclaw extract css
Extrahujte data z webové stránky pomocí CSS selektoru. Ideální pro rychlé získání specifických prvků.
Použijte nástroje pro vývojáře v prohlížeči k přesnému určení CSS selektorů.
openclaw extract xpath
Použijte XPath výrazy pro komplexnější a robustnější extrakci dat, zejména pro složité struktury HTML.
XPath je silnější než CSS pro navigaci mezi rodiči a sourozenci prvků.
openclaw extract json --jsonpath
Extrahujte data z API endpointů nebo JSON objektů vložených v HTML pomocí JSONPath výrazů.
Ověřte si strukturu JSON odpovědi před vytvořením JSONPath výrazu.
openclaw extract table --table-selector
Automaticky detekuje a extrahuje data z HTML tabulek na dané URL.
Můžete specifikovat selektor pro konkrétní tabulku, pokud je jich na stránce více.
3. Navigace a Interakce
openclaw navigate url
Naviguje headless prohlížeč na zadanou URL. To je základ pro jakékoli další interakce.
Použijte tento příkaz v rámci skriptu pro řízené procházení webu.
openclaw click selector
Simuluje kliknutí na prvek identifikovaný CSS selektorem. Užitečné pro interakci s tlačítky, odkazy nebo přepínači.
Ujistěte se, že selektor je dostatečně specifický, aby kliknul na správný prvek.
openclaw fill form --fields '{"jméno": "Jan", "email": "[email protected]"}'
Vyplní formulářová pole na dané URL s poskytnutými daty. Podporuje textová pole, zaškrtávací políčka a rozbalovací seznamy.
Před odesláním formuláře ověřte, zda jsou všechna povinná pole vyplněna.
openclaw scroll page --to bottom
Roluje stránku do zadané pozice (např. dolů) pro načtení dynamického obsahu nebo nekonečných stránek.
Můžete specifikovat počet pixelů nebo dobu rolování pro jemnější kontrolu.
4. Správa Projektů a Šablon
openclaw project create
Vytvoří nový projekt s předdefinovanou strukturou adresářů a základními konfiguračními soubory.
Organizujte své scraping úlohy do samostatných projektů pro lepší správu.
openclaw template add --from-url
Vytvoří novou extrakční šablonu z existující webové stránky, což zjednodušuje opakované úlohy.
Využijte šablony pro stránky s podobnou strukturou, aby se zrychlil vývoj.
openclaw template list
Zobrazí seznam všech dostupných extrakčních šablon ve vašem aktuálním projektu.
Pravidelně kontrolujte šablony a odstraňte ty nepotřebné.
openclaw project delete
Odstraní celý OpenClaw projekt včetně všech konfiguračních souborů a šablon.
Před smazáním projektu vždy zálohujte důležitá data.
5. Pokročilé Filtrování a Zpracování
openclaw filter regex --pattern
Aplikuje regulární výraz na extrahovaná data pro další filtrování nebo transformaci textových řetězců.
Regulární výrazy jsou mocné, ale vyžadují pečlivé testování.
openclaw process js --script
Zpracuje extrahovaná data pomocí vlastního JavaScriptového skriptu pro komplexní manipulaci s daty.
Využijte JS pro složité transformace, které nelze provést jen s regulárními výrazy.
openclaw pipeline add --type --config
Přidá nový krok do extrakčního pipeline. Umožňuje řetězení operací jako je extrakce, filtrování a ukládání.
Budujte pipeline krok za krokem a testujte každý krok zvlášť.
openclaw output format
Určuje výstupní formát (např. CSV, JSON, Excel) pro extrahovaná data a ukládá je do souboru.
Vyberte formát, který je nejvhodnější pro následné zpracování dat.
6. Ladění a Logování
openclaw debug verbose
Spustí OpenClaw v režimu podrobného ladění, zobrazuje detailní informace o průběhu operací a možných chybách.
Aktivujte verbose režim, když narazíte na neočekávané chování.
openclaw log level <úroveň>
Nastaví úroveň logování (např. INFO, WARN, ERROR) pro výstup OpenClaw. Pomáhá kontrolovat množství informací.
Při produkčním nasazení snižte úroveň logování, abyste minimalizovali objem dat.
openclaw audit changes
Provede audit změn v definici projektu nebo šablony a upozorní na potenciální problémy nebo nekonzistence.
Pravidelně spouštějte audit pro udržení integrity projektu.
openclaw test selector
Otestuje platnost a funkčnost CSS nebo XPath selektoru na dané URL a zobrazí nalezené prvky.
Vždy otestujte selektory před jejich použitím v produkčních skriptech.