Ultieme Referentie

OpenClaw CLI Cheat Sheet: Ultieme Gids voor Web Scraping en Data Extractie

Beheers OpenClaw's krachtige AI-commando's voor efficiënte data-automatisering en -analyse.

Basiscommando's & Projectbeheer

openclaw init
Copied!

Initialiseert een nieuw OpenClaw project in de huidige directory. Hiermee worden de benodigde configuratiebestanden aangemaakt.

Gebruik `openclaw init .` om een project in de huidige map te initialiseren zonder een nieuwe submap te maken.

openclaw login
Copied!

Authenticeert de CLI-tool met je OpenClaw account. Vereist inloggegevens zoals API-sleutel of gebruikersnaam/wachtwoord.

Bewaar je API-sleutel veilig en vermijd deze direct in scripts te hardcoden.

openclaw status
Copied!

Toont de huidige status van het project, inclusief actieve taken, geplande runs en beschikbare resources.

Gebruik `openclaw status --verbose` voor gedetailleerde logboeken en debugging informatie.

openclaw help
Copied!

Geeft uitgebreide hulp en gebruiksinstructies voor een specifiek OpenClaw commando.

Begin met `openclaw help` om een lijst van alle beschikbare commando's te zien.

Web Scraping & Extractie

openclaw scrape --selector ""
Copied!

Voert een gerichte web scrape uit op de opgegeven URL en extraheert data met de specifieke CSS-selector of XPath.

Test je selectors eerst in de browser developer tools voordat je ze in OpenClaw gebruikt.

openclaw extract --ai-model "smart_parser"
Copied!

Gebruikt een AI-model voor intelligente, ongestructureerde data-extractie van de opgegeven URL, zonder vooraf gedefinieerde selectors.

Experimenteer met verschillende AI-modellen voor optimale resultaten op diverse webpagina's.

openclaw follow --depth 2 --pattern "/blog/*"
Copied!

Volgt links vanaf de start-URL tot een bepaalde diepte, filterend op URL-patronen, ideaal voor het scrapen van hele websites of blogs.

Combineer met `--delay ` om de server niet te overbelasten en anti-bot maatregelen te omzeilen.

openclaw screenshot --full-page --output "pagina.png"
Copied!

Maakt een volledige paginascreenshot van de opgegeven URL, inclusief scrollbaar gedeelte, en slaat deze op als afbeelding.

Handig voor visuele auditing of het documenteren van webpagina's voor en na wijzigingen.

openclaw headless --action "click #accept-cookies" --wait 5
Copied!

Lanceert een headless browser, navigeert naar de URL en voert gespecificeerde interacties uit, zoals klikken, typen of wachten.

Gebruik `--action "type #zoekveld 'query'"` om tekst in te voeren in formulieren.

Dataverwerking & Opslag

openclaw process --transform "clean_html, deduplicate"
Copied!

Past een reeks transformaties toe op een lokaal of eerder geëxtraheerd databestand, zoals HTML opschonen of duplicaten verwijderen.

Creëer aangepaste transformatielogica voor complexe datamanipulatie.

openclaw export --format csv --output "data.csv"
Copied!

Exporteert eerder geëxtraheerde data, geïdentificeerd door `data_id`, naar een gespecificeerd formaat zoals CSV, JSON of Excel.

Gebruik `--fields "naam,prijs"` om alleen specifieke kolommen te exporteren.

openclaw store --collection "producten" --upsert-key "sku"
Copied!

Slaat gestructureerde data op in een benoemde datacollectie binnen OpenClaw's opslag, met optionele upsert-functionaliteit.

De `--upsert-key` voorkomt het aanmaken van duplicaten en werkt bestaande records bij.

openclaw merge --key "id" --output "merged.json"
Copied!

Voegt twee JSON- of CSV-bestanden samen op basis van een gemeenschappelijke sleutel, handig voor het combineren van datasets.

Zorg ervoor dat de sleutelwaarden consistent zijn in beide bestanden voor een succesvolle merge.

Automatisering & Planning

openclaw schedule --interval "daily" --time "03:00"
Copied!

Plant een eerder gedefinieerde OpenClaw taak om automatisch te worden uitgevoerd met een opgegeven interval en tijd.

Gebruik `--interval "weekly" --day "monday"` voor wekelijkse taken op een specifieke dag.

openclaw trigger --data "payload.json"
Copied!

Activeert een OpenClaw workflow of taak als reactie op een externe gebeurtenis, vaak gebruikt in CI/CD of webhook-integraties.

Definieer duidelijke gebeurtenisnamen om je triggers eenvoudig te beheren en te debuggen.

openclaw workflow create "DagelijkseScrape" --steps "scrape_blog, process_data, export_csv"
Copied!

Definieert en creëert een complexe workflow die een reeks OpenClaw commando's of taken in een specifieke volgorde uitvoert.

Workflows helpen bij het organiseren van complexe scraping-projecten in logische, herbruikbare stappen.

openclaw monitor --alert "email:[email protected]" --threshold "errors > 5"
Copied!

Stelt monitoring in voor een specifieke taak en stuurt alerts via e-mail of andere kanalen wanneer vooraf gedefinieerde drempels worden overschreden.

Configureer alerts voor zowel successen als fouten om een volledig beeld van je geautomatiseerde taken te krijgen.

AI & Integraties

openclaw analyze --sentiment --language "nl"
Copied!

Voert sentimentanalyse uit op een opgegeven tekst, retourneert een score die de emotionele toon aangeeft (positief, negatief, neutraal).

Gebruik dit op productrecensies of klantfeedback om snel inzicht te krijgen in de publieke opinie.

openclaw classify --schema "product_categorieën"
Copied!

Classificeert ongestructureerde data, zoals productbeschrijvingen, in vooraf gedefinieerde categorieën met behulp van AI-modellen en een specifiek schema.

Train je eigen classificatieschema's voor domeinspecifieke nauwkeurigheid.

openclaw integrate --api-key --config "config.json"
Copied!

Configureert integratie met externe services zoals CRM-systemen, databases of cloudopslag.

Bewaar gevoelige API-sleutels in omgevingsvariabelen in plaats van direct in de configuratiebestanden.

openclaw generate --type "summary" --length "short" --input "artikel.txt"
Copied!

Genereert AI-gestuurde content op basis van een prompt en invoerdata, bijvoorbeeld een samenvatting van een artikel of nieuwe productbeschrijvingen.

Experimenteer met verschillende promptformuleringen en lengteparameters voor diverse output.

Configuratie & Beheer

openclaw config set proxy.default "http://localhost:8080"
Copied!

Stelt algemene configuratie-instellingen in voor OpenClaw, zoals standaardproxy's, timeouts of retries.

Gebruik `openclaw config get ` om de huidige waarde van een configuratie-instelling te controleren.

openclaw proxy add "myproxy.com:8080" --auth "user:pass"
Copied!

Voegt een nieuwe proxy toe aan de pool van beschikbare proxy's voor je scraping-taken.

Beheer een lijst met roterende proxy's om blokkades te voorkomen en geografische beperkingen te omzeilen.

openclaw agents list
Copied!

Toont een lijst van alle beschikbare scraping-agents en hun huidige status, inclusief hun capaciteit en locatie.

Kies agents die geografisch dicht bij de doelwebsite staan voor snellere responstijden.

openclaw update
Copied!

Controleert op updates voor de OpenClaw CLI-tool en installeert de nieuwste versie indien beschikbaar.

Voer regelmatig `openclaw update` uit om te profiteren van de nieuwste functies en beveiligingspatches.

openclaw version
Copied!

Geeft de huidige geïnstalleerde versie van de OpenClaw CLI-tool weer.

Vermeld de versie bij het melden van bugs of het vragen om ondersteuning.

Veelgestelde Vragen over OpenClaw

Wat is OpenClaw?

OpenClaw is een geavanceerde AI Command Line Interface (CLI) tool ontworpen voor web scraping, data-extractie en automatisering van complexe data workflows. Het maakt gebruik van AI om ongestructureerde data efficiënt te verwerken.

Is OpenClaw geschikt voor grootschalige web scraping projecten?

Absoluut. OpenClaw is gebouwd met schaalbaarheid in gedachten, ondersteunt parallelle taken, proxyrotatie en geavanceerde planning om efficiënt grote hoeveelheden data te verwerken en te extraheren.

Hoe gaat OpenClaw om met anti-bot maatregelen van websites?

OpenClaw integreert geavanceerde technieken zoals intelligente proxyrotatie, user-agent beheer, headless browser emulatie en aanpasbare vertragingen om detectie te minimaliseren en effectief anti-bot maatregelen te omzeilen.

Kan ik OpenClaw integreren met mijn bestaande data-infrastructuur?

Ja, OpenClaw biedt flexibele exportopties naar diverse formaten (CSV, JSON, Excel) en kan via API's en webhooks worden geïntegreerd met databases, cloud services en andere applicaties voor naadloze data-overdracht en automatisering.