Grundlagen und Setup
openclaw --version
Zeigt die aktuell installierte Version von OpenClaw an. Nützlich zur Überprüfung der Installation und Kompatibilität.
Führen Sie dies immer zuerst aus, um sicherzustellen, dass Sie die neueste Version verwenden oder eine bestimmte Version installiert ist.
openclaw init
Initialisiert ein neues OpenClaw-Projekt im aktuellen Verzeichnis. Erstellt eine Standardkonfigurationsdatei und Projektstruktur.
Starten Sie jedes neue Scraping-Projekt mit diesem Befehl, um eine saubere und organisierte Umgebung zu gewährleisten.
openclaw login
Authentifiziert den Benutzer bei den OpenClaw-Diensten. Erforderlich für den Zugriff auf Cloud-Funktionen und erweiterte AI-Modelle.
Verwenden Sie dies, um Ihre API-Schlüssel oder Anmeldeinformationen sicher zu konfigurieren, idealerweise mit Umgebungsvariablen.
openclaw help [command]
Zeigt eine allgemeine Hilfeübersicht oder detaillierte Informationen zu einem spezifischen OpenClaw-Befehl an.
Wenn Sie unsicher sind, wie ein Befehl funktioniert, ist 'openclaw help' Ihr bester Freund. Probieren Sie 'openclaw help extract'.
Datenextraktion
openclaw extract https://example.com/products --selector ".product-title, .product-price"
Extrahiert spezifische Daten von einer URL basierend auf CSS-Selektoren. Gibt die Daten in einem strukturierten Format aus.
Kombinieren Sie mehrere Selektoren, um verschiedene Datentypen gleichzeitig zu erfassen. Verwenden Sie den Browser-Inspektor, um Selektoren zu finden.
openclaw scrape https://example.com/blog --ai-parse "Artikelüberschrift, Autor, Datum"
Verwendet KI, um unstrukturierte Daten von einer URL zu erkennen und zu parsen. Ideal für komplexe Layouts ohne feste Selektoren.
Beschreiben Sie die gewünschten Daten so präzise wie möglich im AI-Parse-Parameter, um optimale Ergebnisse zu erzielen.
openclaw table https://example.com/data --xpath "//table[@id='data-table']"
Extrahiert Daten aus HTML-Tabellen auf einer Webseite mithilfe von XPath-Ausdrücken. Nützlich für strukturierte Tabellendaten.
XPath ist mächtig für Tabellen. Testen Sie Ihre XPath-Ausdrücke in der Browser-Konsole, bevor Sie sie verwenden.
openclaw export results.json --format csv --output products.csv
Konvertiert und speichert zuvor extrahierte Daten aus einer JSON-Datei in ein anderes Format, z.B. CSV.
OpenClaw unterstützt verschiedene Exportformate. Nutzen Sie dies, um Daten in Ihr bevorzugtes Tool zu importieren.
Navigation und Interaktion
openclaw browse https://example.com --click "#load-more-button"
Öffnet eine URL in einem Headless-Browser und führt eine Klick-Aktion auf ein angegebenes Element aus.
Nützlich für Websites, die dynamisch Inhalte laden oder eine Benutzerinteraktion erfordern, um Daten sichtbar zu machen.
openclaw fill https://example.com/login --input "username=user,password=pass"
Füllt Formularfelder auf einer Webseite aus und sendet das Formular ab. Ideal für Anmeldevorgänge oder Suchformulare.
Achten Sie auf die korrekten Namen der Input-Felder, die Sie im HTML-Code der Seite finden können.
openclaw scroll https://example.com/long-page --to "bottom"
Scrollt eine Webseite zu einer bestimmten Position (z.B. nach unten), um alle Lazy-Loaded-Inhalte zu laden.
Verwenden Sie 'bottom' oder 'selector', um sicherzustellen, dass alle Inhalte vor der Extraktion geladen sind.
openclaw wait https://example.com --for ".dynamic-content"
Wartet, bis ein bestimmtes Element auf der Seite sichtbar oder geladen ist, bevor weitere Aktionen ausgeführt werden.
Unverzichtbar für dynamische Websites, um Race Conditions zu vermeiden, bei denen Elemente noch nicht verfügbar sind.
AI-gesteuerte Analyse
openclaw analyze "Der Service war ausgezeichnet!" --sentiment
Führt eine Sentiment-Analyse für den angegebenen Text durch. Gibt die Stimmung (positiv, negativ, neutral) zurück.
Wenden Sie dies auf gescrapte Kundenbewertungen an, um schnell Trends in der Kundenzufriedenheit zu erkennen.
openclaw classify https://example.com/article --schema "Kategorie:Nachrichten, Sport, Technologie"
Klassifiziert den Inhalt einer URL basierend auf einem vorgegebenen Schema oder einer Liste von Kategorien.
Definieren Sie ein klares Schema, um präzise Klassifizierungsergebnisse zu erhalten und Inhalte automatisch zu taggen.
openclaw summarize https://example.com/report --length "short"
Erstellt eine Zusammenfassung des Textinhalts einer URL in der angegebenen Länge. Ideal für lange Artikel oder Berichte.
Experimentieren Sie mit verschiedenen Längen ('short', 'medium', 'long'), um die beste Zusammenfassung für Ihren Anwendungsfall zu finden.
openclaw identify https://example.com/contact --pattern "email, phone"
Identifiziert und extrahiert spezifische Muster (z.B. E-Mail-Adressen, Telefonnummern) aus dem Inhalt einer URL.
Dies ist sehr nützlich, um Kontaktdaten oder andere spezifische Entitäten automatisch zu sammeln.
Projektmanagement und Automatisierung
openclaw project create "MeinNeuesProjekt"
Erstellt ein neues OpenClaw-Projekt mit einer dedizierten Struktur und Konfiguration.
Verwenden Sie Projekte, um verschiedene Scraping-Aufgaben zu organisieren und Konfigurationen voneinander zu trennen.
openclaw schedule "täglich um 09:00" --run "openclaw scrape ..."
Plant die Ausführung eines OpenClaw-Befehls oder -Skripts zu einer bestimmten Zeit oder in einem Intervall.
Automatisieren Sie wiederkehrende Scraping-Aufgaben, um immer aktuelle Daten zu erhalten, ohne manuellen Eingriff.
openclaw config set "API_KEY=your_key_here"
Setzt oder aktualisiert Konfigurationsparameter für das aktuelle Projekt oder global.
Speichern Sie sensible Daten wie API-Schlüssel sicher und vermeiden Sie es, diese direkt in Skripte zu hardcodieren.
openclaw task list
Zeigt eine Liste aller geplanten oder ausgeführten Aufgaben und deren Status an.
Überwachen Sie den Fortschritt Ihrer automatisierten Scraping-Aufgaben und identifizieren Sie mögliche Probleme.
Fehlerbehandlung und Debugging
openclaw logs --level error
Zeigt Protokolleinträge von OpenClaw an, gefiltert nach dem angegebenen Schweregrad (z.B. 'error', 'warn', 'info').
Verwenden Sie dies, um Probleme schnell zu identifizieren, wenn ein Scraping-Job fehlschlägt oder unerwartete Ergebnisse liefert.
openclaw debug https://example.com/problem --verbose
Führt einen Scraping-Vorgang im Debug-Modus aus und liefert detailliertere Ausgaben über den Prozess.
Der Verbose-Modus gibt zusätzliche Informationen aus, die bei der Fehlersuche von Selektoren oder Interaktionen sehr hilfreich sind.
openclaw retry https://example.com/unstable --attempts 3 --delay 5s
Versucht einen Befehl bei einem Fehler mehrmals erneut auszuführen, mit einer optionalen Verzögerung zwischen den Versuchen.
Ideal für instabile Websites oder bei temporären Netzwerkproblemen, um die Robustheit Ihrer Scraper zu erhöhen.
openclaw validate schema.json data.json
Überprüft, ob extrahierte Daten einer vorgegebenen JSON-Schema-Definition entsprechen.
Stellen Sie sicher, dass Ihre extrahierten Daten konsistent und in dem von Ihnen erwarteten Format vorliegen.