Ultimate Reference

OpenClaw CLI: Il Tuo Cheat Sheet Definitivo

Padronanza del Web Scraping Intelligente e dell'Automazione Dati con OpenClaw.

1. Iniziazione e Configurazione

openclaw init
Copied!

Inizializza un nuovo progetto OpenClaw nella directory corrente, creando la struttura di base necessaria.

Usa questo comando per avviare ogni nuovo progetto di scraping o automazione.

openclaw config set
Copied!

Imposta un parametro di configurazione specifico, che può essere globale o legato al progetto corrente.

Configura proxy, user-agent o credenziali API per un uso efficiente.

openclaw login --api-key
Copied!

Autentica la CLI con la tua chiave API di OpenClaw per accedere a funzionalità avanzate e servizi cloud.

Mantieni la tua chiave API sicura e non condividerla pubblicamente.

openclaw update
Copied!

Controlla e installa gli aggiornamenti disponibili per OpenClaw CLI, assicurandoti di avere l'ultima versione.

Esegui regolarmente per beneficiare delle nuove funzionalità e correzioni di bug.

2. Scraping Base e Navigazione

openclaw fetch --selector
Copied!

Recupera il contenuto di un URL ed estrae elementi specifici utilizzando selettori CSS o XPath.

Ideale per estrazioni rapide di dati da singole pagine.

openclaw browse --headless
Copied!

Apre una sessione browser (visibile o headless) per la navigazione interattiva o l'esecuzione di script JavaScript.

Utilizza la modalità headless per operazioni automatizzate senza interfaccia grafica.

openclaw list-links --depth 1
Copied!

Estrae tutti i link presenti in una pagina, con un'opzione per specificare la profondità di ricerca.

Utile per mappare la struttura di un sito o per crawling di base.

openclaw capture-screenshot --output
Copied!

Acquisisce uno screenshot di una pagina web, utile per debugging visivo o archiviazione.

Aggiungi opzioni come --full-page per catturare l'intera altezza della pagina.

3. Estrazione Dati Avanzata

openclaw extract-table --index
Copied!

Estrae una tabella HTML specifica (identificata dal suo indice) da un URL fornito.

Verifica l'indice della tabella desiderata tramite ispezione dell'elemento.

openclaw paginate --pages
Copied!

Gestisce l'estrazione di dati attraverso pagine multiple che seguono un pattern URL specifico.

Definisci il pattern URL con segnaposto per numeri di pagina o offset.

openclaw interact --actions
Copied!

Simula interazioni utente complesse (click, scroll, input di testo) su una pagina web utilizzando uno script JavaScript.

Crea script JavaScript per gestire popup, moduli o elementi dinamici.

openclaw ai-extract --schema
Copied!

Utilizza l'intelligenza artificiale per estrarre dati strutturati da una pagina, basandosi su uno schema JSON fornito.

Definisci uno schema chiaro per guidare l'AI nell'estrazione precisa dei dati.

4. Automazione e Workflow

openclaw schedule --cron "..."
Copied!

Pianifica l'esecuzione automatica di un comando OpenClaw in base a un'espressione cron.

Automatizza task ripetitivi come il monitoraggio prezzi o l'aggiornamento dati.

openclaw pipeline create --steps
Copied!

Definisce e crea una pipeline di estrazione dati multi-step, concatenando più operazioni OpenClaw.

Usa le pipeline per flussi di lavoro complessi che richiedono più passaggi.

openclaw run-workflow
Copied!

Esegue un workflow predefinito, utile per l'automazione di task complessi e orchestrati.

Monitora l'esecuzione del workflow con il comando 'monitor'.

openclaw monitor
Copied!

Monitora lo stato e i progressi di un job o workflow OpenClaw in esecuzione, fornendo feedback in tempo reale.

Ottimo per il debugging e per assicurarsi che i task siano completati con successo.

5. Gestione Errori e Debugging

openclaw logs view --level error
Copied!

Visualizza i log dettagliati di un job specifico, con la possibilità di filtrare per livello di gravità (es. error, warn, info).

Analizza i log per identificare la causa di eventuali fallimenti.

openclaw debug --verbose
Copied!

Esegue un comando OpenClaw in modalità debug, fornendo output diagnostici estremamente dettagliati.

Indispensabile per risolvere problemi complessi di selezione o interazione.

openclaw retry --attempts --delay 5
Copied!

Riprova automaticamente l'esecuzione di un comando in caso di fallimento temporaneo, con un numero specificato di tentativi e un ritardo.

Utilizza per gestire errori di rete o blocchi temporanei da parte dei siti.

openclaw health-check
Copied!

Esegue un controllo dello stato del sistema e delle dipendenze di OpenClaw, verificando l'ambiente operativo.

Usa prima di avviare operazioni importanti per assicurarti che tutto sia configurato correttamente.

6. Esportazione e Integrazione

openclaw export --format
Copied!

Esporta i dati estratti da una sorgente (es. un job completato) in vari formati di file.

Scegli il formato più adatto per la successiva analisi o integrazione.

openclaw integrate-db --db
Copied!

Inserisce i dati estratti direttamente in un database configurato (es. PostgreSQL, MySQL, MongoDB).

Crea un file di configurazione JSON per le credenziali del database.

openclaw push-api --endpoint
Copied!

Invia i dati estratti a un endpoint API esterno tramite richieste HTTP POST o PUT.

Automatizza l'invio di dati a servizi esterni o webhook.

openclaw serve-api --port
Copied!

Avvia un server API locale che espone i dati estratti tramite endpoint RESTful.

Utile per integrare OpenClaw con applicazioni locali o per testing.

Domande Frequenti (FAQ) su OpenClaw

Cos'è OpenClaw?

OpenClaw è un potente strumento CLI basato su AI per il web scraping avanzato, l'estrazione di dati strutturati e l'automazione di complessi flussi di lavoro di dati.

OpenClaw supporta JavaScript?

Sì, OpenClaw è in grado di eseguire JavaScript e simulare interazioni utente complesse, rendendolo efficace anche con siti web dinamici e applicazioni single-page.

Posso integrare OpenClaw con i miei database?

Assolutamente. OpenClaw offre comandi per l'esportazione diretta in vari formati e l'integrazione con i database più comuni come PostgreSQL, MySQL e MongoDB.

Come gestisce OpenClaw la protezione anti-bot?

OpenClaw include funzionalità avanzate per la gestione delle protezioni anti-bot, come la rotazione dei proxy, la simulazione di browser reali e la gestione dei captcha tramite AI e servizi esterni.