Основни Команди и Конфигурация
openclaw init <проект-име>
Инициализира нов OpenClaw проект в текущата директория или в посоченото име. Създава необходимата структура на файлове и конфигурации.
Винаги започвайте нов проект с тази команда, за да осигурите правилното структуриране и зависимости.
openclaw config set <ключ> <стойност>
Задава или актуализира конфигурационна променлива за текущия проект или глобално. Използва се за настройка на тайм-аути, потребителски агенти и други параметри.
Използвайте 'openclaw config show' за преглед на текущите настройки. За глобални настройки добавете флага '--global'.
openclaw help <команда>
Показва подробна информация за определена команда, включително нейните опции и примери за употреба. Полезно за бърза справка.
Използвайте 'openclaw help' без аргументи, за да видите списък на всички налични команди.
openclaw version
Показва текущата инсталирана версия на OpenClaw CLI. Важно за отстраняване на проблеми и проверка на съвместимостта.
Редовно проверявайте за актуализации с 'openclaw update' или 'npm update -g openclaw-cli' (ако е инсталиран през npm).
openclaw auth login
Автентикира OpenClaw CLI с вашия API ключ, позволявайки достъп до облачни функции и по-високи лимити.
Съхранявайте API ключа си на сигурно място и избягвайте да го споделяте публично.
Извличане на Данни и Селектори
openclaw scrape --selector "css селектор" --output <файл.json>
Извлича данни от посочения URL, използвайки CSS селектор. Резултатите се записват във файл във формат JSON.
За по-сложни структури, използвайте множество селектори или разширени изрази в JSON формат.
openclaw extract xpath "//div[@class='item']/h2" --url
Извлича елементи от страницата, използвайки XPath израз. Подходящо за навигация в сложни HTML структури.
Тествайте XPath изразите си в браузъра (F12 Developer Tools) преди да ги използвате в OpenClaw.
openclaw extract regex "price: (\d+\.\d+)" --url --group 1
Използва регулярен израз за извличане на специфични модели от текстовото съдържание на страницата.
Регулярните изрази са мощни за извличане на данни, които не са в структуриран HTML/CSS.
openclaw crawl --depth 2 --pattern "/products/" --output products.csv
Стартира обхождане на уебсайт, следвайки връзки до определена дълбочина и филтрирайки по URL шаблон. Резултатите се записват в CSV.
Използвайте 'depth 0' за извличане само от началния URL без следване на връзки.
openclaw parse json '' --data-file <файл.json>
Парсва и извлича данни от локален JSON файл, използвайки JSONPath израз. Полезно за обработка на вече извлечени JSON данни.
JSONPath е изключително гъвкав за филтриране и трансформация на JSON данни.
Навигация и Филтриране
openclaw navigate --wait-for-selector ".results-list"
Навигира до посочения URL и изчаква да се появи определен CSS селектор, преди да продължи. Полезно за динамични страници.
Използвайте тази команда за страници, които зареждат съдържание асинхронно или имат lazy loading.
openclaw filter url --contains "/category/" --exclude "/archive/"
Филтрира списък от URL адреси въз основа на включени или изключени поднизове. Може да работи с файл, съдържащ URL адреси.
Създайте списък с URL адреси от предишно обхождане и го филтрирайте, за да таргетирате специфични секции.
openclaw interact click "#next-page-button" --url
Симулира кликване върху елемент на страницата, идентифициран с CSS селектор. Полезно за навигация през пагинация или интерактивни елементи.
Комбинирайте с 'openclaw scrape' след клик, за да извлечете данни от новата страница.
openclaw interact type "#search-input" "ключова дума" --url
Въвежда текст в поле за въвеждане, идентифицирано с CSS селектор. Полезно за търсене или попълване на формуляри.
Можете да симулирате натискане на Enter след въвеждане, като добавите ' --press-key Enter'.
openclaw follow links --from-url --selector "a.product-link" --limit 10
Следва връзки, които отговарят на даден CSS селектор, от посочен начален URL. Ограничава броя на следваните връзки.
Използвайте внимателно, за да не претоварите целевия уебсайт. Винаги спазвайте robot.txt.
Управление на Сесии и Проксита
openclaw session start --proxy-pool "my_proxies.txt" --user-agent "Mozilla/5.0"
Стартира нова сесия за скрейпинг, конфигурирана с пуул от проксита и персонализиран потребителски агент. Повишава анонимността и избягва блокиране.
Пуулът с проксита трябва да е текстов файл, където всеки ред е IP:PORT или USER:PASS@IP:PORT.
openclaw session stop
Прекратява активна сесия, освобождавайки ресурси и връзки.
Използвайте 'openclaw session list' за да видите активните сесии и техните ID-та.
openclaw proxy add
Добавя нов прокси сървър към глобалния или проектния списък с проксита. Пример: http://user:[email protected]:8080.
Можете да използвате 'openclaw proxy remove' за премахване на проксита или 'openclaw proxy clear' за изчистване на списъка.
openclaw proxy use --rotate --test
Конфигурира OpenClaw да използва ротиращи проксита от списъка и ги тества за валидност преди употреба.
Ротацията на проксита е ключова за дълготрайни и мащабни операции по скрейпинг.
openclaw headers add "Cookie: mycookie=value" --global
Добавя персонализирани HTTP хедъри към всички заявки. Полезно за поддържане на сесии или симулация на специфични браузърни настройки.
Можете да добавяте 'User-Agent', 'Referer', 'Accept-Language' и други хедъри.
Експорт и Докладване
openclaw export csv <файл.json> --fields "title,price,url" --output data.csv
Конвертира извлечени JSON данни в CSV формат, като избира само посочените полета.
Уверете се, че имената на полетата съвпадат с ключовете във вашия JSON файл.
openclaw export json <файл.json> --pretty
Форматира JSON файл за по-добра четимост, добавяйки индентация. Полезно за отстраняване на грешки и преглед.
Използвайте тази команда, когато споделяте JSON данни с други разработчици.
openclaw report summary <лог_файл>
Генерира обобщен доклад от лог файл на OpenClaw, показващ статистика за заявки, грешки и извлечени елементи.
Анализирайте тези доклади, за да оптимизирате вашите скрейпинг стратегии и да идентифицирате проблеми.
openclaw log level debug
Задава нивото на детайлност на лог съобщенията. Опции: info, warn, error, debug, silent.
Използвайте 'debug' за подробно отстраняване на грешки и 'error' за продукционни среди.
openclaw validate schema <файл.json> --schema <схема.json>
Валидира структурата на извлечените JSON данни спрямо предварително дефинирана JSON схема.
Валидирането на схемата е критично за поддържане на консистентност на данните в мащабни проекти.
Разширени Функции и Автоматизация
openclaw script run <скрипт.js> --args "param1=value1"
Изпълнява персонализиран JavaScript скрипт, който може да взаимодейства със страницата, да обработва данни или да изпълнява сложна логика.
Скриптовете предлагат максимална гъвкавост за сценарии, които не могат да бъдат покрити от вградени команди.
openclaw schedule task "my_scraper" --cron "0 0 * * *" --command "openclaw scrape ..."
Планира изпълнението на OpenClaw команда или скрипт в определено време, използвайки cron синтаксис.
Автоматизирайте ежедневни или ежеседмични задачи за скрейпинг, за да поддържате данните си актуални.
openclaw webhook add --event "data_extracted" --payload-template <файл.json>
Конфигурира уебкука, който изпраща данни до посочен URL при настъпване на определено събитие (напр. успешно извличане на данни).
Използвайте уебкукове за интеграция с други системи или за известяване в реално време.
openclaw screenshot --full-page --output screenshot.png
Прави екранна снимка на уеб страница. Може да заснеме цялата страница или само видимата част.
Полезно за отстраняване на грешки, документиране или визуална проверка на извлечените данни.
openclaw headless false --url --interact click "#button"
Изпълнява операции с браузъра във видим режим (не headless), което е полезно за отстраняване на грешки и наблюдение на взаимодействията.
Използвайте само за локално отстраняване на грешки, тъй като е по-ресурсоемко.