Ultimate Reference

OpenClaw CLI Cheat Sheet: Крайният Наръчник

Овладейте OpenClaw – мощният AI CLI инструмент за уеб скрейпинг и извличане на данни. Ефективност и прецизност във вашите ръце.

Основни Команди и Конфигурация

openclaw init <проект-име>
Copied!

Инициализира нов OpenClaw проект в текущата директория или в посоченото име. Създава необходимата структура на файлове и конфигурации.

Винаги започвайте нов проект с тази команда, за да осигурите правилното структуриране и зависимости.

openclaw config set <ключ> <стойност>
Copied!

Задава или актуализира конфигурационна променлива за текущия проект или глобално. Използва се за настройка на тайм-аути, потребителски агенти и други параметри.

Използвайте 'openclaw config show' за преглед на текущите настройки. За глобални настройки добавете флага '--global'.

openclaw help <команда>
Copied!

Показва подробна информация за определена команда, включително нейните опции и примери за употреба. Полезно за бърза справка.

Използвайте 'openclaw help' без аргументи, за да видите списък на всички налични команди.

openclaw version
Copied!

Показва текущата инсталирана версия на OpenClaw CLI. Важно за отстраняване на проблеми и проверка на съвместимостта.

Редовно проверявайте за актуализации с 'openclaw update' или 'npm update -g openclaw-cli' (ако е инсталиран през npm).

openclaw auth login
Copied!

Автентикира OpenClaw CLI с вашия API ключ, позволявайки достъп до облачни функции и по-високи лимити.

Съхранявайте API ключа си на сигурно място и избягвайте да го споделяте публично.

Извличане на Данни и Селектори

openclaw scrape --selector "css селектор" --output <файл.json>
Copied!

Извлича данни от посочения URL, използвайки CSS селектор. Резултатите се записват във файл във формат JSON.

За по-сложни структури, използвайте множество селектори или разширени изрази в JSON формат.

openclaw extract xpath "//div[@class='item']/h2" --url
Copied!

Извлича елементи от страницата, използвайки XPath израз. Подходящо за навигация в сложни HTML структури.

Тествайте XPath изразите си в браузъра (F12 Developer Tools) преди да ги използвате в OpenClaw.

openclaw extract regex "price: (\d+\.\d+)" --url --group 1
Copied!

Използва регулярен израз за извличане на специфични модели от текстовото съдържание на страницата.

Регулярните изрази са мощни за извличане на данни, които не са в структуриран HTML/CSS.

openclaw crawl --depth 2 --pattern "/products/" --output products.csv
Copied!

Стартира обхождане на уебсайт, следвайки връзки до определена дълбочина и филтрирайки по URL шаблон. Резултатите се записват в CSV.

Използвайте 'depth 0' за извличане само от началния URL без следване на връзки.

openclaw parse json '' --data-file <файл.json>
Copied!

Парсва и извлича данни от локален JSON файл, използвайки JSONPath израз. Полезно за обработка на вече извлечени JSON данни.

JSONPath е изключително гъвкав за филтриране и трансформация на JSON данни.

Навигация и Филтриране

openclaw navigate --wait-for-selector ".results-list"
Copied!

Навигира до посочения URL и изчаква да се появи определен CSS селектор, преди да продължи. Полезно за динамични страници.

Използвайте тази команда за страници, които зареждат съдържание асинхронно или имат lazy loading.

openclaw filter url --contains "/category/" --exclude "/archive/"
Copied!

Филтрира списък от URL адреси въз основа на включени или изключени поднизове. Може да работи с файл, съдържащ URL адреси.

Създайте списък с URL адреси от предишно обхождане и го филтрирайте, за да таргетирате специфични секции.

openclaw interact click "#next-page-button" --url
Copied!

Симулира кликване върху елемент на страницата, идентифициран с CSS селектор. Полезно за навигация през пагинация или интерактивни елементи.

Комбинирайте с 'openclaw scrape' след клик, за да извлечете данни от новата страница.

openclaw interact type "#search-input" "ключова дума" --url
Copied!

Въвежда текст в поле за въвеждане, идентифицирано с CSS селектор. Полезно за търсене или попълване на формуляри.

Можете да симулирате натискане на Enter след въвеждане, като добавите ' --press-key Enter'.

openclaw follow links --from-url --selector "a.product-link" --limit 10
Copied!

Следва връзки, които отговарят на даден CSS селектор, от посочен начален URL. Ограничава броя на следваните връзки.

Използвайте внимателно, за да не претоварите целевия уебсайт. Винаги спазвайте robot.txt.

Управление на Сесии и Проксита

openclaw session start --proxy-pool "my_proxies.txt" --user-agent "Mozilla/5.0"
Copied!

Стартира нова сесия за скрейпинг, конфигурирана с пуул от проксита и персонализиран потребителски агент. Повишава анонимността и избягва блокиране.

Пуулът с проксита трябва да е текстов файл, където всеки ред е IP:PORT или USER:PASS@IP:PORT.

openclaw session stop
Copied!

Прекратява активна сесия, освобождавайки ресурси и връзки.

Използвайте 'openclaw session list' за да видите активните сесии и техните ID-та.

openclaw proxy add
Copied!

Добавя нов прокси сървър към глобалния или проектния списък с проксита. Пример: http://user:[email protected]:8080.

Можете да използвате 'openclaw proxy remove' за премахване на проксита или 'openclaw proxy clear' за изчистване на списъка.

openclaw proxy use --rotate --test
Copied!

Конфигурира OpenClaw да използва ротиращи проксита от списъка и ги тества за валидност преди употреба.

Ротацията на проксита е ключова за дълготрайни и мащабни операции по скрейпинг.

openclaw headers add "Cookie: mycookie=value" --global
Copied!

Добавя персонализирани HTTP хедъри към всички заявки. Полезно за поддържане на сесии или симулация на специфични браузърни настройки.

Можете да добавяте 'User-Agent', 'Referer', 'Accept-Language' и други хедъри.

Експорт и Докладване

openclaw export csv <файл.json> --fields "title,price,url" --output data.csv
Copied!

Конвертира извлечени JSON данни в CSV формат, като избира само посочените полета.

Уверете се, че имената на полетата съвпадат с ключовете във вашия JSON файл.

openclaw export json <файл.json> --pretty
Copied!

Форматира JSON файл за по-добра четимост, добавяйки индентация. Полезно за отстраняване на грешки и преглед.

Използвайте тази команда, когато споделяте JSON данни с други разработчици.

openclaw report summary <лог_файл>
Copied!

Генерира обобщен доклад от лог файл на OpenClaw, показващ статистика за заявки, грешки и извлечени елементи.

Анализирайте тези доклади, за да оптимизирате вашите скрейпинг стратегии и да идентифицирате проблеми.

openclaw log level debug
Copied!

Задава нивото на детайлност на лог съобщенията. Опции: info, warn, error, debug, silent.

Използвайте 'debug' за подробно отстраняване на грешки и 'error' за продукционни среди.

openclaw validate schema <файл.json> --schema <схема.json>
Copied!

Валидира структурата на извлечените JSON данни спрямо предварително дефинирана JSON схема.

Валидирането на схемата е критично за поддържане на консистентност на данните в мащабни проекти.

Разширени Функции и Автоматизация

openclaw script run <скрипт.js> --args "param1=value1"
Copied!

Изпълнява персонализиран JavaScript скрипт, който може да взаимодейства със страницата, да обработва данни или да изпълнява сложна логика.

Скриптовете предлагат максимална гъвкавост за сценарии, които не могат да бъдат покрити от вградени команди.

openclaw schedule task "my_scraper" --cron "0 0 * * *" --command "openclaw scrape ..."
Copied!

Планира изпълнението на OpenClaw команда или скрипт в определено време, използвайки cron синтаксис.

Автоматизирайте ежедневни или ежеседмични задачи за скрейпинг, за да поддържате данните си актуални.

openclaw webhook add --event "data_extracted" --payload-template <файл.json>
Copied!

Конфигурира уебкука, който изпраща данни до посочен URL при настъпване на определено събитие (напр. успешно извличане на данни).

Използвайте уебкукове за интеграция с други системи или за известяване в реално време.

openclaw screenshot --full-page --output screenshot.png
Copied!

Прави екранна снимка на уеб страница. Може да заснеме цялата страница или само видимата част.

Полезно за отстраняване на грешки, документиране или визуална проверка на извлечените данни.

openclaw headless false --url --interact click "#button"
Copied!

Изпълнява операции с браузъра във видим режим (не headless), което е полезно за отстраняване на грешки и наблюдение на взаимодействията.

Използвайте само за локално отстраняване на грешки, тъй като е по-ресурсоемко.

Често Задавани Въпроси за OpenClaw

Какво е OpenClaw CLI?

OpenClaw CLI е усъвършенстван команден интерфейс, базиран на изкуствен интелект, предназначен за уеб скрейпинг и автоматизирано извличане на данни. Той предоставя мощни функции за навигация, селекция и обработка на данни от уебсайтове.

Защо да използвам OpenClaw вместо други инструменти за скрейпинг?

OpenClaw се отличава с интелигентни възможности, които помагат при справяне с анти-ботове, динамично съдържание и сложни структури на уебсайтове. Той предлага лесен за употреба CLI, гъвкавост чрез скриптове и възможности за автоматизация, което го прави идеален за както за начинаещи, така и за напреднали потребители.

Как да започна с OpenClaw?

Започнете, като инсталирате OpenClaw CLI (обикновено чрез npm или директно изтегляне). След това използвайте 'openclaw init <име_на_проект>', за да създадете нов проект, и 'openclaw help', за да разгледате наличните команди и опции.

Поддържа ли OpenClaw JavaScript изпълнение?

Да, OpenClaw поддържа изпълнение на JavaScript на страниците, което е критично за взаимодействие с динамично съдържание, SPA (Single Page Applications) и други модерни уеб технологии. Можете също да изпълнявате персонализирани JS скриптове за разширена логика.