ਬੁਨਿਆਦੀ ਸਕ੍ਰੈਪਿੰਗ (Basic Scraping)
openclaw scrape
ਇੱਕ ਵੈੱਬਪੇਜ ਤੋਂ ਸਾਰਾ HTML ਡਾਟਾ ਪ੍ਰਾਪਤ ਕਰੋ।
ਤੇਜ਼ ਸਕ੍ਰੈਪਿੰਗ ਲਈ ਵੈੱਬਪੇਜ ਦਾ ਪੂਰਾ HTML ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਵਰਤੋਂ।
openclaw extract --selector "css-selector"
ਖਾਸ CSS ਸਿਲੈਕਟਰ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਪੇਜ ਤੋਂ ਡਾਟਾ ਕੱਢੋ।
ਨਿਸ਼ਾਨਾ ਡਾਟਾ ਨੂੰ ਸਹੀ ਢੰਗ ਨਾਲ ਕੱਢਣ ਲਈ ਸਹੀ CSS ਸਿਲੈਕਟਰਾਂ ਦੀ ਵਰਤੋਂ ਕਰੋ।
openclaw save --output "file.json"
ਸਕ੍ਰੈਪ ਕੀਤੇ ਡਾਟਾ ਨੂੰ JSON ਫਾਈਲ ਵਿੱਚ ਸੇਵ ਕਰੋ।
ਡਾਟਾ ਨੂੰ ਭਵਿੱਖ ਵਿੱਚ ਵਰਤੋਂ ਜਾਂ ਵਿਸ਼ਲੇਸ਼ਣ ਲਈ ਸਟੋਰ ਕਰੋ।
openclaw headless
JavaScript-ਲੋਡਡ ਪੇਜਾਂ ਲਈ ਹੈੱਡਲੈੱਸ ਮੋਡ ਵਿੱਚ ਸਕ੍ਰੈਪ ਕਰੋ।
ਡਾਇਨਾਮਿਕ ਸਮੱਗਰੀ ਵਾਲੀਆਂ ਸਾਈਟਾਂ ਲਈ ਲਾਜ਼ਮੀ ਹੈ ਜੋ JS ਦੁਆਰਾ ਲੋਡ ਹੁੰਦੀਆਂ ਹਨ।
openclaw render --wait 5s
ਵੈੱਬਪੇਜ ਦੇ ਪੂਰੀ ਤਰ੍ਹਾਂ ਰੈਂਡਰ ਹੋਣ ਲਈ ਇੱਕ ਨਿਰਧਾਰਤ ਸਮੇਂ ਲਈ ਉਡੀਕ ਕਰੋ।
ਇਹ ਸੁਨਿਸ਼ਚਿਤ ਕਰੋ ਕਿ ਸਾਰੇ JS ਤੱਤਾਂ ਨੂੰ ਸਕ੍ਰੈਪ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਲੋਡ ਕੀਤਾ ਗਿਆ ਹੈ।
ਡਾਟਾ ਫਿਲਟਰਿੰਗ ਅਤੇ ਪਰਿਵਰਤਨ (Data Filtering & Transformation)
openclaw filter --query "$.items[?(@.price < 100)]"
JSON ਡਾਟਾ ਨੂੰ ਇੱਕ JMESPath ਜਾਂ JSONPath ਕਵੇਰੀ ਨਾਲ ਫਿਲਟਰ ਕਰੋ।
ਸਿਰਫ਼ ਉਹ ਡਾਟਾ ਪ੍ਰਾਪਤ ਕਰੋ ਜੋ ਤੁਹਾਡੀਆਂ ਖਾਸ ਸ਼ਰਤਾਂ ਨੂੰ ਪੂਰਾ ਕਰਦਾ ਹੋਵੇ।
openclaw transform --template "output.j2"
Jinja2 ਟੈਂਪਲੇਟ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਕੱਢੇ ਗਏ ਡਾਟਾ ਨੂੰ ਬਦਲੋ।
ਆਉਟਪੁੱਟ ਡਾਟਾ ਨੂੰ ਆਪਣੀਆਂ ਲੋੜਾਂ ਅਨੁਸਾਰ ਫਾਰਮੈਟ ਕਰੋ।
openclaw map --field "title" --regex "(\w+)"
ਖਾਸ ਫੀਲਡਾਂ 'ਤੇ ਰੈਗੂਲਰ ਐਕਸਪ੍ਰੈਸ਼ਨ ਲਾਗੂ ਕਰੋ ਤਾਂ ਜੋ ਡਾਟਾ ਨੂੰ ਹੋਰ ਸ਼ੁੱਧ ਕੀਤਾ ਜਾ ਸਕੇ।
ਫੀਲਡਾਂ ਦੇ ਅੰਦਰੋਂ ਖਾਸ ਪੈਟਰਨ ਜਾਂ ਉਪ-ਸਤਰਾਂ ਨੂੰ ਕੱਢਣ ਲਈ ਸ਼ਕਤੀਸ਼ਾਲੀ।
openclaw clean --remove-html-tags
HTML ਟੈਗਸ ਨੂੰ ਹਟਾ ਕੇ ਟੈਕਸਟ ਡਾਟਾ ਨੂੰ ਸਾਫ਼ ਕਰੋ।
ਸਿਰਫ਼ ਸਾਫ਼, ਪਲੇਨ ਟੈਕਸਟ ਡਾਟਾ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਵਰਤੋਂ।
openclaw dedupe --key "url"
ਇੱਕ ਖਾਸ ਕੁੰਜੀ ਦੇ ਆਧਾਰ 'ਤੇ ਡਾਟਾ ਤੋਂ ਡੁਪਲੀਕੇਟ ਐਂਟਰੀਆਂ ਹਟਾਓ।
ਡਾਟਾ ਸੈੱਟ ਵਿੱਚ ਵਿਲੱਖਣ ਰਿਕਾਰਡਾਂ ਨੂੰ ਯਕੀਨੀ ਬਣਾਓ।
ਉੱਨਤ ਨੈਵੀਗੇਸ਼ਨ (Advanced Navigation)
openclaw paginate --next-selector ".next-button"
ਸਫ਼ਿਆਂ ਰਾਹੀਂ ਆਪਣੇ ਆਪ ਨੈਵੀਗੇਟ ਕਰੋ ਅਤੇ ਡਾਟਾ ਸਕ੍ਰੈਪ ਕਰੋ।
ਬਹੁਤ ਸਾਰੇ ਪੰਨਿਆਂ ਵਾਲੀਆਂ ਸੂਚੀ ਸਾਈਟਾਂ ਲਈ ਆਦਰਸ਼।
openclaw follow --links-selector "a.product-link"
ਖਾਸ ਲਿੰਕਾਂ ਦਾ ਪਾਲਣ ਕਰੋ ਅਤੇ ਉਹਨਾਂ ਦੇ ਅੰਦਰਲੀ ਸਮੱਗਰੀ ਨੂੰ ਸਕ੍ਰੈਪ ਕਰੋ।
ਉਤਪਾਦ ਜਾਂ ਲੇਖ ਦੇ ਵੇਰਵਿਆਂ ਵਰਗੇ ਅੰਦਰੂਨੀ ਪੰਨਿਆਂ ਤੋਂ ਡਾਟਾ ਕੱਢਣ ਲਈ ਵਰਤੋਂ।
openclaw login --username "user" --password "pass"
ਪ੍ਰਮਾਣਿਕਤਾ ਦੀ ਲੋੜ ਵਾਲੀਆਂ ਸਾਈਟਾਂ ਲਈ ਲੌਗਇਨ ਕਰੋ।
ਪ੍ਰਾਈਵੇਟ ਜਾਂ ਲੌਗਇਨ-ਪ੍ਰੋਟੈਕਟਡ ਸਮੱਗਰੀ ਤੱਕ ਪਹੁੰਚ ਕਰੋ।
openclaw click --selector "#accept-cookies"
ਇੱਕ ਖਾਸ ਤੱਤ 'ਤੇ ਕਲਿੱਕ ਕਰੋ, ਜਿਵੇਂ ਕਿ ਇੱਕ ਬਟਨ ਜਾਂ ਲਿੰਕ।
ਇੰਟਰਐਕਟਿਵ ਤੱਤਾਂ ਨੂੰ ਟਰਿੱਗਰ ਕਰਨ ਲਈ ਉਪਯੋਗੀ।
openclaw fill --form "#search-form" --data '{"query": "OpenClaw"}'
ਫਾਰਮ ਖੇਤਰਾਂ ਨੂੰ ਭਰੋ ਅਤੇ ਜਮ੍ਹਾਂ ਕਰੋ।
ਖੋਜ ਨਤੀਜਿਆਂ ਨੂੰ ਸਕ੍ਰੈਪ ਕਰਨ ਜਾਂ ਡਾਟਾ ਦਾਖਲ ਕਰਨ ਲਈ ਵਰਤੋਂ।
ਆਉਟਪੁੱਟ ਅਤੇ ਰਿਪੋਰਟਿੰਗ (Output & Reporting)
openclaw export --format csv --output "data.csv"
ਸਕ੍ਰੈਪ ਕੀਤੇ ਡਾਟਾ ਨੂੰ ਵੱਖ-ਵੱਖ ਫਾਰਮੈਟਾਂ (ਜਿਵੇਂ ਕਿ CSV, XML) ਵਿੱਚ ਐਕਸਪੋਰਟ ਕਰੋ।
ਵੱਖ-ਵੱਖ ਐਪਲੀਕੇਸ਼ਨਾਂ ਨਾਲ ਅਨੁਕੂਲਤਾ ਲਈ ਡਾਟਾ ਤਿਆਰ ਕਰੋ।
openclaw report --summary
ਸਕ੍ਰੈਪ ਕੀਤੇ ਡਾਟਾ ਦੀ ਇੱਕ ਸੰਖੇਪ ਰਿਪੋਰਟ ਤਿਆਰ ਕਰੋ।
ਇੱਕ ਨਜ਼ਰ ਵਿੱਚ ਸਕ੍ਰੈਪਿੰਗ ਓਪਰੇਸ਼ਨ ਦੇ ਨਤੀਜਿਆਂ ਨੂੰ ਸਮਝੋ।
openclaw validate --schema "schema.json"
JSON ਸਕੀਮਾ ਦੇ ਵਿਰੁੱਧ ਕੱਢੇ ਗਏ ਡਾਟਾ ਨੂੰ ਪ੍ਰਮਾਣਿਤ ਕਰੋ।
ਡਾਟਾ ਦੀ ਇਕਸਾਰਤਾ ਅਤੇ ਸ਼ੁੱਧਤਾ ਨੂੰ ਯਕੀਨੀ ਬਣਾਓ।
openclaw visualize --type chart
ਡਾਟਾ ਨੂੰ ਚਾਰਟ ਜਾਂ ਹੋਰ ਗ੍ਰਾਫਿਕਲ ਫਾਰਮੈਟਾਂ ਵਿੱਚ ਦ੍ਰਿਸ਼ਟੀਗਤ ਕਰੋ।
ਡਾਟਾ ਪੈਟਰਨਾਂ ਅਤੇ ਰੁਝਾਨਾਂ ਦੀ ਬਿਹਤਰ ਸਮਝ ਲਈ।
openclaw notify --channel "slack" --message "Scraping completed!"
ਸਕ੍ਰੈਪਿੰਗ ਪੂਰੀ ਹੋਣ 'ਤੇ ਜਾਂ ਗਲਤੀਆਂ ਹੋਣ 'ਤੇ ਸੂਚਨਾਵਾਂ ਭੇਜੋ।
ਆਪਣੇ ਸਕ੍ਰੈਪਿੰਗ ਕਾਰਜਾਂ ਦੀ ਨਿਗਰਾਨੀ ਲਈ ਆਟੋਮੇਸ਼ਨ।
ਪ੍ਰੌਕਸੀ ਅਤੇ ਹੈਂਡਲਿੰਗ (Proxy & Error Handling)
openclaw proxy --server "http://proxy.example.com:8080"
ਪ੍ਰੌਕਸੀ ਸਰਵਰਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ IP ਬਲਾਕਿੰਗ ਤੋਂ ਬਚੋ।
ਵੱਡੇ ਪੱਧਰ 'ਤੇ ਸਕ੍ਰੈਪਿੰਗ ਕਰਦੇ ਸਮੇਂ ਆਪਣੀ ਅਗਿਆਤਤਾ ਬਣਾਈ ਰੱਖੋ।
openclaw rotate-proxies --list "proxies.txt"
ਇੱਕ ਪ੍ਰੌਕਸੀ ਸੂਚੀ ਤੋਂ ਪ੍ਰੌਕਸੀ ਘੁੰਮਾਓ।
IP ਬਲੈਕਲਿਸਟਿੰਗ ਦੇ ਜੋਖਮ ਨੂੰ ਹੋਰ ਘਟਾਓ।
openclaw retry --attempts 3 --delay 5s
ਅਸਫਲ ਬੇਨਤੀਆਂ ਨੂੰ ਇੱਕ ਨਿਰਧਾਰਤ ਸੰਖਿਆ ਵਾਰ ਅਤੇ ਦੇਰੀ ਨਾਲ ਦੁਬਾਰਾ ਕੋਸ਼ਿਸ਼ ਕਰੋ।
ਅਸਥਾਈ ਨੈੱਟਵਰਕ ਮੁੱਦਿਆਂ ਜਾਂ ਸਰਵਰ ਲੋਡ ਲਈ ਸਹਿਣਸ਼ੀਲਤਾ ਵਧਾਓ।
openclaw user-agent "Mozilla/5.0..."
ਕਸਟਮ ਯੂਜ਼ਰ-ਏਜੰਟ ਸੈੱਟ ਕਰੋ ਤਾਂ ਜੋ ਬੋਟ ਖੋਜ ਤੋਂ ਬਚਿਆ ਜਾ ਸਕੇ।
ਇੱਕ ਆਮ ਵੈੱਬ ਬ੍ਰਾਊਜ਼ਰ ਵਾਂਗ ਦਿਖਾਈ ਦਿਓ।
openclaw cookies --file "cookies.json"
ਸੈਸ਼ਨਾਂ ਨੂੰ ਬਰਕਰਾਰ ਰੱਖਣ ਅਤੇ ਲੌਗਇਨ ਸਥਿਤੀਆਂ ਦਾ ਪ੍ਰਬੰਧਨ ਕਰਨ ਲਈ ਕੂਕੀਜ਼ ਪ੍ਰਬੰਧਿਤ ਕਰੋ।
ਵੈੱਬਸਾਈਟਾਂ ਨਾਲ ਵਧੇਰੇ ਯਥਾਰਥਵਾਦੀ ਤਰੀਕੇ ਨਾਲ ਇੰਟਰੈਕਟ ਕਰੋ।
AI-ਸੰਚਾਲਿਤ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ (AI-Powered Features)
openclaw smart-extract --goal "product_details"
AI ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਬਿਨਾਂ ਖਾਸ ਸਿਲੈਕਟਰਾਂ ਦੇ ਸਮਾਰਟ ਡਾਟਾ ਐਕਸਟਰੈਕਸ਼ਨ।
ਅਣਜਾਣ ਜਾਂ ਗੁੰਝਲਦਾਰ ਵੈੱਬਸਾਈਟਾਂ ਤੋਂ ਡਾਟਾ ਕੱਢਣ ਲਈ ਆਦਰਸ਼।
openclaw summarize --field "description"
AI ਨਾਲ ਲੰਬੇ ਟੈਕਸਟ ਖੇਤਰਾਂ ਦਾ ਸਾਰਾਂਸ਼ ਕਰੋ।
ਵੱਡੇ ਟੈਕਸਟ ਡਾਟਾ ਤੋਂ ਮੁੱਖ ਜਾਣਕਾਰੀ ਨੂੰ ਤੇਜ਼ੀ ਨਾਲ ਕੱਢੋ।
openclaw classify --field "text" --labels "positive,negative"
AI ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਟੈਕਸਟ ਨੂੰ ਪੂਰਵ-ਪ੍ਰਭਾਸ਼ਿਤ ਸ਼੍ਰੇਣੀਆਂ ਵਿੱਚ ਸ਼੍ਰੇਣੀਬੱਧ ਕਰੋ।
ਵੱਡੇ ਡਾਟਾ ਸੈੱਟਾਂ ਵਿੱਚ ਟੈਕਸਟ ਡਾਟਾ ਨੂੰ ਸੰਗਠਿਤ ਅਤੇ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰੋ।
openclaw sentiment --field "review"
AI ਨਾਲ ਸਮੀਖਿਆਵਾਂ ਜਾਂ ਟਿੱਪਣੀਆਂ ਦਾ ਭਾਵਨਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰੋ।
ਗਾਹਕ ਫੀਡਬੈਕ ਅਤੇ ਜਨਤਕ ਰਾਏ ਨੂੰ ਸਮਝੋ।
openclaw generate-schema
ਇੱਕ ਵੈੱਬਪੇਜ ਤੋਂ ਸੰਭਾਵੀ ਡਾਟਾ ਸਕੀਮਾ ਤਿਆਰ ਕਰੋ।
ਸਕ੍ਰੈਪਿੰਗ ਪ੍ਰੋਜੈਕਟਾਂ ਲਈ ਇੱਕ ਸ਼ੁਰੂਆਤੀ ਬਿੰਦੂ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ।