ആരംഭിക്കുക & അടിസ്ഥാന പ്രവർത്തനങ്ങൾ
openclaw init
ഒരു പുതിയ OpenClaw പ്രോജക്റ്റ് ആരംഭിക്കുന്നു. ഇത് ആവശ്യമായ ഫയൽ ഘടനയും കോൺഫിഗറേഷനുകളും സജ്ജീകരിക്കുന്നു.
പുതിയ പ്രോജക്റ്റുകൾക്കായി എപ്പോഴും ഇത് ഉപയോഗിക്കുക. ഉദാ: openclaw init my_first_scrape
openclaw scrape
ഒരു പ്രത്യേക URL-ൽ നിന്ന് ഡാറ്റ സ്ക്രാപ്പ് ചെയ്യാനുള്ള ലളിതമായ കമാൻഡ്. അടിസ്ഥാനപരമായ പേജ് ഉള്ളടക്കം വേർതിരിച്ചെടുക്കാൻ ഉപയോഗിക്കുന്നു.
പ്രധാനപ്പെട്ട ഉള്ളടക്കത്തിനായി ഡാറ്റ എക്സ്ട്രാക്ഷൻ കമാൻഡുകൾ സംയോജിപ്പിക്കുക.
openclaw config view
നിലവിലെ പ്രോജക്റ്റിന്റെ അല്ലെങ്കിൽ ഗ്ലോബൽ കോൺഫിഗറേഷൻ ക്രമീകരണങ്ങൾ കാണിക്കുന്നു. പ്രോക്സികൾ, യൂസർ-ഏജന്റുകൾ എന്നിവ പരിശോധിക്കാൻ ഇത് സഹായകമാണ്.
കോൺഫിഗറേഷൻ ഫയലുകൾ നേരിട്ട് എഡിറ്റ് ചെയ്യുന്നതിന് മുൻപ് ഇത് ഉപയോഗിച്ച് നിലവിലെ ക്രമീകരണങ്ങൾ പരിശോധിക്കുക.
openclaw login --username --password
ലോഗിൻ ആവശ്യമായ വെബ്സൈറ്റുകളിലേക്ക് അല്ലെങ്കിൽ സേവനങ്ങളിലേക്ക് ലോഗിൻ ചെയ്യാൻ OpenClaw-നെ പ്രാപ്തമാക്കുന്നു. പാസ്വേഡുകൾ സുരക്ഷിതമായി കൈകാര്യം ചെയ്യും.
സുരക്ഷ ഉറപ്പാക്കാൻ പാസ്വേഡുകൾ എൻവയോൺമെന്റ് വേരിയബിളുകളായി സജ്ജീകരിക്കുക അല്ലെങ്കിൽ OpenClaw-ന്റെ സുരക്ഷിത സംഭരണം ഉപയോഗിക്കുക.
ഡാറ്റാ എക്സ്ട്രാക്ഷൻ
openclaw extract --css "selector" --output "column_name"
CSS സെലക്ടറുകൾ ഉപയോഗിച്ച് ഒരു വെബ് പേജിൽ നിന്ന് പ്രത്യേക ഡാറ്റ വേർതിരിച്ചെടുക്കുന്നു. ഉദാ: `.product-title`.
ഒന്നിലധികം മൂല്യങ്ങൾ വേർതിരിച്ചെടുക്കാൻ `--multiple` ഫ്ലാഗ് ഉപയോഗിക്കുക.
openclaw extract --xpath "//xpath" --output "column_name"
XPath എക്സ്പ്രഷനുകൾ ഉപയോഗിച്ച് ഡാറ്റ എക്സ്ട്രാക്റ്റ് ചെയ്യുന്നു. കൂടുതൽ സങ്കീർണ്ണമായ ഡാറ്റാ ഘടനകൾ കൈകാര്യം ചെയ്യാൻ ഇത് സഹായകമാണ്.
ഡെവലപ്പർ ടൂളുകൾ ഉപയോഗിച്ച് ശരിയായ XPath കണ്ടെത്തുക.
openclaw extract --ai "what is the product price?"
AI ഉപയോഗിച്ച് പേജിൽ നിന്ന് ആവശ്യമുള്ള ഡാറ്റയെ സ്വയമേവ തിരിച്ചറിയുകയും വേർതിരിച്ചെടുക്കുകയും ചെയ്യുന്നു. സെലക്ടറുകൾ ഇല്ലാതെ ഡാറ്റ ലഭിക്കാൻ ഇത് ഉത്തമമാണ്.
മികച്ച ഫലങ്ങൾക്കായി വ്യക്തവും സംക്ഷിപ്തവുമായ ചോദ്യങ്ങൾ നൽകുക.
openclaw extract --table "table_selector" --format csv
ഒരു HTML പട്ടിക പൂർണ്ണമായി വേർതിരിച്ചെടുക്കുന്നു, ഇത് CSV അല്ലെങ്കിൽ JSON ഫോർമാറ്റിൽ ഔട്ട്പുട്ട് ചെയ്യാൻ കഴിയും.
സങ്കീർണ്ണമായ പട്ടികകളിൽ ശരിയായ സെലക്ടർ നൽകുന്നത് ഉറപ്പാക്കുക.
openclaw extract --image "img_selector" --download-path "./images"
ഒരു പേജിൽ നിന്ന് ചിത്രങ്ങൾ വേർതിരിച്ചെടുക്കുകയും ഒരു നിശ്ചിത ഡയറക്ടറിയിലേക്ക് ഡൗൺലോഡ് ചെയ്യുകയും ചെയ്യുന്നു.
ചിത്രങ്ങൾ ഡൗൺലോഡ് ചെയ്യുന്നതിന് മുൻപ് അവയുടെ URL-കൾ പരിശോധിക്കുക.
നാവിഗേഷൻ & പേജിനേഷൻ
openclaw navigate
ഒരു പുതിയ URL-ലേക്ക് നാവിഗേറ്റ് ചെയ്യാൻ OpenClaw-നെ നിർദ്ദേശിക്കുന്നു. ഇത് സ്ക്രാപ്പിംഗ് ഫ്ലോയുടെ ഭാഗമായി ഉപയോഗിക്കാം.
ഒന്നിലധികം പേജുകൾ സ്ക്രാപ്പ് ചെയ്യുമ്പോൾ ഇത് സാധാരണയായി ഉപയോഗിക്കുന്നു.
openclaw click "selector" --wait 5
ഒരു ബട്ടണിലോ ലിങ്കിലോ ക്ലിക്ക് ചെയ്യുന്നു. AJAX ലോഡുകൾക്കായി ക്ലിക്ക് ചെയ്ത ശേഷം കാത്തിരിക്കാനുള്ള ഓപ്ഷനുണ്ട്.
ഡൈനാമിക് പേജുകളിൽ ക്ലിക്ക് ചെയ്യുന്നതിന് മുൻപ് എലമെന്റ് ലോഡ് ആകാൻ കാത്തിരിക്കുക.
openclaw paginate --next "next_button_selector" --max-pages 10
അടുത്ത പേജിലേക്ക് പോകാൻ പേജിനേഷൻ കൈകാര്യം ചെയ്യുന്നു. അടുത്ത ബട്ടൺ അല്ലെങ്കിൽ ലിങ്ക് തിരിച്ചറിയാൻ ഒരു സെലക്ടർ ഉപയോഗിക്കുന്നു.
അനന്തമായ ലൂപ്പുകൾ ഒഴിവാക്കാൻ `--max-pages` പരിധി സജ്ജമാക്കുക.
openclaw scroll --to "bottom" --delay 2
ഒരു വെബ് പേജിൽ സ്ക്രോൾ ചെയ്യാൻ ഉപയോഗിക്കുന്നു, പ്രത്യേകിച്ച് ഡൈനാമിക് ഉള്ളടക്കം ലോഡ് ചെയ്യുന്ന പേജുകളിൽ ഇത് സഹായകമാണ്.
സ്ക്രോൾ ചെയ്ത ശേഷം ഡാറ്റ ലോഡ് ആകാൻ ആവശ്യമായ സമയം `--delay` ഉപയോഗിച്ച് നൽകുക.
openclaw form fill "field_selector" "value" --submit "submit_selector"
ഒരു ഫോം ഫീൽഡ് പൂരിപ്പിക്കുകയും ആവശ്യമെങ്കിൽ ഫോം സമർപ്പിക്കുകയും ചെയ്യുന്നു. ലോഗിൻ ഫോമുകൾ അല്ലെങ്കിൽ തിരയൽ ഫോമുകൾക്ക് ഇത് ഉപയോഗിക്കാം.
ഫോം സമർപ്പിക്കുന്നതിന് മുൻപ് എല്ലാ ആവശ്യമായ ഫീൽഡുകളും പൂരിപ്പിച്ചു എന്ന് ഉറപ്പാക്കുക.
ഡാറ്റാ ഫിൽട്ടറിംഗ് & ട്രാൻസ്ഫോർമേഷൻ
openclaw filter "column_name" --contains "keyword"
ഒരു പ്രത്യേക കോളത്തിൽ ഒരു കീവേഡ് അടങ്ങിയിട്ടുണ്ടോ എന്നതിനെ അടിസ്ഥാനമാക്കി ഡാറ്റ ഫിൽട്ടർ ചെയ്യുന്നു.
ഒന്നിലധികം ഫിൽട്ടറുകൾ `--and` അല്ലെങ്കിൽ `--or` ഉപയോഗിച്ച് സംയോജിപ്പിക്കുക.
openclaw transform "column_name" --regex "pattern" --replace "replacement"
ഒരു കോളത്തിലെ ഡാറ്റയെ റെഗുലർ എക്സ്പ്രഷനുകൾ ഉപയോഗിച്ച് പരിവർത്തനം ചെയ്യുന്നു. ഡാറ്റ ക്ലീനിംഗിന് ഇത് സഹായകമാണ്.
റെഗുലർ എക്സ്പ്രഷനുകൾ പരീക്ഷിക്കാൻ ഒരു റെഗുലർ എക്സ്പ്രഷൻ ടെസ്റ്റർ ഉപയോഗിക്കുക.
openclaw merge --on "common_column"
ഒന്നിലധികം ഡാറ്റാ ഫയലുകൾ (ഉദാ: CSV, JSON) ഒരു പൊതുവായ കോളം ഉപയോഗിച്ച് ലയിപ്പിക്കുന്നു.
ലയിപ്പിക്കുന്നതിന് മുൻപ് ഫയലുകളുടെ ഫോർമാറ്റ് സ്ഥിരമാണെന്ന് ഉറപ്പാക്കുക.
openclaw deduplicate "column_name"
ഒരു പ്രത്യേക കോളത്തിലെ തനിപ്പകർപ്പുകൾ നീക്കംചെയ്യുന്നു, അതുവഴി ഡാറ്റാ സെറ്റ് വൃത്തിയാക്കുന്നു.
ഏത് കോളമാണ് തനിപ്പകർപ്പുകൾക്ക് അടിസ്ഥാനമാക്കേണ്ടതെന്ന് ശ്രദ്ധാപൂർവ്വം തിരഞ്ഞെടുക്കുക.
റിപ്പോർട്ടിംഗ് & ഔട്ട്പുട്ട്
openclaw output --format json --file data.json
സ്ക്രാപ്പ് ചെയ്ത ഡാറ്റ JSON ഫോർമാറ്റിൽ ഒരു ഫയലിലേക്ക് ഔട്ട്പുട്ട് ചെയ്യുന്നു.
സ്ക്രിപ്റ്റുകൾ അല്ലെങ്കിൽ API-കൾ ഉപയോഗിച്ച് ഡാറ്റ പ്രോസസ്സ് ചെയ്യാൻ JSON ഉത്തമമാണ്.
openclaw output --format csv --file data.csv --delimiter ","
സ്ക്രാപ്പ് ചെയ്ത ഡാറ്റ CSV ഫോർമാറ്റിൽ ഒരു ഫയലിലേക്ക് ഔട്ട്പുട്ട് ചെയ്യുന്നു. ഡിലിമിറ്റർ വ്യക്തമാക്കാൻ കഴിയും.
സ്പ്രെഡ്ഷീറ്റ് പ്രോഗ്രാമുകളിൽ ഡാറ്റ വിശകലനം ചെയ്യാൻ CSV അനുയോജ്യമാണ്.
openclaw report --summary
അവസാന സ്ക്രാപ്പിംഗ് പ്രവർത്തനത്തിന്റെ സംഗ്രഹ റിപ്പോർട്ട് കാണിക്കുന്നു, അതിൽ സ്ക്രാപ്പ് ചെയ്ത പേജുകളുടെ എണ്ണം, പിശകുകൾ എന്നിവ ഉൾപ്പെടാം.
സ്ക്രാപ്പിംഗ് ജോലികളുടെ കാര്യക്ഷമതയും പിശകുകളും നിരീക്ഷിക്കാൻ ഇത് ഉപയോഗിക്കുക.
openclaw export --db "sqlite://data.db" --table "scraped_data"
സ്ക്രാപ്പ് ചെയ്ത ഡാറ്റ ഒരു ഡാറ്റാബേസിലേക്ക് (ഉദാ: SQLite, PostgreSQL) എക്സ്പോർട്ട് ചെയ്യുന്നു.
വലിയ അളവിലുള്ള ഡാറ്റ സംഭരിക്കുന്നതിനും കൈകാര്യം ചെയ്യുന്നതിനും ഡാറ്റാബേസ് എക്സ്പോർട്ട് ഉപയോഗിക്കുക.
പ്രോക്സികളും സുരക്ഷയും
openclaw proxy add --auth :
ഒരു പുതിയ പ്രോക്സി സെർവർ ചേർക്കുന്നു. IP ബ്ലോക്കുകൾ ഒഴിവാക്കാൻ ഇത് സഹായിക്കും. പ്രാമാണീകരണം ആവശ്യമെങ്കിൽ അത് വ്യക്തമാക്കാം.
നിങ്ങൾ ഉപയോഗിക്കുന്ന പ്രോക്സികൾ വിശ്വസനീയവും വേഗതയേറിയതുമാണെന്ന് ഉറപ്പാക്കുക.
openclaw proxy rotate
പ്രോക്സി ലിസ്റ്റിൽ നിന്ന് അടുത്ത ലഭ്യമായ പ്രോക്സിയിലേക്ക് മാറുന്നു. ഓരോ അഭ്യർത്ഥനയ്ക്കും IP മാറ്റാൻ ഇത് ഉപയോഗിക്കാം.
വലിയ തോതിലുള്ള സ്ക്രാപ്പിംഗിന് ഇത് നിർണായകമാണ്.
openclaw user-agent set "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.60 Safari/537.36"
ഒരു വെബ്സൈറ്റ് ഒരു യഥാർത്ഥ ബ്രൗസറിൽ നിന്നുള്ള അഭ്യർത്ഥനയാണെന്ന് തെറ്റിദ്ധരിപ്പിക്കാൻ യൂസർ-ഏജന്റ് സജ്ജമാക്കുന്നു.
പ്രധാനപ്പെട്ട വെബ്സൈറ്റുകൾ സ്ക്രാപ്പ് ചെയ്യുമ്പോൾ ഒരു റാൻഡം യൂസർ-ഏജന്റ് ഉപയോഗിക്കുന്നത് പരിഗണിക്കുക.
openclaw bypass-captcha --service "2captcha" --api-key "YOUR_API_KEY"
ക്യാപ്ചകൾ ബൈപാസ് ചെയ്യാൻ ഒരു മൂന്നാം കക്ഷി സേവനം (ഉദാ: 2Captcha, Anti-Captcha) ഉപയോഗിക്കുന്നു.
ക്യാപ്ച ബൈപാസ് സേവനങ്ങൾ ചിലവ് വരുന്നതാണ്, അതിനാൽ ആവശ്യാനുസരണം മാത്രം ഉപയോഗിക്കുക.