ଅନ୍ତିମ ସନ୍ଦର୍ଭ

ଓପନ୍‌କ୍ଲ' (OpenClaw) ଚିଟ୍ ଶିଟ୍

ୱେବ୍ ସ୍କ୍ରାପିଂ ଏବଂ ଡାଟା ଏକ୍ସଟ୍ରାକ୍ସନ୍ ପାଇଁ ଆପଣଙ୍କର ଅନ୍ତିମ ସହାୟକ

ମୂଳ ସ୍କ୍ରାପିଂ କମାଣ୍ଡ୍ସ (Basic Scraping Commands)

openclaw fetch
Copied!

ଏକ ନିର୍ଦ୍ଦିଷ୍ଟ URL ରୁ HTML କିମ୍ବା JSON ବିଷୟବସ୍ତୁ ଫେଚ୍ କରେ।

ଏକ ୱେବ୍ ପୃଷ୍ଠାର ମୂଳ ଉତ୍ସ ଦେଖିବା ପାଇଁ ଏହା ଏକ ଭଲ ଆରମ୍ଭ।

openclaw scrape --selector "h1"
Copied!

ଏକ URL ସ୍କ୍ରାପ୍ କରେ ଏବଂ ନିର୍ଦ୍ଦିଷ୍ଟ CSS ସିଲେକ୍ଟର ସହିତ ଡାଟା ଏକ୍ସଟ୍ରାକ୍ଟ କରେ।

ଏକାଧିକ ସିଲେକ୍ଟର ପାଇଁ କମା ସହିତ ଅଲଗା କରନ୍ତୁ, ଯେପରିକି "h1, .price"।

openclaw fetch --agent mobile
Copied!

ଏକ ମୋବାଇଲ୍ ୟୁଜର୍ ଏଜେଣ୍ଟ୍ ବ୍ୟବହାର କରି URL ଫେଚ୍ କରେ, ଯାହା ମୋବାଇଲ୍-ନିର୍ଦ୍ଦିଷ୍ଟ ବିଷୟବସ୍ତୁ ପାଇଁ ଉପଯୋଗୀ।

ୱେବସାଇଟ୍ ମୋବାଇଲ୍ ଏବଂ ଡେସ୍କଟପ୍ ପାଇଁ ଭିନ୍ନ ବିଷୟବସ୍ତୁ ଦେଖାଉଥିଲେ ଏହାକୁ ବ୍ୟବହାର କରନ୍ତୁ।

openclaw scrape --delay 3s
Copied!

ପ୍ରତ୍ୟେକ ଅନୁରୋଧ ମଧ୍ୟରେ 3 ସେକେଣ୍ଡର ବିଳମ୍ବ ସହିତ URL ସ୍କ୍ରାପ୍ କରେ, ଯାହା ସର୍ଭର ଉପରେ ଚାପ ହ୍ରାସ କରେ।

ଆଇପି ବ୍ଲକିଂ ଏଡାଇବା ପାଇଁ ଏବଂ ୱେବସାଇଟ୍ ନୀତିକୁ ସମ୍ମାନ କରିବା ପାଇଁ ବିଳମ୍ବ ବ୍ୟବହାର କରନ୍ତୁ।

ଡାଟା ନିଷ୍କାସନ କୌଶଳ (Data Extraction Techniques)

openclaw extract --json-path "$.data[*].title"
Copied!

JSON ରେସପନ୍ସରୁ ନିର୍ଦ୍ଦିଷ୍ଟ JSON ପାଥ୍ ବ୍ୟବହାର କରି ଡାଟା ନିଷ୍କାସନ କରେ।

ନେଷ୍ଟେଡ୍ ବସ୍ତୁ ଏବଂ ଆରେରୁ ଡାଟା ବାହାର କରିବା ପାଇଁ JSON ପାଥ୍ ଅତ୍ୟନ୍ତ ଶକ୍ତିଶାଳୀ।

openclaw extract --xpath "//div[@class='product-name']/text()"
Copied!

HTML ରୁ ନିର୍ଦ୍ଦିଷ୍ଟ XPath ପ୍ରକାଶନ ବ୍ୟବହାର କରି ଡାଟା ନିଷ୍କାସନ କରେ।

XPath CSS ସିଲେକ୍ଟର ଅପେକ୍ଷା ଅଧିକ ଜଟିଳ ଟ୍ରାଭର୍ସାଲ୍ ଏବଂ ଫିଲ୍ଟରିଂ ପାଇଁ ଉପଯୋଗୀ।

openclaw extract --ai-prompt "ସମସ୍ତ ଉତ୍ପାଦ ନାମ ଏବଂ ସେମାନଙ୍କର ମୂଲ୍ୟ ବାହାର କରନ୍ତୁ।"
Copied!

AI ମଡେଲ୍ ବ୍ୟବହାର କରି ପ୍ରାକୃତିକ ଭାଷା ପ୍ରମ୍ପ୍ଟ ଆଧାରରେ ଡାଟା ନିଷ୍କାସନ କରେ।

ଅସଂରଚିତ ୱେବ୍ ପୃଷ୍ଠାରୁ ଡାଟା ବାହାର କରିବା ପାଇଁ ଏହା ଅତ୍ୟନ୍ତ ଉପଯୋଗୀ।

openclaw extract --schema "name:h1, price:.price, description:#desc"
Copied!

ନିର୍ଦ୍ଦିଷ୍ଟ CSS ସିଲେକ୍ଟରକୁ କ୍ଷେତ୍ର ନାମ ସହିତ ମ୍ୟାପ୍ କରି ଡାଟା ଏକ ସ୍କିମା ଆକାରରେ ନିଷ୍କାସନ କରେ।

ନିରନ୍ତର ଡାଟା ସଂରଚନା ସହିତ ବହୁ ସଂଖ୍ୟକ ପୃଷ୍ଠା ସ୍କ୍ରାପ୍ କରିବା ପାଇଁ ଏହା ଆଦର୍ଶ।

ଉନ୍ନତ ସ୍କ୍ରାପିଂ କାର୍ଯ୍ୟ (Advanced Scraping Operations)

openclaw paginate --pages 5 --next-selector ".next-page"
Copied!

ଏକ ସିଲେକ୍ଟର ବ୍ୟବହାର କରି ପାଞ୍ଚଟି ପୃଷ୍ଠା ପର୍ଯ୍ୟନ୍ତ ସ୍କ୍ରାପ୍ କରି ପାଗିନେସନ୍ ହ୍ୟାଣ୍ଡେଲ୍ କରେ।

ଅନନ୍ତ ସ୍କ୍ରୋଲିଂ ପୃଷ୍ଠା ପାଇଁ, ଆପଣ --scroll-to-bottom ବିକଳ୍ପ ବ୍ୟବହାର କରିପାରିବେ।

openclaw interact --click "#login-btn" --type "#username, user123"
Copied!

ୱେବ୍ ପୃଷ୍ଠା ସହିତ କ୍ଲିକ୍ କରି, ଟାଇପ୍ କରି ଏବଂ ଫର୍ମ ଦାଖଲ କରି ପାରସ୍ପରିକ କ୍ରିୟା କରେ।

ଡାଇନାମିକ୍ ବିଷୟବସ୍ତୁ ଲୋଡ୍ କରିବା ପାଇଁ କିମ୍ବା ଲଗ୍ ଇନ୍ କରିବା ପାଇଁ ଏହା ଅତ୍ୟନ୍ତ ଉପଯୋଗୀ।

openclaw render --wait 5s --screenshot output.png
Copied!

ଜାଭାସ୍କ୍ରିପ୍ଟ ରେଣ୍ଡରିଂ ପାଇଁ 5 ସେକେଣ୍ଡ ଅପେକ୍ଷା କରି URL ରେଣ୍ଡର କରେ ଏବଂ ଏକ ସ୍କ୍ରିନସଟ୍ ସେଭ୍ କରେ।

ଜାଭାସ୍କ୍ରିପ୍ଟ-ଭାରୀ ୱେବସାଇଟଗୁଡ଼ିକରୁ ଡାଟା ବାହାର କରିବା ପାଇଁ ଏହା ଅତ୍ୟାବଶ୍ୟକ।

openclaw proxy --server "http://proxy.example.com:8080"
Copied!

ଏକ ନିର୍ଦ୍ଦିଷ୍ଟ ପ୍ରକ୍ସି ସର୍ଭର ମାଧ୍ୟମରେ URL ଫେଚ୍ କରେ।

ଆଇପି ବ୍ଲକିଂ ଏଡାଇବା ପାଇଁ ଏବଂ ଭୌଗୋଳିକ ପ୍ରତିବନ୍ଧିତ ବିଷୟବସ୍ତୁକୁ ପ୍ରବେଶ କରିବା ପାଇଁ ପ୍ରକ୍ସି ବ୍ୟବହାର କରନ୍ତୁ।

ଆଉଟପୁଟ୍ ଏବଂ ରପ୍ତାନି (Output & Export)

openclaw scrape --output output.json
Copied!

ସ୍କ୍ରାପ୍ ହୋଇଥିବା ଡାଟାକୁ ଏକ JSON ଫାଇଲ୍ ରେ ସେଭ୍ କରେ।

ଅଧିକାଂଶ ପ୍ରୋଗ୍ରାମିଂ ଭାଷା ଏବଂ ଡାଟାବେସ୍ ପାଇଁ JSON ଏକ ସାଧାରଣ ଫର୍ମାଟ୍।

openclaw scrape --output output.csv --format csv
Copied!

ସ୍କ୍ରାପ୍ ହୋଇଥିବା ଡାଟାକୁ ଏକ CSV ଫାଇଲ୍ ରେ ରପ୍ତାନି କରେ।

ସ୍ପ୍ରେଡସିଟ୍ ସଫ୍ଟୱେୟାରରେ ତୁରନ୍ତ ବିଶ୍ଳେଷଣ ପାଇଁ CSV ଉପଯୋଗୀ।

openclaw scrape --stream | jq .
Copied!

ଆଉଟପୁଟ୍ ଷ୍ଟ୍ରିମ୍ କରେ, ଯାହାକୁ ଅନ୍ୟ କମାଣ୍ଡ୍-ଲାଇନ୍ ଉପକରଣକୁ ପାଇପ୍ କରାଯାଇପାରିବ।

ଡାଟାକୁ ଫିଲ୍ଟର୍, ପାର୍ସ କିମ୍ବା ଫର୍ମାଟ୍ କରିବା ପାଇଁ 'jq' ପରି ଉପକରଣ ସହିତ ବ୍ୟବହାର କରନ୍ତୁ।

openclaw report --format html
Copied!

ଏକ ନିର୍ଦ୍ଦିଷ୍ଟ ପ୍ରୋଜେକ୍ଟ ପାଇଁ HTML ଫର୍ମାଟରେ ଏକ ସ୍କ୍ରାପିଂ ରିପୋର୍ଟ ଉତ୍ପାଦନ କରେ।

ଆପଣଙ୍କ ସ୍କ୍ରାପିଂ କାର୍ଯ୍ୟର ସାରାଂଶ ଏବଂ ତ୍ରୁଟି ଦେଖିବା ପାଇଁ ରିପୋର୍ଟ ଉପଯୋଗୀ।

ପ୍ରାମାଣିକିକରଣ ଏବଂ ସେସନ୍ (Authentication & Sessions)

openclaw login --user --pass
Copied!

ଏକ ନିର୍ଦ୍ଦିଷ୍ଟ URL ରେ ୟୁଜର୍ ନାମ ଏବଂ ପାସୱାର୍ଡ ବ୍ୟବହାର କରି ଲଗ୍ ଇନ୍ କରେ।

ପ୍ରତିବନ୍ଧିତ ବିଷୟବସ୍ତୁକୁ ପ୍ରବେଶ କରିବା ପାଇଁ ଏହା ଅତ୍ୟାବଶ୍ୟକ।

openclaw session save my_session.json
Copied!

ବର୍ତ୍ତମାନର ସ୍କ୍ରାପିଂ ସେସନ୍ (କୁକିଜ୍, ଟୋକେନ୍) ଏକ ଫାଇଲ୍ ରେ ସେଭ୍ କରେ।

ପ୍ରତିଥର ଲଗ୍ ଇନ୍ ନକରି ପରବର୍ତ୍ତୀ ସ୍କ୍ରାପିଂ କାର୍ଯ୍ୟ ପାଇଁ ସେସନ୍ ପୁନଃ ବ୍ୟବହାର କରନ୍ତୁ।

openclaw session load my_session.json --fetch
Copied!

ପୂର୍ବରୁ ସେଭ୍ ହୋଇଥିବା ସେସନ୍ ଲୋଡ୍ କରେ ଏବଂ ତାହା ବ୍ୟବହାର କରି URL ଫେଚ୍ କରେ।

ଲଗ୍ ଇନ୍ ଅବସ୍ଥା ବଜାୟ ରଖିବା ପାଇଁ ଏହା ଅତ୍ୟନ୍ତ ଉପଯୋଗୀ।

openclaw auth token --header "Authorization: Bearer "
Copied!

ଏକ API ଟୋକେନ୍ ସହିତ ଅନୁରୋଧ ହେଡରରେ ପ୍ରାମାଣିକିକରଣ ଯୋଗ କରେ।

API ଏଣ୍ଡପଏଣ୍ଟଗୁଡ଼ିକରୁ ଡାଟା ବାହାର କରିବା ପାଇଁ ଏହା ସାଧାରଣତଃ ବ୍ୟବହୃତ ହୁଏ।

ଡିବଗିଂ ଏବଂ ଉପଯୋଗିତା (Debugging & Utilities)

openclaw debug --verbose
Copied!

ସ୍କ୍ରାପିଂ ପ୍ରକ୍ରିୟା ସମ୍ବନ୍ଧରେ ବିସ୍ତୃତ ଡିବଗିଂ ସୂଚନା ପ୍ରଦାନ କରେ।

କମାଣ୍ଡ୍ କାହିଁକି ଆଶା ମୁତାବକ କାର୍ଯ୍ୟ କରୁନାହିଁ ତାହା ବୁଝିବାରେ ଏହା ସାହାଯ୍ୟ କରେ।

openclaw validate
Copied!

ଏକ OpenClaw କନଫିଗରେସନ୍ ଫାଇଲ୍ ର ବୈଧତା ଯାଞ୍ଚ କରେ।

ସ୍କ୍ରାପିଂ ଆରମ୍ଭ କରିବା ପୂର୍ବରୁ ସିଣ୍ଟାକ୍ସ ତ୍ରୁଟି ଏଡାଇବା ପାଇଁ ଏହାକୁ ବ୍ୟବହାର କରନ୍ତୁ।

openclaw version
Copied!

ଇନଷ୍ଟଲ୍ ହୋଇଥିବା OpenClaw ର ସଂସ୍କରଣ ପ୍ରଦର୍ଶିତ କରେ।

ସମସ୍ୟା ରିପୋର୍ଟ କରିବା ସମୟରେ କିମ୍ବା ସଫ୍ଟୱେୟାର ଅପଡେଟ୍ ଯାଞ୍ଚ କରିବା ସମୟରେ ଏହା ଉପଯୋଗୀ।

openclaw help
Copied!

ଏକ ନିର୍ଦ୍ଦିଷ୍ଟ OpenClaw କମାଣ୍ଡ୍ ପାଇଁ ସହାୟତା ମାନୁଆଲ୍ ପ୍ରଦର୍ଶିତ କରେ।

ଯେକୌଣସି କମାଣ୍ଡ୍ ର ସମସ୍ତ ଉପଲବ୍ଧ ବିକଳ୍ପ ଏବଂ ବ୍ୟବହାର ଦେଖିବା ପାଇଁ ଏହାକୁ ବ୍ୟବହାର କରନ୍ତୁ।

ବାରମ୍ବାର ପଚରାଯାଉଥିବା ପ୍ରଶ୍ନ (FAQs)

OpenClaw କ'ଣ?

OpenClaw ହେଉଛି ୱେବ୍ ସ୍କ୍ରାପିଂ ଏବଂ ଡାଟା ଏକ୍ସଟ୍ରାକ୍ସନ୍ ପାଇଁ ଏକ AI-ପାୱାର୍ଡ କମାଣ୍ଡ୍ ଲାଇନ୍ ଉପକରଣ।

ମୁଁ OpenClaw କିପରି ଇନଷ୍ଟଲ୍ କରିବି?

OpenClaw ଇନଷ୍ଟଲ୍ କରିବା ପାଇଁ, ଆପଣ ଅଫିସିଆଲ୍ ଡକ୍ୟୁମେଣ୍ଟେସନ୍ ଦେଖିବା ଉଚିତ୍। ସାଧାରଣତଃ, ଏହା 'pip install openclaw' କିମ୍ବା ଏକ ସ୍ୱତନ୍ତ୍ର ଇନଷ୍ଟଲର୍ ମାଧ୍ୟମରେ ହୋଇଥାଏ।

OpenClaw କେଉଁ ପ୍ରକାରର ୱେବସାଇଟ୍ ସ୍କ୍ରାପ୍ କରିପାରିବ?

OpenClaw ଷ୍ଟାଟିକ୍ HTML, ଜାଭାସ୍କ୍ରିପ୍ଟ ରେଣ୍ଡର ହୋଇଥିବା ପୃଷ୍ଠା, ଏବଂ API ଏଣ୍ଡପଏଣ୍ଟରୁ ଡାଟା ଏକ୍ସଟ୍ରାକ୍ଟ କରିପାରିବ। AI କ୍ଷମତା ଏହାକୁ ଅସଂରଚିତ ଡାଟା ହ୍ୟାଣ୍ଡେଲ୍ କରିବାରେ ସାହାଯ୍ୟ କରେ।

AI-ପାୱାର୍ଡ ଏକ୍ସଟ୍ରାକ୍ସନ୍ କିପରି କାର୍ଯ୍ୟ କରେ?

AI-ପାୱାର୍ଡ ଏକ୍ସଟ୍ରାକ୍ସନ୍ ଏକ ବିଶାଳ ଭାଷା ମଡେଲ୍ ବ୍ୟବହାର କରେ ଯାହା ଆପଣଙ୍କର ପ୍ରାକୃତିକ ଭାଷା ପ୍ରମ୍ପ୍ଟକୁ ବୁଝିପାରେ ଏବଂ ୱେବ୍ ପୃଷ୍ଠାର ବିଷୟବସ୍ତୁ ଆଧାରରେ ସମ୍ବନ୍ଧିତ ଡାଟା ଚିହ୍ନଟ କରି ନିଷ୍କାସନ କରେ।