መሰረታዊ ስክራፒንግ ትእዛዞች
openclaw fetch
የተሰጠውን ዩአርኤል በመጠቀም የድረ-ገጽ ይዘትን ያመጣል። ይህ ትእዛዝ የድረ-ገጹን ጥሬ HTML ወይም የተሰራ ይዘት ለማግኘት ይጠቅማል።
የድረ-ገጹን የመጀመሪያ ይዘት ለማየት ወይም የጃቫስክሪፕት ያልሆኑ ድረ-ገጾችን ለመሰብሰብ ይጠቀሙ።
openclaw select --selector ""
ከተወሰነ ዩአርኤል ላይ በCSS ወይም XPath መራጭ የተገለጹትን ነገሮች ይመርጣል። ይህ ትእዛዝ ከተወሰኑ የድረ-ገጽ ክፍሎች ዳታ ለመለየት ይጠቅማል።
ትክክለኛውን መራጭ ለመምረጥ የድረ-ገጹን መርማሪ (inspector) ይጠቀሙ።
openclaw extract --ai-parse "product_name, price"
በAI በመታገዝ ከተሰጠው ዩአርኤል ላይ የተወሰኑ ዳታ ነጥቦችን ያወጣል። AIው የዳታውን መዋቅር በራስ-ሰር ይገነዘባል።
AI-parse ውስብስብ መዋቅር የሌላቸውን ዳታዎች (ለምሳሌ የምርት ስሞች፣ ዋጋዎች) ለማውጣት በጣም ውጤታማ ነው።
openclaw save --output data.json --format jsonl
የተመረጠውን ወይም የተወጣውን ዳታ ወደተገለጸ ፋይል በተወሰነ ቅርጸት ያስቀምጣል።
የተለያዩ የውጤት ቅርፀቶችን ለመሞከር --format ባንዲራውን ይጠቀሙ (ለምሳሌ: csv, jsonl, html)።
openclaw render
ጃቫስክሪፕት የሚጠቀሙ ድረ-ገጾችን ለመስራት እና ሙሉ ይዘታቸውን ለማግኘት ይጠቅማል። ይህ ትእዛዝ የገጹን ሙሉ ጭነት ያረጋግጣል።
አንዳንድ ድረ-ገጾች ይዘታቸውን በጃቫስክሪፕት ስለሚጭኑ ይህ ትእዛዝ ያስፈልጋል።
የላቁ የዳታ ማውጫ
openclaw table --selector "table.data-table"
ከተወሰነ ዩአርኤል ላይ የተወሰኑ ሠንጠረዦችን በራስ-ሰር ያወጣል። ይህ ትእዛዝ የሠንጠረዥ ዳታዎችን ለማውጣት የተመቻቸ ነው።
የተወሰነ ሠንጠረዥ ለማውጣት የCSS መራጭ ይግለጹ። አለበለዚያ ሁሉንም ሠንጠረዦች ያወጣል።
openclaw schema --schema-file schema.json
ከተገለጸው የJSON ስኪማ ፋይል ጋር የሚዛመድ የተዋቀረ ዳታ ያወጣል። ይህ ትእዛዝ የዳታውን ወጥነት ያረጋግጣል።
የJSON Schema ፋይልን በመጠቀም የዳታ ማውጫውን ትክክለኛነት እና ቅርጹን ያረጋግጡ።
openclaw content-ai --query "article_title, author, main_content"
በAI በመታገዝ የጽሑፍ ይዘትን (ለምሳሌ ጽሑፎች፣ ብሎጎች፣ ዜናዎች) ያወጣል። AIው የገጹን ዋና ይዘት ይለያል።
ይህ ትእዛዝ ከተለያዩ የድረ-ገጽ አቀማመጦች ላይ ዋናውን ይዘት ለመለየት በጣም ጥሩ ነው።
openclaw paginate --next-selector ".next-page-button"
የገጽ መለዋወጫዎችን (pagination) በመከተል ዳታን ከበርካታ ገጾች ያወጣል። የገጹን የ'ቀጣይ' ቁልፍ መራጭ ያስፈልገዋል።
የ'ቀጣይ ገጽ' ቁልፍን የሚለይ ትክክለኛ መራጭ መኖሩን ያረጋግጡ።
openclaw follow --link-selector "a.product-link" --depth 2
ከተሰጠው ዩአርኤል ጀምሮ የተወሰኑ አገናኞችን እስከተወሰነ ጥልቀት ድረስ ይከተላል። ይህ ትእዛዝ የድረ-ገጽን መዋቅር ለመቃኘት ያግዛል።
ከመጠን በላይ ስክራፒንግን ለመከላከል የጥልቀት (depth) ገደብን በጥንቃቄ ይጠቀሙ።
የማሰስ እና የማጣራት
openclaw crawl --max-pages 10 --delay 2
ከተነሳበት ዩአርኤል ጀምሮ ድረ-ገጾችን ይቃኛል፣ እስከተወሰነ የገጾች ብዛት ድረስ። በገጾች መካከል መዘግየትን ማዘጋጀት ይቻላል።
ከመጠን በላይ ጭነትን ለማስወገድ እና እንዳይታገዱ ለመከላከል --delay ባንዲራውን ይጠቀሙ።
openclaw filter --jq-query '.items[] | select(.price < 100)'
ከፋይል የወጣውን ዳታ በJQ መጠይቅ ያጣራል። ይህ ትእዛዝ የተወሰኑ መስፈርቶችን የሚያሟሉ ዳታዎችን ለመምረጥ ያግዛል።
ዳታውን ለማጣራት፣ ለመለወጥ እና ቅርጹን ለመቀየር የJQን ኃይል ይጠቀሙ።
openclaw include --pattern "blog|news"
የሚዛመዱ ዩአርኤሎችን ብቻ ለመቃኘት ወይም ለማውጣት ይፈቅዳል። ይህ ትእዛዝ በትላልቅ ድረ-ገጾች ላይ የተወሰኑ ክፍሎችን ለመምረጥ ጠቃሚ ነው።
የተወሰኑ የድረ-ገጽ ክፍሎችን ብቻ ለመስራት በጣም ጠቃሚ ነው። የregex ቅጦችን መጠቀም ይችላሉ።
openclaw exclude --pattern "privacy|terms"
ከተወሰኑ ዩአርኤሎች ዳታ እንዳይወጣ ይከለክላል። ይህ ትእዛዝ አላስፈላጊ ወይም ሚስጥራዊነት ያላቸውን ገጾች ለማስወገድ ይጠቅማል።
አላስፈላጊ ገጾችን በማስወገድ የማውጫውን ፍጥነት ይጨምሩ እና የሀብት ፍጆታን ይቀንሱ።
openclaw scrape-list --selector "h1.title"
ከዩአርኤሎች ዝርዝር ውስጥ ዳታን ያወጣል። ዝርዝሩ በእያንዳንዱ መስመር አንድ ዩአርኤል የያዘ የጽሑፍ ፋይል መሆን አለበት።
እያንዳንዱ ዩአርኤል በአዲስ መስመር ላይ መሆኑን ያረጋግጡ። ይህ በርካታ ገጾችን ለመቆጣጠር ፈጣን መንገድ ነው።
የመውጫ ቅርፀቶች እና ማከማቻ
openclaw export --format csv --output products.csv
የተወጣውን ዳታ ወደተፈለገው ቅርጸት (ለምሳሌ CSV, JSON, HTML) ይልካል። የውጤት ፋይል ስም መግለጽ ይቻላል።
ከCSV በተጨማሪ json, jsonl, እና html ን መምረጥ ይችላሉ። የዳታውን መዋቅር በሚመጥን ቅርጸት ያስቀምጡ።
openclaw store --db-type postgres --conn-string "postgresql://user:pass@host:port/db"
የተወጣውን ዳታ በቀጥታ ወደ ዳታቤዝ ያስቀምጣል። የተለያዩ የዳታቤዝ አይነቶችን ይደግፋል።
የዳታቤዝ ግንኙነት ሕብረቁምፊዎን ደህንነቱ በተጠበቀ ሁኔታ ያስቀምጡ እና አስፈላጊ የሆኑትን ጠረጴዛዎች አስቀድመው ይፍጠሩ።
openclaw upload --s3-bucket "my-openclaw-bucket" --s3-key "data/latest.json"
የተወጣውን ፋይል ወደ ደመና ማከማቻ (ለምሳሌ Amazon S3) ይሰቅላል። ለርቀት ዳታ ማከማቻ እና ምትኬ ጠቃሚ ነው።
የS3 ባልዲ ስምዎ ትክክል መሆኑን ያረጋግጡ እና የመዳረሻ ፈቃዶችን በትክክል ያዋቅሩ።
openclaw webhook --url "https://api.example.com/data-ingest"
የተወጣውን ዳታ ወደተወሰነ ዌብሁክ ዩአርኤል ይልካል። ይህ ትእዛዝ ዳታውን ከሌሎች ስርዓቶች ጋር ለማዋሃድ ያግዛል።
ዳታውን ወደ ሌላ አገልግሎት ወይም ስርዓት ለማዋሃድ ይጠቀሙ። የHTTP POST ጥያቄ ይልካል።
openclaw append --file existing_data.jsonl
አዲስ የተወጣውን ዳታ ከነባር ፋይል ጋር ያያይዘዋል። ይህ ትእዛዝ የዳታ ስብስቦችን ቀስ በቀስ ለመገንባት ይጠቅማል።
ትላልቅ የዳታ ስብስቦችን በየጊዜው ለመገንባት ይጠቅማል፣ በተለይም ከJSONL ቅርጸት ጋር።
የአውቶሜሽን እና መርሐግብር
openclaw schedule "0 0 * * *" "openclaw crawl example.com"
የOpenClaw ትእዛዝን በተወሰነ የCron አገባብ በመጠቀም እንዲሰራ ያዘጋጃል። ለተደጋጋሚ ተግባራት ጠቃሚ ነው።
የCron አገባብን በመጠቀም ተደጋጋሚ ተግባራትን ያዘጋጁ። ለምሳሌ '0 0 * * *' ማለት በየቀኑ እኩለ ሌሊት ማለት ነው።
openclaw task run my_task.yml
ከተገለጸው YAML ፋይል ውስጥ የተዋቀረ ተግባርን ያካሂዳል። የYAML ፋይሉ በርካታ ትእዛዞችን ሊይዝ ይችላል።
ውስብስብ የስክራፒንግ ሂደቶችን እና የዳታ ማቀነባበሪያ እርምጃዎችን በYAML ፋይሎች ውስጥ ይግለጹ።
openclaw monitor --interval 60 --notify "[email protected]"
የድረ-ገጽ ለውጦችን ይከታተላል እና ሲቀየር በተወሰነ መንገድ (ለምሳሌ በኢሜል) ያሳውቃል።
ለዋጋ ለውጦች፣ ለዜና ማሻሻያዎች ወይም የምርት ክምችት ለመከታተል ይጠቀሙ።
openclaw workflow start my_workflow.json
የተዋቀረ የworkflow ፋይልን ይጀምራል። ይህ ፋይል የበርካታ ተግባራትን ቅደም ተከተል እና በመካከላቸው ያለውን ጥገኝነት ይገልጻል።
የበርካታ ተግባራትን ቅደም ተከተል ለማስተባበር እና ውስብስብ የዳታ ማውጫ ፓይፕላይኖችን ለመፍጠር ይጠቅማል።
openclaw pipeline
የዳታ ማውጫ፣ ማጣራት እና ማከማቻን ያካተተ ሙሉ የፓይፕላይን ሂደት ያካሂዳል። ይህ ትእዛዝ ሁሉንም እርምጃዎች ያቀናጃል።
ለሙሉ ዳታ አውቶሜሽን ፓይፕላይኖች ይህን ትእዛዝ ይጠቀሙ። የኮንፊግ ፋይሉ ሁሉንም ዝርዝሮች ይይዛል።
የስህተት አያያዝ እና ምዝግብ ማስታወሻ
openclaw debug
የተወሰነ ትእዛዝን በዲባግ ሁነታ ያካሂዳል። ይህ ትእዛዝ ችግሮችን ለመለየት እና ለመፍታት ዝርዝር መረጃዎችን ያሳያል።
የስክራፒንግ ትእዛዛትዎ በትክክል የማይሰሩ ከሆነ ይህን ሁነታ ይጠቀሙ።
openclaw logs --level error --follow
የምዝግብ ማስታወሻ መልዕክቶችን በተወሰነ ደረጃ (ለምሳሌ ስህተት፣ ማስጠንቀቂያ፣ መረጃ) ያሳያል። 'follow' ባንዲራ አዲስ ምዝግብ ማስታወሻዎችን በቅጽበት ያሳያል።
የስህተት መልዕክቶችን ብቻ ለማየት --level error ይጠቀሙ። ችግሮችን በፍጥነት ለመለየት ይረዳል።
openclaw retry --attempts 3 --delay 5
ትእዛዝን በስህተት ጊዜ ብዙ ጊዜ እንዲሞክር ያደርጋል። በሙከራዎች መካከል መዘግየትን መግለጽ ይቻላል።
ያልተረጋጉ ድረ-ገጾችን ወይም ጊዜያዊ የአውታረ መረብ ችግሮችን ለመቋቋም ይጠቅማል።
openclaw report --output report.json
የተወሰነ ተግባር (task) የማስኬጃ ሪፖርት ያመነጫል። ሪፖርቱ የስክራፒንግ ስኬት ደረጃን እና የተገኙ ስህተቶችን ያካትታል።
የስክራፒንግ ስኬት ደረጃን እና የተገኙ ስህተቶችን ለመገምገም ይጠቀሙ።
openclaw validate-schema
የተወጣውን ዳታ ከተሰጠው ስኪማ ጋር ያወዳድራል። ይህ ትእዛዝ የዳታዎን ጥራት እና ወጥነት ለማረጋገጥ ይረዳል።
የዳታዎን ጥራት እና ወጥነት ለማረጋገጥ ይህን ትእዛዝ ይጠቀሙ።