Mengenal dan memasang robots tips 2
“USER-AGENT” dan “DISALLOW”
- perintah “USER-AGENT” ini memerlukan anda untuk menentukan nama dari robot, yang mana perintah spidering yang akan diterapkan.
Yang bisa anda terapkan adalah tanda ini * untuk menyatakan bahwa perintah spidering di terapkan pada robot manapun yang tidak dikenali pada bagian file ROBOTS.txt
- perintah “DISALLOW” akan menentukan bagian URL yang harus di abaikan (tidak boleh di index) oleh web robot.
Berikut ini adalah contoh-contoh file robots.txt. Pada penggunaannya dan terserah anda karena anda mempunyai hak mutlak atas website anda.
User-agent : *
Disallow : /
2.memerintahkan salah satu robot untuk tidak mengindex website anda sedangkan robot yang lain di persilakan:
User-agent : nama robot yang di inginkan (contoh WebCrawler)
Disallow : /
3.memerintahkan semua robot untuk menyingkir dari / ~mydir / , sedangkan di rektori yang lainnya tidak di batasi:
User-agent : *
Disallow : /~mydir /
4.membiarkan WebCrawler untuk bisa mengakses semua di rektori lainnya kecuali /~mydir / , sedangkan robot yang lainnya bisa mengakses semua direktori kecuali / docs /, / private / , dan / cgi-bin / :
User-Agent : *
Disallow : / docs /
Disallow : /private/
Disallow : /cgi – bin/
User-Agent: WebCrawler
Disallow : /~mydir/
Demikianlah yang bisa anda lakukan pad file robots.txt anda namun tidak menutup kemungkinan juga untuk menghentikan semua robot-robot yang melakukan spidering ke situs anda. Pada tips selanjutnya saya akan mecoba untuk membahas masalah keamanan pada file robots.txt. dan semoga tips ini bermanfaat bagi anda..salam dari seorang newbiew.
NB: untuk mempelajari lebih lanjut tentang Robot dan Bot anda bisa melihat di http://botspot.com dan http://www.kollar.com/robot.html
dan jangan lupa ngevote aku ya
Vote Orang Narsis


