Spam や、
このテンプレートファイルと、
実施した
Robots.txt に ついて
Robots.txt とは 何か?
以下、
* Robots.txt の
* Robots メタタグと
一言で
一般的に どのように 記載されているか?
大手サイトの
robots.txtで わかる 「検索で ヒットされたくない ページ」の 特徴 | 齊藤貴義の 唯物論
バッドノウハウかもしれませんが、参考に なりました。 イケてる
パイソンエンジニアを 無料で 集める 方法(神田敏晶) - 個人 - Yahoo!ニュース
robots.txt でリクルーティングを する サイトを 紹介しています。 Fun with robots.txt - Search Engine Land
NIKE のサイトの robots.txt には、 ロゴの アスキーアートが 記載されています。 The Ultimate Robots.txt Guide to Improve Crawl Efficiency
robots.txt の記載例が 参考に なります。
ultimate-bad-blocker の robots.txt の 内容に ついて
以下のような
対象の
User-agent: * Disallow: /wp-admin/ Allow: /wp-admin/admin-ajax.php User-agent: 173.212soso Disallow:/ User-agent: 192.comagent Disallow:/ User-agent: 1noonbot Disallow:/ User-agent: 1on1searchbot Disallow:/ User-agent: 360Spider
wordpress の
robots.txt の
User-agent: * Disallow: /wp-admin/ Allow: /wp-admin/admin-ajax.php
また、
前提 この ブログでの、 robots.txt の 生成方法
django-robots を
robots.txt の 取得、 マージ
既存の
オリジナル robots.txt
robots.txt のファイルの 内容は 以下の 通りです。 # sitemap.xml Sitemap: https://mutter.monotalk.xyz/sitemap.xml
オリジナル robots.txt を
書き 込む cat /var/www/templates/robots.txt.org > robots.txt
ファイルを
取得して、 追記する wget -O robots.txt.bot_block https://raw.githubusercontent.com/mitchellkrogza/apache-ultimate-bad-bot-blocker/master/robots.txt/robots.txt cat robots.txt.bot_block >> robots.txt
作成した
robots.txt
以下のようになりました。# sitemap.xml Sitemap: https://mutter.monotalk.xyz/sitemap.xml ################################################################### # The Ultimate robots.txt Bot and User-Agent Blocker # Copyright: # https://github.com/mitchellkrogza/apache-ultimate-bad-bot-blocker ################################################################### ### Version Information # ################################################### ### Version: V3.2018.08.1015 ### Updated: Wed Aug 22 09:50:24 SAST 2018 ### Bad Bot Count: 1772 ################################################### ### Version Information ## User-agent: * Disallow: /wp-admin/ Allow: /wp-admin/admin-ajax.php User-agent: 173.212soso Disallow:/ User-agent: 192.comagent
Sitemap:
の
スケジュール実行
apache-ultimate-bad-bot-blocker/update-apacheblocker.sh at master · mitchellkrogza/apache-ultimate-bad-bot-blocker を
気が向いたら
以上です。
コメント