Сегодня Суббота, 18.05.2024 

Главная » Статьи »

Robots.txt


 Первичную информацию об индексации сайта поисковые роботы получают из файла robots.txt, в нем описываются те страницы и директории, которые не должны быть проиндексированы.

 Обратите внимание, что узел может иметь только один файл "robots.txt", который должен быть расположен в корневом каталоге сайта. Пример расположения: http://ваш_сайт/robots.txt

 Размещение файла в директориях не имеет смысла. Все символы в названии файла должны быть в нижнем регистре.

 Файл robots.txt состоит из записей. Каждая запись содержит два поля: строка пользовательского агента (User-agent) и строка запрета (Disallow).


 Чтобы запретить индексацию отдельных страниц вашего сайта для всех роботов, нужно прописать в robots.txt:

User-agent: *
Disallow: путь

  Чтобы запретить индексацию отдельных страниц сайта, определённому роботу, например роботу Рамблера нужно написать:

User-agent: StackRambler
Disallow: путь

  Во всех случаях слово «путь» нужно заменить на путь к странице вашего сайта. Например, если хотите запретить индексацию страницы http://ваш_сайт/stranica.html, то нужно заменить слово «путь» на «/stranica.html».


 С помощью символов "*" и «$» можно запретить индексацию определенного типа файлов по маске. Следующий пример запрещает всем роботам индексацию файлов с расширениями .doc, .pdf и .mp3:

User-Agent: *
Disallow: /*.doc$
Disallow: /*.pdf$

Disallow: /*.mp3$


 Осторожно! - если прописать вместо «путь» символ «*» или «/», то индексация вашего сайта будет полностью запрещена.

 Надо помнить, что файл robots.txt доступен для чтения всеми пользователями, поэтому не нужно прописывать в него пути к админкам или панелям управления на сайте.


Меню сайта
Наш опрос
Есть ли у вас свой сайт?
Всего ответов: 154
Статистика
Статей: 21
Фоток: 140
Тестов: 10