amp-web-push-widget button.amp-subscribe { display: inline-flex; align-items: center; border-radius: 5px; border: 0; box-sizing: border-box; margin: 0; padding: 10px 15px; cursor: pointer; outline: none; font-size: 15px; font-weight: 500; background: #4A90E2; margin-top: 7px; color: white; box-shadow: 0 1px 1px 0 rgba(0, 0, 0, 0.5); -webkit-tap-highlight-color: rgba(0, 0, 0, 0); } .amp-logo amp-img{width:190px} .amp-menu input{display:none;}.amp-menu li.menu-item-has-children ul{display:none;}.amp-menu li{position:relative;display:block;}.amp-menu > li a{display:block;} /* Inline styles */ h2.acss2f015{text-align:center;} .icon-widgets:before {content: "\e1bd";}.icon-search:before {content: "\e8b6";}.icon-shopping-cart:after {content: "\e8cc";}

Директивы allow и disallow

Файл robots.txt имеет большое значение для любого сайта. Он создаётся специально для поисковых ботов. Если кто-то ещё не знает или уже не помнит, то поисковый бот (робот) – это программа, которая в некотором роде копирует поведение пользователей на web-ресурсе. Он точно также заходит на сайт и начинает кликать по ссылкам, читать тексты и делать свою работу.

Именно эти роботы индексируют наши с вами сайты. На сегодняшний день они сделали существенный шаг вперёд в сравнении с прошлым временем. Так плавно мы перешли к вопросу – зачем нужен robots.txt

Что такое robots.txt

Несмотря на постоянное развитие, поисковые боты всё ещё далеко не идеальны. Что бы сделать их работу более качественной, поисковые системы предлагают web-мастерам сделать подсказку ботам. Именно для этого и используется robots.txt. C его помощью мы можем сделать следующее:

  • Указать боту, на что он должен обращать внимание;
  • Что следует пропустить;
  • Как правильно пишется адрес ресурса и т.д.

Файл robots.txt составляется самим web-мастером и о том, как это правильно делать, можно прочитать на сайтах поисковиков. Сегодня мы поговорим об основных моментах в его настройке и директивах allow и disallow.

Настройка robots.txt

Существует много директив для ботов, например, тут мы писали про Crawl delay. Есть несколько, без которых robots будет не правильным, что скажется на индексации и продвижении вашего ресурса.

Любой файл должен начинаться с директивы User-agent, после которой указывается имя поискового бота – yandex или google. В одном файле может быть несколько подобных записей.

И теперь двух самых главных директивах. С помощью команды disallow можно запретить боту индексировать любую часть ресурса.
Не менее важной является и команда allow в robots txt. Она противоположна предыдущей и разрешает для индексации ресурс в целом или его любую часть. Есть один важный момент – пока нет запрещающей команды, ресурс открыт для индексации. То есть, можно, например, запретить доступ ко всему ресурсу, кроме нужной страницы. Если этих команд несколько, то сначала ботом будет выполняться первая из них.

Конечно при создании и настройке файла robots много нюансов, о которых можно говорить долго, поэтому лучше всего обратиться к информации, которую предоставляют сами поисковые системы. Там написано всё доходчиво и просто.

Адель Гадельшин

Recent Posts

Что такое отказы на сайте, почему они происходят, как их уменьшить

Отказы на сайте - это процент посетителей, которые покидают сайт после просмотра только одной страницы.…

8 месяцев ago

Как сделать запуск инфопродукта

Инфопродукт - это любой продукт, который содержит информацию, полезную для потенциальных клиентов. Это может быть…

8 месяцев ago

Как вебмастеру юридически обезопасить себя

Ведение сайта - это не только подержание его работоспособности и наполнение контентом. В последние годы…

8 месяцев ago

Папки WordPress: значение папок /wp-admin, /wp-includes и /wp-content

WordPress - это популярная система управления контентом (CMS), которая позволяет создавать и управлять веб-сайтами различной…

8 месяцев ago

Что такое сертификат Let’s Encrypt и стоит ли его устанавливать

Сертификат Let’s Encrypt - это бесплатный и открытый сертификат SSL/TLS, который позволяет защитить веб-сайт от…

9 месяцев ago

Защита WordPress от вирусов

WordPress - это одна из самых популярных систем управления контентом в мире, которая используется миллионами…

9 месяцев ago