— Как сделать сайт видимым в Яндексе

26.08.2021 Выкл. Автор Елена
gem

     Владельцам сайтов очень важно разобраться, как сделать сайт видимым в Яндексе и как Яндекс индексирует ресурсы. 

     Для того, чтобы сайты появились в выдаче Яндекса, с ними «работают» многочисленные роботы, которые обходят ресурсы и загружают информацию о них в поисковую базу. Загруженные данные обрабатываются с помощью специальных алгоритмов.  Занесение информации в базу и обработка данных называется индексированием. 

     Прежде чем сайт появится в результатах поиска, он проходит четыре этапа. Это также относится к обновленным и к новым страницам: 

  • обход роботами 
  • индексирование 
  • выявление страниц, которые будут участвовать в поиске 
  • формирование результатов самого поиска 

     Ознакомимся с каждым из этапов, чтобы понять, как сделать сайт видимым в Яндексе. 

gem
Как сделать сайт видимым в Яндексе
gem

Обход роботами 

     Роботы – это программы. Они сами регулируют частоту посещения сайтов и количество страниц на них, которые следует обойти за определенный промежуток времени (краулинговый бюджет) 

     Следует учесть, что страницы с размером больше 10 мб Яндексом индексироваться не будут. 

     Для того, чтобы робот узнал о существовании сайта, или о добавленных новых страницах, ему нужно предоставить информацию. Ее он получает, используя следующие источники: 

  • ссылки с уже проиндексированных страниц (внутренние) 
  • ссылки со сторонних ресурсов (внешние) 
  • sitemap.xml (файл, содержащий список всех url сайта) 
  • файл robots.txt (файл с инструкциями для роботов) 

     В процессе загрузки страницы, робот ориентируется на код ответа сервера (код HTTP-статуса): 

  • 200 ОК – запрос к серверу успешен, и страница доступна к просмотру, а значит, будет проиндексирована роботом 
  • 3ХХ – редирект (перенаправление) на другой url. Страницы с кодом 3ХХ не индексируются и не участвуют в поиске. 
  • 4ХХ и 5ХХ – страница не существует из-за ошибки на стороне клиента (4ХХ), или из-за ошибки на стороне сервера (5ХХ). 

Индексирование 

     Робот идентифицирует контент страницы и сохраняет ее в базу. С этой целью он использует следующую информацию:  

  • мета-тег description (краткое описание)  
  • данные микроразметки Schema.org  
  • мета-тег title (название)  
  • изображения  
  • текст 
  • видео 

     Страница не будет проиндексирована, если: 

  • для нее прописана инструкция  noindex (закрыть от индексирования) 
  • не является канонической (при наличии двух одинаковых страниц, для одной из них прописывается атрибут rel=»canonical», эта страница попадет в индекс. Вторая – нет) 
  • является дубликатом (Яндекс объединит дублирующие страницы в группу дублей и покажет в результатах поиска только одну из них. Если объединения не произойдет, дубликаты будут конкурировать между собой в поиске. Кроме этого, робот потратит краулинговый бюджет на дубли, и его может не хватить на важные страницы сайта) 

Формирование базы страниц, участвующих в поиске 

     Различные алгоритмы выбирают из проиндексированных страниц те, которые могут участвовать в поиске. Здесь применяется большое количество факторов ранжирования и индексирования. Как уже указывалось выше, в базу не попадут страницы, закрытые от индексирования, и дубликаты. 

     Яндекс может не внести в базу страницы, не востребованные пользователями, а также те, которые не смогут попасть в зону видимости из-за высокой конкуренции (так может быть при продвижении сайта по высокочастотным ключевым словам) 

Формирование результатов поиска 

     Качество страницы определяется алгоритмами.  

     Страница должна быть:  

  • понятной и полезной для пользователя 
  • релевантной (соответствующей) запросу  
  • удобной (заголовки, абзацы, изображения и т.д.) 
  • безопасной (Яндекс Вебмастер ежедневно проверяет ресурсы на безопасность и соблюдение правил поисковой системы) 
  • корректно открываться в браузере  

    

gem

Иногда бывает так, что некоторые страницы сайта долго не появляются в поиске Яндекса. В этом случае нужно проверить, что: 

  • они доступны для робота (код ответа сервера 200 ОК).  
  • они присутствуют в  файле sitemap.xml 
  • на них ведут ссылки с уже проиндексированных страниц сайта 
  • они не закрыты от индексирования директивами disallow, noindex, а также HTML-элементом noindex 

     В Яндекс Вебмастере можно получить информацию о странице в разделе «Индексирование» — «Проверить статус URL». Если на сайте появилась новая страница, или были внесены изменения в ранее проиндексированные, можно отправить их на переобход в разделе «Индексирование» — «Переобход страниц».  В случае, если на сайт было внесено много изменений, отправьте на переобход sitemap.xml. 

gem

     Может случиться и так, что ранее проиндексированные страницы исчезают из поиска. Яндекс перечисляет основные причины:  

  • инструкции на запрет индексирования в robots.txt или директивой noindex 
  • малоценность и невостребованность 
  • сайт является неглавным зеркалом  
  • код ответа сервера 3ХХ. 4ХХ. 5ХХ 
  • страница является дубликатом 
  • неканоническая страница 
  • нарушения на сайте 

     Если будут внесены исправления в исключенные из поиска страницы, нужно отправить их на переобход. Робот посетит их, проверит возможность показа в выдаче, и в течение двух недель страницы могут снова появиться в поиске. 

gem