Индексация

Индексация сайта — что это такое и кем она проводится?

Индексация сайта - это процесс, проводимый роботами поисковых систем и заключающийся в исследовании ими страниц сайта с выявлением используемых слов, частоты их употребления, … со внесением полученной информации в базы данных, которые используются для формирования ответов на поисковые запросы.

Индексирование в поисковых системах (веб-индексирование) — процесс добавления сведений (о сайте) роботом поисковой машины в базу данных, впоследствии использующуюся для (полнотекстового) поиска информации на проиндексированных сайтах.

В сведения о сайте чаще всего входят ключевые слова (алгоритм определения ключевых слов зависит от поисковой системы), статьи, ссылки, документы, также могут индексироваться изображения, аудио и т. д.

Далее на этой странице выявлен и описан самый быстрый и верный способ определения числа проиндексированных страниц.

Индексация страниц сайта приводит к тому, что начинает брезжить надежда на появление посетителей из выдачи поисковых систем.

Google обычно обнаруживает и индексирует новую страницу буквально в первые 12-ть часов её существования.

Чтобы узнать, что конкретная страница проиндексирована Google, я обычно на google.ru делаю поиск по запросу название_страницы экопарк Z  Например, 12.06.2014 создал страницу Цвета, а 13.06.2014 эта страница находится на 4-м месте поисковой выдачи по запросу цвета экопарк Z

Можете проверить этот способ сначала на моём запросе, а потом и на подобном своём.

Яндекс действует значительно медленнее, на обнаружение страницы у него обычно уходит от 3-х до 7-ми дней, а индексацию, как я не совсем обоснованно считаю, он обычно проводит только тех страниц, которые имеют более ста слов.

Удалось обнаружить проиндексированные Яндексом страницы, имеющие 56-ть и 17-ть слов, поэтому считаю, что число слов, равное ста, не является чётким критерием, но уверен, что увеличение числа слов повышает шансы на индексацию Яндексом.

07.09.2014 даже обнаружил давно опубликованную страницу, имеющую лишь название и дважды упомянутое ключевое слово, совпадающее с названием. Вполне очевидные выводы делайте сами… У меня создалось впечатление, что Яндекс проиндексировал её авансом: ему просто надоело ждать , когда же страница будет наполнена текстом.

Используя сортировку на отдельном листе, выделил в таблице сайта 34-ре страницы с числом слов от 2-х до 97-ми — собираюсь вскоре существенно дополнить их текстами, ибо просто считаю неприличным иметь столь короткие страницы.

Чтобы наверняка и чётко узнать число страниц, проиндексированных Яндексом и Google, запускал программу Site-Auditor версии 2.54.1, которая выдавала информацию о числе проиндексированных страниц, но значения были сильно завышены: Яндекс - 779-ть, Google  — 940-к. Кликнув по подчёркнутому значению 779, попадаю в поисковую выдачу Яндекса. В строке поискового запроса стоит значение 779.

Перейдя в конец страницы, кликнул по +5 и перешёл на 6-ю страницу выдачи. Аналогичным образом перешёл на 11-ю, 16-ю, 21-ю, … страницы. На 46-й странице в строке поискового запроса появилось число 630-ть. Дошёл до 63-й странице и увидел число 628-мь. Именно столько страниц проиндексировал Яндекс. На сайте создано 645-ть страниц, согласно чёткой информации WordPress. 17-ть страниц по разным причинам ещё не попали в число проиндексированных.

За последние два дня создал примерно 11-ть страниц, которые наверняка ещё не проиндексированы Яндексом. 6-ть страниц — это, пожалуй, заготовки страниц, содержащие совсем мало слов. Таким образом, можно считать, что с индексацией страниц сайта Яндексом всё в порядке!

Считается, что можно узнать число страниц, проиндексированных Яндексом, набрав в адресной строке браузера на сайте yandex.ru запрос site:адрес_сайта

Попробовал — получил 2000-чи ответов. Кликнул по адресной строке браузера, информация в ней стала более подробной. Увидел в конце p=1 (то есть page=1), заменил 1 на 65 — попал на 63-ю страницу, так как 65-я не существует. В строке запроса увидел 628-мь ответов.

Вот так обнаружил быстрый и верный способ определения числа проиндексированных страниц.

Попытался аналогичным образом, танцуя от Site-Auditor, определить число страниц, которые проиндексированы Гуглом. Вместо 940-ка сначала получил значение 779-ть, последней страницей выдачи оказалась 43-я, причём с 35-й страницы в теле сниппетов появлялась запись «Описание веб-страницы недоступно из-за ограничений в файле robots.txt«. То есть реально Гугл индексирует всего лишь примерно 350-т страниц!

Начал разбираться. Файл robots.txt не редактировал, он у меня стандартный — просмотрел его текст, но ничего странного не заметил — последние две строки, как положено, указывают путь к двум файлам Sitemap. Странно то, что файлы Sitemap не менялись с 31.03.2014

Деактивировал плагин Google XML Sitemaps, который должен формировать два файла Sitemap. Снова активировал плагин, но он не сформировал новые файлы Sitemap. Деактивировал плагин Google XML Sitemaps

Подобрал другой плагин: Sitemap - сразу активировал его. Понаблюдаю за его действиями и попытаюсь наладить обновление двух файлов Sitemap, чтобы облегчить деятельность поисковых роботов и нарастить число страниц, нормально проиндексированных Гуглом.

Странная наблюдается ситуация: в панели управления хостинга два файла Sitemap не видны, но по адресу http://ep-z.ru/sitemap.xml файл виден. Снова активировал плагин Google XML Sitemaps, предварительно деактивировав плагин Sitemap.

Хотя прошёл слушок, что вскоре Гугл перестанет функционировать в России, пренебрегать трафиком с него не имеет смысла. За последние 30-ть суток Гугл дал 10,88 % посетителей (2160-т), что примерно в 8-мь раз меньше, чем Яндекс.

Самый быстрый и верный способ узнать число страниц, проиндексированных Яндексом, — заглянуть на страницу Мои сайты панели Вебмастера Яндекса по адресу http://webmaster.yandex.ru/sites/ Само собой разумеется, что сайт предварительно должен быть внесен в список сайтов!

Когда-то пришёл к выводу, что проще всего определить число страниц, проиндексированных Яндексом, если обратиться по адресу типа http://yandex.ru/search/?text=site%3Aep-z.ru&clid=9403&lr=213&p=99, но сейчас это не срабатывает: выдаёт ошибку 404.

Индексация страниц сама по себе мало что значит, ибо посетители на страницы сайта приходят, в основном, из так называемого ТОП10, то есть с первой страницы поисковой выдачи. Поэтому надо стараться, чтобы созданные страницы поскорее попадали в ТОП10.

Сколько времени нужно, чтобы страница попала в ТОП10? Иногда мне удавалось этого добиться за 30-ть, а за 55-ть суток удавалось вывести страницу на 1-е место в Яндексе по высокочастотному запросу! Крайний пример можете посмотреть на странице Как сделать быстрый сайт.

Многие страницы этого сайта побывали на первой позиции Яндекса, но с течением времени потеряли её — чтобы этого не происходило, нужно, как мне представляется, регулярно обновлять и совершенствовать эти страницы, обращая особое внимание на привлекательность Сниппета, ибо от него зависит переход на страницу.

В 2016-м году заметил, что Яндекс отказывается индексировать более тысячи страниц на моём сайте, причём это относится не только к моему сайту.

29-го апреля 2016-го года на сайте опубликовано 1124-ре страницы, Site-Auditor версии 3.0.12.beta сообщает, что Google проиндексировал 1240-к страниц, а Bing — 1120-ть страниц. Проверка показала, что Google проиндексировал 390-то страниц, а Bing — 1000-чу страниц, как и Яндекс. Получается, что полностью верить Site-Auditor версии 3.0.12.beta нельзя!

3-го ноября 2018-го года установил Site-Auditor версии 3.0.24.beta — она мне нравится меньше старых версий.

Откровенно говоря, индексация страниц сайта перестала меня волновать: поисковые системы прекрасно справляются с этим.

Если Вам нужно продвинуть страницу в ТОП10, посетите страницу Услуги.

Приглашаю всех высказываться в Комментариях. Критику и обмен опытом одобряю и приветствую. В хороших комментариях сохраняю ссылку на сайт автора! И не забывайте, пожалуйста, нажимать на кнопки социальных сетей, которые расположены под текстом каждой страницы сайта.

ИндексацияПродолжение тут…

Deviz_12

2 комментария: Индексация

  1. Александр говорит:

    Если не против, оставлю здесь полезный и актуальный гайд по индексации сайтов — alexbrush.com/index-page.html

    • admin говорит:

      Александр!

      Я принципиально против исходящих ссылок со страниц моих трёх сайтов.
      Причины излагать не стану — догадаетесь и сами.
      В Вашем комментарии убрал ссылку и переставил запятую, но адрес Вашей страницы сохранил и даже выделил полужирным шрифтом.

      Юрий

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Можно использовать следующие HTML-теги и атрибуты: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Проверка комментариев включена. Прежде чем Ваши комментарии будут опубликованы пройдет какое-то время.