Основная задача PR состоит в том, чтобы найти критерий, выражающий значимость страницы. В случае с PageRank таким критерием была выбрана теоретическая посещаемость страницы.
Для этого рассматривается переход пользователя по ссылкам. Чаще всего он начинает просматривать сайты с какой-то случайным образом отобранной страницы. Затем по полученным ссылкам он «кликает» на другие ресурсы. При этом существует большая вероятность того, что посетитель выйдет из страницы сайта и снова начнет поиск со случайной страницы (в PageRank вероятность этого принята 0.15 на каждом этапе). Значит, с вероятностью 0.85 он продолжит выбранный путь, «кликая» по одной из доступных на открытой им странице ссылок (все ссылки при этом имеют равные права). Так, путешествуя бесконечно, он может заходить на популярные страницы много раз, а на малоизвестные - меньше.
Соответственно, PR страницы рассчитывается как вероятность нахождения пользователя на данной странице. При этом сумма вероятностей по всем страницам сети равна единице, так как пользователь обязательно находится на какой-либо странице.
Из-за того, что пользоваться вероятностями не очень удобно, после некоторых преобразований, PageRank можно пользоваться в виде конкретных чисел (например, мы видим его в Google ToolBar, где каждая страница имеет PageRank от 0 до 10).
Таким образом, мы получаем, что каждая страница в сети (даже если на нее нет внешних ссылок) первоначально имеет ненулевой PR (хотя и очень небольшой). Каждая страница, имеющая исходящие ссылки, передает часть своего PR страницам, на которые она ссылается. При этом переданный PageRank обратно пропорционален числу ссылок на странице – чем больше ссылок, тем меньший PageRank передается по каждой. PR передается не полностью, на каждом этапе происходит падение рейтинга (при вероятности 15%, при которой пользователь начинает просмотр с новой, случайно выбранной, страницы).
Статья, имеющая большее число качественных внешних ссылок, содержит наиболее ценную информацию.
Таким образом, алгоритм PageRank "вытесняет" вверх в поисковике те статьи, которые и без поисковика наиболее популярны.
В настоящее время PR не используется непосредственно в алгоритме Google, так как PageRank определяет лишь количество и качество внешних ссылок на сайт, но никак не учитывает ссылочный текст и информационное содержимое ссылающихся страниц. Ведь именно этим факторам придается максимальное значение при определении рейтинга. Скорее всего, для ранжирования Google пользуется так называемым тематическим PR (то есть учитывающим только ссылки с тематически связанными страницами), но механизм действия этой программы известен только разработчикам от компании Google.
Определить показатель PageRank для любой страницы можно с помощью Google ToolBar, который определяет значение PageRank в диапазоне от 0 до 10. Желательно учесть, что Google ToolBar показывает не точное значение PR, а лишь диапазон, в который попадает сайт (от 0 до 10) Он определяется по логарифмической шкале.
Например, каждая страница имеет точное значение PageRank, известное только Google. Диапазоны PR, показываемые в Google ToolBar, не равнозначны друг другу. Например, увеличить PR c 1 уровня до 2 легко, а с 6 до 7 гораздо сложнее.
На практике PageRank применяют в основном для двух целей.
Первая - быстро оценить «раскрученность» сайта. PageRank не дает точной информации о ссылающихся страницах, но позволяет быстро и просто выявить уровень развития сайта. Для англоязычных сайтов можно придерживаться следующих границ: PR 4-5 – наиболее часто встречающийся PR для большинства сайтов средней «раскрученности». PR 6 – очень хорошо раскрученный сайт. PR 7 – величина, практически недостижимая для непрофессионального веб-мастера, но иногда встречается. PR 8, 9, 10 – встречаются только у сайтов крупных корпораций и фирм (Microsoft, Google и т.п.). Для русскоязычных сайтов эти показатели незначительно ниже. Владение информацией о PageRank нужно учитывать при обмене ссылками, чтобы оценить качество предоставленной для обмена страницы.
Вторая - оценка конкуренции по поисковому запросу. При помощи PR можно косвенно оценить конкурентоспособность запроса. Например, если в результате поиска сначала стоят сайты с PageRank 6-7, то сайт с PageRank 4 имеет мизерные шансы выйти вперед.
Еще одна деталь – пересчет значений PR, определяемых в Google ToolBar происходит достаточно редко (раз в несколько месяцев), поэтому ToolBar показывает в каком-то роде устаревшую и неактуальную информацию. То есть сама поисковая система Google определяет изменения во внешних ссылках гораздо раньше, чем эти изменения видит Google ToolBar.
В отличие от Google PR, подобная система Яндекс ТИЦ не показывает рейтинг конкретной страницы, а только всего сайта. Поэтому на данный момент система Google PageRank является одной из лучшей для оптимизации и продвижения сайтов.
Источник Web-avangard.net