Вся правда о Google PageRank

NePlankton 0 5743
Вся правда о Google PageRank

На заре Интернета популярность и авторитетность веб-страниц определялась плотностью ключевых слов. Это вносило определенные неудобства в работу поисковых систем — достаточно было через слово вставлять тематические фразы, чтобы “обманывать” поисковик и обеспечивать себе верхние строчки в поисковых выдачах.

Приблизительно в это же время два молодых аспиранта Стэнфорского Университета — Сергей Брин и Лоуренс Пейдж — работали над более оптимизированным и эффективным алгоритмом ссылочного ранжирования — теперь известным как Google PageRank (дальше PR).

Что такое Google PageRank

Google PR — это алгоритм, используемый поисковой системой Google, по которому вычисляется авторитетность страницы (именно страницы, а не всего сайта). Технология определяет количество сайтов, которые ссылаются на отдельно взятую страницу, учитывая их «вес» (т. е. качество и собственную авторитетность). В основу технологии легла принятая в академическом мире оценка престижа работы авторов научных трудов. Значение этой оценки напрямую зависит от количества ссылок на эту работу или упоминание фамилии автора в других трудах.

Патент на PR выписан на Стэнфордский университет, но автором патента указан Лоуренс Пейдж. Название алгоритма с английского можно перевести как “ранг страницы”, но компания Google связывает его с именем автора (англ. Lawrence Page).

Стоит обратить внимание на то, что не все входящие ссылки одинаково влияют на PR страницы; при прочих равных условиях:

  • Чем выше PR (т.е. авторитетность) ссылающейся страницы, тем больше PR она передаст твоей странице.
  • Чем меньше исходящих ссылок на ссылающейся странице, тем большая часть PR перейдёт по каждой из них.
  • Входящие ссылки, закрытые от индексирования поисковыми системами (с помощью атрибута “nofollow”), не будут учитываться при вычислении PR страницы.
  • Входящие ссылки, написанные шрифтом значительно меньшего размера, чем остальной текст, или же имеющие тот же цвет, что и фон страницы (т.е. визуально незаметные посетителю), будут негативно влиять на PR страницы, вплоть до её удаления из индекса.
  • Входящие ссылки с некачественных сайтов (например, т.н. линк-фермы, “зеркала”, и прочие ухищрения недобросовестных “оптимизаторов”), а также из комментариев блогов, форумов — и прочие ссылки, выглядящие “ненатурально”, могут не только не дать дополнительного PR, но и уменьшить имеющийся.

Например:

Если страница с PR равным 6 ссылается только на одну страницу, то сайт, на который она указывает, получит максимальное значение PR, которое возможно при передаче. Если же на этой странице 20 ссылок, то каждая из них получит только 1/20 часть передаваемого PR. В случае если на этой же странице одна из ссылок закрыта от индексирования с помощью атрибута “nofollow”, то PR, который она могла получить, “сгорает” — т. е.  не «перетекает» странице твоего сайта и не переходит к другим исходящим ссылкам.

Вычисление PR

В обиходе под “PageRank” чаще всего понимается т.н. “тулбарное” значение PR (от англ. “toolbar pagerank”). Этот приблизительный показатель рассчитывается на основе реального PR по логарифмическому закону, и его значение показывает авторитетность страницы в диапазоне от 0 до 10. Принцип логарифмической прогрессии подразумевает, что каждая следующая ступень PR достигается сложнее предыдущей:

По тулбарному значению PR сайты средней популярности находятся в диапазоне от 3 до 5; все, что ниже — это менее раскрученные и молодые сайты. Отметка 6-7 для большинства сайтов уже практически недосягаема; значения 8, 9 и 10 принадлежат только самым авторитетным сайтам — Google (9), Microsoft (8), Wikipedia (9), Adobe (9), а также большинству социальных сетей, таких как Facebook (9), Vkontakte (9) и Twitter (10).

Проверить популярность своей страницы может любой сайтовладелец. Существует несколько вариантов,как это сделать:

  • На онлайн-сервисах, таких как PR Checker  или pr-cy.ru.
  • С помощью специального расширения, которое ты можешь установить на свой браузер, например, на Chrome или Firefox. Оно будет автоматически определять показатель PR, как только ты откроешь страницу.

Реальное значение PR страницы — это число в диапазоне от 0,00000001 до бесконечности. Оно не разглашается и применяется только внутри системы Google. Для его определения, помимо входящих ссылок, принимается во внимание также “возраст” (время существования) страницы и эффективность структуры сайта (т.е. внутренние ссылки).

Значение PR меняется в реальном времени, и именно оно влияет на итоговое ранжирование сайтов в поисковых системах. Значение тулбарного PR обновляется раз в несколько месяцев —  поэтому напрямую оно не используется при ранжировании страниц в поисковых выдачах, однако его часто рассматривают как удобное приближение реального PR при определении авторитетности страниц.

Заключение

Людей, действительно понимающих, что такое Google PageRank — значительно меньше, чем тех, кто использует это слово; вместе с тем уяснение основной идеи PR очень важно для эффективной поисковой оптимизации и улучшения видимости твоего сайта в Google.