Supplimental results - взгляд внутрь мусорного индекса Google.

Slc
На сайте с 27.06.2003
Offline
150
Slc
4451

Когда-то давно Google показывал так называемые supplimental results. В это множество входили страницы менее ценные для пользователей. В 2007, после выхода патента System and method for selectively searching partitions of a database, Гугл перестал показывать в выдаче ссылку на supplimental. Данный патент описывает возможность последовательного или паралельного поиска по разным частям индекса.

С помощью некоторых ухищрений можно заставить Google отображать в выдаче разное количество страниц по запросу вида site:. На данный момент, извне, мы можем сделать три разных выборки из страниц известных Гуглу. Потренируемся на narod.ru:

site:narod.ru - 69 млн страниц

site:narod.ru -ывпфывп - 101 млн страниц

site:narod.ru/* - 1,5 млн страниц

- также можно сделать запрос в AOL, в ответ получим еще меньше еще более ценных для Гугла страниц.

С помощью этих запросов зачастую получаются интересные выборки. У меня подозрение, что основной трафик Гугл дает тому 1,5 млн. страниц, которые мы видим по последнему запросу в примере с народом (или по запросу в AOL). По крайней мере на больших сайтах, например mail.ru - это похоже на правду.

Также я неоднократно встречал утверждения что можно искать только по трешовыми страницам (бывший supplimental index), достаточно сделать запрос такого вида::

-site:narod.ru/* site:narod.ru

Есть идея посчитать метрику "засранности" TLD зон. Just for fun :)

отсюда

Sower
На сайте с 30.12.2009
Offline
651
#1

Стара заезженная песня. :)

/ru/forum/584221

__________________Бесплатная накрутка ПФ: посещаемость, просмотры, переходы с поисковиков по ключевикам, итд.
__________________Все посетители живые, не боты. (http://livesurf.ru/promo/80271)
Slc
На сайте с 27.06.2003
Offline
150
Slc
#3
Sower:
Стара заезженная песня. :)

Понятно что старая и заезженная -) Эти запросы известны давным давно.

Я предлагаю посмотреть на ситуацию в разрезе патента. Очевидно, что раздельный поиск по разным частям базы необходим Гуглу для увеличения быстродействия. Зачем искать по всей базе, если среди выборки из авторитетных страниц и так хватает документов.

Соответственно меня сейчас интересуют критерии "пограничности" запросов. От каких параметров запроса зависит то будет ли Гугл выводить результаты откуда-нибудь кроме основного индекса?

В теории это должно зависеть от:

- количества найденых документов

- частотности запроса

- принадлежности запроса к той или иной категории, по которым у Гугла есть отдельный индекс.

Может быть кто-нибудь исследовал этот вопрос?

А то что на страницы из основного индекса идет большая часть трафика на сайт действительно так? Есть ли какие-то исследования подтверждающие или опровергающие это?

Sower
На сайте с 30.12.2009
Offline
651
#4
Slc:
Понятно что старая и заезженная -) Эти запросы известны давным давно.
Я предлагаю посмотреть на ситуацию в разрезе патента. Очевидно, что раздельный поиск по разным частям базы необходим Гуглу для увеличения быстродействия. Зачем искать по всей базе, если среди выборки из авторитетных страниц и так хватает документов.

Соответственно меня сейчас интересуют критерии "пограничности" запросов. От каких параметров запроса зависит то будет ли Гугл выводить результаты откуда-нибудь кроме основного индекса?
В теории это должно зависеть от:

- количества найденых документов
- частотности запроса
- принадлежности запроса к той или иной категории, по которым у Гугла есть отдельный индекс.

Может быть кто-нибудь исследовал этот вопрос?

А то что на страницы из основного индекса идет большая часть трафика на сайт действительно так? Есть ли какие-то исследования подтверждающие или опровергающие это?

И об этом уже писалось не раз. Всё что написано выше очень критично. Не на страницы из основного индекса идет большая часть трафика, а страницы, на которые идёт больше трафика, гугл вносит в свой верхний кеш выдачи (по вашему - основная выдача).

Slc
На сайте с 27.06.2003
Offline
150
Slc
#5
Sower:
И об этом уже писалось не раз. Всё что написано выше очень критично. Не на страницы из основного индекса идет большая часть трафика, а страницы, на которые идёт больше трафика, гугл вносит в свой верхний кеш выдачи (по вашему - основная выдача).

Поисковик, по идее, не должен поддерживать прямую зависимость между количеством трафика на документ с серпа и перемещением документа в вышестоящий индекс. Так как обратная положительная связь будет "прибивать страницы гвоздями" в верхний индекс.

Если речь идет о трафике НЕ с Гугла, то да, согласен, логично. Более того, на месте Гугла я бы вообще не учитывал трафик с него же при принятии решения о помещении страницы в выше- и ниже-стоящий индекс.

Вообще, чем больше думаю на эту тему, тем больше вижу практических вариантов использования. -)

Игорь Родной
На сайте с 05.07.2008
Offline
369
#6
Sower:
Не на страницы из основного индекса идет большая часть трафика, а страницы, на которые идёт больше трафика, гугл вносит в свой верхний кеш выдачи (по вашему - основная выдача).

Всё так, только с точностью до наоборот.

Комплексный маркетинг в буржунете (http://burzhu.net/showthread.php?t=39)
Sower
На сайте с 30.12.2009
Offline
651
#7
Slc:

Если речь идет о трафике НЕ с Гугла

Речь идёт о любом трафике, и с гугла и не с гугла.

Игорь ( Родной Портал):
Всё так, только с точностью до наоборот.

У нас с вами разный уровень знаний поисковика Google. Ваши утверждения основываются лишь на вашем понимании вопроса, которое не обязательно должно быть верным. То, о чём написал я, и что вы оспариваете, основано на результатах полученных при проведении практических экспериментов.

Игорь Родной
На сайте с 05.07.2008
Offline
369
#8

Sower, Мои утверждения основаны на продвижении 10 крупных проектов в буржунете. 2 из которых я продвигаю сейчас. А так же они основаны на 5-летнем стаже работы с этим поисковиком.

Игорь ( Родной Портал) добавил 30.12.2010 в 18:42

Sower:
То, о чём написал я, и что вы оспариваете, основано на результатах полученных при проведении практических экспериментов.

Вы предлагаете мне согласится с вами?

Вот я открываю статистику по проектам, смотрю её и вижу, что 95 процентов трафа идёт со страниц в основном индексе.

Как я после этого могу с вами согласиться?

Sower
На сайте с 30.12.2009
Offline
651
#9
Игорь ( Родной Портал):

Вы предлагаете мне согласится с вами?

Для меня это не принципиально.

Игорь ( Родной Портал):
Вот я открываю статистику по проектам, смотрю её и вижу, что 95 процентов трафа идёт со страниц в основном индексе.

Я уже написал по этому поводу в позапрошлом посте.

Игорь Родной
На сайте с 05.07.2008
Offline
369
#10

М-дя, тяжеловато. Как немой со слепым. :(

Если бы вы практиковали, то такого бы не писали никогда.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий