Tryerty

Tryerty
Рейтинг
68
Регистрация
04.12.2007
Должность
Intelsib
Чуркин Игорь Владимирович
Miha Kuzmin (KMY):
ну чего проще то, ищецо запрос к примеру мебель, находится количество некоторое сайтов(документов), если оно больше некоторого порога, начинается обрезка допустим по статрангу документа(или как-нибудь извращенно сайта). А оставшееся уже ранжируется.

А как же декларация об отсутствии связи "запрос - страница"?

wolf:
Не для всех запросов

Следует понимать, что существует некий динамический порог обрезки индекса в зависимости от запроса?

Хотя бы гипотетически - какая характеристика запроса может определять этот порог? Суммарный вес? Вес самого тяжелого слова? или ...

wolf:
Насколько я понимаю, речь идет как раз таки о статическом прюнинге.

То есть вне зависимости от потенциальных запросов цифра Яндекса "Поиск по 4 005 168 124 веб-страницам" в действительности заранее резко уменьшена, ибо из индекса удалены страницы, "которые заведомо никогда не будут найдены".

Или я сильно упрощаю схему?

Pruning (от англ. отсечение, сокращение), состоит в том, чтобы динамически прекращать обработку запроса после накопления достаточного количества релевантной информации. Бывает еще статический pruning, когда на основании некоторых допущений индекс сокращается за счет таких документов, которые заведомо никогда не будут найдены.


Как работают поисковые системы. Раздел "Цена одного процента".

Речь у нас идет о динамическом?

wolf:

Достаем всякие методы наименьших квадратов, линейного сглаживания Брауна и всякие прочие регресии, либо просто пытаемся продолжить линию на глазок. Итак, вопрос - в каком месяце доля Яндекса достигнет 100 процентов?

Если "на глазок", то к середине февраля...

Далась вам эта "яма"...

Пожалуй проще сослаться на авторитеты:

Составление семантического ядра

Вариант 2, на мой взгляд, тоже совсем не гиблый, его только немного причесать нужно. Например: "земляные работы" и иже с ними. Тот же wordstat утверждает, что запрос уже не "никакой".

Никакого определения первоисточника в данном примере нет, что вообщем-то естественно. Если взглянуть на сохраненные копии, то в одной из них подсвечены 32 слова (включая титл), а во второй всего 25. Какой из документов должен быть выше в выдаче (если абстрагироваться от авторства)?

Не исключено, что проблема может быть и по этой причине: HTTP/1.1 302 Moved Temporarily.

Скажу честно, не понял: зачем нужен редирект, да еще по referer, если Вы продвигаете внутреннюю страницу. Народ с поиска сразу на нее и будет попадать.

По-моему, это просто стандартное продвижение внутренней страницы, зачем огород-то огораживать?

Всего: 173