Комментарии - Eugen - Профиль вебмастера - Форум об интернет-маркетинге

3 мая 2006, 09:17

xxx-dred:
да и целых доменов.
сайты белые, но относительно свежие, в индексе был только индекс, и то который исчез, остался только по нескольким дата центрам,
остальные проекты тоже белые сначала вылетели внутренние страницы, затем и индекс

У меня ситуация похожая, но сайт исчез со всех ДЦ. В вашем случае - только на части ДЦ домены выпали?

индексация гугла

3 мая 2006, 08:03

xxx-dred:
также наблюдается вылет из индекса где как где то массовое где то только индекс, на разных дата центрах по разному.до этого убивались только некоторые страницы из-за контента.

Имеется в виду: баны целых сайтов? Если да, то что это за сайты: белые или спам, или и те и другие? :)

Нейросети в ранжировании

3 мая 2006, 08:00

Да, но что тогда подавать на входы сети? Я считаю, что при таком подходе надо как-то максимально полно описать документ вектором конечной длины, вот только, что это будет за вектор? Кроме того, тот подход, что вы предложили, не учитывает соответствие документа запросу и скорее применим для тематической кластеризации документов, чем для ранжирования.

А насчет dataparksearch, то, как понятно из краткого описания, они документы рассматривают, как нейроны, а линки между ними - как связи нейронов. И как-то пытаются эту сеть обучить :)

Кстати, может, кто посоветует книги или статьи на эту тему?

Нейросети в ранжировании

2 мая 2006, 19:34

Kolyaj:
Метод обратного распространения ошибки обучает многослойную сеть без обратных связей. В данном случае получится с обратными.

Нет, он может применяться в т.ч. и для сетей с обратными связями. Но вопрос не в этом. Интересно, как именно нейросети используются при ранжировании, в частности - в DataparkSearch.

индексация гугла

2 мая 2006, 11:18

C индексацией в гугле сейчас совсем загадочная ситуация. Как по мне - попахивает trust rank, т.к. сейчас жирные линки не играют определяющую роль в индексации. У кого-то есть еще идеи на этот счет?

Гугл дал ПР забанненым ранее доменам и обновил кеш

1 мая 2006, 10:33

Амнистия? У кого-нибудь были случаи выхода из бана в связи с последним апдейтом?

Глюк ПР ?

28 апреля 2006, 05:52

amph:
Дело в том, что раньше PR страницы учитывался при индексации пауком, а теперь -нет

А что же тогда является определяющим критерием для гуглбота?

Прощай, золотой треугольник (как читают серп)

27 апреля 2006, 21:24

ИМХО, разные сайты воспринимается по разному. Каждый дизайн расставляет свои акценты. Да, исследование подтверждает, что наибольшее внимание уделяется верхней части страницы, но это и так понятно :)

Как правильно организовать базу?

21 апреля 2006, 15:24

itman:
. Для слов, про которые известно, как они склоняются и спрягаются, лучше и дуобнее хранить словарь ИМХО в виде trie-дерева.

Где можно почитать про такой способ хранения?

А насчет эвристики разделения на 2 индекса, то тут, наверное, надо ждать комментариев самого Максима Голубева :)

А хочется знать ваше мнение?

21 апреля 2006, 15:08

Krukov,

А какие мощности используются для вычисления PR? PageRank достаточно сложен (в плане требуемых вычислительных мощностей), поэтому немногие решаются его применять. Как вам удалось? :) Хотя перед этим надо задать еще вопрос, для какого размера индекса вы его считаете?

Как снизить ДРР до 4,38% и повысить продажи с помощью VK Рекламы

В 2023 году 36,9% всех DDoS-атак пришлось на сферу финансов

Eugen