Роясь в "исчезнувшем" сайте натолкнулся на очень интересную вещь - в базе Я. несколько тысяч страниц, где то они видны, но пытаясь посмотерть страницы сайта заходя на вторую страницу сразу красуются списки "Abort trap (no core dumped) Bus error (core mailed)", при этом число найденых страниц сокращается с нескольких тысяч до 14.
Ну и стандартная фишка - в выдаче по разным запросам две главные страницы, одна за 7/09, другая за сегодня.
Также второй день бот подозрительно часто жрет главную страницу:
11.09.2005 04:00:06
11.09.2005 07:22:40
11.09.2005 07:57:32
Вот еще подумалось. 3-4 дня назад с сайта были удалены достаточно большие части сайта - подразделы http://сайт/раздел1/ и http://сайт/раздел2/ в связи с выносом в отдельные сайты и старые разделы были удалены через сервис Яндекса. Кроме того был настроен редирект, выдающий вначале 404 ошибку, а потом через Location перекидывал на новый сайт каждого сервиса. Вчера исправил на 301 ошибку + редирект.
В принципе, не мог же Я. из за этого выкинуть весь сайт из базы а потом начать усиленно его снова индексировать?
Подписка пришла сегодня в 9 часов, из чего можно предположить - вчера был апдейт :(
думаю на общий вес документа влияют, это же индексируемый текст. да и в запросах тоже влияют, хотя не всегда явно видно.
Из приведенного Вами списка проводим эксперимент:
запрос "холодильник" и "большой холодильник" - две абсолютно разные выдачи.
немного разные выдачи например по "холодильник кухня" и "холодильник и кухня".
все сугубо имхо.
так, выдача как то меняется. вообще шайтанизм какой то. беру словосочетание, которое находится почти на всех страницах сайта. Ввожу в кавычках в запрос - находится целиком только на одной странице сайта, которая проиндексирвоана вчера. По данным Яндекса в базе все (большинство) страниц присутствует.
Проводим другой эксперимент. Задаем низкочастотный запрос, по которому было сто лет первое место и который (запрос) нафиг никому не нужен. В 10-тке находится страница сайта (на главная). Берем небольшой кусочек уникального контента с этой найденой странице и задаем запрос - результат - 0, "Искомая комбинация слов нигде не встречается".
я рад за Вас :)
если Вы внимательно посмотрите, то увидите, что тема не моя.
т.к. нельзя точно идентифицировать автора сообщения и связь его с рассматриваемым сайтом, данный сайт нельзя напрямую постить в форум. имхо.
Zlo, кидайте сайт в личку, будем препарирвоать.
и вот почитайте соседнюю ветку: /ru/forum/25347
В дополнение: С чем боролись, на то и напоролись. Пример запроса "новости", возврат к концу августа, "родной" ТРТУ снова в серпе:
http://www.yandex.ru/yandsearch?text=%ED%EE%E2%EE%F1%F2%E8&tb=1
мдя, очень интересно. Yandex/1.01.001 (compatible; Win16; I) стал забирать главную с интервалом примерно в 4 часа, так длится несколько дней. При том, что из всего сайта индексатор берет в день в среднем только 15-20 страниц.
вот еще интересное явление: морда находится только по названию, в тоже время есть уникальный текст не только на морде, но и на другой странице сайта. в результатае другая старница находится первой, а морды нет :(
Yandex/1.01.001 (compatible; Win16; I) последний раз схавал главную сегодня в 11:59
pershaw,
не очень... в 20-тке почти нет изменений. подписка не приходила.