cymax

cymax
Рейтинг
16
Регистрация
28.08.2007

alnem, но это никак не помогло гуглу продемонстрировать хороший поиск. Выдача-то нерелевантная - всего 1 ссылка где говорится именно про скрипт пари, а остальное мусор. Вы не находите?

Да, интересная картинка. Вижу тоже, что и прошедшей ночью: один фронт отдает «найден по ссылке», другой нет, а через 10 минут все может поменяться до наоборот. При этом фронты любые, со всех 3-х кластеров.

И в xml-партнерах та же сказка: mail.ru не работает, парочка других - да. Потом картина меняется. Вопрос к знатокам Яндекс.XML: там схема обработки запроса такая же? Т.е. xml-запросы в итоге приходят на те же самые фронты верхнего метапоиска и "залипают" на конкретный фронт или как-то иначе?

Побочный эффект - на фронтах, которые не отдают "найден по ссылке" увеличились веса слов. Совсем мизерно, заметить можно только на словах-"миллионниках", так что на смену корпуса это точно не тянет. Видимо, просто глюк.

Интересно, долго эта каша протянется и чем все закончится? ;)

Денис, gmw не померещилось. Около часа на некоторых фронтах url не искал по ссылке. И не только это. Сейчас вроде нормализовалось.

Косяк в том, что вы переопределяете FS уже после того, как прочитана и разбита на поля первая строчка. Правильно будет так

BEGIN { FS = " : " }

{

print $1 >> "names.txt"

print $2 >> "values.txt"

}

или так

awk -F " : " '

{

print $1 > "names.txt"

print $2 > "values.txt"

}'

А такой FS = " *: *" , наверное, еще лучше :)

Вы меня запутали. При поиске с ограничением на дату документа, хоть с 01.01.1995 по 01.11.2007, вашего сайта вообще нет в выдаче ни по одному ключу - ни по ссылке, ни по контенту. Так? Если да, то ставьте Last-Modified - вылечится.

Theorist:
Expires: Thu, 01 Nov 2007 08:44:43 GMT

Это не тот заголовок, вам нужен Last-Modified. Если не верите, прогоните сайт через адурилку и Яндекс вам сам скажет.

cymax:
Попробуйте искать по дате индексации.

Свой совет беру назад. Ограничение по дате индексации убирает из серпа все, что найденно по ссылке. Как раз ваш случай.

DrJeans, архивов у меня нет, базу стал собирать уже после отмены. Так что вес свежий.

DrJeans, в наследстве опечатка, конечно? И в 14008 тоже :)

наслество::800378936

наследство::140085

Theorist, вам правильно сказали про дату модификации документа. Проверьте, если сервер ее не выдает, то поиск по дате документа ничего не даст. Попробуйте искать по дате индексации.

Всего: 123