alnem, но это никак не помогло гуглу продемонстрировать хороший поиск. Выдача-то нерелевантная - всего 1 ссылка где говорится именно про скрипт пари, а остальное мусор. Вы не находите?
http://captcha.yandex.net
Да, интересная картинка. Вижу тоже, что и прошедшей ночью: один фронт отдает «найден по ссылке», другой нет, а через 10 минут все может поменяться до наоборот. При этом фронты любые, со всех 3-х кластеров.
И в xml-партнерах та же сказка: mail.ru не работает, парочка других - да. Потом картина меняется. Вопрос к знатокам Яндекс.XML: там схема обработки запроса такая же? Т.е. xml-запросы в итоге приходят на те же самые фронты верхнего метапоиска и "залипают" на конкретный фронт или как-то иначе?
Побочный эффект - на фронтах, которые не отдают "найден по ссылке" увеличились веса слов. Совсем мизерно, заметить можно только на словах-"миллионниках", так что на смену корпуса это точно не тянет. Видимо, просто глюк.
Интересно, долго эта каша протянется и чем все закончится? ;)
Денис, gmw не померещилось. Около часа на некоторых фронтах url не искал по ссылке. И не только это. Сейчас вроде нормализовалось.
Косяк в том, что вы переопределяете FS уже после того, как прочитана и разбита на поля первая строчка. Правильно будет так
BEGIN { FS = " : " }
{
print $1 >> "names.txt"
print $2 >> "values.txt"
}
или так
awk -F " : " '
print $1 > "names.txt"
print $2 > "values.txt"
}'
А такой FS = " *: *" , наверное, еще лучше :)
Вы меня запутали. При поиске с ограничением на дату документа, хоть с 01.01.1995 по 01.11.2007, вашего сайта вообще нет в выдаче ни по одному ключу - ни по ссылке, ни по контенту. Так? Если да, то ставьте Last-Modified - вылечится.
Это не тот заголовок, вам нужен Last-Modified. Если не верите, прогоните сайт через адурилку и Яндекс вам сам скажет.
Свой совет беру назад. Ограничение по дате индексации убирает из серпа все, что найденно по ссылке. Как раз ваш случай.
DrJeans, архивов у меня нет, базу стал собирать уже после отмены. Так что вес свежий.
DrJeans, в наследстве опечатка, конечно? И в 14008 тоже :)
наслество::800378936
наследство::140085
Theorist, вам правильно сказали про дату модификации документа. Проверьте, если сервер ее не выдает, то поиск по дате документа ничего не даст. Попробуйте искать по дате индексации.