Вообщем так: любые каталоги которые когда либо были в базе и были впоследствии удалены, процедурой импорта всегда опознаются как дупы.
Кстати "Оптимизация БД" в меню сервис что делает? У меня такое ощущение, что ничего. Если делать что-то типа repair tables, то из файла должны физически чиститься удаленные записи, но они остаются на месте, да и размер файла не меняется.
А вот еще косяк.
Игрался с импортом бэклинков и автоматическим поиском форм.
Попутно экспериметировал с поиском дупов.
В какой то момент прога рухнула с каким то рантаймом и предложением пожаловаться на это БГ. Перезапустил. Удалил из БД все каталоги.
Создал новый каталог и импортнул тот же сайт на котором все упало. Весь импорт попал в дупы. Упс... Причем после этого программа не может разорвать соединение с БД.
Еще слегка шокирует процедура поиска дупов.
Что-то я не понимаю логики.
Насколько я понял, дупы ищусся по доменному имени? Явно не по полному урлу. Если дупы перемещать в отдельный каталог, то туда перемещаются все записи. Те не остается ни одной не дублированной записи в тех каталогах в которых ведется проверка. Те оставить одну запись из всех дублей невозможно. Либо все, либо ничего. При удалении тоже самое.
При импорте итп понятно, галку поставил и дубли просто не заносятся в базу. Но как слить вместе например несколько каталогов загруженных с дублями? Непонятно.
В сео броузере не работает кнопка "сграбить ссылки".
Выбираешь каталог, появляется окно "дождитесь выполнения операции" и все, окно висит вечно.
Минимум три сайта достаточно давно сами оказались в каталоге без моего участия. Еще один - писал заявку, через месяц где-то добавили, бесплатно. Сайтам всем много больше года.
Хороший вопрос. На первый взгляд обычная страница, каких довольно много на том же сайте. Но на второй взгляд обнаружилось, что этот робот проверяет исключительно страницы в урле которых присутствуют русские символы энкоженые конечно же.
Типа:
xxxx.ru/%CF%D4%D7%C5%D2%D4%CB%C1.html (/отвертка.html в KOI8)
В сео броузере не работает кнопка "перейти" справа от поля ввода урла.
Если просто ентером ткнуть, то все ок. Если мышой ткнуть то переходит на урыл, который был в этом поле до этого.
Мда...
Сделал запрос попроще: в в в в в
http://www.yandex.ru/yandsearch?text=%E2+%E2+%E2+%E2+%E2&stype=www
Говорит: "Для требуемой операции не хватает памяти"
Если буковок побольше, то ошибка диска.
У яндекса чего, своп кончился? :)
Может быть это отдельный индексер для забаненых сайтов, который проверяет не сменился ли контент?
На шалости не похоже, ип аутентичный: 213.180.207.224
inetnum: 213.180.206.0 - 213.180.207.255
netname: YANDEX-BIGSEARCH2
descr: Yandex search engine
Кстати, на своих посещаемых и ангельски непорочных сайтах за последнюю неделю я этого бота не заметил. Но на забаненом сайте появляется регулярно, берет robots.txt, страницу из глубины сайта и сваливает.