Anton

Рейтинг
118
Регистрация
29.12.2005

Вообщем так: любые каталоги которые когда либо были в базе и были впоследствии удалены, процедурой импорта всегда опознаются как дупы.

Кстати "Оптимизация БД" в меню сервис что делает? У меня такое ощущение, что ничего. Если делать что-то типа repair tables, то из файла должны физически чиститься удаленные записи, но они остаются на месте, да и размер файла не меняется.

А вот еще косяк.

Игрался с импортом бэклинков и автоматическим поиском форм.

Попутно экспериметировал с поиском дупов.

В какой то момент прога рухнула с каким то рантаймом и предложением пожаловаться на это БГ. Перезапустил. Удалил из БД все каталоги.

Создал новый каталог и импортнул тот же сайт на котором все упало. Весь импорт попал в дупы. Упс... Причем после этого программа не может разорвать соединение с БД.

Еще слегка шокирует процедура поиска дупов.

Что-то я не понимаю логики.

Насколько я понял, дупы ищусся по доменному имени? Явно не по полному урлу. Если дупы перемещать в отдельный каталог, то туда перемещаются все записи. Те не остается ни одной не дублированной записи в тех каталогах в которых ведется проверка. Те оставить одну запись из всех дублей невозможно. Либо все, либо ничего. При удалении тоже самое.

При импорте итп понятно, галку поставил и дубли просто не заносятся в базу. Но как слить вместе например несколько каталогов загруженных с дублями? Непонятно.

В сео броузере не работает кнопка "сграбить ссылки".

Выбираешь каталог, появляется окно "дождитесь выполнения операции" и все, окно висит вечно.

Минимум три сайта достаточно давно сами оказались в каталоге без моего участия. Еще один - писал заявку, через месяц где-то добавили, бесплатно. Сайтам всем много больше года.

Junior:
А вот страница из глубин вашего сайта чем-нибудь характерна?

Хороший вопрос. На первый взгляд обычная страница, каких довольно много на том же сайте. Но на второй взгляд обнаружилось, что этот робот проверяет исключительно страницы в урле которых присутствуют русские символы энкоженые конечно же.

Типа:

xxxx.ru/%CF%D4%D7%C5%D2%D4%CB%C1.html (/отвертка.html в KOI8)

В сео броузере не работает кнопка "перейти" справа от поля ввода урла.

Если просто ентером ткнуть, то все ок. Если мышой ткнуть то переходит на урыл, который был в этом поле до этого.

Мда...

Сделал запрос попроще: в в в в в

http://www.yandex.ru/yandsearch?text=%E2+%E2+%E2+%E2+%E2&stype=www

Говорит: "Для требуемой операции не хватает памяти"

Если буковок побольше, то ошибка диска.

У яндекса чего, своп кончился? :)

Может быть это отдельный индексер для забаненых сайтов, который проверяет не сменился ли контент?

Antony69:
А что в whois у IP написано? Может шалит кто-то? :)

На шалости не похоже, ип аутентичный: 213.180.207.224

inetnum: 213.180.206.0 - 213.180.207.255

netname: YANDEX-BIGSEARCH2

descr: Yandex search engine

Кстати, на своих посещаемых и ангельски непорочных сайтах за последнюю неделю я этого бота не заметил. Но на забаненом сайте появляется регулярно, берет robots.txt, страницу из глубины сайта и сваливает.

Всего: 620