У меня ссылка была с каталога mail.ru до несколько недель назад ее удалили так ТИЦ упал на 10 (хотя все остальные беки на месте). Черт его знает может от этого, а может и нет. Во всяком случае некоммерческие сайты всегда добавляю во все крупные каталоги.
Вышло обновление программы до версии 3.10.
В обновление вошло:
1. Корректировка работы с файлом robots.txt
2. Несколько изменен алгоритм проверки проиндексированности страниц
3. Устранены некоторые бажки в чтении url
keira, Прошу прощения, что ответил не стразу, уведомления почему то не приходят...
по сабжу:
1. Глобально изменится подход к получению страниц на сайте с версии 4 (думаю предусмотреть несколько видов получения страниц).
2. При просчете так же многое зависит и количества ссылок на страницах. Например недавно написал один пользователь, что его сайт с 1,7к страниц проверяется с большим трудом. Как выяснилось там на каждой странице по 200-300 ссылок (сейчас этот бажок исправлен), то есть нагрузка уже на процессов=р компа так как просчет идет на компьютере.
3. Программа будет дорабатываться и в этом очень помогают мнения и пожелания пользователей :)
keira, Ключ отправил в личку
В принципе да, очень большой объем достаточно сложен в просчете, так как здесь не просто получаются страницы, а просчитываются все получаемые и передаваемые веса между страницами (если не учитывать все остальные параметры). При тестировании программы сайты были до 5000 страниц, поэтому больший объем не проверялся.
Идеальная среда для работы это html сайт до 1000 страниц.
После нажатия на кнопку "стоп" программа "переваривает" все полученные данные, Если данных очень много то останавливается не сразу. Все зависит от объема.
Вынужден признать, что такая проблема к сожалению имеется и она систематическая. Правда тут вина не программы, а хостинга. То есть идет блокировка на уровне хостинга, очевидно однообразные обращения воспринимаются как атака.
Можно попробовать исключить получение текста страниц и просчет "сквозных" что бы облегчить доступ и уменьшить нагрузку.
В следующей версии планируется изменить (расширить) подход к получению информации и этот вопрос будет решен или минимизирован по крайней мере.
Если потребуется ключ на 10 дней, для дальнейших тестов, то могу предоставить.
Доброго времени!
Обновление программы до версии 3.08.
В обновление вошла корректировка чтения /noindex/ и /nofollow/ согласно "Методы управления поведением робота":
http://help.yandex.ru/webmaster/?id=1111858
Обновление программы до версии 3.07
1. Добавлена строка в файл отчета с данными о редиректах (300...307) для просмотра страницы откуда ссылка, куда ссылается и куда перенаправляется просто кликаем на указанном значении :)
2. Добавлена информация "10 самых популярных слов на сайте" которая так же располагается в файле отчета.
3. Исправлен бажок с неверной трактовкой "базовой адресации (<base>)"
Хороший сайт, качественное размещение. остался доволен. Рекомендую всем к сотрудничеству :)
приятный сайт, оперативное размещение. Остался доволен :)
anthony_, Я рад, что новость хорошая :) На сайте действительно не выложил, надо будет подумать как это сделать
В обновление вошли:
1. Исправление некорректного чтения пустого disallow: (воспринимался как полный запрет)
2. Исправлена ошибка с работой 404 страницы.
3. Не демонстрировалось общее количество проверенных страниц разделе "список проверок"