Определение бана в 1 запрос

Коля Дубр
На сайте с 02.03.2005
Offline
153
1381

Возникла насущная необходимость сделать расширение (firefox, как обычно) для быстрого определения проиндексированности ресурса.

При обращении к хосту должен идти запрос на Яндекс, после чего в статусбаре может появляться значок "сайт забанен".

Сейчас вот думаю, какой синтаксис использовать. Сам обычно ищу через #rhost, но почему - сказать затрудняюсь, привычка =) Вообще есть 3 варианта:

оператор #rhost

оператор #url

параметр &site (через расширенный поиск)

Все дают немножко разные результаты.

Собственно, вопрос: кто-нибудь анализировал, какой вариант работает точнее? Есть ли какие-то особенности?

Кроме того, буду благодарен, если мне в личку покидаете примеры забаненных на данный момент сайтов, чтоб было на чем потренироваться.

Фичу, скорее всего, выкину в общий доступ =)

Разрабатываю общую шину (http://habrahabr.ru/company/floxim/blog/268467/) помаленьку. ...а еще у меня есть бложек (http://www.blogovo.ru/).
A
На сайте с 25.10.2005
Offline
219
#1

Коля Дубр,

Коля, мне кажется, что надежнее всего через расширенный поиск.

А для примеров можешь взять кучу забаненных каталогов (даже из ЯК).

K. Ermakov
На сайте с 10.12.2004
Offline
328
#2

Коля Дубр, проблема в том, что сейчас некоторые сайты исчезают из индекса не потому, что забанены, а потому что имеет место глюк Яндекса, о котором говорил Александр Садовский. Потому как бы сайты ни проверять, в данный конкретный момент проверка может дать не совсем корректный результат. Ну, или говорить надо не то, что сайт в бане, а что его нет в индексе :)

С уважением, Константин Ермаков, absite.ru: онлайн кроссворды (http://absite.ru/); searchsuggest.ru: поисковые подсказки доставляют (http://searchsuggest.ru/).
Коля Дубр
На сайте с 02.03.2005
Offline
153
#3

Константин, ну да, я согласен - речь идет именно о наличае в индексе. Просто задача как раз состоит в удалении забаненных каталогов из базы. Поскольку масштабы вполне промышленные, теми случаями, когда имеет место глюк Яндекса, можно и пренебречь.

Спасибо всем ответившим тут и в личке +)

Devel
На сайте с 08.05.2006
Offline
29
#4
Коля Дубр:
Константин, ну да, я согласен - речь идет именно о наличае в индексе. Просто задача как раз состоит в удалении забаненных каталогов из базы. Поскольку масштабы вполне промышленные, теми случаями, когда имеет место глюк Яндекса, можно и пренебречь.

Спасибо всем ответившим тут и в личке +)

Скажите, а зачем Вам статус бар? Чем не устраивает скрипт, который обрабатывает базу (например в .txt) и на выходе генерирует список забаненых и список не забаненых? Проверка 500 каталогов займет минуты 3-4, не больше.

5NTR - Разработка и редизайн Сайтов (http://5ntr.ru) Тибетский SEO Блог (http://176226007.com)
Коля Дубр
На сайте с 02.03.2005
Offline
153
#5

Devel, скрипт тоже будет. Просто, базы приходят сравнительно маленькими кусками, которые, в любом случае, нужно проглядывать глазками. Ну, и плодить много внешних утилит не хочется - почти весь инструмент для работы с каталогами у меня встроен в брувзер. Короче, особенности архитектуры =) Ну, и вообще, давно хотел такую штуку сделать, чтоб была +)

MiRaj
На сайте с 03.07.2006
Offline
509
#6
Devel:
Скажите, а зачем Вам статус бар? Чем не устраивает скрипт, который обрабатывает базу (например в .txt) и на выходе генерирует список забаненых и список не забаненых? Проверка 500 каталогов займет минуты 3-4, не больше.

это конечно хорошо :)

но я солидарен с Коля Дубр.. это ж надо скопировать урл, запустить скрипт, посмотреть.. а тут - аккуратный бар все сам покажет..

блин, автор опередил меня с ответом :)

Муркетолог. 100 пресс-релизов с прямыми ссылками за 150 баксов? Легко! (http://b2blogger.com) Статейный маркетинг - лучшее лекарство от Минусинска! (http://miralinks.ru)
Megavolt
На сайте с 23.12.2005
Offline
179
#7

Коля Дубр, если не трудно, поделитесь результатами анализа? какой таки запрос оптимальнее? :)

Иногда лучше жевать.... (С)
Amigo
На сайте с 21.07.2004
Offline
67
#8

Devel, а где такой взять? :)

Tagirov SEO блог (http://www.tagirov.org/blog/) - про SEO и не только... Интернет-журнал Etoday (http://www.etoday.ru/) - все самое яркое и актуальное в мире
D
На сайте с 24.05.2006
Offline
13
#9

Например www.au-to.ru забанен. В каталоге есть с ИЦ 1400.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий