Google Spybar :)

12 3
xgenius
На сайте с 10.01.2002
Offline
55
2394

Интересная ситуация:

Есть молодой сайт который буквально на днях попал в базу Гугля.

Сегодня написал скрипт который редиректит пользователей пришедших с WAP-браузерами на WAP-версию сайта, точнее даже не редиректит, а включает различные коды для WML и HTML соответственно (по UA). Так вот, сначала зашел бот, потом я, а буквально через несколько минут появились странные заходы, причем с таким же броузером и OS как у меня. Странно то, что сайт молодой и столько подряд заходов с такими же данными как у меня теоретически маловозможно. Плюс, проверив IP, нашел записи в которых язык броузера никак не мог быть русским. Ниже кусок из статистики:

IP Host Lang Browser OS

------------------------------------------------------------------

217.93.8.170 pD95D08AA.dip.t-dialin.net ? MSIE 5.5 Windows 98

129.254.210.43 ? ru MSIE 5.5 Windows 98

83.30.21.160 lj160.neoplus.adsl.tpnet.pl ? MSIE 5.5 Windows 98

65.123.97.74 ? ? MSIE 5.5 Windows 98

219.130.81.58 ? en-ca-ru MSIE 5.5 Windows 98

137.53.23.163 ? ? MSIE 5.5 Windows 98

193.125.183.246 ? en-ca-ru MSIE 5.5 Windows 98

64.68.82.172 crawler14.googlebot.com ? ? ?

64.68.82.182 crawler14.googlebot.com ? ? ?

64.68.82.173 crawler14.googlebot.com ? ? ?

Моё посещение в этом списке:

193.125.183.246 ? en-ca-ru MSIE 5.5 Windows 98

Все остальные не мои.

Вот не пойму, если это проверка на клоакинг, то как Гугль узнал что есть другая версия сайта. И почему он стал заходить с теми же данными броузера как у меня... Иначе как на тулбар подумать не могу...

Ни у кого не было подобного?

Мой Круг (http://dsemenov.moikrug.ru/) - Мой Блог (http://www.semenov.org/)
Pavlus
На сайте с 26.01.2004
Offline
121
#1

хм... интересно

E
На сайте с 09.04.2004
Offline
10
#2
Как писал xgenius
Интересная ситуация:

Вот не пойму, если это проверка на клоакинг, то как Гугль узнал что есть другая версия сайта. И почему он стал заходить с теми же данными броузера как у меня... Иначе как на тулбар подумать не могу...

Ни у кого не было подобного?

Такого не было, но сегодня пропал очень весомый сайт(222 BL) из моей ниши который в пятёрке был очень давно, дорвеи на этом сайте были с моментальной переадресацией, но не на явном ява скрипте. Посещаемость, а следовательно и предпологаемая статистика сливаемая googl-у через бар высоки, и если гуглеманы начали отслеживать паузы между открытием двух страниц подряд(что намного легче и логичней чем лопатить скрипты и флеши на предмет редиректов), то есть над чем задуматься... ;)

PS. Не смотря ни на какие "заслуги" в виде раскрученного бренда и солидных-таки 200 бэклинков? влепили ему PR=0 и в обозримой выдаче я его не вижу. Так что делайте выводы.

wolf
На сайте с 13.03.2001
Offline
1183
#3
и если гуглеманы начали отслеживать паузы между открытием двух страниц подряд

Тут могло быть все гораздо проще - банальный стук...

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
E
На сайте с 09.04.2004
Offline
10
#4
Как писал wolf


Тут могло быть все гораздо проще - банальный стук...

Могло, но ведь хочется верить в красивое ;) Кстати можно отслеживать даже не паузы, а переход на другую страницу при отсутствии клика мыши - проще уже некуда, так что думаю всё это если не присутствует сейчас, то обязательно появится...

wolf
На сайте с 13.03.2001
Offline
1183
#5
Кстати можно отслеживать даже не паузы, а переход на другую страницу при отсутствии клика мыши - проще уже некуда

Угу, и чтобы забанить конкурента, надо будет просто набрать его адрес в строке браузера. Сильно придумано :)

E
На сайте с 09.04.2004
Offline
10
#6
Как писал wolf


Угу, и чтобы забанить конкурента, надо будет просто набрать его адрес в строке браузера. Сильно придумано :)

Нехочется скрупулёзничать, но тут всё по-взрослому похоже. С математикой у ребят всё хорошо, учитывая специфику их работы, и при хорошей посещаемости обладателей баров тоже будет достаточно для накопления статистики. При превышении определённого уровня которой совсем не обязательно сразу следует бан, а к примеру генерится спам-саспекшн репорт человеку, для более ручной проверки. Да и мне кажется проблематично при правильной постановке дела у тулбара переходить куда-то не нажимая кнопок ;) Словом технически вполне реализуемо...

xgenius
На сайте с 10.01.2002
Offline
55
#7

3 дня назад зарегистрировал доме в зоне .org, вывесил на него свой русскоязычный блог (софтина PLOG на PHP) и начал его вести. Никуда ссылок на него не добавлял, в поисковики не совал. Так буквально на следующий день пришел бот гугля. Откуда спрашивается? Уменя 3 варианта: тулбар, сервис whois.sc в котором я всего пару раз простотрел данные пока не проделегировался домен (кстати этот сервис каким-то образом частично спонсирован Гуглем), и сам скрипт блога (я в нем до конца не разобрался, он вроде шлет какие-то пинги серверу Weblog.com). Есть мысли?...

SilverMaster
На сайте с 08.10.2003
Offline
228
#8
Как писал xgenius
3 дня назад зарегистрировал доме в зоне .org, вывесил на него свой русскоязычный блог (софтина PLOG на PHP) и начал его вести. Никуда ссылок на него не добавлял, в поисковики не совал. Так буквально на следующий день пришел бот гугля. Откуда спрашивается? Уменя 3 варианта: тулбар, сервис whois.sc в котором я всего пару раз простотрел данные пока не проделегировался домен (кстати этот сервис каким-то образом частично спонсирован Гуглем), и сам скрипт блога (я в нем до конца не разобрался, он вроде шлет какие-то пинги серверу Weblog.com). Есть мысли?...

После захода whois.sc всегда приходит гугль и читает индекс и роботс.

у меня всегда так. ничего подозрительного. whois.sc просто посмотрел что домен уже в DNS и не 404 и дал гугльботу команду "ату".

другое дело что он только индекс съест, но это уже по понятным тоже причинам.

Из детских комшаров: "А вдруг ночью придет страшный робот!" Из взрослых: "И криво проиндексирует сайт". Не всякий гик добежит до середины поисковой страницы гугла
xgenius
На сайте с 10.01.2002
Offline
55
#9

2SilverMaster

Спасибо за подсказку. А я то сижу голову ломаю :)

Вообще, тогда получается whois.sc можно использовать в целях "ознакомления" гугельбота с новыми реурсами? ;)

SilverMaster
На сайте с 08.10.2003
Offline
228
#10
Как писал xgenius
2SilverMaster

Спасибо за подсказку. А я то сижу голову ломаю :)
Вообще, тогда получается whois.sc можно использовать в целях "ознакомления" гугельбота с новыми реурсами? ;)

Нет, ты не понял, это никак не зависит от твоих запросов на whois.sc

У whois своя база доменов - примерно 40 млн. Каждый день +- 10.000 новых. Вот он их и просматривает, а дальше все просто, если кто из новых (или из купленых старых) не 404 - то складываем гуглю в new.txt

+ если из купленых старых то в ban.txt.

P.S. ищу(шукаю) полный zonefile .com .net .org

12 3

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий