Lupus, по поводу актуальности для отдельно взятого примера я могу ответить только фразой из анекдота: Вы, мыши, меня ерундой не грузите. Я стратегией занимаюсь. (Ноу персонал, это так - шютка юмора).
Проблема не в том, что в Яндекс попадут ссылки с английским текстом, а в Гугль - с русским. А в том, что придя из поисковика по одному запросу, посетитель увидит (ок, может увидеть)страницу весьма отдалённо напоминающую о том, что он искал. Просто потому, что переключение произойдёт не на основании того, что посетитель пришёл из Гугля или Яндекса, а на основании либо настроек его браузера, либо его IP. Представьте такую ситуацию: вы выехали отдыхать в Таиланд. И решили поразвлекаться. И вышли через Яндекс на тот самый портал. А он бац - и анекдоты Вам на тайском. Потому что IP у Вас такой. А не потому, что в Яндексе ссылка с lang=ru. Что называется - прочувствуйте разницу. Криминала - никакого. Постетителю - сплошные неудобства.
И с редиректом на JScripte или META точно такие же проблемы - в самом редиректе ничего криминального нет. Кроме неудобств, как например на тот же RBC - при отключенном редиректе им пользоваться невозможно - видишь только пустые страницы.
Забанят или не забанят - дело десятое. Но если забанят, то виноват будет кто? (вопрос риторический).
ostmaster, предлагаю в словарь заглянуть. Яндексовский. Там есть и такой переводик : cloaking - маскировка, сокрытие (в целях защиты от неблагоприятных последствий некорректных операций).
Если ты что-то маскировала - значит клоачила. Если не клоачила, значит ничего и не маскировала. Это к вопросам терминологии.
А теперь к проблемам применения тех же самых приёмов. На простой гипотетической ситуации. Ты, как вебмастер, содержишь на своём сайте словарь компьютерных терминов. На двух языках. Для простоты: один термин - одна страница. Но выдаёшь в зависимости от IP или же Accepted-Language либо на одном, либо на другом языке.
И вот я, простой пользователь, набираю в Гугле такой термин: OLE.
И вижу на первом месте страницу с твоего сайта ostmaster.ru/ole.html
Со сниппетом: OLE (Object Linking and Embedding) -Microsoft’s object-based technology... Ну Гугль-то не наш и ru в Accepted-Language не передают. Кликаю значит я по ссылке и что вижу на странице в результате работы скрипта? Легко догадаться что (IP-то у меня российский, да и язык - ru): ПиВО (привязывание и внедрение объектов) - объектно-ориентированная технология Майкрософт...
С одной строны это не клоакинг, так как ничего не маскировали.
С другой стороны - явное введение пользователя в заблуждение (мне это ПиВо отродясь не надо). И с третьей стороны - фигу бы русский вариант нашёлся в поисковике по английскому запросу. А вот это уже не нравится поисковикам - если руки не кривые запросто можно манипулиовать результатами выдачи и при этом ссылаться на кодекс - типа не запрещено, геотаргетинг однако. Чуствуешь куда клоню?
Опять-таки не должно иди речи о полной или существенной замене контента не важно с какими целями - маскирующими или нет. И как там поговорка - дорога, устланная благими намерениями ведёт в ад?
ostmaster, извини, вынужден писать конспективно
1) суд модераторов поисковика не суд присяжных заседателей и там не действует презумпция невиносвности, а действует презумция виновности.
Поэтому как ни крути намерения (любые) доказывать некому.
2) Меня ни разу не интересуют сложности у поисковиков с определением клоакинга - это их проблемы.
3) Заботиться мы вроде о посетителе собирались.
Так вот, в твоём случае русский посетитель, набравший в Гугле английскую фразу попадёт на страницу с русским текстом. Что есть непреднамеренный обман ожиданий посетителя. Что не есть хорошо.
(А лично меня злит очень сильно - приходится в кэш Гугля лазить).
И держать версии на разных поддоменах :)
Я об этом и писал. В соседнем топике про глоссарий. Клоакинг без спама ничего страшного для поисковика не представляет. Но вот такая незадача - грамотно реализованный клоакинг бот не видит. А это значит, что дело до модератора доходит только если кто-то настучит.
И при этом шансы бана очень велики. Причём если верить Вашей цитате Ильи, то забанят даже за попытку, а не за сам обман. А потом вебмастер будет доказывать что он не верблюд. И если всё было честно, то докажет, но время будет упущено.
ostmaster, значит нужно выделить слово принципиально.
Неужели Сегалович непогрешим? :)
Ещё раз привожу пример: есть страница на русском языке и на английском. Переведено один в один и заверено у нотариуса. На основании HTTP заголовка Accept-Language нашим показывают русскую версию, не нашим - английскую. Если бы поисковиков на свете не было, то всё было бы абсолютно честно с точки зрения любого пользователя. И никаким спамом бы не пахло. Но когда в игру вступает поисковик, то выясняется, что заголовок Accept-Language он серверу не передаёт и попадает скажем в не наши. И получается, что в поисковике посетитель видит сниппет от английской страницы, а придя на сайт получает русскую. Если при этом окажется, что этот посетитель не простой, а знающий что такое клоакинг, то поисковику может быть отправлен spam-report. Догадайся с трёх раз: затребуют ли в поисковике нотариально заверенный перевод, для того, чтобы разобраться в том что содержимое копии в индексе и на сайте абсолютно идентично, видя перед собой тексты на разных языках?
Перефразируя Пушкина - много много геморроя (клиенту в первую очередь) принесёт оно (выдача различных версий поисковику и посетителю) с собою. И без спама.
Так что более грамотно написать будет так:
"техника сокрытия поискового спама от посетителя, состоящая из..." и далее по тексту. При такой формулировке не придётся делать экивоки в сторону геотрагетинга и т.п. - нет спама, нет и клоакинга. Но проблемы всё-равно могут быть :)
Уфф. Довльно сумбурно, но на дворе тёмная ночь, а не белый день :)
тут наверное опять должны звучать слова про полную или существенную замену контента. В случае различных браузеров должно меняться только оформление текста, но не сам текст. В идеале это достигается путём замены только CSS файла. А если по языку или каким либо другим критериям (геотаргентинг) документ изменяется например с русского на английский, то это чистой воды клоакинг хоть и с благими намерениями. Так быть не дОлжно.
Клоакинг - не метод спама, а способ его сокрытия. И свопинг можон назвать разновидностью клоакинга. Банят не за клоакинг и не свопинг, а за то, что было спрятано клоакингом и свопингом.
Скажу что не оччень плохо - это безусловный редирект. Т.е. одинаковый и для робота и для поисковика. Если это клоакинг, пусть и с трижды благими целями и при помощи серверного редиректа - это плохо. Тот же ID сессии в URL для незарегистрированного пользователя (сиречь бота) - обясним, но является бякой, то бишь кривостью рук вебмастера.
Вообще-то не грех бы и у Ильи поинтересоваться, что он имел ввиду.
Я так думаю, он имел ввиду массовый сабмит в каталоги, гостевухи и т.п.
Оффтоп: Кстати, некоторые сервисы массабмита (даже платные) находятся в блэклистах. В смысле сайты, которые числятся в каталогах этих сервисов находятся "на карандаше".
Врядли. Спам он и в Африке спам. Пусть даже отдельно взятый поисковик его таковым не считает. Кроме того, не всегда автоматически распознать форум или гостевую можно.
Я не то имел ввиду. Сомнительно, что MARQUEE действует хотя бы как B.
Просто его применение позволяет воткнуть в одну строку, видимую посетителем несколько килобайт текста, видимых поисковиком. Так сказать разновидность слоёв.
Я против попыток обеления клоакинга. Сайт и за георгафию могут забанить и только после длительной переписки с саппортом востановят.
Abuse'ы-то ведь откуда берутся: посетитель приходит из поисковика за одной инфой, а ему подсовывают совсем другую. Т.е. можно сформулировать мысль несколько по-другому: сам по-себе клоакинг не есть зло, но разделы, где он применяется, должны быть закрыты от индексирования. Или наоборот - все варианты заклоаченного контента должны быть доступны боту. И если уж человек пришёл с поиска, то он должн увидеть то же, что и бот.
wolf, дык я и не художник, а всего-навсего сын брата художника :) И больше всего вспоминаю Билли тёплыми словами когда в очередной раз объясняю брату художника где надо два раза кликать, а где один. Или на какой крестик нажать, чтобы закрыть всё приложение, а не один из документов...
Это, как ево. Ну, вобщем, я тоже иногда рисую, а точнее компилирую :)
И мне очень не нравится любая стилизация под MS. В данном случае речь о букве Е от IE.