Обсуждаем раздел «Спамдексинг»

Lupus
На сайте с 02.11.2002
Offline
241
#61

Я против попыток обеления клоакинга. Сайт и за георгафию могут забанить и только после длительной переписки с саппортом востановят.
Abuse'ы-то ведь откуда берутся: посетитель приходит из поисковика за одной инфой, а ему подсовывают совсем другую. Т.е. можно сформулировать мысль несколько по-другому: сам по-себе клоакинг не есть зло, но разделы, где он применяется, должны быть закрыты от индексирования. Или наоборот - все варианты заклоаченного контента должны быть доступны боту. И если уж человек пришёл с поиска, то он должн увидеть то же, что и бот.

Сегалович, конечно, не Священное Писание, но, помнится, он говорил где-то так: банят не за использование каких-либо приемов, а за попытку обмана поисковика. Кроме того, не знаю, как у других, но, AFAIK, у русских поисковиков банят вручную - автоматом лишь понижают. Вообще, бот в принципе не может видеть то же что и браузер. Он не интерпретирует скрипты, не применяет стили, не использует DOM. Так что, вопрос на самом деле еще сложнее для формализации. Можно ли говорить о клоакинге, как об изменении отображаемого текста или надо включать и другие элементы (тэги заголовков, выделение и т.п.). А невыдача роботу килобайта-другого джаваскриптов, предваряющих текст на странице - это благо или обман? Разумеется, объявив любой клоакинг недопустимым, можно значительно облегчить задачу. Но не уверен, что это правильно.

Опять таки, это не ответы, а вопросы ;)

There are two types of people in this world: 1. Those who can extrapolate from incomplete data.
AiK
На сайте с 27.10.2000
Offline
257
AiK
#62
Рекомендовать не использовать этот метод, а заменять возможностью выбора языка отображения из меню.

И держать версии на разных поддоменах :)

банят не за использование каких-либо приемов, а за попытку обмана поисковика.

Я об этом и писал. В соседнем топике про глоссарий. Клоакинг без спама ничего страшного для поисковика не представляет. Но вот такая незадача - грамотно реализованный клоакинг бот не видит. А это значит, что дело до модератора доходит только если кто-то настучит.

И при этом шансы бана очень велики. Причём если верить Вашей цитате Ильи, то забанят даже за попытку, а не за сам обман. А потом вебмастер будет доказывать что он не верблюд. И если всё было честно, то докажет, но время будет упущено.

ostmaster
На сайте с 01.09.2002
Offline
222
#63

Сейчас переброшу сюда из соседней ветки сообщения по вопросам клоакинга и продолжим ;)


Тестирование мобильных приложений и сайтов (/ru/forum/1032925) https://www.facebook.com/ostmaster (https://www.facebook.com/ostmaster)
ostmaster
На сайте с 01.09.2002
Offline
222
#64

Сделано.

Перенесла три сообщения по клоакингу, чтоб было понятно что есть что, добавила там "Перенесено из темы «глоссарий» 05.03"

И чтоб не запутаться окончательно, цитирую, что у нас есть на данный момент по клоакингу.

В разделе "Спамдексинг"

4. Клоакинг (cloaking) – техника поискового спама, состоящая в распознании средствами сервера робота (индексирующего агента) поисковой системы и выдача для него специального содержания, принципиально отличающегося от содержания, выдаваемого пользователю.

Исключения.
4.2.1. Использование техники распознавания поискового робота с целью закрытия от индексации избыточных документов (например, выборки из базы данных с различной сортировкой) в случаях, когда это невозможно или затруднительно стандартными средствами сервера.
4.2.2. Выдача клиенту различных версий документа в зависимости от характеристик браузера, (языка, кодировки и т.п.), передаваемых в http запросе, клоакингом не является.

В Глоссарии:

Клоакинг – технология, часто используемая как метод поискового спама, см. раздел спамдексинг.
ostmaster
На сайте с 01.09.2002
Offline
222
#65

Совсем запуталась.

AiK, с одной стороны ты утверждаешь, что клоакинг не есть технология часто используемая как метод ПСп (сокращаю поисковый спам ;)), а лишь «техника сокрытия ПСп».

Но с другой стороны ты против любого обеления клоакинга, что по моему разумению означает, что любой клоакинг ПСп.

Противоречие получается…

Попробую рассуждать поэтапно ;).

Техника сокрытия поискового спама или
технология, часто используемая как метод ПСп.

Я склоняюсь ко второй формулировке.

Есть два текста. Принципиально разных. Один для пользователя, другой для робота. Предположим, что второй не содержит элементов спамдексинга в чистом виде (такое тож иногда встречается). Т.е. получается, что в этом случае подмена одного на второй не есть сокрытие спама, а есть метод спама. Так как элемент спама не в самом тексте, а в факте его замены.

А если по языку или каким либо другим критериям (геотаргентинг) документ изменяется например с русского на английский, то это чистой воды клоакинг хоть и с благими намерениями. Так быть не дОлжно.

В идеале – возможно. Но нам то нужны реалии.

А они таковы, что технология клоакинга иногда используется именно с благими целями, т.е. либо просто не думая про поисковики, а лишь про «чтоб пользователю было удобно».

Либо наоборот оптимизатор получив бестолкового монстра с кучей сессий и прочего хлама, вынужден лишнее закрывать при помощи клоакинга, не пытаясь обмануть поисковую машину, а стремясь облегчить жизнь роботу поисковика, а следовательно обеспечить нормальную индексацию подшефному сайту.

Объявив, что любой клоакинг есть спам – мы как бы напрочь отметаем технологию, которая может не только вредить, но и заметно помогать.

Что ни есть правильно.

По моему разумению ;).

ostmaster, значит нужно выделить слово принципиально

В вордовском файле оно выделено. И не только оно. Т.е. там я расставляла «ударения», и я их потом перенесу в файл оригинала. Но, честно признаюсь, забивать все это в формат форума просто нет сил :(.

Так что более грамотно написать будет так:
"техника сокрытия поискового спама от посетителя, состоящая из..." и далее по тексту. При такой формулировке не придётся делать экивоки в сторону геотрагетинга и т.п. - нет спама, нет и клоакинга. Но проблемы всё-равно могут быть

Изначально была формулировка без экивоков, но даже среди опытных оптимизаторов отсутствие уточнений вызывало слишком много вопросов, поэтому во избежание разночтений были добавлены исключения. Чтоб уж точно было понятно, что есть «принципиально»

Ну а про «сокрытие» я выше писала.

Неужели Сегалович непогрешим?

Как заметил Lupus, Сегалович, конечно, не Священное Писание, но его формулировки весьма продуманны, а уж что такое спамдексинг, полагаю, знает он поболее нашего.

(жаль что не расскажет ;))

Ещё раз привожу пример: есть страница на русском языке и на английском...Догадайся с трёх раз: затребуют ли в поисковике нотариально заверенный перевод, для того, чтобы разобраться в том что содержимое копии в индексе и на сайте абсолютно идентично, видя перед собой тексты на разных языках?

почти офтопик:
Для начала скажу, что сегодня я не пользуюсь языковым клоакингом, посему никакой личной заинтересованности нет.
Но в 98-2001 был у меня серьезный (но развлекательный ;)) ресурс с определением языка на входе. Глаза он многим мозолил (никто не знал, что ведущая – девушка, так что мужских откровений и наездов я начиталась на всею оставшуюся жизнь ;)).
В те времена я еще не знала загадочного слова «оптимизация», для меня был важен лишь целевой посетитель. И уж не знаю, то ли роботы понимали «300 на входе», то ли просто честно ходили по ссылкам в сети… Но в базе Гугля, к примеру, при англоязычных запросах находились английские страницы, при русскоязычных русские. И не было проблем. И никто ни разу не посчитал это спамом.

И вот объясни мне, почему это должно классифицироваться как спам?

И что мешает поисковикам в этом случае просто отрабатывать 300 и брать разные урлы?

Я могу лишь предположить, что к этому есть какие-то технические сложности.

Но почему если что-то сложно реализовать поисковикам, то значит это спам?

Спам – это прежде всего преднамеренный обман.

AiK
На сайте с 27.10.2000
Offline
257
AiK
#66

ostmaster, извини, вынужден писать конспективно

1) суд модераторов поисковика не суд присяжных заседателей и там не действует презумпция невиносвности, а действует презумция виновности.

Поэтому как ни крути намерения (любые) доказывать некому.

2) Меня ни разу не интересуют сложности у поисковиков с определением клоакинга - это их проблемы.

3) Заботиться мы вроде о посетителе собирались.

Так вот, в твоём случае русский посетитель, набравший в Гугле английскую фразу попадёт на страницу с русским текстом. Что есть непреднамеренный обман ожиданий посетителя. Что не есть хорошо.

(А лично меня злит очень сильно - приходится в кэш Гугля лазить).

ostmaster
На сайте с 01.09.2002
Offline
222
#67

Уж лучше конспективно, чем никак ;).

1. Там тож вполне вменяемые люди. И если сайт чист и клоакинг не с целью обмана, а по ранее описаным причинам, шанс влететь в бан практически ничтожен. Даже если "махнут шашкой сгоряча", то потом вернут.

Понятно, что если там немножечко наспамили, тут чуть чуть перестарались, то честные глазки строить бесполезно.

2. О чем и речь ;).

3. Так о нем и заботилась.

Мы ж о криворукости не говорим?

Клоакинг стоял на морде, т.е. на сайт.com/ Поисковики прекрасно "видели" и "отдавали" на выдачу /файл?lang=ru (или en).

Ну и по разделам так же. Т.е. кэш отдыхал.

Но ведь это же клоакинг! Однако не спам.

AiK
На сайте с 27.10.2000
Offline
257
AiK
#68

ostmaster, предлагаю в словарь заглянуть. Яндексовский. Там есть и такой переводик : cloaking - маскировка, сокрытие (в целях защиты от неблагоприятных последствий некорректных операций).

Если ты что-то маскировала - значит клоачила. Если не клоачила, значит ничего и не маскировала. Это к вопросам терминологии.

А теперь к проблемам применения тех же самых приёмов. На простой гипотетической ситуации. Ты, как вебмастер, содержишь на своём сайте словарь компьютерных терминов. На двух языках. Для простоты: один термин - одна страница. Но выдаёшь в зависимости от IP или же Accepted-Language либо на одном, либо на другом языке.

И вот я, простой пользователь, набираю в Гугле такой термин: OLE.

И вижу на первом месте страницу с твоего сайта ostmaster.ru/ole.html

Со сниппетом: OLE (Object Linking and Embedding) -Microsoft’s object-based technology... Ну Гугль-то не наш и ru в Accepted-Language не передают. Кликаю значит я по ссылке и что вижу на странице в результате работы скрипта? Легко догадаться что (IP-то у меня российский, да и язык - ru): ПиВО (привязывание и внедрение объектов) - объектно-ориентированная технология Майкрософт...

С одной строны это не клоакинг, так как ничего не маскировали.

С другой стороны - явное введение пользователя в заблуждение (мне это ПиВо отродясь не надо). И с третьей стороны - фигу бы русский вариант нашёлся в поисковике по английскому запросу. А вот это уже не нравится поисковикам - если руки не кривые запросто можно манипулиовать результатами выдачи и при этом ссылаться на кодекс - типа не запрещено, геотаргетинг однако. Чуствуешь куда клоню?

Опять-таки не должно иди речи о полной или существенной замене контента не важно с какими целями - маскирующими или нет. И как там поговорка - дорога, устланная благими намерениями ведёт в ад?

Lupus
На сайте с 02.11.2002
Offline
241
#69

Но выдаёшь в зависимости от IP или же Accepted-Language либо на одном, либо на другом языке.

Прошу прощения, за то, что вмешиваюсь. Но мне кажется, что "имеет место быть" недоразумение. Ostmaster ясно говорит, что языковый переключатель стоял именно "на морде", то есть, в зависимости от языка ссылки на ней принимали вид /?lang=ru или /?lang=en.

Следовательно, получивший первую версию поисковик никак не мог сослаться на вторую.

Et vice versa. А описанный Вами, AiK вариант мог произойти лишь в случае ссылки непосредственно на главную страницу. Что, конечно не отменяет Ваших рассуждений, но заметно понижает их актуальность. Если я не так понял - поправьте.

AiK
На сайте с 27.10.2000
Offline
257
AiK
#70

Lupus, по поводу актуальности для отдельно взятого примера я могу ответить только фразой из анекдота: Вы, мыши, меня ерундой не грузите. Я стратегией занимаюсь. (Ноу персонал, это так - шютка юмора).

Проблема не в том, что в Яндекс попадут ссылки с английским текстом, а в Гугль - с русским. А в том, что придя из поисковика по одному запросу, посетитель увидит (ок, может увидеть)страницу весьма отдалённо напоминающую о том, что он искал. Просто потому, что переключение произойдёт не на основании того, что посетитель пришёл из Гугля или Яндекса, а на основании либо настроек его браузера, либо его IP. Представьте такую ситуацию: вы выехали отдыхать в Таиланд. И решили поразвлекаться. И вышли через Яндекс на тот самый портал. А он бац - и анекдоты Вам на тайском. Потому что IP у Вас такой. А не потому, что в Яндексе ссылка с lang=ru. Что называется - прочувствуйте разницу. Криминала - никакого. Постетителю - сплошные неудобства.

И с редиректом на JScripte или META точно такие же проблемы - в самом редиректе ничего криминального нет. Кроме неудобств, как например на тот же RBC - при отключенном редиректе им пользоваться невозможно - видишь только пустые страницы.

Забанят или не забанят - дело десятое. Но если забанят, то виноват будет кто? (вопрос риторический).

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий