Распознавание языка как клоакинг

12
euhenio
На сайте с 21.09.2001
Offline
357
2060

Планирую сделать на сайте такую фичу - автоматическую выдачу документа на нужном языке (рус или англ., конечно, с возможностью переключения) в зависимости от переменных окружения типа ACCEPT_LANGUAGE, HTTP_REFERER, REMOTE_ADDR...

Увидев такое, посчитают ли поисковики это клоакингом? Потому что Google и Yandex увидят разные языки при заходе...

Для меня основной интерес в семинаре РОЦИТА есть в заявлении Ильи - что банят только за "обман". Мне кажется, это обманом считать нельзя... Прошу прокомментировать!

с ув., Евгений Трофименко seo блог Trofimenko.ru ( http://trofimenko.ru/ ) но ыыы мало обновляется... Tools.Promosite.ru - анализатор апдейтов Яндекса (пожертвуйте лимиты на Яндекс.XML! ( https://searchengines.guru/ru/forum/801888/page7#comment_11942489 )) Konvr.ru - увеличение конверсии сайта на 81% за 4 недели ( http://konvr.ru/ )
Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#1

А вот интересно - какое значение языка будет у робота?

В любом случае, это не обман. И не клоакинг. Ведь робот с русским языком увидит то же, что и любой юзер с русским броузером.

K
На сайте с 31.01.2001
Offline
737
#2

Я пробовал такой прием, правда всего на паре страниц своего ресурса, одна из которых центральная и может быть интересна разноязычным аудиториям. Т.е. сделал 2 файла: index.html.ru и index.html.en, включив соответствующую поддержку в apache. Но страшное слово "клоакинг" мне даже в голову не пришло. Тем более, что оба варианта ссылаются друг на друга. Могу точно сказать: Яндекс берет русскую страничку, Апорт - английский вариант, импортные поисковики - разумеется тоже. Да, по умолчанию у меня выдается английская, если предпочтения клиента не указаны. 2-е место в Яндексе и Апорте по запросу "rc5", в Рамблере -первое, но через top100, там не знаю, какую берет кодировку.

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
euhenio
На сайте с 21.09.2001
Offline
357
#3

Originally posted by GRAY:
А вот интересно - какое значение языка будет у робота?
В любом случае, это не обман. И не клоакинг. Ведь робот с русским языком увидит то же, что и любой юзер с русским броузером.

-у робота, если есть ACCEPT_LANGUAGE=ru; как у Яндекса=> русский. А если ACCEPT_LANGUAGE нет, то по префиксу домена - один из наших национальных (rus) или com,net,org...(eng)

Но не любой пользователь увидит одно и то же. К тому же, недалеко и до клоакинга - например, я захочу Гуглю выдать русское содержимое, хотя все пользователи, зашедшие с него, увидят английский язык (допустим, я об этом не позаботился), а другим буржуйским искалкам - выдам английский. В общем-то, слова Ильи касаются только Яндекса... А вот что другие SE про такой клоакинг подумают?

Originally posted by Kost:
Т.е. сделал 2 файла: index.html.ru и index.html.en, включив соответствующую поддержку в apache. Но страшное слово "клоакинг" мне даже в голову не пришло.

-ну да, 2 разных файла. А я хочу сделать выдачу разного содержимого под одним именем файла. Ведь если будет выбор для ссылки - сошлются на одну из страниц ru или en, да и удобнее, когда язык сразу определяется...

AiK
На сайте с 27.10.2000
Offline
257
AiK
#4

euhenio

А подумать? Если поисковик _всегда_ видит примерно одно и тоже, то как он определит, что это клоакинг? А вот если ты зарвёшся, то тебя выкинут за спам,

а никак не за клоакинг.

ИМХО, за клоакинг никого никогда ниоткуда не исключали. Это технология, которую робот может отловить только меняя параметры при заходе. Очень сомнительно, что паук будет тратить на это своё время. А вот за содержимое страниц, которые выдаются в резултате работы скрипта банят только в лёт. В некоторых случаях это делается в автоматическом режиме. В других - в результате проверки оператором.

euhenio
На сайте с 21.09.2001
Offline
357
#5

Чего ж тут думать? При клоакинге поисковик всегда видит одно и то же, но дело-то в том, что не всегда то же самое видит пользователь. Даже если страница для поисковика не является явно спаммерской, но хотя бы просто написана на другую тему, имхо, могут забанить. Потому что обман налицо.

Вопрос, опять же, не в том, будет SE тратить время на ковыряние в моем сайте или нет. Предполагаем, что будет (ну или я не скрываю это) - но что сделает?

[This message has been edited by euhenio (edited 08-02-2002).]

V
На сайте с 20.06.2001
Offline
24
vs
#6

Originally posted by euhenio:
Чего ж тут думать? При клоакинге поисковик всегда видит одно и то же, но дело-то в том, что не всегда то же самое видит пользователь. Даже если страница для поисковика не является явно спаммерской, но хотя бы просто написана на другую тему, имхо, могут забанить. Потому что обман налицо.

1. Робот может определить, что пользователям дают не то же самое, что ему. Причем автоматически.

2. Пользователи принимают решение, пойти на сайт со страницы результатов поиска, или не пойти, на основе цитаты. Если в цитате что-то по русски, а сайт вдруг выдает английский текст, многие тут же уйдут. Поэтому полезно, чтобы поисковик видел (и цитировал) то же самое, что и люди, зашедшие на страницу.

3. Сделайте, чтобы русская версия была доступна по адресу rus/index.html, английская - по адресу eng/index.html и скормите каждую из них соответствующим поисковикам. А главную страницу index.html запретите через robots.txt

С уважением,

Влад

[This message has been edited by vs (edited 10-02-2002).]

С уважением, Влад Шабанов vs@rambler-co.ru
Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#7

Робот может определить, что пользователям дают не то же самое, что ему. Причем автоматически.

Подробнее, плиз. Ничего лишнего у него не просят, как он распознает разницу?

euhenio
На сайте с 21.09.2001
Offline
357
#8


2. Пользователи принимают решение, пойти на сайт со страницы результатов поиска, или не пойти, на основе цитаты. Если в цитате что-то по русски, а сайт вдруг выдает английский текст, многие тут же уйдут. Поэтому полезно, чтобы поисковик видел (и цитировал) то же самое, что и люди, зашедшие на страницу.

3. Сделайте, чтобы русская версия была доступна по адресу rus/index.html, английская - по адресу eng/index.html и скормите каждую из них соответствующим поисковикам. А главную страницу index.html запретите через robots.txt

-2: Да, но при заходе с англоязычных поисковиков будет выдаваться английская страница, она же выдавалась этому поисковику. То же и с русскими SE.

-3: Вариант, так сказать, общеизвестный. Но например, Rambler TopShop позволяет повесить счетчик только на ОДНУ странцу сайта. А чтобы не терять рейтинг, я хочу сделать выдачу обоих языков с одной страницы.

V
На сайте с 20.06.2001
Offline
24
vs
#9

Originally posted by euhenio:
-2: Да, но при заходе с англоязычных поисковиков будет выдаваться английская страница, она же выдавалась этому поисковику. То же и с русскими SE.

2. Вы уверены на 100% что нигде не ошибетесь? Что при переходе с английского поисковика будет выдаваться именно английская версия? А то прикольно будет - пошел на сайт с google - увидел английский текст. Потом нажал refresh - и он внезапно обрусел (или наоборот, обанглел .

Влад

[This message has been edited by vs (edited 11-02-2002).]

euhenio
На сайте с 21.09.2001
Offline
357
#10

VS:

Может, и ошибусь, может, нет. Если интересно, могу прислать скрипт (php) потестить. Я ставлю куку при первом определении языка при заходе.

Еще есть такая возможность - определять, есть ли в HTTP_REFERER перекодированные русские буквы (%XX)...

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий