Комментарии - euhenio - Профиль вебмастера - Форум об интернет-маркетинге

11 февраля 2002, 23:55

AiK

Расслабься. Робот здесь ни при чем (как тебе, конечно, было ясно и самому). Язык для робота - определять каждый раз без куки.

Распознавание языка как клоакинг

11 февраля 2002, 22:29

VS:

Может, и ошибусь, может, нет. Если интересно, могу прислать скрипт (php) потестить. Я ставлю куку при первом определении языка при заходе.

Еще есть такая возможность - определять, есть ли в HTTP_REFERER перекодированные русские буквы (%XX)...

Распознавание языка как клоакинг

10 февраля 2002, 19:13

2. Пользователи принимают решение, пойти на сайт со страницы результатов поиска, или не пойти, на основе цитаты. Если в цитате что-то по русски, а сайт вдруг выдает английский текст, многие тут же уйдут. Поэтому полезно, чтобы поисковик видел (и цитировал) то же самое, что и люди, зашедшие на страницу.

3. Сделайте, чтобы русская версия была доступна по адресу rus/index.html, английская - по адресу eng/index.html и скормите каждую из них соответствующим поисковикам. А главную страницу index.html запретите через robots.txt

-2: Да, но при заходе с англоязычных поисковиков будет выдаваться английская страница, она же выдавалась этому поисковику. То же и с русскими SE.

-3: Вариант, так сказать, общеизвестный. Но например, Rambler TopShop позволяет повесить счетчик только на ОДНУ странцу сайта. А чтобы не терять рейтинг, я хочу сделать выдачу обоих языков с одной страницы.

Распознавание языка как клоакинг

8 февраля 2002, 18:41

Чего ж тут думать? При клоакинге поисковик всегда видит одно и то же, но дело-то в том, что не всегда то же самое видит пользователь. Даже если страница для поисковика не является явно спаммерской, но хотя бы просто написана на другую тему, имхо, могут забанить. Потому что обман налицо.

Вопрос, опять же, не в том, будет SE тратить время на ковыряние в моем сайте или нет. Предполагаем, что будет (ну или я не скрываю это) - но что сделает?

[This message has been edited by euhenio (edited 08-02-2002).]

Распознавание языка как клоакинг

8 февраля 2002, 17:23

Originally posted by GRAY:
А вот интересно - какое значение языка будет у робота?
В любом случае, это не обман. И не клоакинг. Ведь робот с русским языком увидит то же, что и любой юзер с русским броузером.

-у робота, если есть ACCEPT_LANGUAGE=ru; как у Яндекса=> русский. А если ACCEPT_LANGUAGE нет, то по префиксу домена - один из наших национальных (rus) или com,net,org...(eng)

Но не любой пользователь увидит одно и то же. К тому же, недалеко и до клоакинга - например, я захочу Гуглю выдать русское содержимое, хотя все пользователи, зашедшие с него, увидят английский язык (допустим, я об этом не позаботился), а другим буржуйским искалкам - выдам английский. В общем-то, слова Ильи касаются только Яндекса... А вот что другие SE про такой клоакинг подумают?

Originally posted by Kost:
Т.е. сделал 2 файла: index.html.ru и index.html.en, включив соответствующую поддержку в apache. Но страшное слово "клоакинг" мне даже в голову не пришло.

-ну да, 2 разных файла. А я хочу сделать выдачу разного содержимого под одним именем файла. Ведь если будет выбор для ссылки - сошлются на одну из страниц ru или en, да и удобнее, когда язык сразу определяется...

Клингоны

8 февраля 2002, 17:08

Originally posted by Gray:
Мне что, закрыть сайт? Что мне еще сделать, чтобы вы, дорогие мои посетители, ЧИТАЛИ, что там написано?

- сделай шрифт покрупнее, в пойнтах. У меня форум виден нормальным фонтом, в отличие от сайта. Хотя это, наверное, не совсем поможет - обновления на форуме гораздо чаще идут, чем на сайте...

Навеяно упоминанием о ashmanov.com....

7 февраля 2002, 18:56

Пожалуйста, пришлите и мне файл с продуктовой линейкой. cactus@dax.ru

Originally posted by Ashmanov:
Однако мы не создаём ссылочных клубов, фальшивых страниц-паровозов и т.п., поскольку поисковики и это считают спамом.

- а что значит слово "страницы-паровозы"?

Думаю над методикой тестирования приближенной морфологии. (+)

30 января 2002, 22:43

Интересно, но такого словаря у меня нет, я просто предлагаю...

2 DWORKIN : в том и вопрос, как понимать результаты...

Если бы был такой словарь, можно было бы делать следующее -

1) определять, все ли квазиосновы, найденные по словоформе одной реальной основы, одинаковы, (% безошибочных основ в отношении общего количества основ)

2) Определять, какие из квазиоснов являются НЕНУЖНЫМИ (т.е., ложными) - т.е., если квазиоснова предполагается как основа для некой словоформы - а эта словоформа имеет 2 или более квазиоснов (каждая из которых длиннее, т.е. включает в себя исследуемую квазиоснову) - по всем словоформам реальной основы=> эта квазиоснова ложная. То есть не необходимая при данном наборе словоформ. Пример - \свежесобра\...

Ну, и проценты - например, числа словоформ, которые дают плохие квазиосновы, к общему числу словоформ...

3) Собирать квазиосновы, не распознанные ранее как ложные, но являющиеся основами для >=2 словоформ с разным смыслом (типа ложка - ложь), в % к общему числу правильных квазиоснов.

[This message has been edited by euhenio (edited 30-01-2002).]

Думаю над методикой тестирования приближенной морфологии. (+)

30 января 2002, 22:43

Интересно, но такого словаря у меня нет, я просто предлагаю...

2 DWORKIN : в том и вопрос, как понимать результаты...

Если бы был такой словарь, можно было бы делать следующее -

1) определять, все ли квазиосновы, найденные по словоформе одной реальной основы, одинаковы, (% безошибочных основ в отношении общего количества основ)

2) Определять, какие из квазиоснов являются НЕНУЖНЫМИ (т.е., ложными) - т.е., если квазиоснова предполагается как основа для некой словоформы - а эта словоформа имеет 2 или более квазиоснов (каждая из которых длиннее, т.е. включает в себя исследуемую квазиоснову) - по всем словоформам реальной основы=> эта квазиоснова ложная. То есть не необходимая при данном наборе словоформ. Пример - \свежесобра\...

Ну, и проценты - например, числа словоформ, которые дают плохие квазиосновы, к общему числу словоформ...

3) Собирать квазиосновы, не распознанные ранее как ложные, но являющиеся основами для >=2 словоформ с разным смыслом (типа ложка - ложь), в % к общему числу правильных квазиоснов.

[This message has been edited by euhenio (edited 30-01-2002).]

Думаю над методикой тестирования приближенной морфологии. (+)

30 января 2002, 21:44

Квазиоснова - она имеет какой-нибудь машинный смысл? (какое "определение" квазиосновы?)

Напимер, в слове \свежесобранный\, по-моему, правильная основа - \свежесобран\, но и через \свежесобранн\ можно сделать некие правильные слова... (-ое, -ые, ...) А \свежесобра\ - явная ошибка. Какое слово можно сделать из этой основы?

Ну, я бы мог предложить как тестирование - брать некий словарь, в котором содержались бы все (почти все) словоформы каждого слова (за исключением шел-идти и т.п.), и проверялось бы, что все квазиосновы, найденные по каждой словоформе, одинаковы для всего набора словоформ данной реальной основы. Генерацию слов он делать не может => полноту, в ее нормальном смысле, протестировать не удастся, а вероятность того, что основа определена правильно - наверное, да.

[This message has been edited by euhenio (edited 30-01-2002).]

Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ

Вышел новый Яндекс Браузер с YandexGPT и YandexART

euhenio