baranov:
В принципе, можно для решения этой проблемы указывать в качестве ссылки главную страницу сайта с параметрами, в которых определяется, какую статью надо показать. Ну и, конечно, соответствующий скрипт, заменяющий содержимое. URL другой, а страница-то все равно одна.
AiK
Расслабься. Робот здесь ни при чем (как тебе, конечно, было ясно и самому). Язык для робота - определять каждый раз без куки.
VS:
Может, и ошибусь, может, нет. Если интересно, могу прислать скрипт (php) потестить. Я ставлю куку при первом определении языка при заходе.
Еще есть такая возможность - определять, есть ли в HTTP_REFERER перекодированные русские буквы (%XX)...
-2: Да, но при заходе с англоязычных поисковиков будет выдаваться английская страница, она же выдавалась этому поисковику. То же и с русскими SE.
-3: Вариант, так сказать, общеизвестный. Но например, Rambler TopShop позволяет повесить счетчик только на ОДНУ странцу сайта. А чтобы не терять рейтинг, я хочу сделать выдачу обоих языков с одной страницы.
Чего ж тут думать? При клоакинге поисковик всегда видит одно и то же, но дело-то в том, что не всегда то же самое видит пользователь. Даже если страница для поисковика не является явно спаммерской, но хотя бы просто написана на другую тему, имхо, могут забанить. Потому что обман налицо.
Вопрос, опять же, не в том, будет SE тратить время на ковыряние в моем сайте или нет. Предполагаем, что будет (ну или я не скрываю это) - но что сделает?
[This message has been edited by euhenio (edited 08-02-2002).]
-у робота, если есть ACCEPT_LANGUAGE=ru; как у Яндекса=> русский. А если ACCEPT_LANGUAGE нет, то по префиксу домена - один из наших национальных (rus) или com,net,org...(eng)
Но не любой пользователь увидит одно и то же. К тому же, недалеко и до клоакинга - например, я захочу Гуглю выдать русское содержимое, хотя все пользователи, зашедшие с него, увидят английский язык (допустим, я об этом не позаботился), а другим буржуйским искалкам - выдам английский. В общем-то, слова Ильи касаются только Яндекса... А вот что другие SE про такой клоакинг подумают?
-ну да, 2 разных файла. А я хочу сделать выдачу разного содержимого под одним именем файла. Ведь если будет выбор для ссылки - сошлются на одну из страниц ru или en, да и удобнее, когда язык сразу определяется...
- сделай шрифт покрупнее, в пойнтах. У меня форум виден нормальным фонтом, в отличие от сайта. Хотя это, наверное, не совсем поможет - обновления на форуме гораздо чаще идут, чем на сайте...
Пожалуйста, пришлите и мне файл с продуктовой линейкой. cactus@dax.ru
- а что значит слово "страницы-паровозы"?
Интересно, но такого словаря у меня нет, я просто предлагаю...
2 DWORKIN : в том и вопрос, как понимать результаты...
Если бы был такой словарь, можно было бы делать следующее -
1) определять, все ли квазиосновы, найденные по словоформе одной реальной основы, одинаковы, (% безошибочных основ в отношении общего количества основ)
2) Определять, какие из квазиоснов являются НЕНУЖНЫМИ (т.е., ложными) - т.е., если квазиоснова предполагается как основа для некой словоформы - а эта словоформа имеет 2 или более квазиоснов (каждая из которых длиннее, т.е. включает в себя исследуемую квазиоснову) - по всем словоформам реальной основы=> эта квазиоснова ложная. То есть не необходимая при данном наборе словоформ. Пример - \свежесобра\...
Ну, и проценты - например, числа словоформ, которые дают плохие квазиосновы, к общему числу словоформ...
3) Собирать квазиосновы, не распознанные ранее как ложные, но являющиеся основами для >=2 словоформ с разным смыслом (типа ложка - ложь), в % к общему числу правильных квазиоснов.
[This message has been edited by euhenio (edited 30-01-2002).]