Nick Bubelo

Рейтинг
95
Регистрация
14.09.2004
Должность
командую

Недавно обсуждалось: /ru/forum/comment/2042665

adman, DrJeans, нет, это не просто формальная запись. И ошибки здесь никакой нету. Действительно, существует часовой пояс UTC+13, и даже (sic) UTC+14. Время дня там совпадает со временем на Гавайях, но сдвинуто на один день вперед.

Т.е., новый календарный день на Земле раньше всех наступает на острове Рождества, за 14 часов до Гринвича. Как это ни парадоксально -- но факт. Так уж было принято.

См., напр. http://ru.wikipedia.org/wiki/%D0%A7%D0%B0%D1%81%D0%BE%D0%B2%D0%BE%D0%B9_%D0%BF%D0%BE%D1%8F%D1%81

DrJeans, дык, из реестра Windows. Там так и прописано. А, вообще говоря, Нукуалофа -- это столица Королевства Тонга.

Yukko, вместо предложенных Вами эвристик, касающихся морфологии, я бы предложил (на выбор) три возможных алгоритма:

1) Построение на основе ispell полного русского словаря (всех словоформ), и поиск по нему всех нормальных словоформ. Объем словаря будет очень большим, т.к. нужно будет хранить все словоформы, полученные из ispell.

2) Поиск основной формы слова (также по ispell) на основе алгоритма, описанного здесь:

http://xpoint.ru/know-how/VebAlgoritmyi/RabotaSTekstami/RabotaSRusskoyMorfologieyPriPomoschiSlovaryaIspell

В базе потребуется хранить только исходный ispell-овский словарь.

3) Вовсе без словаря -- использовать стеммер Портера (это, насколько мне известно, единственный более-менее приемлемый стеммер для русского языка). Я, кстати предпочитаю именно этот вариант. Оригинальное описание здесь: http://snowball.tartarus.org/algorithms/russian/stemmer.html

У Котерова есть неплохая реализация: http://forum.dklab.ru/php/advises/HeuristicWithoutTheDictionaryExtractionOfARootFromRussianWord.html

Могу поделиться и своей, но у Дмитрия сделано проще и изящнее.

Каширин:
И ждать тридцать лет и три года перезеркаливания. Которое может никогда не состояться.

Директива Host носит рекомендательный характер.

Тем не менее -- мне в свое время в аналогичной ситуации это помогло. Прописал в robots.txt директиву Host -- и через ~2 недели все пришло в норму.

deedee, а кто "тырит": робот или админы ручками? Робота отследить и забанить ИМНО, не проблема. Да и админов по IP можно забанить, если он у них постоянный.

Однако, любое такого рода решение будет паллиативом. Хотя, может быть, и поможет...

bullet74:
После 24 числа статы нет, увы :(

А у меня с 23-го нет статистики... :(

Пишет, что "Данных, удовлетворяющих заданным условиям, не найдено".

Хотя клики за эти дни вреде бы как считаются... 😕

Запрос "яблоки и зубы" - 7 результатов (последнее поле пустое).

Запрос "яблоко и зубы" - 4 результата.

ИМХО, результаты должны были бы совпадать.

Всего: 325