А я вообще, честно говоря, не понял смысла оцифровки лексикона, тем более не разрешая коллизий. Но этот способ уже где-то видел, по-моему, у mnogosearch.
Неплохое решение уже предложил Игорь Ашманов. Берете вашу фразу:
"... в этом случае при тестовом поиске(6) не было найдено требуемых документов, но при изменении поискового(15) запроса(16) ..."
разбиваете по словам и сортируете с учетом позиций в документе:
...
запроса 16
поиске 6
поискового 15
Потом берете список всех возможных окончаний, убираете их, после чего бинарным поиском здесь уже можно найти основы слов из запроса и подсветить.
Mikek:
Keva:
Ваш полнофункциональный морфологический анализатор позволяет рассматривать слова "поиск" и "поиско'вый" как формы одного и того же слова? Или анализатор содержит связи между разными частями речи, чего я в поиске Рамблера не замечал?
То есть правила "игры" остались те же? Или же все-таки удалось о чем-то договориться?
Да, я уже думал об этом, тем более что большая часть системы статистикиTopPing сделана мной. Можно было бы при случае тряхнуть стариной :)
Может, и наоборот. Но делиться идеями почему-то ни у кого особого желания нет :)
Это мысль! В принципе, можно совместить даже со статистиками вроде Рамблера и Хотлога и автоматом забирать у них из отчетов поисковые фразы для конкретного сайта и подключить по ним анализатор. Реализовать технически подобную вещь не так уж сложно и вовсе не обязательно для этого ставить сервис себе на сайт.
Ну так здесь ведь речь и идет о том, чтобы для анализатора выработать такие спецификации, которые бы удовлетворяли всех. Вот только отсутствие предложений показывает, что никто пока особо не представляет, что ему нужно и зачем.
Скорее всего, версия насчет прокси самая правдоподобная. Я сам до недавнего времени спокойно обходил лицензии Яндекса с помощью ROL'овского прокси и полагал, что ничего поделать они не могут, иначе имелась хорошая возможность оставить без Яндекса пол-Москвы :)
Видимо, с помощью этой своей новой "штучки" как-то выкрутились. Придется изобретать что-нибудь новенькое :)
В принципе, если есть интерес, можно на основе анализатора снова открыть сервис, но для этого все же придется договариваться с тем же Яндексом и оплачивать запросы. То есть, как говорит Professor, работать законно :)
Но я думаю, что если сделать плату не слишком большой, скажем, $10-15 в месяц, при хорошем качестве сервиса его использование может быть оправданно.
Это как один из вариантов.
Да, серьезное нарушение лицензии Яндекса, которую он же сам себе и придумал. Яндекс был и остается компанией, которая в любой ситуации предпочитает лишь грубую силу, другие аргументы им, судя по всему, неизвестны и попытки с ними договориться (не только мои) обычно ни к чему не приводят. Сами они, как вы все неоднократно убеждались, используют тройные стандарты и делают, что хотят, поэтому бороться с ними можно только их же методами.
А где здесь определяется грань между законным и незаконным?
Даже если это будет коробочная версия программного продукта, работающего под окошками, еще нужно доказать, что он нарушает лицензию Яндекса. Анализатор эмулирует работу броузера так, что для Яндекса это будет выглядеть как заход обычного пользователя, то есть если условия лицензии нарушает анализатор, то нарушает ее и любой другой броузер. И попробуйте доказать, что это не так.
P.S. Professor, с чего бы это ты защищаешь Яндекс? :) Боишься конкуренции?