За комплимент - спасибо :) К сожалению, правда, я не профессор :)
Насчет "2000" - это вы меня недооцениваете :) За 2000 я libmorphrus еще никому не продавал :)
Ну а то, что Рамблер использует, наряду с рядом других больший проектов, объективно лучший морфоанализатор из доступных на рынке - это факт.
Собственно, среди остального есть реально еще только один анализатор - это ОРФО, но там странная маркетинговая политика и очень низная производительность. Ну не делали его для таких нагрузок.
Все остальные "продукты" таковыми считать вреднодля здоровья :)
Ну вот о том и речь. Фактически, вашей командой была выполнена разработка - поисковая машина БигМир. Работали вы за зарплату, которую вам платили, и работали по служебному заданию.
Отсюда - в соответствии с Законом Украины - все авторские права на движок БигМира, будучи неотъемлемыми, принадлежат вашей команде. А все имущественные - компании БигМир, если иное не оговорено дополнительным соглашением.
А теперь ваша команда уходит и, воспользовавшись опытом, наработанным в БигМире за чужие деньги, "разрабатывает" новый движок.
Я готов даже поверить, что "все было переписано" - но от того, что класс CPageLoader переименовали в CPageDownloader, суть-то не меняется. Да, лох тут спасует, а грамотный адвокат, скорее всего, сможет доказать использование чужого ноу-хау.
Просто уж слишком сильно смахивает на оригинал!
Казалось бы, почти все поисковики поддерживают "заморозку формы". Для Рамблера и Меты, например, это двойные кавычки.
Не спорю. Однако разработка поиска - штука такая... Даже если ты прекрасно помнишь, что и как делать, и точно не пытаешься хотя бы исправить ряд архитектурных ошибок, то все равно от начала до запуска не может пройти 2 месяца. Но вот как говорят - "Не верю!".
И действительно не верю.
Да, возможно, испольняемые модули называются иначе. Но, к примеру, морфологические словники, если они там есть, за месяц-два просто не набиваются вручную по памяти :)
Эффект де жа вю - "словари на Рамблере" :)
Там, по крайней мере, сами словники были лицензированы законно у издательства "Русский язык", а web-оболочка написана заново. Морфологии Рамблер лицензировал у меня, и все равно это не было сделано за месяц.
Так что что-то тут нечисто. Попахивает "пертосскими" сырцами.
Т. е., может, и неплохая, но пока только "поделка". И еще возникает у меня вопрос как у разработчика. А как это возможно - за месяц или два сделать "с нуля" поисковый движок? :)
Я их разработал и запустил, как вы знаете, несколько, однако ни разу мне не аделось сделать это за такой рекордный срок!
Напрашивается вывод: либо это команда гениев, и тогда - держитесь все: google, yandex, rambler, meta, bigmir.net... Либо все же это, как бы сказать помягче, "калька" с некоторого другого движка?
P.S. Ничего личного.
А что, деньги есть? :)
А зачем на Яндекс "забивать"? :)
Посмотрел. Особенно впечатлил поиск с учетом синонимии.
Ребята, ну нельзя вкручивать в большой поисковик словарь синонимов Евгеньевой! Как, впрочем, а Александровой. Или можно, но нельзя давать пользователю возможность искать с ним :)
Нет, я совершенно не против того, чтобы использовать механизмы поиска с учетом синонимии! Но только это должна быть осмысленная синонимия, отнесенная к поставленной задаче!
А то получается, что при поиске слова "выпить" в выдаче на почетном месте документ с такой цитатой: "Ивченко: газа в подземных хранилищах хватит Украине на зиму "
Здесь выделено слово "хватит", потому как в словаре Евгеньевой есть такой синоним - "хватить" :)
А если уж и искать, то ранжировать в таком случае надо с цчектом близости к изначальному запросу.
Вообще же непонятно, для чего это было сделано.
Да бросьте :) Если посмотреть внимательно, то можно понять, что НИКАКОЙ лингвистики там нету, и программка тривиально выкидывает слова по стоп-словарю (примерно слов так на 100-200), и плохо склоняет/спрягает. Так, например, для глагола to eat она не знает формы eats.
Ни о каком естественноязыковом интерфейсе речи не идет. И скобки в логических вражениях надо расставлять, а то не совсем понятно, что получается.
Естественно, потому что ему нечего удалять из строки - пользователь и сам стоп-слов не вводит поисковику :)
М-да... Жаль, что не имеет. Простые морфологические расширители дают гораздо более полезные результаты.
Кстати, сваять такую штучку для более-менее подкованного студента - работа на неделю.
Как всегда, ничего личного. Мнение мое составлено по результатам собственного тестирования демонстрационной версии на сайте и не претендует на абсолютную истину.
Да это как раз неважно, хоть из Бангкокка :), оттуда тоже неплохо видно :)
Хотя я смотрю с двух сторон - из Москвы чаще, из Харькова - чуть реже. У меня, как у Горыныча, голов много, одна из них на Украине :)
Я прекрасно знаю, что бывает с технологическими проектами при уходе главного архитектора: они не умирают, но оказываются отброшены назад как минимум на полгода, а то и на больший срок. Конечно, Бигмиру не дадут умереть, просто инвесторы не дадут - денег-то вложено порядком, да и молочко коровка уже дает. Хотя... Вот Женя Нестеренко, к примеру, прекратил поддерживать и помешивать поиск на аванпорте (бывш. asearch) - тот и приказал долго жить. Правда, он из Аванпорта, насколько я помню, не уходил - просто занялся другими совсем задачами.
Так это нормально. Любой разработчик приличного уровня достаточно часто получает разные предложения, и как только предложение по совокупности условий перевешивает то, что он имеет "тут" - он поднимается "на крыло". Мы, разработчики - вообще очень продажные люди. Девочки с обочин рядом с нами - просто невинность :)