Keva

Рейтинг
80
Регистрация
27.11.2000
Интересы
Software development, linguistics, BMW, dogs, girls ;-)
AlienZzzz:
Слышал я что морфологию рамблеру продал какой то профессор за 2000 баксов(хотя может и байка)

За комплимент - спасибо :) К сожалению, правда, я не профессор :)

Насчет "2000" - это вы меня недооцениваете :) За 2000 я libmorphrus еще никому не продавал :)

Ну а то, что Рамблер использует, наряду с рядом других больший проектов, объективно лучший морфоанализатор из доступных на рынке - это факт.

Собственно, среди остального есть реально еще только один анализатор - это ОРФО, но там странная маркетинговая политика и очень низная производительность. Ну не делали его для таких нагрузок.

Все остальные "продукты" таковыми считать вреднодля здоровья :)

Alex Tanchik:
...
разрабатывать с нуля архитектуру нам не надо было. На нее копирайтов нет и как авторы можем ее повторять.

Ну вот о том и речь. Фактически, вашей командой была выполнена разработка - поисковая машина БигМир. Работали вы за зарплату, которую вам платили, и работали по служебному заданию.

Отсюда - в соответствии с Законом Украины - все авторские права на движок БигМира, будучи неотъемлемыми, принадлежат вашей команде. А все имущественные - компании БигМир, если иное не оговорено дополнительным соглашением.

А теперь ваша команда уходит и, воспользовавшись опытом, наработанным в БигМире за чужие деньги, "разрабатывает" новый движок.

Я готов даже поверить, что "все было переписано" - но от того, что класс CPageLoader переименовали в CPageDownloader, суть-то не меняется. Да, лох тут спасует, а грамотный адвокат, скорее всего, сможет доказать использование чужого ноу-хау.

Просто уж слишком сильно смахивает на оригинал!

Tritel:
Сделайте, плз, для меня поиск без морфологии :)
Как раньше хорошо было!!!

Здесь есть разработчики поисковиков, потому и прошу (крик души). !!!Сделайте, плз, чекбокс "Без морфологии"!!!

Казалось бы, почти все поисковики поддерживают "заморозку формы". Для Рамблера и Меты, например, это двойные кавычки.

Alex Tanchik:
Я уже отвечал выше, что если вы делали что-то, то повторить это не сложно, при этом повторить так, чтобы это не была копия.

Не спорю. Однако разработка поиска - штука такая... Даже если ты прекрасно помнишь, что и как делать, и точно не пытаешься хотя бы исправить ряд архитектурных ошибок, то все равно от начала до запуска не может пройти 2 месяца. Но вот как говорят - "Не верю!".

И действительно не верю.

Да, возможно, испольняемые модули называются иначе. Но, к примеру, морфологические словники, если они там есть, за месяц-два просто не набиваются вручную по памяти :)

Эффект де жа вю - "словари на Рамблере" :)

Там, по крайней мере, сами словники были лицензированы законно у издательства "Русский язык", а web-оболочка написана заново. Морфологии Рамблер лицензировал у меня, и все равно это не было сделано за месяц.

Так что что-то тут нечисто. Попахивает "пертосскими" сырцами.

Alex Tanchik:
http://www.i.ua/ - выкатили поиск, тестируйте, если есть глюки, а они в первой волне наверняка найдутся, то оставляйте тут, будем править
...

Т. е., может, и неплохая, но пока только "поделка". И еще возникает у меня вопрос как у разработчика. А как это возможно - за месяц или два сделать "с нуля" поисковый движок? :)

Я их разработал и запустил, как вы знаете, несколько, однако ни разу мне не аделось сделать это за такой рекордный срок!

Напрашивается вывод: либо это команда гениев, и тогда - держитесь все: google, yandex, rambler, meta, bigmir.net... Либо все же это, как бы сказать помягче, "калька" с некоторого другого движка?

P.S. Ничего личного.

FutureArt:
На чем остановились:
Ктонибудь желает поучавствовать в разработке нового поисковика ?

А что, деньги есть? :)

Astaldo:
.... и забейте теперь на Яндекс...

А зачем на Яндекс "забивать"? :)

Посмотрел. Особенно впечатлил поиск с учетом синонимии.

Ребята, ну нельзя вкручивать в большой поисковик словарь синонимов Евгеньевой! Как, впрочем, а Александровой. Или можно, но нельзя давать пользователю возможность искать с ним :)

Нет, я совершенно не против того, чтобы использовать механизмы поиска с учетом синонимии! Но только это должна быть осмысленная синонимия, отнесенная к поставленной задаче!

А то получается, что при поиске слова "выпить" в выдаче на почетном месте документ с такой цитатой: "Ивченко: газа в подземных хранилищах хватит Украине на зиму "

Здесь выделено слово "хватит", потому как в словаре Евгеньевой есть такой синоним - "хватить" :)

А если уж и искать, то ранжировать в таком случае надо с цчектом близости к изначальному запросу.

Вообще же непонятно, для чего это было сделано.

Yuri_K:
анализируется и в зависимости от типа вопроса представляется в булевском виде таким образом, чтобы в результатах поиска с максимальной вероятностью оказался ОТВЕТ НА ВОПРОС, а не сочетание введенных слов.

Да бросьте :) Если посмотреть внимательно, то можно понять, что НИКАКОЙ лингвистики там нету, и программка тривиально выкидывает слова по стоп-словарю (примерно слов так на 100-200), и плохо склоняет/спрягает. Так, например, для глагола to eat она не знает формы eats.

Ни о каком естественноязыковом интерфейсе речи не идет. И скобки в логических вражениях надо расставлять, а то не совсем понятно, что получается.

Yuri_K:

По результатам тестирования NLI (Natural Language Interface) показывает лучшие результаты, когда пользователь вводит в поисковую строку корректно сформулированный вопрос. В остальных случаях (когда вводятся просто поисковые слова) NLI не эффективен.

Естественно, потому что ему нечего удалять из строки - пользователь и сам стоп-слов не вводит поисковику :)

Yuri_K:
NLI не имеет ничего общего с марфологоическими расширителями запросов. NLI построен на основе Intellexer(TM) Question-answering System (http://www.intellexer.com/sol_qasys.html)

М-да... Жаль, что не имеет. Простые морфологические расширители дают гораздо более полезные результаты.

Кстати, сваять такую штучку для более-менее подкованного студента - работа на неделю.

Как всегда, ничего личного. Мнение мое составлено по результатам собственного тестирования демонстрационной версии на сайте и не претендует на абсолютную истину.

Yukko:
Keva, я понимаю, что из Москвы виднее ;)

Да это как раз неважно, хоть из Бангкокка :), оттуда тоже неплохо видно :)

Хотя я смотрю с двух сторон - из Москвы чаще, из Харькова - чуть реже. У меня, как у Горыныча, голов много, одна из них на Украине :)

Yukko:
Если Вы думаете, что на Танчике весь свет клином сошелся, то Вы глубоко ошибаетесь. Танчик тоже был в таком возрасте, когда у него не было строчки в резюме: сделал портал Бигмир.нет успешным.

Я прекрасно знаю, что бывает с технологическими проектами при уходе главного архитектора: они не умирают, но оказываются отброшены назад как минимум на полгода, а то и на больший срок. Конечно, Бигмиру не дадут умереть, просто инвесторы не дадут - денег-то вложено порядком, да и молочко коровка уже дает. Хотя... Вот Женя Нестеренко, к примеру, прекратил поддерживать и помешивать поиск на аванпорте (бывш. asearch) - тот и приказал долго жить. Правда, он из Аванпорта, насколько я помню, не уходил - просто занялся другими совсем задачами.

Yukko:
Возьмите в руки Корреспондент (журнал такой от KPP)
, почитайте список тех, кто работал над выпуском журнала, условно поделите на половинки. 50% человек, фамилии которых вы прочитаете в этом списке, разговаривают про трудоустройство в других компаниях не реже, чем раз в два месяца.

Так это нормально. Любой разработчик приличного уровня достаточно часто получает разные предложения, и как только предложение по совокупности условий перевешивает то, что он имеет "тут" - он поднимается "на крыло". Мы, разработчики - вообще очень продажные люди. Девочки с обочин рядом с нами - просто невинность :)

Всего: 238