Библиотечка phpmorphy

S
На сайте с 13.07.2007
Offline
56
7200

Кто работал с даной библиотечкой (phpmorphy)?

Вопрос: как вытащить словоформы и соотнести их с падежами (то есть надо к слову приписать морфологию). Интересует русская морфология.

Zhilinsky
На сайте с 05.08.2007
Offline
86
#1

http://notes.rudomilov.ru/2007/08/16/poisk-s-russkoy-morfologiey-sredstvami-php/

Оно ? Интересная, кстати, разработка. У яндекса тоже есть бесплатный морфологический скрипт.

Жилинский (http://жилинский.рф/).
S
На сайте с 13.07.2007
Offline
56
#2

Да, вот этот проект.

Но один косяк: $all_forms = $morphy->getAllForms($bulk_words); выводит лажу какую-то


Array
(
[0] => Array
(
[all] => Array
(
[0] => га
[1] => гбгжгй
[2] => гвге
[3] => гг
[4] => гд
[5] => гд
[6] => гз
[7] => ги
[8] => гк
[9] => гл
)

[common] => Фа
[forms] => Array
(
[0] => ЗАДАЧКА
[1] => ЗАДАЧКИ
[2] => ЗАДАЧКЕ
[3] => ЗАДАЧКУ
[4] => ЗАДАЧКОЙ
[5] => ЗАДАЧКОЮ
[6] => ЗАДАЧЕК
[7] => ЗАДАЧКАМ
[8] => ЗАДАЧКАМИ
[9] => ЗАДАЧКАХ
)

)

)

М
На сайте с 08.02.2006
Offline
59
#3


$result = $morphy->morph(strtoupper("Задачка"));
$forms = $result->getAllForms();

Оно?

S
На сайте с 13.07.2007
Offline
56
#4
Магнат:

$result = $morphy->morph(strtoupper("Задачка"));
$forms = $result->getAllForms();


Оно?

Что "оно"? Результат вашего примера моим постом выше. Он выдает сами формы, но ЧТО это за форма (ед./мн. число, какой род, какой падеж) не выдает :(

Покопавшись в самой библиотечке понял, что все это берется из базы. Но вот только база у них похоже в своем формате :(

MM
На сайте с 02.12.2003
Offline
49
m&m
#5
solnikolay:
Кто работал с даной библиотечкой (phpmorphy)?
Вопрос: как вытащить словоформы и соотнести их с падежами (то есть надо к слову приписать морфологию). Интересует русская морфология.

По-моему, так никак. Когда мне в свое время понадобилось - помыкался, да свое дописал. Благо мне нужно было всего-то с причастиями работать, оказалось не так сложно.

Вообще, насколько я помню, это порт на php библиотеки с aot.ru, а там есть программа для редактирования словарей. Попробуйте, вдруг что найдете.

m&m добавил 06.03.2008 в 00:08

И еще. Яндексовский mystem определяет падеж, род и число слова (пытается, точнее). Так что если нужно решить эту проблему - то воспользуйтесь им.

А вот если нужно из слова получить определенную форму - то я бы и сам хотел что-нибудь такое :) Если вдруг найдете - сообщите пожалуйста.

Коля Дубр
На сайте с 02.03.2005
Offline
153
#6

solnikolay, если я верно понял, то так:

1. При загрузке нужно выставить опцию 'with_gramtab' => true

2. Дальше дергаем getAllFormsWithGramInfo(), получаем что-то вроде:


Array
(
[0] => Array
(
[all] => Array
(
[0] => С жр,ед,им
[1] => С жр,ед,рд;С жр,мн,им;С жр,мн,вн
[2] => С жр,ед,дт;С жр,ед,пр
[3] => С жр,ед,вн
[4] => С жр,ед,тв
[5] => С жр,ед,тв
[6] => С жр,мн,рд
[7] => С жр,мн,дт
[8] => С жр,мн,тв
[9] => С жр,мн,пр
)

[common] => но
[forms] => Array
(
[0] => ЗАДАЧКА
[1] => ЗАДАЧКИ
[2] => ЗАДАЧКЕ
[3] => ЗАДАЧКУ
[4] => ЗАДАЧКОЙ
[5] => ЗАДАЧКОЮ
[6] => ЗАДАЧЕК
[7] => ЗАДАЧКАМ
[8] => ЗАДАЧКАМИ
[9] => ЗАДАЧКАХ
)

)

)

С этим уже можно что-то делать :) Наверно, есть какие-то более приспособленные методы, этот getAllFormsWithGramInfo() я нашел прямо в файле example.php :)

Разрабатываю общую шину (http://habrahabr.ru/company/floxim/blog/268467/) помаленьку. ...а еще у меня есть бложек (http://www.blogovo.ru/).
A
На сайте с 09.08.2004
Offline
82
#7

solnikolay: в массиве га, гб и так далее - это последовательно все формы слова, выбранные из базы, как они там хранятся, и учитывая одинаковые формы. Грамматическая информация дополнительно появляется, если указать 'with_gramtab' => true, как и писал Коля Дубр.

Допустим для существительных это слово во всех падежах и числах, начиная с именительного, ед.число(га) ... предложный, ед.число (ге), ... предложный, мн.число(гл) - всего получается 13, а не двенадцать, поскольку в творительном падеже ед.числа допустимы две формы - ЗАДАЧКОЙ и ЗАДАЧКОЮ.

Вопрос ко всем использующим данную библиотеку: никто не пробовал ковырять/расширять прилагаемые словари, либо конвертировать АОТовские в формат phpmorphy?

[Удален]
#8
Zhilinsky:
У яндекса тоже есть бесплатный морфологический скрипт.

Любопытно! Где его можно посмотреть?

Kolyaj
На сайте с 28.03.2006
Offline
69
#9
Serge_N:
Любопытно! Где его можно посмотреть?

http://company.yandex.ru/technology/products/mystem/mystem.xml

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий