Прога от Яндекса Mystem

123
maxivanov
На сайте с 25.07.2006
Offline
58
#11

Karl_ung, это я понял, я хотел узнать чем пользуется Hkey, он написал что Mystem не осилил и пользуется тримером. понятно что ошибка, наверное имел ввиду другой стеммер, интересно какой.

Главное не в том что ты делаешь, а в том как ты это делаешь!
Hkey
На сайте с 30.09.2006
Offline
222
#12

Если честно, то я вполне мог ошибиться и перепутать стеммер и тример.

Для сайтов я использую простую схему: Если в БД нет информации по слову, то я удаляю окончание, используя список окончаний. Пусть длина слова N, длина обрезания n. Из базы окончаний нахожу окончание с максимальной длиной, но так чтобы длина "корня" была большей либо равной трем (N-n>=3). Для поиска по сайту достаточно, для подсветки орфографии или синомайзинга - нет.

Для ПК (синомайзинга) использую самописную морфологию.

HTraffic.ru (http://HTraffic.ru/) - удобная система для управления контекстной рекламой. тема на форуме (/ru/forum/810827) HTracer (http://htracer.ru/) - скрипт для автопродвижения сайтов по НЧ и СЧ запросам. Для больших сайтов от 100 страниц. (тема на форуме (/ru/forum/676867))
[Удален]
#13

пельсиска))))))))))))))))))))

P.S. я всё днюху продолжаю..........................................................................................................................

A1
На сайте с 31.03.2008
Offline
33
#14

Фиг не работает... Пробовал прописывать команды, как вы советуете....

Может каких-то библиотек в винде не хватает? (у меня виндус сборка - зверь), может быть в этом проблема, но на виртуалке пробовал тоже нифига не выдает... я даже не заню что еще можно придумать, чтобы прога заработала.... (((

Apollon1 добавил 28.09.2009 в 15:01

LeonCrab, почему это с него сейчас толку нет?

Кстати, если библиотек не хватает, то как можно это узнать?

Apollon1 добавил 28.09.2009 в 15:04

maxivanov, все в точности записал, но эффекта ноль! :( С .exe и без оного...

Apollon1 добавил 28.09.2009 в 15:05

Все файлы как я понимаю должны лежать в одной папке?

Apollon1 добавил 28.09.2009 в 22:01

За сегодня попробовал поставить на 3-х разных виндусах ХП (на виртуалке) - ничего не пашет... :(

Попробовал еще на мандриве запустить - там работает как-то коряво - нельзя прописывать какие-либо установки - майстим тупо обрабатывает все, что вводишь в консоль и все!!!

Что же за проблема с виндой?

A1
На сайте с 31.03.2008
Offline
33
#15

Х.М. в винде программа прореагировала на такую команду:

"echo кошка, которая гуляет сама по себе | C:\mystem.exe"

соответственно вызов был осуществлен из командной строки, вот что вывелось: и{и}в{в}а{а}п{п??}г{г}п{п??}в{в}б{б}б{б}

Хоть что-то но че за фигня такая??? где слова???

Может кто-то знает как правильно оформить команду через командную стоку к этой проге?

Apollon1 добавил 30.09.2009 в 16:19

maxivanov, ну я и чайник!!!

Твой вариант сработал!

R
На сайте с 30.09.2009
Offline
1
#16

Получается работает нормально только у одного человека что то тут не то

Знаменитости (http://znamenitosti.ucoz.com) Новости (http://rudecom.ucoz.com)
kandyshop
На сайте с 01.10.2009
Offline
4
#17

что-то с требованием к операционке может быть?

Одобри (http://odobri.ru/): для блогов и форумов, cy10. От 10 голосов - на главную, до 4000 знаков; html-тэги, ссылки, картинки, "навсегда"; без: бирж, noindex, nofollow. Только ваши исходящие. Коммерц.-1wmz (перс.серт.)
R
На сайте с 29.02.2008
Offline
16
rgu
#18

Как пример:

1. Ложим рядом с mystem.exe файл sapgir.txt

у меня такого содержания

Че делал:
1) запускаю
2)Создаю заранее файл: "sapgir.txt" с содержанием:
В мурелки шлепают пельсиски.
В стакелках светится мычай.
3) Печатаю, как написано в факе: "$ mystem sapgir.txt"
4) Enter
5) Ничего не происходи - курсор просто переходит на следующую пустую строку и ничего не выводит, в файле тоже без изменений!
Что не так делаю???
Заранее премного благодарен за помощь!

2. С командной строки запускаем mystem.exe с параметрами mystem.exe -pi sapgir.txt output.txt

3. результат смотрим в output.txt

Че{Че??}делал{делать=V,несов=прош,ед,изъяв,муж}запускаю{запускать=V=непрош,ед,изъяв,1-л,несов}Создаю{Создавать=V=непрош,ед,изъяв,1-л,несов}заранее{заранее=ADV=}файл{файл=S,муж,неод=им,ед|файл=S,муж,неод=вин,ед}sapgir{sapgir?}txt{txt??}с{с=PR=}содержанием{содержание=S,сред,неод=твор,ед}В{в=PR=}мурелки{мурелка?=S,жен,од=им,мн|мурелка?=S,жен,од=род,ед|мурелка?=S,жен,неод=им,мн|мурелка?=S,жен,неод=род,ед|мурелка?=S,жен,неод=вин,мн|мурелки?=S,мн,жен,неод=им|мурелки?=S,мн,жен,неод=вин|мурелок?=S,муж,од=им,мн}шлепают{шлепать=V,несов=непрош,мн,изъяв,3-л}пельсиски{пельсиска?=S,жен,неод=им,мн|пельсиска?=S,жен,неод=род,ед|пельсиска?=S,жен,неод=вин,мн}В{в=PR=}стакелках{стакелка?=S,жен,неод=пр,мн|стакелка?=S,жен,од=пр,мн|стакелок?=S,муж,неод=пр,мн|стакелок?=S,муж,од=пр,мн|стакелки?=S,мн,жен,неод=пр|стакелки?=S,мн,муж,неод=пр|стакелок?=S,муж,неод=пр,мн|стакелка?=S,од=пр,мн,жен|стакелка?=S,од=пр,мн,муж|стакелка?=S,обсц,жен,неод=пр,мн|стакелк?=S,муж,неод=пр,мн|стакелк?=S,муж,неод=пр,мн}светится{светиться=V,несов=непрош,ед,изъяв,3-л}мычай{мычай?=S,муж,неод=им,ед|мычай?=S,муж,неод=вин,ед}Печатаю{Печатать=V,несов=непрош,ед,изъяв,1-л}как{как=PART=|как=ADVPRO=|как=CONJ=}написано{написать=V,сов=прош,ед,прич,кр,сред,страд}в{в=PR=}факе{фак?=S,муж,неод=пр,ед}mystem{mystem?}sapgir{sapgir?}txt{txt??}Enter{Enter}Ничего{Ничего=ADV,прдк=}не{не=PART=}происходи{происходить=V=ед,пов,2-л,несов}курсор{курсор=S,муж,неод=им,ед|курсор=S,муж,неод=вин,ед}просто{простой=A=ед,кр,сред|просто=ADV=|просто=PART=}переходит{переходить=V=непрош,ед,изъяв,3-л,несов|перехаживать=V=непрош,ед,изъяв,3-л,сов}на{на=PR=|на=PART=}следующую{следовать=V,несов=непрош,вин,ед,прич,жен|следующий=A=вин,ед,жен}пустую{пустовать=V,несов=непрош,ед,изъяв,1-л|пустой=A=вин,ед,жен}строку{строка=S,жен,неод=вин,ед}и{и=INTJ=|и=PART=|и=CONJ=}ничего{ничего=ADV,прдк=}не{не=PART=}выводит{вываживать=V=непрош,ед,изъяв,3-л,сов|выводить=V=непрош,ед,изъяв,3-л,несов}в{в=PR=}файле{файл=S,муж,неод=пр,ед}тоже{тоже=ADV=|тоже=PART=|тоже=CONJ=}без{без=PR=}изменений{изменение=S,сред,неод=род,мн}Что{Что=ADVPRO=|Что=CONJ=|Что=SPRO,ед,муж,неод=им|Что=SPRO,ед,муж,неод=вин}не{не=PART=}так{так=PART=|так=ADVPRO=|так=CONJ=}делаю{делать=V,несов=непрош,ед,изъяв,1-л}Заранее{Заранее=ADV=}премного{премного=ADV=}благодарен{благодарить=V,несов=прош,ед,прич,кр,муж,страд|благодарный=A=ед,кр,муж}за{за=PR=}помощь{помощь=S,жен,неод=им,ед|помощь=S,жен,неод=вин,ед}

4. параметры mystem.exe -pi sapgir.txt output.txt меняем на свое усмотрение(от них зависит что в итоге Вы хотите получить, все описано в хелпе)

пс. надеюсь кому-то поможет.

ппс. кстати sapgir.txt у меня в кодировке windows-1251

Пассивный заработок (http://artriva.ru/article/informaciya-o-fotobankax.html) на фотографиях. Статистика (http://artriva.ru/tools/li/) liveinternet.ru для любого сайта
A1
На сайте с 31.03.2008
Offline
33
#19

Кстати говоря... кто знает откуда такая скорость и точность этого парсера? у меня текст на 4Мб обработался за 3-и секунды!!!

KU
На сайте с 09.07.2009
Offline
61
#20
Apollon1:
Кстати говоря... кто знает откуда такая скорость и точность этого парсера? у меня текст на 4Мб обработался за 3-и секунды!!!

Хороший код конечно же🚬 и ни какой магии.

123

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий