Серверный синонимайзер

1 2345 6
garem
На сайте с 08.06.2006
Offline
35
#31

Напоминаю, что тестировать синонимайзер можно как в бесплатной автоматической и полуавтоматической версии, они полностью соответствуют платной версии в которой присутствуют оба варианта. Старайтесь добавлять большие куски реальных статей, для более точного определения тематики.

СССР - Семантический Серверный Синонимайзер Рерайтер. (http://www.blogka.ru)
[Удален]
#32

garem, мдаа, пока пользы мало.

Кто автор http://blogka.ru/dictfree.php ?

garem
На сайте с 08.06.2006
Offline
35
#33
gasyoun:
garem, мдаа, пока пользы мало.
Кто автор http://blogka.ru/dictfree.php ?

Автор страницы я. Автор словарей - Тришин.

Пожалуйста точнее указывайте, что не нравиться и где, желательно с примерами.

garem
На сайте с 08.06.2006
Offline
35
#34

В рамках исследования возможности построения авто тезауруса русскоязычных поисковых запросов, родился частотный словарь по базе запросов Пастухова. Словарь специально не прореживался на стоп слова, во-первых потому, что они необходимы для следующих этапов, а во-вторых, что понятие о стопсловах у всех разные.

Скачать бесплатно словарь можно здесь, из бесплатного словаря удалены все слова на буквы О, П, Р, С, Т.

Купить комерческую версию версию с полными вхождениями слов можно здесь. Частотный словарь содержит 1.152.154 сырых словоформ.

Комерческая, и бесплатная версии частотных словарей выполнены в виде дампа таблицы MySQL.

[Удален]
#35
garem:


Для разрушения шингла применяются следующие методики:

* Подбор синонимов в тексте, в размере шингла.
* Переформатирование текста.
* Включение опечаток.
* Выборочная замена русских букв английскими (только теми, которые не ловятся Яндексом).
* Выборочная замена слов яваскриптом.
* Включение мусорных слов.
* Включение матерных слов.
* Включение Албанизации.
* Склейка слов.
* Дробление слов переносом строки.
* Включение ошибочной пунктуации.
* Включение кейвордов по теме.

+1 за работу

Если можно - немного поподробней о методиках.

garem
На сайте с 08.06.2006
Offline
35
#36

Увы - нельзя.

drima
На сайте с 17.07.2007
Offline
46
#37

бесплатная версия в качестве демки вызывает сомнения: очень уж нелепые варианты замены предлагаются :)

можно ли в платной версии подключать свои собственные тематические словари синонимов? и если да, то насколько легко и каким образом такие словари можно создать?

No future 4 me
garem
На сайте с 08.06.2006
Offline
35
#38

Подключить свою базу можно элементарно, но она должна содержать все поля, что и в исходной базе. Посмотреть поля можно здесь. Создать свой словарь тоже просто, надо подобрать все слова из своей тематики, просеять их на омонимы и стоп слова, составить ядро тематики, определить каждому слову из ядра его морфологическую принадлежость, и придумать им синонимы. Вроде все.

drima
На сайте с 17.07.2007
Offline
46
#39
garem:
Вроде все.

а потом что делать с полученной базой синонимов - импортировать в базу подготовленный вручную SQL-файл?

не очень понятно - можно ли определить тематику самому, подключив соответствующий словарь, а не доверяя скрипту автоматическое определение темы?

мат и албанский - это обязательно или можно вырубить?

сколько стоит исходник?

можно все же пару-тройку скриншотов веб-интерфейса?

garem
На сайте с 08.06.2006
Offline
35
#40

- да

- нет

- мата и албанского там давно нет

- в два раза дороже

- интерфейс такой же как у бесплатной версии тут.

1 2345 6

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий