Собирателям и владельцам баз синонимов – скрипт SynAuditor

1 2345 6
Удивительно
На сайте с 07.07.2009
Offline
215
#31
sergej79:
Спасибо, upload_max_filesize помог, запускал на денвере, там вообще в дефолте 2MB стоит.
Апдейты приходят на мэил?

Приходят в том случае, если Вы на них запишетесь.

Качественная семантика недорого ( https://moab.tools/ )
Удивительно
На сайте с 07.07.2009
Offline
215
#32

Вышло обновление SynAuditor'a.

Добавлено:

  • конвертация баз синонимов из формата слово|синоним1,синоним2... в формат слово|синоним
  • возможность удаления словоформ - останутся только базовые формы (удобно для последующего ручного просмотра и правки баз синонимов)
  • удаление строк, в которых содержатся слова и синонимы, состоящие более чем из одного слова (может, кому пригодится ;))
  • добавлена инструкция по использованию скрипта
  • обновлена версия phpMorphy

Цена остается прежней - 24$. Покупка в автоматическом режиме.

Обновления разосланы записавшимся покупателям.

vtomas
На сайте с 19.03.2007
Offline
102
#33

Конвертер слово|синоним не работает!!!

Строку:

абракадабра,фигура,муть,бред,ерунда,тарабарщина,чушь,чепуха,абсурд,нонсенс,заумь,галиматья,бессмыслица,нелепость,околесица

Преобразовал в:

абракадабра|фигура

Действовал следующим образом: загрузил базу и выбрал "конвертировать" затем скачать результат.

На одной из баз при конвертировании вылетела ошибка. Грустно :(

P.S. И еще один нюанс:

При выполнении действий:

1. Простое удаление дублей

2. Удалить несовпадения словоформ

3. Добавить морфологию

4. Скачать результат

В базе появляются дубли и приходится 5-м действием снова делать "Простое удаление дублей"

jpg 15.10.jpg
Хорошее стоит дорого, на плохое не стоит и тратиться. В поисках VPS захостился здесь (http://ipserver.su), а бэкапы храню здесь (http://billing.markovservers.com/backup/pl.php?65).
Удивительно
На сайте с 07.07.2009
Offline
215
#34
vtomas:
Конвертер слово|синоним не работает!!!

Обратите внимание, что конвертер сработает только в том случае, когда между словом и набором синонимов и между синонимами в наборе стоят разные разделители. То есть слово,синоним1,синоним2,синоним3... (как в Вашем случае) не обработается, а обработается слово#синоним1,синоним2,синоним3.... Скрипт не универсален и Вы должны позаботиться о соответствии базы входному формату скрипта.

По поводу нюанса - в инструкции, в разделе Добавить морфологию как раз и указано, что (цитирую): "После обработки рекомендуется удалить дубли простым удалением, т.к. функция не проверяет дубли в процессе работы."

В будущем подобные вопросы просьба решать через техподдержку. Спасибо.

P.S. Нашел красивое решение первой проблемы.

Я пользуюсь текстовым редактором EmEditor (подозреваю, что и в других подобных сработает)

1. Открываете базу.

2. Нажимаете Ctrl-H (замена), выделяете флажок Регулярные выражения

3. В поле Найти пишете ^(.*?),

4. В поле Заменить на пишете \1=

5. Заменить все, Сохранить

После этого в качестве первого разделителя при обработке используйте знак =, второго - запятую, третьего - любой, с которым хотите сохранить базу.

vtomas
На сайте с 19.03.2007
Offline
102
#35

C разделителями слово::синоним1**синоним2 тож не работает, в поддержку отправил запрос.

Работает только в слово#синоним1,синоним2

А нельзя ль еще функционал подбавить?

Удивительно
На сайте с 07.07.2009
Offline
215
#36
vtomas:
C разделителями слово::синоним1**синоним2 тож не работает, в поддержку отправил запрос.
Работает только в слово#синоним1,синоним2
А нельзя ль еще функционал подбавить?

Ответил. Теоретически можно, в ближайшем апдейте сделаем. Не думал, что такие базы заковыристые бывают, поэтому не протестил до конца :)

А пока что отвечу для всех:

В любом текстовом редакторе замените первый разделитель на |, а второй и последующие на ,

И всё заработает

vtomas
На сайте с 19.03.2007
Offline
102
#37

Я считаю что универсальность должна быть полной, если при добавлении базы пользователь указывает разделители на морде скрипта, то и на второй вкладке (манипуляции с базой) эти настройки (разделители) должны иметь силу при любой операции с базой. Жду обновления. :)

S7
На сайте с 13.10.2009
Offline
0
#38

Отлично, скрипт растет, неможет не радовать.

Одно предложение - строки которые должны удалится, можно записывать в отдельный текстовой файл? Тогда можно проанализировать что удаляется, а то скрипт прошел по базе, и сиди гадай что удалилось.

vtomas
На сайте с 19.03.2007
Offline
102
#39

Аппдейт приближается или заморожен?

O
На сайте с 06.11.2008
Offline
23
#40

vtomas, цитата с сайта программы:

Ведущий программист и администратор сайта AmazingSoftware.ru Артем (Удивительно) с 19.10.2009 ложится в больницу на плановую операцию и будет отсутствовать 2 недели. Продажи в интернет-магазине продолжаются, техподдержка на 2 недели приостанавливается.

Благодарим за понимание!
1 2345 6

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий