Если честно, то я вполне мог ошибиться и перепутать стеммер и тример.
Для сайтов я использую простую схему: Если в БД нет информации по слову, то я удаляю окончание, используя список окончаний. Пусть длина слова N, длина обрезания n. Из базы окончаний нахожу окончание с максимальной длиной, но так чтобы длина "корня" была большей либо равной трем (N-n>=3). Для поиска по сайту достаточно, для подсветки орфографии или синомайзинга - нет.
Для ПК (синомайзинга) использую самописную морфологию.
Давайте кого-то пригласим, чтобы он оценил эргономику приложений. На форуме есть люди, которые оценивают юзабилити, для них будет рекламка. Вы согласны?
Насчет того, что у вас можно щелкнуть по селекту и он выпадет. Значит текст в нем нельзя редактировать? Как мы пару сообщений выяснили назад, у вас большая проблема со словоформами. Т.е. нужно сначала убрать все ошибки синомайзинга по слову, потом врубить ручное редактирование, затем попытаться отыскать замены, которые он сделал и исправить все окончания. Сколько на это нужно времени? Текст у вас нужно перечитывать дважды. Первый раз читая его с селектами второй раз читая его очень внимательно. Это только для исправления. Это по 50-70 секунд на перечитку минимум. Во время первой перечитки пользователь должен исправить 6-9 ошибочных слов, кликнув на селекте, прочитав, что написано в выпадающем меню, кликнув по нужному элементу. Это по 3-5 секунд. Потом пользователь включает ручное редактирование и перечитывает текст еще раз и вручную исправляет 15 - 20 окончаний, это 4-7 секунд на каждое.
Итого по минимуму 100 + 18 +60 = 3 минуты
По максимуму 140+45+140 = 5 минут
В моем синомайзере на это нужно: 1-3 секунды, что бы щелкнуть на руку, секунд 20-30 чтобы пересмотреть исправления текста, и по одной секунде на три щелчка, выбрав ошибку. Потом 1-3 секунды, чтобы перейти на следующий этап.
Полминуты - Минута.
Скачайте последнюю версию, там ее нет.
Сравните качество текстов. Сравните эргономику.
Имущественное авторское право сохраняется за автором и его наследниками на протяжении 70 лет после его смерти. Так, что скан, например, Бабеля (которого расстреляли в 38) не нарушает не чьи права, если при публикации указано имя Автора.
На скрине моей программы. Вы находитесь на втором этапе (сравнения двух текстов), ручная работа по уникализации происходит на третьем этапе. На этом этапе отмена замен происходит в один клик. Переход на следующий этап - тоже один клик.
У вас, чтобы отменить одну замену, нужно кликнуть мышью по кнопке справа Селекта (в нее нужно еще попасть), потом прочитать, что написано в выпадающем меню, потом навести мышь на выпадающий элемент, потом кликнуть. У меня нужно выбрать руку и щелкнуть по неудачным заменам либо выделить диапазон текста и все замены там прибьются.
Текст напичканный селектами, крайне неудобно читать, чтобы посмотреть какой текст был до этого, нужно совершать дополнительные действия. У меня, нужно просто чуть посмотреть влево.
У меня ручное добавление синонимов происходит на следующем этапе. В правом меню.
P.S. поиграйтесь с со стилем границ Select, что бы он не мешал читать текст. Он не должен быть так заметен.
Аналогично... Еще он какой-то не особо быстрый, как мне показалось...
Если для сайта нужно, то пару тысяч слов самых популярных слов лучше в базу загнать, а для остальных пользоваться тримером (Sape например тримером пользуется).
Обработал... На последнем публике, только с демобазой (без базы полной версии). Любой желающий может проверить, скачав дему синомайзера.
Как ни странно отличие от исходного текста такае-же как и вас и равна 68% (длина шингла 5, самый жесткач)
Настройка - самое худшее качество. Без ручных правок.
Явных глюков 3:
английский -> британский
"очень не очень"
решение -> ответ
На настройках флага "- -А" (среднячок)
в тексте только одна ошибка "очень не очень"
при 50 % сходстве (длина шингла 5, самый жесткач)
---------------------
В тексте Offlajn
от себя прибавлю (Серьезная стилистическая ошибка, более того "прибавлю" и "добавлю" это один глагол с разными приставками)
до выходы (Синомайзер мало того, что ваш не решает омонемию, так у него еще нету защиты от перехода омонемии в строковую неоднозначность)
теснее употреблял модулем
обидную черта
Дельце в книга (Дело->Дельце - стилистическая ошибка, в 90% случаев)
отправное информация Умеет ли ваш синомайзер склонять
по крайней границе базы фразеологизмов у вас нет, сомневаюсь об механизме исключений
тратить со советского на лондонский
снова вполне
находилось б мириться
ежели б труба ежели-архаизм
ак бы то ни было
взяли речи на российском
находилось б удивлен обидно
на тему тот, что стая я угадал
снова на этапа опции трубы.
назначить гораздо модуль
систематических речений
....
И так далее....
---------------------------
P.S. Выделяйте жирным. Замены.
1. Внутренние ссылки тоже в ноиндекс попадут.
2. Ноиндекс некашерный таг по валидатору - гуглу это может не понравиться, и сложнее отлаживать.
просто пишите $post->ID обычно здесь и будет ID поста... Зависит самого файла синг.пхп, если в не есть строка
php if (have_posts()) : while (have_posts()) : the_post();
или просто
the_post();
Значит $post->ID - это номер вашего поста.
Напишите echo $post->ID; и проверьте
Я уже отвечал по этому вопросу. Количество замен для разных приложений при одинаковой базе варьируется на уровне 10%-20% процентов. Однако качество текста может варьироваться очень значительно. Более того у разных прог разные возможности по синтаксису базы синонимов.
Например, мой синомайзер поддерживает морфологию, абстрактные условия, дополнительный синтаксис генерационный синтаксис и преобразования словоформы, и язык регулярных выражений, позволяющий найти какую угодно группу слов изменить ее как угодно.
По качеству текста все решает система исключений и противовесов и защита от переходов разнообразных форм омонимии в строковую неоднозначность. Например, в моем синомайзере около 40 параметров определяют, выберется ли одна замена или другая или замены не произойдет.
Открываете wp-content/themes/YOU_CURENT_THEM/ single.php, в нужном месте (после "the_content('');") прописываете
echo get_post_meta($post->ID, "pole", true);
Это код ПХП и он должен быть внутри <? ?> или внутри <?php ?>,
YOU_CURENT_THEM - это название вашей текущей темы.
pole это название вашего произвольного поля;
$post->ID - это ID поста
Можно улучшить
во втором случае лишние пробелы справа и слева обрезаются, что экономит трафик ваш и пользователя, но немного нагружает процессор сервера.