Комментарии - Hkey - Профиль вебмастера - Форум об интернет-маркетинге

22 сентября 2009, 15:11

Если честно, то я вполне мог ошибиться и перепутать стеммер и тример.

Для сайтов я использую простую схему: Если в БД нет информации по слову, то я удаляю окончание, используя список окончаний. Пусть длина слова N, длина обрезания n. Из базы окончаний нахожу окончание с максимальной длиной, но так чтобы длина "корня" была большей либо равной трем (N-n>=3). Для поиска по сайту достаточно, для подсветки орфографии или синомайзинга - нет.

Для ПК (синомайзинга) использую самописную морфологию.

Соревнование синомайзеров

18 сентября 2009, 13:27

Давайте кого-то пригласим, чтобы он оценил эргономику приложений. На форуме есть люди, которые оценивают юзабилити, для них будет рекламка. Вы согласны?

У вас надо кликнуть мышью по руке (в нее нужно еще попасть), у меня не обязательно по кнопке, можно по слову.
У вас надо щелкнуть по неудачным заменам (в нее тоже нужно еще попасть),

Насчет того, что у вас можно щелкнуть по селекту и он выпадет. Значит текст в нем нельзя редактировать? Как мы пару сообщений выяснили назад, у вас большая проблема со словоформами. Т.е. нужно сначала убрать все ошибки синомайзинга по слову, потом врубить ручное редактирование, затем попытаться отыскать замены, которые он сделал и исправить все окончания. Сколько на это нужно времени? Текст у вас нужно перечитывать дважды. Первый раз читая его с селектами второй раз читая его очень внимательно. Это только для исправления. Это по 50-70 секунд на перечитку минимум. Во время первой перечитки пользователь должен исправить 6-9 ошибочных слов, кликнув на селекте, прочитав, что написано в выпадающем меню, кликнув по нужному элементу. Это по 3-5 секунд. Потом пользователь включает ручное редактирование и перечитывает текст еще раз и вручную исправляет 15 - 20 окончаний, это 4-7 секунд на каждое.

Итого по минимуму 100 + 18 +60 = 3 минуты

По максимуму 140+45+140 = 5 минут

В моем синомайзере на это нужно: 1-3 секунды, что бы щелкнуть на руку, секунд 20-30 чтобы пересмотреть исправления текста, и по одной секунде на три щелчка, выбрав ошибку. Потом 1-3 секунды, чтобы перейти на следующий этап.

Полминуты - Минута.

p.s. решите проблему с richedit, кодировка

Скачайте последнюю версию, там ее нет.

p.p.s. еще увидев цену я немного опешил 75 у.е. не дороговато?

Сравните качество текстов. Сравните эргономику.

Скупаю готовые статьи об Одессе

18 сентября 2009, 12:06

DEM333:
ТС, ваше предложение с таким ценником выглядит по-одесски предприимчивым, а вот предложение купить скан и вовсе противоречит этическим нормам и правилам этого раздела. Здесь торговля сканом официально запрещена.

Имущественное авторское право сохраняется за автором и его наследниками на протяжении 70 лет после его смерти. Так, что скан, например, Бабеля (которого расстреляли в 38) не нарушает не чьи права, если при публикации указано имя Автора.

Соревнование синомайзеров

18 сентября 2009, 11:42

На скрине моей программы. Вы находитесь на втором этапе (сравнения двух текстов), ручная работа по уникализации происходит на третьем этапе. На этом этапе отмена замен происходит в один клик. Переход на следующий этап - тоже один клик.

У вас, чтобы отменить одну замену, нужно кликнуть мышью по кнопке справа Селекта (в нее нужно еще попасть), потом прочитать, что написано в выпадающем меню, потом навести мышь на выпадающий элемент, потом кликнуть. У меня нужно выбрать руку и щелкнуть по неудачным заменам либо выделить диапазон текста и все замены там прибьются.

Текст напичканный селектами, крайне неудобно читать, чтобы посмотреть какой текст был до этого, нужно совершать дополнительные действия. У меня, нужно просто чуть посмотреть влево.

У меня ручное добавление синонимов происходит на следующем этапе. В правом меню.

P.S. поиграйтесь с со стилем границ Select, что бы он не мешал читать текст. Он не должен быть так заметен.

Прога от Яндекса Mystem

17 сентября 2009, 21:33

Fredo:
У меня с ним тоже как-то не срослось...

Аналогично... Еще он какой-то не особо быстрый, как мне показалось...

Если для сайта нужно, то пару тысяч слов самых популярных слов лучше в базу загнать, а для остальных пользоваться тримером (Sape например тримером пользуется).

Соревнование синомайзеров

17 сентября 2009, 20:45

Обработал... На последнем публике, только с демобазой (без базы полной версии). Любой желающий может проверить, скачав дему синомайзера.

Как ни странно отличие от исходного текста такае-же как и вас и равна 68% (длина шингла 5, самый жесткач)

Настройка - самое худшее качество. Без ручных правок.

Явных глюков 3:

английский -> британский

"очень не очень"

решение -> ответ

На настройках флага "- -А" (среднячок)

в тексте только одна ошибка "очень не очень"

при 50 % сходстве (длина шингла 5, самый жесткач)

---------------------

В тексте Offlajn

от себя прибавлю (Серьезная стилистическая ошибка, более того "прибавлю" и "добавлю" это один глагол с разными приставками)

до выходы (Синомайзер мало того, что ваш не решает омонемию, так у него еще нету защиты от перехода омонемии в строковую неоднозначность)

теснее употреблял модулем

обидную черта

Дельце в книга (Дело->Дельце - стилистическая ошибка, в 90% случаев)

отправное информация Умеет ли ваш синомайзер склонять

по крайней границе базы фразеологизмов у вас нет, сомневаюсь об механизме исключений

тратить со советского на лондонский

снова вполне

находилось б мириться

ежели б труба ежели-архаизм

ак бы то ни было

взяли речи на российском

находилось б удивлен обидно

на тему тот, что стая я угадал

снова на этапа опции трубы.

назначить гораздо модуль

систематических речений

....

И так далее....

---------------------------

P.S. Выделяйте жирным. Замены.

Для сапёров. Закрыть все ВС одним махом.

17 сентября 2009, 17:16

1. Внутренние ссылки тоже в ноиндекс попадут.

2. Ноиндекс некашерный таг по валидатору - гуглу это может не понравиться, и сложнее отлаживать.

Доп. поля в WP

17 сентября 2009, 17:03

dmg.shark:
Hkey, а ID поста, разве нужно вручную вписывать? :) или оно берет из скула? Просто постов 200+ и каждый день +3-6 постов, это же файл вырастит, как репка...

просто пишите $post->ID обычно здесь и будет ID поста... Зависит самого файла синг.пхп, если в не есть строка

php if (have_posts()) : while (have_posts()) : the_post();

или просто

the_post();

Значит $post->ID - это номер вашего поста.

Напишите echo $post->ID; и проверьте

Соревнование синомайзеров

17 сентября 2009, 16:56

KupluSsilki:
поскольку любой синонимайзер - это фактически база синонимов к нему, а не сама программа (программу-то легко написать), правильнее было бы не использовать стандартные базы, а устроить именно соревнование баз - имхо..

Я уже отвечал по этому вопросу. Количество замен для разных приложений при одинаковой базе варьируется на уровне 10%-20% процентов. Однако качество текста может варьироваться очень значительно. Более того у разных прог разные возможности по синтаксису базы синонимов.

Например, мой синомайзер поддерживает морфологию, абстрактные условия, дополнительный синтаксис генерационный синтаксис и преобразования словоформы, и язык регулярных выражений, позволяющий найти какую угодно группу слов изменить ее как угодно.

По качеству текста все решает система исключений и противовесов и защита от переходов разнообразных форм омонимии в строковую неоднозначность. Например, в моем синомайзере около 40 параметров определяют, выберется ли одна замена или другая или замены не произойдет.

Доп. поля в WP

16 сентября 2009, 21:13

dmg.shark:

Я думаю, что суть вопроса понятна, может быть найдутся люди, которые помогут ответом? ☝

Открываете wp-content/themes/YOU_CURENT_THEM/ single.php, в нужном месте (после "the_content('');") прописываете

echo get_post_meta($post->ID, "pole", true);

Это код ПХП и он должен быть внутри <? ?> или внутри <?php ?>,

YOU_CURENT_THEM - это название вашей текущей темы.

pole это название вашего произвольного поля;

$post->ID - это ID поста

Можно улучшить

echo trim(get_post_meta($post->ID, "pole", true));

во втором случае лишние пробелы справа и слева обрезаются, что экономит трафик ваш и пользователя, но немного нагружает процессор сервера.

Как удалить плохие SEO-ссылки и очистить ссылочную массу сайта

В 2023 году Одноклассники пресекли более 9 млн подозрительных входов в учетные записи

Hkey