Fobiss

Рейтинг
1
Регистрация
13.02.2008
А myrewriter вроде бы как понимает

Нет, Kashey, MyRewriter тоже не понимает. Впрочем, ему это не мешает :) (кстати, я в аське ответил, прошу прощения, что так долго тормозил. Абсолютно времени нет.)

Просто база составлена так:

ошибочный|неправильный

ошибочная|неправильная

ошибочное|неправильное

Поэтому может показаться, что он поддерживает морфологию.

c-master:
так вот стучуть, да ни кто не открывает:o

😕 Мы всем открываем... Может быть, попробуем наоборот? Куда постучать? 😕

Вот этот, конечно же :)

Текст получается весьма приличным. Если кто хочет проверить вживую, покажем установленный на нашем хосте. 449-331-056 или 426-487-512.

c-master, сделаем. И скрины админки покажем. И даже в демку дадим поиграться :) Стучите, если интересно.

Если в 449-331-056 не отвечают, то стучите в 426-487-512.

хех... интересная штучка🚬

Пока что её нету :p Хотя прикрутить MyRewriter к своей грабилке контента очень легко.

Есть ли возможность выбора синонима из списка, например при подводе к слову, которое изменилось, но результат не устраивает?

Нету. Каждому слову соответствует только один синоним, поэтому список составлять не из чего :)

goglov, Поддерживаю, тс сделайте в новой версии, очень интересная возможность.

Если нужно, в следующей версии можно будет нажать на слово, появится текстовое поле для синонима. Хотя, честно говоря, не вижу особого смысла, ведь ничто не мешает поправить результат в текстовом редакторе. Да и предполагается, что скрипт делает достаточно качественные тексты и их можно не проверять 😎

Но я вовсе не отказываюсь, если хочется - сделаю.

Necromanc, в 6-7-8 часов меня там точно не было. Но можно писать в офлайн, когда приду, обязательно отвечу. С глюками, увы, ничего поделать не могу :(

Да, признаться, доки написаны больше для тех, кто будет переделывать MyRewriter под себя. Потом, наверно, напишем понятнее 😕

По поводу вопроса: со скриптом в комплекте идут два интерфейса. Первый - текст вводится прямо в броузере в текстовое поле, нажимается кнопка, результат выводится прямо в броузер. Второй - нужно записать тексты в файл, зайти в броузере на страницу, синонимизированные тексты будут записаны в файлы в другой папке, а в броузере их можно будет просмотреть, увидеть статистику.

После добавим интерфейс, которому можно будет указать адрес RSS-ленты, он будет её скачивать и генерировать RSS-фид с синонимизированным контентом.

В общем-то предполагалось, что MyRewriter будет использоваться в связке со скриптами покупателя, поэтому вариантов немного.

О каком коде идёт речь в случае замены точных совпадений? Подключиться к базе и в цикле сделать реплейс? Единственное, что может стоить денег это БД - но не столько же. Хотя и БД при таких объёмах не нужна - можно ограничиться массивом.

Ну да, все три строки закомментированы :)

На самом деле там действительно довольно много всего, это просто на первый взгляд кажется совсем простым. Ну, подсчёт статистики, возможность легко создать свой интерфейс (способ получения/возвращения текста), отправка e-mail'ов при ошибках :) и ещё много всего по мелочам.

Дело в том, что самому написать всё продуманно, может, и не сложно, но явно займёт немало времени. А здесь код понятный, простой, то есть если тебе нужно что-то поменять под себя, это не должно вызвать проблем.

Fobiss, Сам удивлён, простой в установке и действительно приятный скрипт, продуманный до мелочей инсталлятор, проведёт по шагам даже самого не искушённого пользователя.
Пожелания к будущим версиям я высказал в аську, с нетерпением жду реализации, очень прошу не бросайте проект на пол пути :)

Благодарю! 🍻 Правда там шаг всего один - зайти на install.php :)

Всё будет развиваться дальше, скрипт улучшаться, база синонимов - пополняться. Пожелания, конечно, учтём.

Fobiss добавил 15.02.2008 в 13:30

Ещё хочу поблагодарить того, кто подсказал мне про шинглы. Спасибо. Но я знал, что это такое, и раньше, своим постом немного выше просто хотел сказать, что мы не знаем, чем пользуется Яндекс. А так как в серпах иногда несколько полных копий, то, возможно, используются какие-то очень сложные алгоритмы, оценивающие очень специфические факторы. Иначе с помощью шинглов или чего-то ещё абсолютные копии были бы отфильтрованы.

Даже не знаю... Ну, что-то вроде скорости обновления сайта (пять новых статей в день - дубли, слишком быстро; одна статья в неделю - уникальная, иначе почему они тырят контент так медленно). Это просто пример, и просто мои предположения, разумеется.

Цитата с сайта.

"Мы понятия не имеем, как Яндекс определяет дубли"

Э. Ну ведь точной информации действительно нет.

А так как иногда в выдаче несколько явных 100%-ых дублей, то можно предположить, что всё гораздо хитрее и запутаннее, чем можно предположить :)

nepro100, возможно.

Но база пополняется и будет пополняться дальше.

А, например, рерайтерам, или тем, у кого есть другие средства для повышения уникальности, скрипт будет очень полезен и сейчас.