Нет, Kashey, MyRewriter тоже не понимает. Впрочем, ему это не мешает :) (кстати, я в аське ответил, прошу прощения, что так долго тормозил. Абсолютно времени нет.)
Просто база составлена так:
ошибочный|неправильный
ошибочная|неправильная
ошибочное|неправильное
Поэтому может показаться, что он поддерживает морфологию.
😕 Мы всем открываем... Может быть, попробуем наоборот? Куда постучать? 😕
Вот этот, конечно же :)
Текст получается весьма приличным. Если кто хочет проверить вживую, покажем установленный на нашем хосте. 449-331-056 или 426-487-512.
c-master, сделаем. И скрины админки покажем. И даже в демку дадим поиграться :) Стучите, если интересно.
Если в 449-331-056 не отвечают, то стучите в 426-487-512.
Пока что её нету :p Хотя прикрутить MyRewriter к своей грабилке контента очень легко.
Нету. Каждому слову соответствует только один синоним, поэтому список составлять не из чего :)
Если нужно, в следующей версии можно будет нажать на слово, появится текстовое поле для синонима. Хотя, честно говоря, не вижу особого смысла, ведь ничто не мешает поправить результат в текстовом редакторе. Да и предполагается, что скрипт делает достаточно качественные тексты и их можно не проверять 😎
Но я вовсе не отказываюсь, если хочется - сделаю.
Necromanc, в 6-7-8 часов меня там точно не было. Но можно писать в офлайн, когда приду, обязательно отвечу. С глюками, увы, ничего поделать не могу :(
Да, признаться, доки написаны больше для тех, кто будет переделывать MyRewriter под себя. Потом, наверно, напишем понятнее 😕
По поводу вопроса: со скриптом в комплекте идут два интерфейса. Первый - текст вводится прямо в броузере в текстовое поле, нажимается кнопка, результат выводится прямо в броузер. Второй - нужно записать тексты в файл, зайти в броузере на страницу, синонимизированные тексты будут записаны в файлы в другой папке, а в броузере их можно будет просмотреть, увидеть статистику.
После добавим интерфейс, которому можно будет указать адрес RSS-ленты, он будет её скачивать и генерировать RSS-фид с синонимизированным контентом.
В общем-то предполагалось, что MyRewriter будет использоваться в связке со скриптами покупателя, поэтому вариантов немного.
Ну да, все три строки закомментированы :)
На самом деле там действительно довольно много всего, это просто на первый взгляд кажется совсем простым. Ну, подсчёт статистики, возможность легко создать свой интерфейс (способ получения/возвращения текста), отправка e-mail'ов при ошибках :) и ещё много всего по мелочам.
Дело в том, что самому написать всё продуманно, может, и не сложно, но явно займёт немало времени. А здесь код понятный, простой, то есть если тебе нужно что-то поменять под себя, это не должно вызвать проблем.
Благодарю! 🍻 Правда там шаг всего один - зайти на install.php :)
Всё будет развиваться дальше, скрипт улучшаться, база синонимов - пополняться. Пожелания, конечно, учтём.
Fobiss добавил 15.02.2008 в 13:30
Ещё хочу поблагодарить того, кто подсказал мне про шинглы. Спасибо. Но я знал, что это такое, и раньше, своим постом немного выше просто хотел сказать, что мы не знаем, чем пользуется Яндекс. А так как в серпах иногда несколько полных копий, то, возможно, используются какие-то очень сложные алгоритмы, оценивающие очень специфические факторы. Иначе с помощью шинглов или чего-то ещё абсолютные копии были бы отфильтрованы.
Даже не знаю... Ну, что-то вроде скорости обновления сайта (пять новых статей в день - дубли, слишком быстро; одна статья в неделю - уникальная, иначе почему они тырят контент так медленно). Это просто пример, и просто мои предположения, разумеется.
Э. Ну ведь точной информации действительно нет.
А так как иногда в выдаче несколько явных 100%-ых дублей, то можно предположить, что всё гораздо хитрее и запутаннее, чем можно предположить :)
nepro100, возможно.
Но база пополняется и будет пополняться дальше.
А, например, рерайтерам, или тем, у кого есть другие средства для повышения уникальности, скрипт будет очень полезен и сейчас.