WSGU

Рейтинг
173
Регистрация
07.10.2007

AntonioM, просто создавал по желаниям трудящихся, большенство говорило, что при генерации получают на выходе множество файлов, где в каждом файле одна статья. Ваши пожелания постараюсь реализовать в следующей версии.

у меня и в зоне ru, писал своему хостеру, ответили, что проблемы у яндекса. Даже народные сайты выдают такое же

Просто до этого момента очень часто слышал, что директ ни как не связан с поиском, а получается что даже очень связан

T.R.O.N, я вас понял прекрасно, но хотел бы подчеркнуть, что для меня главное в этой ситуации - использование статистики директа при ранжировании. И что ожидать далее? Где через месяц будет использоваться информация с площадок? Как снять данный фильтр?

T.R.O.N:

Не верно. Код был размещен добровольно

Троянского коня в городе Троя - тоже добровольно разместили. Троя пала (выпала)

Str256:
А вы не думали, что всё зависит от трафика? После выпадения, у сайта проседает трафик ниже допустимого уровня, поэтому из РСЯ его и исключают?

На наблюдаемых мной сайтах он был по 1000 стал 500

Проанализировав статистику прихожу к выводу, что заблокированы были сайты у которых 70% и выше посетителей были на сайте менее 10 секунд. Считаю такую политику нехорошей по отношению к ВМ. Культурно было бы предупредить площадки хотя бы за месяц, можно было бы подвести параметры под нужные - это решаемые вопросы, а не рубить топором сразу. Не учитывается специфика справочных сайтов - "нашел, посмотрел, ушел". Или такие сайты дают трафик низкого качества?

gasyoun, чем вы проверяли on-line сервисом или WSGURerayter ом?

В WSGURerayter английский отключен для того, что бы ускорить работу, но могу подключить по запросу. Если Вы не используете английские тексты, то лучше не подключать, так как скорость работы понижается. платить тут цена $10. Если у вас репутация больше 10000 и вы хотите оставить отзыв, то скидка 30%. Платите на Z266001017484 $7 с указанием за что, свой e-mail и свой логин на серче. Также если вы закачивали вчера прогу до 18-00, то закачайте новую версию, там были исправлены некоторые баги.

теперь Rewriter. Для тех, кто уже скачал - вышла версия 1.0.1 - исправлены найденные баги

WSGURerayter - отбор самых уникальных статей

WSGURerayter предназначен для анализа массы текстов и отбора из них с самым уникальным содержимым.

Для работы с программой необходимо:

• Поместить в каталог с исходными статьями файлы с расширением .html. В каждом файле должна находиться одна статья.

• Указать каталог, куда будут перемещены отобранные статьи

• В поле «Отобрать из общей массы» ввести количество отбираемых статей с самым уникальным содержимым.

• Поле «использовать максимум слов» необходимо заполнить целым положительным числом не менее 10 с учетом стоп слов.

• Качественный, но более медленный анализ – время анализа увеличивается примерно в 2 раза, но используются более точные алгоритмы.

• Файл stopwords.txt содержит стоп слова, которые не учитываются при анализе.

Для ускорения работы алгоритмов, программа работает только с русскими словами. По индивидуальному запросу возможно подключение и английских слов.

10 статей по 4 кб. анализирует за 2 секунды.

100 статей по 4 кб. анализирует за 3 мин 39 секунды.

1000 статей по 25 слов за 38 мин

Скачать демоверсию можно тут http://www.wsgu.ru/faylyi/files.download-2.html

купить тут http://www.snips.ru/tovar2021.html

Всего: 866