Генератор дорвеев VP

VT
На сайте с 20.11.2010
Offline
14
#61
tupak:
для кого это? для саповодов?
имхо, ты ошибся номером, здесь люди трафик собирают, а не не лепят говносайты под сапу.
предложи трафогенерящий инструмент. и будет тебе почет и уважуха.

а говнокопипаст с синонимами отправь своим внукам в девяностые.
зы: только не обижайся.

Не, всё нормально! Давай порассуждаем. Если я ошибаюсь ты скажи. Ну во первых для кого? Люди интересовались - я пример сделал.

А если в общем? То синонимы - это что б были =) Согласен, это не есть сам траффик. Они скорей для того что бы дор имел более человеческий вид. Синонимайзеров тыщщи, синонимайзеров с морфологией единицы. Ты скажешь опять я со своей морфологией. Ну да, на мой взгляд это единственный козырь против поисковых роботов. Если нет морфолоигии - это сразу видно достаточно тривиальными алгоритмами. И если у тебя сайт (дор) на 50% без морфологии, это будет подозрительно. Здесь я ожидаю от тебя вопрос: а почему тогда все (или пусть не все) доры живут в индексе? А дело в том что этот алгоритм (назовём его валидатор текста) несколько медленней чем индексный бот, скажем 10-100 раз. Он придёт позже сделает свой "грязное" дело. Я считаю, что у ботов есть два основных ориентира: вероятностное соотношение слов в тексте, соответствующее языку, т.н. закон Зипфа, и морфология, а ну и ещё новые никому не известные технологии. Других признаков валидности текста я не знаю, может быть знают мои конкуренты, тогда обратитесь к ним.

Ezekiel
На сайте с 11.08.2010
Offline
28
#62

Вот мне кто-нибудь объяснит чем закон Зипфа опасен для генерированного текста? Википедию читал, но там и опровержение закона есть. Он где-то используется?

Или, например, у меня текст генерируется цепями Маркова, конечно, все зависит от реализации, но, например, у меня учитывается частота появления слова в тексте. Попытаюсь объяснить на пальцах:

После анализа текста получается так, что после слова "Они" могут появляться слова "иногда", "вчера" и "сегодня". Предположим, что по исходному тексту слово "иногда" встречается чаще всех, соответственно, при генерации оно тоже будет всречаться чаще всех. Как это нарушает закон Зипфа?

Обмен WebMoney (http://bit.ly/kqBOlV) Продам инвайт на Хабр (http://www.plati.ru/asp/pay.asp?idd=1529255)
VT
На сайте с 20.11.2010
Offline
14
#63
Ezekiel:
Вот мне кто-нибудь объяснит чем закон Зипфа опасен для генерированного текста? Википедию читал, но там и опровержение закона есть. Он где-то используется?

Или, например, у меня текст генерируется цепями Маркова, конечно, все зависит от реализации, но, например, у меня учитывается частота появления слова в тексте. Попытаюсь объяснить на пальцах:
После анализа текста получается так, что после слова "Они" могут появляться слова "иногда", "вчера" и "сегодня". Предположим, что по исходному тексту слово "иногда" встречается чаще всех, соответственно, при генерации оно тоже будет всречаться чаще всех. Как это нарушает закон Зипфа?

В общем-то думаю никак, если у тебя как ты говоришь всё из одного монолитного куска текста. Только это офтоп! Сделай свою тему я подключусь, или пиши в личку - пообщаемся.

tupak
На сайте с 06.05.2011
Offline
11
#64
VenyaTolinov:
Не, всё нормально! Давай порассуждаем. Если я ошибаюсь ты скажи. Ну во первых для кого? Люди интересовались - я пример сделал.
А если в общем? То синонимы - это что б были =) Согласен, это не есть сам траффик. Они скорей для того что бы дор имел более человеческий вид. Синонимайзеров тыщщи, синонимайзеров с морфологией единицы. Ты скажешь опять я со своей морфологией. Ну да, на мой взгляд это единственный козырь против поисковых роботов. Если нет морфолоигии - это сразу видно достаточно тривиальными алгоритмами. И если у тебя сайт (дор) на 50% без морфологии, это будет подозрительно. Здесь я ожидаю от тебя вопрос: а почему тогда все (или пусть не все) доры живут в индексе? А дело в том что этот алгоритм (назовём его валидатор текста) несколько медленней чем индексный бот, скажем 10-100 раз. Он придёт позже сделает свой "грязное" дело. Я считаю, что у ботов есть два основных ориентира: вероятностное соотношение слов в тексте, соответствующее языку, т.н. закон Зипфа, и морфология, а ну и ещё новые никому не известные технологии. Других признаков валидности текста я не знаю, может быть знают мои конкуренты, тогда обратитесь к ним.

Это ты сам придумал, что лингвистический бот (назовём его так) приходит позже и анализирует текст? Или это твои догадки, основанные на опыте?

Вот давай возьмём снипеты яндекса. Возьмём их потому, что за ними, как и за твоим контентом, надо лезьть доргену в интернет.

Пример:

http://yandex.ru/yandsearch?text=теплоход+москва-самара

С морфологией всё в порядке (на сколько это возможно в коротких или обрезанных предложениях).

С Зипфом вообще всё отлично, как на уровне одиночного предложения, так и страницы в целом.

Вопрос: почему такие доры идут в бан в Яндексе?

VT
На сайте с 20.11.2010
Offline
14
#65

tupak Извини, я ничего не понял. У тебя мысль светлая, оформи её в обычную серую рамку и выложи сюда - помозгуем.

tupak
На сайте с 06.05.2011
Offline
11
#66
VenyaTolinov:
tupak Извини, я ничего не понял. У тебя мысль светлая, оформи её в обычную серую рамку и выложи сюда - помозгуем.

да я то мозговать не хочу. я уже всё для себя давно перемозговал.

так, потрындеть ниочём.

а что непононятного в моём посте?

люди используют контент из выдачи яндекса (снипеты), заливают на свои доры, доры немного посидят в выдаче и банятся.

мне кажется с дорами на твоем контенте происходит тоже самое.

VT
На сайте с 20.11.2010
Offline
14
#67
tupak:
да я то мозговать не хочу. я уже всё для себя давно перемозговал.
так, потрындеть ниочём.


а что непононятного в моём посте?
люди используют контент из выдачи яндекса (снипеты), заливают на свои доры, доры немного посидят в выдаче и банятся.
мне кажется с дорами на твоем контенте происходит тоже самое.

Понятно! Кажется крестится надо! Я никогда снипеами не пользвался и пользоваться не буду, потому что это очень тупо пытаться впарать яндексу обрато его же высер.

tupak
На сайте с 06.05.2011
Offline
11
#68

вообщем ты умеешь делать доры, которые не идут в бан.

а не идут они в бан, потому что ты юзаешь морфологию и статистику слов.

а домены для своих небанящихся доров ты покупать не хочешь, ибо привык брать деньги только за программерский труд.

странный ты парень.

VT
На сайте с 20.11.2010
Offline
14
#69
tupak:
вообщем ты умеешь делать доры, которые не идут в бан.
а не идут они в бан, потому что ты юзаешь морфологию и статистику слов.

а домены для своих небанящихся доров ты покупать не хочешь, ибо привык брать деньги только за программерский труд.

странный ты парень.

Послушай друг, я никак не пойму ты от меня что хочешь получить? У тебя ко мне вопросы? Пиши здесь, ты же видишь, если я могу я отвечаю.

Или у тебя притензии ко мне, тогда лучше в личку! Или может тебя просто жаба душит за мой программерский труд. Тут я тебе на советчик. Удачи!

tupak
На сайте с 06.05.2011
Offline
11
#70
VenyaTolinov:
Послушай друг, я никак не пойму ты от меня что хочешь получить? У тебя ко мне вопросы? Пиши здесь, ты же видишь, если я могу я отвечаю.

Или у тебя притензии ко мне, тогда лучше в личку! Или может тебя просто жаба душит за мой программерский труд. Тут я тебе на советчик. Удачи!

вопросов нет. есть непонимание, которое я и высказал.

сапожник без сапог смотрится как-то неестественно и довольно уныло.

ну ладно, друг (а ведь мы теперь друзья :) ). не буду тебя больше доставать.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий