_Snake_

_Snake_
Рейтинг
151
Регистрация
06.12.2010
dpcenter:
Кстати, ни кто не заметил резкого падения трафа с Яши с 23.11 ?

Как же не заметишь тут, когда весь яшкин траф в ноль. Если почитать ветку апдейтов яши, то там и seo'шники не сильно довольны апдейтом.

---------- Добавлено 25.11.2016 в 16:54 ----------

master_jeday:
Но там в старом индексе и были дорвеи и прочее УГ. То же самое на нормальных доменах в том же акке ЯВМ без санкций.

Расшифруй пожалуйста, что такое "старый индекс", что такое "нормальный домен", а то не совсем понятно.

MudryiKaa:
Какие вы там затраты увидели в аддурилке Гугла?

Аккаунты и рекапчи2 и индивидуальные прокси на каждые N-тыс добавлений это уже на затраты?

---------- Добавлено 23.11.2016 в 22:16 ----------

MudryiKaa:
Или я что-то не знаю за свои 10 лет дорвеестроительсва? Через "посмотреть как гуглбот" отлично загоняется вся основа сайта, а уже через неделю - весь.
betauser:
К сожалению морды нет, как и нет карты сайта.

Вы бы лучше за 10 лет "дорвеестроительсва" научились читать глазами, а не жопой.

J-ran:
Спроси у Купрума, он шибко подкован в партнёрках.

И нам расскажи потом :)

Ilekor:
Что бы потом дорчики посмотреть чьи то?

Да ладно тебе, делаешь выборку букварикса или моаб и смотри на здоровье :)

Откуда ключи?

shurik0:
Как определить качество дора? 😂

У тебя устаревшая информация. http://roskachestvo.gov.ru/

IBakalov:
Сути дела это не меняет, т.к. и в первом и во втором случае будет большое количество плохих n-грамм, по которым и будут фильтроваться доры
http://rcdl.ru/doc/2009/306_308_Section09-3.pdf

Это было бы кошмаром для дорвейщика, если бы не являлось сказкой яндекса. Всё, что описано в статье, относится только к рукописному тесту и годится только для анализа Plant текста и совершенно не пригоден например к табличным данным, которые могут больше напоминать набор слов, однако эти данные могут быть вполне полезные.

Если бы было всё так сладко как пишет яндекс, то они бы уже давно победили марковку. Однако что-то ни как не победят. Тем более, на любой их алгорит определения машинописного текста, может быть написан антиалгоритм, который будет строить текст напимер с учётом этих самых n-грамм, вполне себе задача для нейросетей, всё зависит от прямоты рук программиста.

TopperHarley:
Не совсем.
А при пословной генерации получаются десятки тысяч слов в тексте, что как можно заметить гораздо больше).

А если словарь сократить путём синонимизации? Например привести все слова «скорый, скоростной, стремительный, проворный» к «быстрый». Или вообще описать набором правил. А потом уже когда произойдёт генерация, применить обратно синонимизацию / выборку по набору правил. Конечно осмысленности не получится, но возможно получится, что-то более или менее читаемое.

---------- Добавлено 20.11.2016 в 00:19 ----------

TopperHarley:

Я разве не об этом выше говорил?
Кроме элизы знаешь сколько чатботов написано за всю историю? Даже Siri не понимает о чем сообщает.

Так то пофиг, что увлечённый пользователь раскусит подставу, главное, чтобы увлечённый бот не заметил подвоха. А пользователю можно и красивую клоаку показать. 😂

TopperHarley:
Никак не получится сделать так, чтобы текст был осмысленным.

Ни когда не говори никогда, дядька в 1966 году, вон какую штуку написал. А тогда возможностей было намного меньше и производительности не те и языки программирования не те. :)

TopperHarley:
Выдуманные слова уйдут если юзать пословную генерацию, а не побуквенную.

По есть получается, та же самая морковка?

Всего: 1049