Как же не заметишь тут, когда весь яшкин траф в ноль. Если почитать ветку апдейтов яши, то там и seo'шники не сильно довольны апдейтом.---------- Добавлено 25.11.2016 в 16:54 ----------
Расшифруй пожалуйста, что такое "старый индекс", что такое "нормальный домен", а то не совсем понятно.
Аккаунты и рекапчи2 и индивидуальные прокси на каждые N-тыс добавлений это уже на затраты?---------- Добавлено 23.11.2016 в 22:16 ----------
Вы бы лучше за 10 лет "дорвеестроительсва" научились читать глазами, а не жопой.
И нам расскажи потом :)
Да ладно тебе, делаешь выборку букварикса или моаб и смотри на здоровье :)
Откуда ключи?
У тебя устаревшая информация. http://roskachestvo.gov.ru/
Это было бы кошмаром для дорвейщика, если бы не являлось сказкой яндекса. Всё, что описано в статье, относится только к рукописному тесту и годится только для анализа Plant текста и совершенно не пригоден например к табличным данным, которые могут больше напоминать набор слов, однако эти данные могут быть вполне полезные.
Если бы было всё так сладко как пишет яндекс, то они бы уже давно победили марковку. Однако что-то ни как не победят. Тем более, на любой их алгорит определения машинописного текста, может быть написан антиалгоритм, который будет строить текст напимер с учётом этих самых n-грамм, вполне себе задача для нейросетей, всё зависит от прямоты рук программиста.
А если словарь сократить путём синонимизации? Например привести все слова «скорый, скоростной, стремительный, проворный» к «быстрый». Или вообще описать набором правил. А потом уже когда произойдёт генерация, применить обратно синонимизацию / выборку по набору правил. Конечно осмысленности не получится, но возможно получится, что-то более или менее читаемое.---------- Добавлено 20.11.2016 в 00:19 ----------
Так то пофиг, что увлечённый пользователь раскусит подставу, главное, чтобы увлечённый бот не заметил подвоха. А пользователю можно и красивую клоаку показать. 😂
Ни когда не говори никогда, дядька в 1966 году, вон какую штуку написал. А тогда возможностей было намного меньше и производительности не те и языки программирования не те. :)
По есть получается, та же самая морковка?