Прям вот так вот, чтобы препод повелся - это вряд ли получится.
Дело не только в ротации букв - я например букву А могу написать 10 раз рядом и 10 раз получится разная буква А. Натуральное человеческое письмо смоделировать чрезвычайно сложно, как и всё, что делает человек. Можно лишь попытаться - но всё равно будет видно, что это не человек.
ИМХО.
xxx: Созрел адский план, поливать лужи, которые остаются за котом, валерианкой.
xxx: Пусть тоже мучается, с...ка шерстяная
(с) bash.org.ru
P.S. тоже люблю котов, у самого Мартын (как у Кунина) и Феникс (нашли на мусорке - типа из пепла возродился ;) )
Первое сообщение на серче
Жалко, не моё :)
Спасибо за отзыв.
База Fitless после обработки из 300 с лишним тысяч превратилась в 900 с лишним тысяч строк. Странно, что нет ощутимых результатов на выходе - ведь в базу был добавлен не какой-нибудь мусор, а реально существующие словоформы, которые в теории должны встречаться в текстах.
В любом случае, лучше с ними, чем без них - думаю, качество на несколько процентов всё же возросло ;)
Весь вылез? Или сколько страниц посчастливилось запихнуть?
Меняем айпишники (много)
Каптчу будет выдавать по любому, но если айпишников много, то пока дойдете до конца списка - начало списка уже будет без каптчи (вордстат разбанит). И так по кругу. Штук 150-200 проксей хватает для парсинга без задержек (зависит только от скорости самих проксей).
Спец. способы обхода каптчи были, но накрылись с выходом в паблик :(
Через прокси можно чекать этим скриптом
Свершилось! Спасибо!
А теперь вопрос, который заинтересует очень многих - адалт планируется?
Про конкурента я со смайликом ;)
Это да, засвеченый по самое небалуйся :) Неплохо бы прикрутить прокси и при каптче где-то писать, мол, каптча.
Еще чуток напрягает кнопка "Нвчать парсинг". Ну а так, в общем, неплохо. Удачи 🍻
Честно попытался оценить конкурента ;)
Но не смог даже открыть файл с кеями. Ни один.
Парсинг кеев также закончился неудачей.