Антоний Казанский

Антоний Казанский
Рейтинг
791
Регистрация
12.04.2007
Должность
Частный интернет-маркетолог и SEO специалист
Интересы
Интернет-маркетинг, SEO, интернет реклама
Подробности на сайте https://akazansky.ru
finisher :
Нужна ли плоская структура категорий в ИМ?

Нет.


finisher :
У некоторых сайтах видел плоскую структуру категорий. Без вложенности.

Увидеть можно много чего. Вопрос - стоит ли это принимать как руководство к действию.

При желании можно конечно и все адреса страниц назвать порядковой нумерацией: 1.html, 2.html, 3.html и т.д.


finisher :
Имеет ли смысл ее делать?

Если у вас ИМ состоит из одной категории и более нет никаких вложенностей, то в принципе имеет.


finisher :
Какие плюсы, минусы есть?

Про плюсы я вам написал - если у вас несколько или даже полтора десятка однотипных товаров, то новые сущности вам не нужны.

А вот минусов, если это большой магазин, можно перечислять длинным списком. Самый главный - полная неразбериха, какой товар к чему относится, с чем группируется и т.д. 

sagamorr #:
Про второе. На прямые заходы можно какие то сети полностью блокировать, т.к директ трафика практически нет.

При второй части цикла (при целевом заходе) - это всегда поисковый запрос и на вашем сайте его уже не будет (если вы не выступаете в качестве человека, который старается стимулировать себе ПФ результаты).

Во всех других случаях - это нагул. И он - да, может быть (и чаще всего) прямой, может также идти через директ.

юни #:
Не понял этой фразы. Наверное, потому, что там нет пользователей и капча реже проходится?

Об этом я написал во второй части предложения, а в этой - я имел ввиду, что вручную часто блокируемые сети наверняка тоже рассматриваются как серые.


юни #:
Вообще, такой подход будет плохо работать на новых подсетях и/или типах трафика.

На новых - да, но свершенное действие - уже история, а историю можно (и в определённой степени) нужно анализировать.


юни #:
Думаю, что он анализируются не только по имеющейся истории, но и в реальном времени.

А вот это, пожалуй, самый интересный вопрос.

Какие данные собирает CF сервис после прохождения капчи - это действительно интересно. Никто не встречал разъяснительных материалов на эту тему?


юни #:
Как в антивирусах есть и база данных, и эвристика.

Не вижу повода не согласится, однако как уже сказал, пока пользователь не начал отправлять post данные, анализировать кроме формальных технических данных особо нечего. 

юни #:
Думаю, что сервисы капчи используют гораздо больше данных, чем просто информация из хуиза (частью которой является номер AS).

Я про это и говорю, что помимо фактических технических данных, которые доступны из протокола, сервисы типа CF используют свою историю (cвою аналитическую базу). И если в их базе большая часть заходов из отдельной AS имела большую часть отказов, то сервис помечает выбранную подсеть как серую и на старте направляет заходы из этой сети на капчу. Если процент прохождений капчи не растёт, то данная посеть так и остаётся в перечне серых.

Т.е. условная Битерика будет натыкаться на 100% капчу не потому, что мы про неё знаем из наших обсуждений на форуме, а потому что как раз пользователи сервиса её чаще всего блокируют и прохождение капчи там наверняка самый маленький процент.

А заходя с IP-шника домашнего провайдера CF знает про подсеть этого провайдера, что процент прохождения капчи там высокий, следовательно, нет необходимости каждый раз обрабатывать эти заходы через капчу.

Своего рода обучение, где белые подсети, а где серые.

Думаю, что скорее всего это работает так. Ибо логично и вполне резонно.

sagamorr #:
Если прошел, то он сохранится в метрике во внутреннем переходе (без ключа), накрутчику такой визит пользы не принесет.

Ммм.. смотрите.

Есть принципиально две различные стадии.

1) Стадия нагула - т.е. сбор куков и здесь накрутчику принципиально важно, чтобы был счётчик Яндекса.

Это могут быть прямые заходы, поисковые, реферальные.

Чаще всего прямые, потому что они избавляют от необходимости упираться в капчу Яндекса.

Поисковые конечно тоже используются, но позднее, когда профиль собран и уже необходимым образом "прогрет".

2) Стадия целевого захода, когда для эффективности накрутки важно использовать целевой поисковый запрос.

Вы сейчас про первое или про второе? 

юни #:
Очевидно, переходить к блокировке по другим признакам.

Хорошо, давайте поразмышляем, как это практически можно было применить.


юни #:
Т.е. от хуиза к анализу передаваемой информации (от заголовков, скриптов и прочих низкоуровневых данных и вплоть до поведения на сайте в целом).

Давайте с конца.

Поведение мы можем проанализировать лишь постфактум. Т.е. получив первую пачку get/post запросов мы можем анализировать лишь заголовки, выполнить js проверки - всё. 

Следовательно, на старте получив запрос от отдельного IP мы ничего не знаем про этого потенциального бота или пользователя.

СF, используя свою накопленную базу, может автоматически пропускать живого пользователя, а предположительного бота втыкать в капчу. Но это решение не на основе последующих данных, это решение на основе собранной статистики по отдельным случаям AS.

sagamorr #:
Возможно, что даже нет разницы прошел бот проверку или нет. Если не прошел, то он сохранится в метрике во внутреннем переходе (без ключа), накрутчику такой визит пользы не принесет.

Проверка выполняет до загрузки Метрики, поэтому если бот проверку не проходит, то он не попадает в Метрику и не получит куку Яндекса с этого сайта.

Вот одна любопытная деталь, я в группе накрутчиков спрашиваю,

группа почти 5K участников.

И знаете какой я сделал вывод из ответов? 

Большинство вслепую гоняют по сайтам готовыми программами и вообще многие слабо понимаю, что я такое спросил.

Из этого (и из моего первого сообщения) вывод - можно даже изначально показывать заглушку с самой просто капчей c отключенной Метрикой (на сомнительную подсеть) - боты будут бестолково ползать по заглушке. 

Большая часть "деятелей" банально тупо вслепую направляют ботов на выгул и отрабатывают на объёмы куков.

Вот, кстати, гайд, которые они любят друг другу перекидывать.  


sagamorr #:
Я понимаю, что домашний с прокси никак не связан, но теоретически ваша домашняя сеть может использоваться кем то для нагула профилей. Ее добавил владелец антибота в базу и теперь вам вылезает проверка.

Теоретически такое возможно, но года примерно полтора назад (может, больше, вас ещё не было на форуме) мы (и в частности я) - разбирали Антибот.

Я как раз приводил скриншоты и показывал, что Антибот просто отправляет всех на капчу и практические все участники обсуждения подтвердили, что - да, заходили под своими рабочими IP-шниками  и всем приходится разгадывать капчу.

При желании можно найти эту переписку, точно в ней участвовали Дима Алаев и Серафим, остальных сейчас не вспомню.


sagamorr #:
Можно не банить, а отправлять на проверку, если вы используете CF или что то подобное.

Ну вот и получается, что в итоге решает результат прохождения капчи, а не сервис. 

Впрочем, надо признать, что CF часть серверных проксей действительно жёстко банит (я с этим время от времени сталкиваюсь). 

sagamorr #:
Возможно ваша сетка "спалилась" и попала в базу.

Смотрите. Мой домашний IP-шник и мой рабочий компьютер он никак не связан с работой прокси - это отдельный компьютер. Вся работа с прокси идёт строго с другого компа, где другое железо и каждый рабочий вход начинает с процедуры проверки анонимности. Я провожу проверку под двум сервисам анонимности и если сгенерированная конфигурация не проходит проверку, последующие шаги невозможны (происходит это программно, поэтому человеческий фактор исключён).

Думаю, Антибот просто проверяет любого нового пользователя и перестраховывается капчей, вот и всё.

Но в этом случае мы просто может использовать капчу, как доп. проверку на роботность. 


sagamorr #:
Вот эта сеть AS25159 реально моб инет мегафона и сам попадал заходя с моб устройства на проверку. Но с нее помимо норм пользователей, еще куча ботов идет.

Вот о том и речь, что получается неразрешимая вилка, с одной стороны бот заходы с мобильных подсетей статистику и поведенческие, с другой стороны мы не можем банить эти точки входа, потому что оттуда возможен поток живых пользователей и клиентов. 

Всего: 12687