Всё уже было сказано неоднократно. Доступы везде закрыты, чтобы скрыть военную тайну.
Так что реально у нас есть только один показатель - сколько Дима приведет лидов.
Сейчас мы ждем пока Таня совершит манибек, потом (если вдруг она хоть в этом сдержит свое слово) будем ждать пока пойдут первые объявления в продакшн, пойдет первый траф, потом открутится бюджет, и уже тогда будет видно.
Всё что пишет или не пишет Дима это лишь развлечение для поддержания интриги ибо результаты будут ой как не скоро.
Хотите Танины ошибки? Просите у нее доступы. Лена которая заплатила за танины эксперименты бюджетом - не против чтобы вы их изучали. Таня заплатившая своим опытом навыками и знаниями </сарказм> против изучения ее ошибок ибо всё сделала правильно.
Ну я к этому и вел собственно.
Интуитивно-очевидная версия тут: поскольку в поиске он часть опечаток и ошибок исправляет а часть нет, то часть ошибок он будет воспринимать отдельными словами и в контексте должна быть такая же картина, а поскольку у данного конкретного слова (манЕкюр) есть своя частотность и что важнее - цена, то логично сделать вывод, что в данном случае оно таки не распознается как одно слово.
Чисто по опыту когда писал/разбирал_чужие орфографические проверки, то слова обычно разбирают на три группы - правильные слова, известные по словарю (лично я предпочитаю пхпморфи, если нет спец.требований), известные опечатки/ошибки (те кто есть в словаре с пометкой "опечатка" или другой морфемой вроде "груб."), неизвестные слова.
Бывают вариации уточнения (например разбор морфологической омонимии может из первого списка известных верных слов выделить "возможные опечатки", или признание опечаткой слова которое имеет малое "расстояние", от правильных слов), но общую картину это не меняет.
Когда мы разделили слова на группы, нам нужно принять решение - кого как воспринимать.
В простейшем случае мы подчеркиваем то что точно ошибочно, а также то что мы не знаем.
Так работает ворд, так работает истио, да и большинство спелчекеров.
А вот исправление опечаток у ПС и контекста ведет себя по разному. В простейшем случае даже подозрительные вещи проще не исправлять а оставлять в исходном виде или лишь предлагать исправление.
Ведь если серпе мы можем отменить ошибочное исправление, то в контексте кому его отменять? искомому клиенту? вебмастеру?
К чему так много букв?
Не знаю. Увлекся) Ну пусть это будет приквелом к следующему замечанию:
Если уж роботу сложно решить что делать с опечаткой/неграмотностью, то что на счет человека?
Знаю два рекламных кейса (оффлайн) когда рекламодатель (в одном случае я, во втором новые хозяева того-же магазина) намеренно совершал ошибку, и это увеличивало отдачу от РК в несколько раз.---------- Добавлено 26.09.2016 в 19:19 ----------Да, и еще, к этому:
Сколько работал с опечатками (например в древности я еще и домейнером был, с тайпом работали), но никогда не разделяли ошибки и опечатки. глубоко в статистике оно конечно бывало, ибо что-то бывает чаще, что-то реже, но ИМХО грамнаци это уже эмоциональная оценка)
Это тоже заметил, но не был уверен в собственной грамотности.)
Если опечатки автоматом исправляет, то почему статистика разная и разная цена/прогноз? Не настаиваю, спрашиваю всерьез.
Ясно же что опечатка на картинке а не в СЯ.
Все-таки трафик на три порядка отличается. Но вообще подобная опечатка тоже имеет право на место в списке ключей.
Печалька. По сути - любой у кого есть вторая версия уязвимости (без файла) может слить, и что еще хуже - изменить чужую БД на том же сервере что и у него.
Так в чем уязвимость? Расширение прав пользователя БД и доступ к чужим БД, или расширение прав в системе? Если второе, то я так понимаю возможно оно в сочетании с плохой настройкой системы в целом, что сокращает масштаб трагедии.
Не то, чтобы кривые системы были редки, но их таки меньше чем всех шаредов.
Лучше для кого и для чего?
Вы пишите глупость.
Если комментарии на отдельной странице, и ЦА не стадо бизонов, и комментарии модерируются, то как правило комментарии будут только в плюс ибо содержат непредсказуемый тематический контент. Да, есть частные случаи когда лучше закрыть, но вот так вот без контекста давать категоричный совет признак вашего явного ламерства.
любой поисковик.
характерные словосочетания в кавычках и хоть тысяча сайтов.
Если бы не юкос, то можно было бы много чего сделать.
Сайт на чужом хостинге? Т.е. у них IP не здешний?
Тогда манипуляции с ДНС отпадают.
Контент меняется моментально? Значит проксируют. Все запросы через CURL или еще как - дублируются на ваш сайт, и отдается содержимое.
Не знаю что можно сделать на этом "юкосе", но попробуйте забанить IP того сайта, а лучше всю сетку.
В идеале конечно было бы открыть новую страницу на клоне и сразу глянуть в аксесс.лог, но это ведь юкос, не уверен что там есть логи доступные клиенту.
В общем, если вы ничего не напутали в ваших показаниях, то диагноз однозначный - все запросы на клон.жп/папка/страница.хтмл вызывают запрос на жертва.юкос.ру/папка/страница.хтмл и возврат ответа в браузер. Убьете парсинг, убьете клона.
Или индекс (в прямом смысле слова, т.е. да, ссылки на вложенные страницы), или 404. Тут выбор не велик. Индекс обычно лучше. Потому что не хуже, и дает полезную информацию - ссылки на страницы. И человека приведет, и робота.
Но лет семь назад мы зачем-то делали вариант с 404. Не вспомню уже целей) Или клиент хотел чтобы в хлебных крошках ссылка была неактивной или еще что-то. В общем не вижу проблемы если ссылка которая нигде не указана никуда не приведет (404). Наказывать за это не будут. Как и за ссылки на другие внутренние страницы.