Lazy Badger

Lazy Badger
Рейтинг
250
Регистрация
14.06.2017
olega81:
А если оставить только нужные страницы - свои, а ересь убрать, то как не получить 404 ответ. Или придется все 3000 спамных страниц загонять в no index?

Просто - ничего не делать. Эти "страницы" все получаются из главной добавлением GET-параметра ?zuz= - в интерфейсе таких ссылок нет, появились они за счет того, что кто-то где-то снаружи сделал такие ссылки и они были проиндексированы. Ну будут эти ссылки давать 404, потом вывалятся из индексов (Гугель говорит так), можно еще до кучи заблокировать в robots.txt "*?zuz=*" (вроде так, если что - тут меня поправят) и скормить все левые урлы в "Удаление URL" в Яндесовом Вебмастере (та не более 500 день, да и из индекса вывалятся не сразу, а с ближайшим апдейтом индекса, так что не быстрее, чем с 404)

Не думаю, что гугель эти ссылки где-то как-то для полезного учитывает, но можно их до кучи, пока в индексе, еще и дезавуировать (надо ли - не уверен, а возни - много)

olega81:
Посоветуйте, пожалуйста, этот "любой" парсер для 250 страниц, коих содержится на нашем сайте.

Их 224 (проверял), ну и с парсерами мне подсказать сложно - я старорежимный, мне wget хватает последние дцать лет. Тут кто-то из аудитории может предложить скорее что-то лучше, чем вот такое (не проверял, не смотрел, не знаю)

Да любой красноглазик на КВорке за 500 рублей сделает копию и не будет грузить проблемами

Romanov Roman:
Почему на первую?

Потому что это лучший из возможных методов удовлетворить требования обеих нужных ПС

У большинства сайтов-конкурентов каноникал идёт сам на себя.

Потому что

- самореферентный каноникал бесполезен чуть менее, чем полностью

- если это (простихосподя) WP, то "каноникал на себя" это стандартное поведение (не помню, корки или Yoast), которое многие забывают исправить - обычно не мешает ничем и неприятно только на страницах пагинации

Romanov Roman:
Мало у кого реализована кнопка Аякс "загрузить ещё".

Потому что эта кнопа - нехорошо для спайдеров-индексаторов, в отличие от людей

Romanov Roman:
Я решил последовать их примеру.

Неправильное решение, реально ошибочное

Romanov Roman:
Прочитал статьи, той же ТексТерры, которая также не рекомендует закрывать постраничную навигацию от индексации роботом.

Не читайте текстерру, это вредно. Не знаю, какие у них молчащие исполнители конечные, но в воих публикациях она несет такой лютый бред, что страшно иногда становится:

Если просто "не закрывать" и ничего не делать - то будет плохо, и в статейниках, и особенно - в ИМ. А что делать - все поют немного по разному

Dmitriy_DA:
Т.е. если сайт будет на поддоменах, то каждому поддомену можно будет указать отдельный регион в вебмастере?

Не "можно", а "нужно"

SeVlad:
Ну тут ты не прав. RiDDi достаточно компетентен во многих вопросах.

Так я и не стебусь в остальных вопросах, только в том единственном, что инфобезопасник из него так себе (при том, что про физбезопасность излагает достаточно внятно, а прочего - просто не видел и посему не критикую)

Если netstat еще до кучи покажет, что на 3306 на внешнем интерфейсе LISTEN, то искать - кто по дороге от клиента до сервера фильтрует порт (хостер это может делать легко и непринужденно на бордере у себя, пров клиента не выпускать наружу, если это кастомерская сетка)

SeVlad:
Надежда на эффект неуловимого Джо в безопасности - одна из самых дорогих ошибок.

Не мешай "молодому прогрессивному" самостоятельно пробежать по граблям. Товарисч ну очень хочет

SeVlad:
Тот случай когда неуловимый Джо попал таки в засаду

Я, пожалуй, буду посылать в этот топик активно топящих за "надо лепить самописы, чтобы было все по фэншую" сектантов

olega81:
Не знаю, насколько они важные. Посмотрите, пожалуйста.

Все 11 "ошибок" - откровенно ерунда, и там написано, как лечится большая часть их (если возможность менять шаблон еще осталась) - на примере самой первой

<meta http-equiv="Content-Type" content="text/html; charset=windows-1251" />

For the current document, the validator interprets strings like <FOO /> according to legacy rules that break the expectations of most authors and thus cause confusing warnings and error messages from the validator. This interpretation is triggered by HTML 4 documents or other SGML-based HTML documents. To avoid the messages, simply remove the "/" character in such contexts



---------- Добавлено 18.06.2019 в 08:38 ----------

olega81:
4 месяца нет на месте

Это был (непрозрачный) намек на то, что нанимаете постороннего исполнителя на задачи"понять чужой код, навтыкать костылей, сопровождать далее, очистить от вирусного инжекта установленный сайт". Это может быть 1 или 2 разных человека, ибо специализация несколько разная - программер и безопасник

А если по уму и разумно распорядиться бюджетом - то

* сохранить сайт (любым парсером) полностью - с содержанием ваших страниц и структурой

* сделать его по новой, на коробочной CMS и как минимум в дизайне 2019 года, а не 2009

Не туда смотреть надо. Сайт давно потерял невинность и водится на нем какая-то гадость. Достаточно посмотреть хотя бы первую страницу выдачи.

Это - проблема, а то, что говорит валидатор, - вообще не вопрос, с таким-то DOCTYPE

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">

и прочим соответственно шикарным (для 2009 года)

<meta http-equiv="Description"...
<meta http-equiv="Keywords"..
<meta http-equiv="X-UA-Compatible" content="IE=EmulateIE7" />
altezzik:
Что обосновать?

Ничего. "обоснуй" - это существительное, а не глагол в повелительном наклонении, означает "дополнительная информация в подтверждение высказанного тезиса"

Всего: 3030