- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
В 2023 году 36,9% всех DDoS-атак пришлось на сферу финансов
А 24,9% – на сегмент электронной коммерции
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
В данном случае, когда на ресурсе 15к страниц и обновляемость <=20% страниц в месяц, роботс.тхт распухнет...
И через роботс.тхт будет не отследить - можно ли эту строку в нем удалить или еще нет.
При удалением через форму - Яндекс требует, что бы сервер вернул... 404 код для данного URL.
Круг замкнулся.;)
а вам то что на размер роботса???
блин... это же не главная страница ;-)
я вот встречал и роботсы по 10, и .htaccess по 100 с лишним килобайт и ничего - работает...
А вы в этой идее уверены?
Если Вы дадите четкое обоснование, что после ответа, что данной страницы НЕТ на сервере, НЕОБХОДИМО(!) повторять эти проверки еще какое-то время, то я от этой идеи откажусь. И, следует учесть, что такие повторы по 404 ответам "захламляют" Базу Данных, увеличивают расход трафика для ПС, на "выпуклый глаз" прикинуть общее кол-во таких ответов в Рунете...
Логичным будет вопрос: - А на кой этот "хлам" Яндексу?
Что это за база такая? Что в ней хранится вместе с URL? По каким причинам, как вы думаете, её откатывать бы стали?
Прошу прощения... Не знаю в каком ключе ответить.
Буду говорить, с точки зрения, что Вы хорошо знакомы с СУБД.
База, физически, не одна. Так как структура ПС требует разделения всей информации на "логические" блоки, для увеличения скорости работы.
Таким образом, допускаю, что есть БД, в которой хранится информаци о ресурсах:
список известных ПС URL ресурса, дата индексации, контент URL и т.п.
Есть "поисковая" БД, в которой и происходит сам поиск.
Так как размер БД велик, то вполне допустимо, что она разделена физически и размещена на разных серверах...
- Какой процент безвозвратной потери информации, на Ваш взгляд, допустим для Яндекса?
5%? 10?.. 20?... 50?... А для критически важных вещей - есть и должен быть бекап.
Пс. Правлю орфографию....
а вам то что на размер роботса???
блин... это же не главная страница ;-)
я вот встречал и роботсы по 10, и .htaccess по 100 с лишним килобайт и ничего - работает...
Ну... - А зачем "напрягать" роботов? Сваливать на них свои "грехи"...
Или по принципу: - он железный, вот пусть и работает? :D
ИМХО: - За роботс.тхт > 1к - ресерс можно "отстреливать". ;)
Ну... - А зачем "напрягать" роботов? Сваливать на них свои "грехи"...
Или по принципу: - он железный, вот пусть и работает? :D
ИМХО: - За роботс.тхт > 1к - ресерс можно "отстреливать". ;)
ну просто у него работа такая... понимаете ;-) мы его не напрягаем, а направляем...
зато один раз прочитав роботс, он не будет читать по 1000 несуществующих страниц по несколько раз...
Еще раз подниму тему.
Фигняс получается с роботом Яндекса!
В ФАК-е Яндекса сказано:
http://webmaster.yandex.ru/faq.xml?id=502499#redirect
Как требует стандарт протокола HTTP, Яндекс, получив в заголовке ответа информацию, что данный URL является редиректом (коды 3хх), добавит в список адресов для обхода URL, на который ведет редирект. Если редирект был постоянный (код 301), либо на странице встретилась директива refresh, то старый URL будет исключен из списка обхода.
(Выделение мое.)
Так вот, на "404-й странце" как раз и есть мета-тег "refresh"...
То есть: либо робот действует не описано, либо...