- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
VK приобрела 70% в структуре компании-разработчика red_mad_robot
Которая участвовала в создании RuStore
Оксана Мамчуева
Зачем быть уникальным в мире, где все можно скопировать
Почему так важна уникальность текста и как она влияет на SEO
Ingate Organic
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Если индексатор яндекса просит контент по протоколу HTTP/1.1 а ему в ответ уходит HTTP/1.0 (что не противоречит RFC и спокойно проглатывается другими поисковиками) - яндекс индексировать сайт не будет.
Проблема засечена на IIS, который без определенных ключей в реестре может ломать выходящие с сайтов заголовки принудительно проставляя HTTP/1.0.
Технические причины подобного поведения сервера нужно смотреть в каждом случае отдельно, но для тех кто пользует ActivePerl в ISAPI варианте (естественно под IIS) - я написал пост на selectcms.ru, поскольку тут это будет мало кому интересно (Perl-овщиков мало).
Думается, тут дело не в версии протокола, а в content-type.
Ключ реестра HKEY_LOCAL_MACHINE\SOFTWARE\ActiveState\PerlIS\EnableCGIHeader по умолчанию отсутствует, но по поведению скриптов он =1.
Тест под Windows 2000 server:
1. EnableCGIHeader - отсутствует (или = 1)
в бродилке:
заголовки
2. EnableCGIHeader = 0
в бродилке:
заголовки
Что и следовало ожидать - если выключаете заголовки, делайте их сами :)
Но при отсутствии ключа в реестре они включены.
PS. На вашем в блоге в файрфоксе ссылки "читать полностью" не нажимаются - перекрыты каким-то слоем, вероятно %)
/updated/
Yandex-I - один из немногих ботов, который передает хедер Accept. Вот такой:
и в этом случае вполне может получать вместо 200 OK - 406 Not Acceptable
Да в том то и дело что вроде бы не в Content-type, его перелопатили давно. Проблема не в отстутствии ключа в реестре, с этим все понятно, поведение действительно как =1. Проблема в том, что при этом ключе HTTP/1.1 выдаваемое вручную будет переписано поверх! А об этом нигде не сказано.
Собственно сама ситуация не важна, как заголовки формируются. Важно, что робот не кушает страницы если ему отвечают HTTP/1.0 в ответ за запрос.
PS: То что яндексу можно 406 выдать это занятно, но вопрос только в том как он это интерпретирует. Сомневаюсь, что он будет делать перезапрос с другими параметрами. Негибкий он какой-то. Без Date тоже может страницы не есть. С неправильным Content-length ничего не ест. И так далее. При этом все другие боты менее жестки в требованиях - интернет бывает разный, чего не встретится только на его просторах.
Да в том то и дело что вроде бы не в Content-type, его перелопатили давно. Проблема не в отстутствии ключа в реестре, с этим все понятно, поведение действительно как =1. Проблема в том, что при этом ключе HTTP/1.1 выдаваемое вручную будет переписано поверх! А об этом нигде не сказано.
Earlier versions of Perl for ISAPI did not output headers correctly, and this caused Perl for ISAPI scripts to misbehave. You could work around this in earlier versions of PerlIS by sending the headers at the beginning of your script like this:
print <<"END";
HTTP/1.0 200 OK
Content-Type: text/html
END
This is no longer necessary with the current version of Perl for ISAPI, as Perl for ISAPI sends the correct headers. The Registry value that governs this is EnableCGIHeader, a REG_DWORD value that is set to 1 by default. This value is stored under the Registry key HKEY_LOCAL_MACHINE\SOFTWARE\ActiveState\PerlIS. If you need to turn off the automatic generation of the header, set this value to 0.
Собственно сама ситуация не важна, как заголовки формируются. Важно, что робот не кушает страницы если ему отвечают HTTP/1.0 в ответ за запрос.
У меня на всех серверах HTTP/1.1 - там практически везде host-based виртуальные хосты, которые по HTTP/1.0 недоступны как класс (хедер Host - это HTTP/1.1). Все кушает нормально.
PS: То что яндексу можно 406 выдать это занятно, но вопрос только в том как он это интерпретирует. Сомневаюсь, что он будет делать перезапрос с другими параметрами. Негибкий он какой-то. Без Date тоже может страницы не есть. С неправильным Content-length ничего не ест. И так далее. При этом все другие боты менее жестки в требованиях - интернет бывает разный, чего не встретится только на его просторах.
Ну как он может интерпретировать 406? Как все 40х статусы - не индексирует и все. На форуме была тема по этому поводу - апач с MultiViews возвращал 406.