AVV

AVV
Рейтинг
84
Регистрация
31.07.2006
Talyma5:
Что лучше - пробел или спецсимвол пробела?

Иногда неразрывный пробел бывает необходим.

Кстати, вместо него можно использовать <nobr></nobr>.

На продвижение никак не влияет. Так же как и др. спецсимволы, например, &lt; &gt; &laquo; &raquo; и т.п.

--

burunduk, в указанном вами примере, на страницах сайтов используется nbsp; ( без & ), а также &amp;nbsp; ( а не &nbsp; ), поэтому Яндекс и проиндексировал. Т.е. html-код неправильный там, с ошибками.

Делаем вывод: П.Щукин и модератор Яндекс каталога - одно и то-же лицо.

Един в двух лицах. ;)

dj_maxx:
В общем сделал примерно так как описано выше, имеем следующий файл robots.txt
http://solomenka-ix.org.ua/robots.txt

Сегодня утром зашел Яндекс, прочитал файл и ушел. Что опять не так?

http://solomenka-ix.org.ua/robots.txt

А где файл то, robots.txt?


HTTP/1.1 404 Not Found
Server: nginx/0.5.17
Date: Mon, 09 Jul 2007 05:08:05 GMT
Content-Type: text/html
Connection: close
Last-Modified: Sun, 25 Jun 2006 13:41:31 GMT
ETag: "8d8195-c37-9f9178c0"
Accept-Ranges: bytes
Content-Length: 3127

Было уже такое, примерно в прошлом августе-сентябре. Может еще когда.

Если поискать на форуме, когда то уже была такая тема.

Глюк. Быстро проходит.

Drbel:
Такой ответ нормальный:
"GET /about.html HTTP/1.1" 200

200 - значит нормальный.

Коды ошибок WEB-серверов:


Коды второго класса (2xx) возникают, когда запрос успешно принят и понят сервером.

200 - ОК.
201 - Created. Объект создан.
202 - Accepted. Информация принята.
203 - Non-Authoritative Information. Не заслуживающая доверия информация.
204 - No content. Нет содержания.
205 - Reset Content. Восстановить исходное содержание.
206 - Partial Content. Частичное содержание.

Коды третьего класса (3xx) сообщают о перенаправлениях; чтобы выполнить запрос нужны еще какие-то действия.

300 - Multiple Choices. Несколько вариантов на выбор.
301 - Moved Permanently. Ресурс перемещен на постоянной основе.
302 - Moved Temporarily. Ресурс временно перемещен.
303 - See Other. Смотрите другой ресурс.
304 - Not Modified. Не изменился.
305 - Use Proxy. Используйте прокси-сервер.

Коды четвертого класса (4xx) сообщают об ошибках клиента, т.е. о том, что проблема связана не с сервером, а с Вашими запросами.

400 - Bad Request. Некорректный запрос.
401 - Unauthorized. Нет разрешения.
402 - Payment Required. Требуется оплата.
403 - Forbidden. Доступ запрещен.
404 - Not Found. Ресурс не найден.
405 - Method Not Allowed. Недопустимый метод.
406 - Not Acceptable. Непреемлимый запрос.
407 - Proxy Authentication Required. Необходима регистрация.
408 - Request Timeout. Время обработки запроса истекло.
409 - Conflict. Конфликт.
410 - Gone. Ресурса больше нет.
411 - Length Required. Необходимо указать длину.
412 - Precondition Failed. Не выполнено предварительное условие.
413 - Request Entity Too Large. Запрашиваемый элемент слишком велик.
414 - Request-URI TOO Long. Идентификатор ресурса слишком длинный.
415 - Unsupported Media Type. Неподдерживаемый тип ресурса

Коды пятого класса (5xx) сообщают об ошибке на сервере (к этим ошибкам Вы не имеете отношения).

500 - Internal Server Error. Внутренняя ошибка сервера.
501 - Not Implemented. Функция не реализована.
502 - Bad Gateway. Дефект шлюза.
503 - Service Unavailable. Служба недоступна.
504 - Gateway Timeout. Время прохождения через шлюз истекло.
505 - HTTP Version Not Supported. Неподдерживаемая версия HTTP.

У меня стоит автоматическая пересылка с ящика на yandex.ru на ящик на мэйле, так почта доходит.

BigBrother:
Дело в том, что если робот видит наличие robots.txt, но не может получить его содержимое - он, по понятным причинам, считается запрещающим.

Т.е., если Яндекс не смог по каким-то причинам прочитать robots.txt, или же правильно его обработать, то сайт проиндексирован не будет (что, кстати, противоречит стандарту исключений для роботов).

Не в этом ли заключается причина периодического массового выпадения сайтов из индекса? ;)

BigBrother:
Дело в том, что если робот видит наличие robots.txt, но не может получить его содержимое - он, по понятным причинам, считается запрещающим.

Почему считается запрещающим?

Стандарт исключений для роботов:

http://www.robotstxt.org/wc/norobots.html


The presence of an empty "/robots.txt" file has no explicit associated semantics, it will be treated as if it was not present, i.e. all robots will consider themselves welcome.

Отсутствие файла или пустой файл robots.txt равнозначно разрешению любому роботу индексировать весь сайт полностью.

--

И потом, как это так:


видит наличие robots.txt, но не может получить его содержимое

Ведь если бот получил ответ сервера при запросе файла с кодом ошибки отличным от 200, то, ясное дело, он файл не видит, а если с ответом сервера 200ОК, то содержимое файла он, естественно, уже получил.

Genn@diy:
обычно папка Logs в корне виртуального сервера

Да, но только иногда, нужно ее (logs) создать самостоятельно. Потом в нее будут писаться логи.

brait:
Кстате я про это подумал, может и в этом быть причина, хотя таких сайтов куча.

brait, конечно, не должна по-логике в этом быть причина, но лучше подстраховаться, тем более, что это не займет много времени, и, к тому же, улучшит параметры глубины индексации.

Всего: 3259