Благодарю, будем знать...
А за какой не забанят?
А вот интересно, будут ли банить вот такой извращенный редирект?
<BODY onLoad='document.forms[0].submit()'>
<FORM action='.../index.html'>
</FORM>
может чего-то не точно по памяти указал, но в оффлайне это у меня работало. А вообще интерес чисто академический, нужды в редиректе пока нет.
Не поленился, поискал "документ pdf" - запрос, может не самый удачный, но если посмотреть несколько страниц, то можно увидеть, что pdf'ов проиндексировано апортом немало. Очевидно, по тексту ссылки. Так что разницы то может и нет?
Нет, ошибся я, зип есть.
Но нафига он его все-таки индесирует?
Ну я согласен, что у меня необязательно дело было в редиректе. Просто чистка кода и полноценная индексация произошли друг за другом, и связь между ними как-то напросилась.
Мне непонятно, какая разница поисковику между пдф и зипом, он не должон индексировать ни того, ни другого.
А общий вывод, который напрашивается, у Апорта есть глюк, когда вместо HTML-страниц, индексируется "левый" файл, потому что теперь этого зипа НЕТ в списке проиндексированных страниц.
Вопросик такой у меня: даты, указанные в "оценке доступности" (она по нажатию кнопочки апортовской выдается) связаны с посещениями робота (к сожалению, доступа к логам сервера у меня нет)?
Ostmaster: у меня было то же самое, но с зипом :). Вылечилось убиранием с одного из фреймов js-редиректа. А убрал после того как ине прислали следующее:
Порядок индексации и ограничений на индексацию сайтов поисковым роботом Апорта:
Поисковый робот Апорт не индексирует и не видит:
- ссылок, сделанных через javascript, флэш или форму (select и т.п.). Соответственно, страницы, на которые можно попасть только по таким ссылкам не индексируются.
- индексирует динамические страницы или страницы, содержащие символ “?” в адресе в ограниченном для каждого сайта количестве. Размер квоты зависит от конкретного сайта (в частности, от его индекса цитируемости) и может, в частности, быть нулевым.
- не индексирует страниц, содержащих в адресе символы “%” и “#”
- не индексирует страницы в кодировках Macintosh 10007 (Mac), IBM 866 (DOS), ISO 8859-5 и UTF8 (Unicode), а также страницы в неопознанных кодировках (последнее не касается страниц на украинском или белорусском языке и языках, использующих преимущественно латинский алфавит).
- отсеиваются страницы в испорченной кодировке и страницы, на языках, сильно отличающихся от русского и использующих при этом нелатинский алфавит
- отсеиваются страницы, которые выходят за пределы сайта (домена)
- отсеиваются редиректы начальных страниц
Спасибо за ответы!
Ну, в Апорте работатает бегун, так что он не особо интересует, да и вопрос звучит так, в другой формулировке:
не будет ли это воспринять как спам и забанено?