Тестирование новых файлов "на живую" и поисковая система Google

SerG757
На сайте с 07.02.2010
Offline
98
605

На одном из бложеков, проводились работы над сменой вёрстки, устанавливались новые скрипты, новый функционал и всё такое.

Для работ над главной страницей, в корне был создан файл index1.php , его я и мучил. После окончания всех работ, index.php был удалён, index1.php переименован в index.php

Google апнул, и... в поисковую базу влетел index1.php

Естественно, никаких ссылок на тестовый файл не стояло, пути к нему Google подобрал "пальцетыком"

Предполагаю, что эта машина подбирает вероятные адреса (которые чаще всего используются разработчиками) и проверяет.

Дальше, недавно обнаружил на одном проекте (не моём), что в индекс Google попала корневая директория, незакрытая (в неё попал от виндовозоской XP файл .db), т.е. понятно, она открывалась как папка на компьютере, и дальше, все незакрытые пути от неё, проиндексировались.

Предполагаю, что добрый Google помимо хождения по ссылкам, проверяет состояние директорий, т.е., если есть файл http://site.ru/papka/file.htm , то Google не поленится и проверит http://site.ru/papka/

Будьте внимательны, Google может содержать в индексе уязвимость, мусор и недоделки, дубликаты страниц.

Оптимизатор - от слова ОПТИМИСТ. Как неизлечимый яндексоид, вам говорю...
ewg777
На сайте с 04.06.2007
Offline
225
#1
Разработка сайтов в Ростове-на-Дону Качественно, индексируемо

В чём проблема?

SerG757
На сайте с 07.02.2010
Offline
98
#2
ewg777:
В чём проблема?

Никаких проблем, не совсем понимаю к чем пост? Есть неприятное явление, уведомляю разработчиков.

ewg777
На сайте с 04.06.2007
Offline
225
#3

SerG757, как бы классика. Откуда эти? Аналогично. "Тестирование 'на живую'" дурной тон.

SerG757
На сайте с 07.02.2010
Offline
98
#4
ewg777:
SerG757, как бы классика. Откуда эти? Аналогично. "Тестирование 'на живую'" дурной тон.

Или лень. В общем, практически любая самописная кухонная работа, имеет массу недоработок и хлама. Настоятельно рекомендую, отладку производить не на рабочем серваке, и перед заливкой повырезать мусор, пока его Гугл не нашёл. Сам увидел - опешил, делаю генеральную уборку.

unlimbox
На сайте с 03.01.2008
Offline
56
#5

У вас тулбар от гугла установлен?. Полагаю, что да. Вот он и есть причина попадания в индекс вашей страницы.

Предполагаю, что эта машина подбирает вероятные адреса (которые чаще всего используются разработчиками) и проверяет.

Это полный бред, извините. Все бы тогда наблюдали в статистике серверов 404 ошибки генерируемые Гуглом при таком "подборе".

JamBlog.ru (http://jamblog.ru)
SerG757
На сайте с 07.02.2010
Offline
98
#6
unlimbox:
У вас тулбар от гугла установлен?. Полагаю, что да. Вот он и есть причина попадания в индекс вашей страницы.

Это полный бред, извините. Все бы тогда наблюдали в статистике серверов 404 ошибки генерируемые Гуглом при таком "подборе".

Установлен, слона то я и не заметил... Ошибки он отфильтровывает по любому, с подбором я поэкспериментирую, отпишусь через пару недель.

unlimbox
На сайте с 03.01.2008
Offline
56
#7
Ошибки он отфильтровывает по любому

Как он их фильтрует - это его личное дело. Я же имел в виду, что в логах вашего (нашего да, любого) сайта (сервера) будут 404 ошибки при "непопадании" Гугла в "подбираемую" страницу

SerG757
На сайте с 07.02.2010
Offline
98
#8
unlimbox:
Как он их фильтрует - это его личное дело. Я же имел в виду, что в логах вашего (нашего да, любого) сайта (сервера) будут 404 ошибки при "непопадании" Гугла в "подбираемую" страницу

Вкурил, всё правильно, спасибо:)

Никогда бы не подумал, что надстройка сливает журнал. Удивительно, как это антивирус терпит.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий