Вот что ответил Платон:
"Здравствуйте, Константин!
Сейчас указанная Вами страница возвращает 301 перенаправление, этого вполне достаточно для ее удаления из поиска. В этом случае робот должен повторно переобойти страницу, отследить, что с нее идет редирет, после чего она пропадет из поиска. Однако переобход всех подобных ранее проиндексированных страниц может занять достаточно длительное время. Рекомендую Вам запретить их индексирование в файле robots.txt, в этом случае подобные страницы пропадут из поиска достаточно быстро - после 2-3 обновлений поисковых баз. Также это позволит ускорить обход доступных и более полезных страниц Вашего сайта.
Подробнее о файле robots.txt Вы можете прочитать на странице нашей помощи: http://help.yandex.ru/webmaster/?id=996567
С уважением, Платон Щукин
Служба поддержки Яндекса
http://help.yandex.ru/"
Но в роботсе у меня есть такая строка:
Disallow: /templates
Т.е. вроде бы и закрыта эти говностарые ссылки...
Katran-1, понимаешь, у нас тоже стояла Джумла и там тоже были такие ссылки (помимо этих говноссылок с tamplates) типа .ru/index.php/2011-07-06-12-01. Но это были ссылки на полезную инфу на нашем сайте и после заливки нового сайта на ВП эти ссылки примерно через недельку выпали из кеша робота и из индекса без моего вмешательства.
А вот те templates до сих пор висят в кеше, и постоянно сыпятся из него в индекс (непонятно почему, да и в роботсе эти ссылки закрыты)...
Как я понял из всего происходящего - единственный выход из-за пакостей предыдущих "админов" это удалять все эти ссылки вручную как я и делал. 1200 уже удалены, осталось еще примерно 7000...
Пачкой эти ссылки, я так понял, с кеша Яндекса их не выбросить.
Меня тоже интересует ответ на этот вопрос. Вчера написал Платону, жду, что он ответит.
Вот снова вывалилась очередная порция этих говно-ссылок в индекс Яндекса...
Вот пример: uwbs.ru/templates/index/index.php?data=6436 (запрос- "Скачать лицензию для eset nod32 4.0.437.0 russian").
Что же это за наваждение-то такое?! И так изо дня в день! Пишу Платону...
Мне нужно, чтобы эти 8 с лишним тысяч говно-страниц, которые в памяти у робота Яндекса, не вываливались периодически в индекс. Чтобы в индексе были ровно те страницы, которые есть в реальности на нашем сайте (их 132 штуки, файл sitemap.xml есть - загружен и обработан роботом).
А эти выпадания в индекс старых говно-страниц происходят регулярно. Я их вручную удаляю из индекса, они исчезают, затем спустя какое-то время (3-4 дня), выпадают новые эти плохие страницы. Выпадает их понемногу - по 20-50 штук. Вот таким способом я уже избавился от примерно 1000 страниц. Но эти выпадания продолжаются. И на наш сайт периодически заходят люди с ПС именно по этим говно-запросам.
Я вчера в первом посте привел один из примеров ключевой фразы по которой к нам заходят - Скачать ulead mediastudio pro 8 rus - и еще вчера она была в индексе. Но я ведь удаляю периодически такие страницы. Вот сегодня она удалилась из индекса (робот Яндекса заходит к нам на сайт почти каждые 2 дня, вон и вчера заходил), хотя сервер по прежнему дает на нее ошибку 301, вместо 404.
Я бы не бил тревогу, если бы к нам на сайт не заходили люди по таким плохим запросам, и если бы другие старые страницы с нашего старого сайта тоже бы давали 301 ошибку. Но! Старые ХОРОШИЕ страницы с предыдущего сайта дают ошибку 404! Вот пример - http://uwbs.ru/shop?page=shop.product_details&flypage=flypage.tpl&product_id=18&category_id=1
Вот я и чешу репу 😕. Не знаю как это все победить. А то я уже не знаю, что отвечать гендиректору на вопрос и том, по каким ключевым словам к нам заходят. И это все притом, что я почти полный ноль в СЕО (недельку только читаю этот форум и несколько блогов).
LEOnidUKG, SeVlad, спасибо, ребят, за ответы. Вообщем, попробую перекинуть сайт на другой хостинг и посмотреть, как он себя будет там вести. У меня давно были подозрения, что нашим серваком давно никто не занимается...
Почему тогда в сервисе проверки ответа сервера в Я.ВМ пишется ошибка 301 (я привел ответ сервера в предыдущем посте)? На другие-то несуществующие страницы на этом же сервисе выдается 404... Кому верить?
Есть еще такой момент.
В памяти робота Яндекса висит около 8000 страниц (именно тех плохих страниц, не проиндексированы, просто висят). Новый сайт имеет всего 132 страницы. Так вот, я вручную удаляю эти плохие страницы, так как они периодически вываливаются в индекс Яндекса. Можно ли как-то махом сразу удалить все это Г из памяти робота? Или так и убирать это постоянно выпадающее Г?
Я не особо разбираюсь еще. Но вот ответ сервера на плохую ссылку, приведенную выше:
Код статуса HTTP: "301 Moved Permanently" ?
Время ответа сервера: 320мс
IP сайта: 195.91.189.253
Заголовки:
X-Pingback: http://uwbs.ru/xmlrpc.php
Content-Length: 0
Expires: Wed, 11 Jan 1984 05:00:00 GMT
Last-Modified: Thu, 26 Jul 2012 05:02:26 GMT
Location: http://uwbs.ru/templates/index/?data=3414
Set-Cookie: qtrans_cookie_test=qTranslate+Cookie+Test; path=/; domain=uwbs.ru
Connection: keep-alive
Server: nginx/1.0.12
X-Powered-By: PHP/5.3.14
Cache-Control: no-cache, must-revalidate, max-age=0
Pragma: no-cache
Date: Thu, 26 Jul 2012 05:02:26 GMT
Content-Type: text/html; charset=UTF-8
Кодировка: utf-8
Размер страницы: 0Кб
Вот, что написано в .htaccess:
# BEGIN WordPress
<IfModule mod_rewrite.c>
RewriteEngine On
RewriteBase /
RewriteRule ^index\.php$ - [L]
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule . /index.php [L]
</IfModule>
# END WordPress