Вылетели страницы из индекса Google

SS
На сайте с 26.10.2011
Offline
7
1018

Ситуация такая: на старом сайте (около 8 лет) вылетели страницы из индекса Google. Было больше миллиона - стало двести тысяч с гаком. В Яндексе все осталось на месте. Единственное, что делалось - это был переписан robots.txt. Там все стандартное, единственно, что появилось - Crawl-delay: 10

Вот я думаю, может таймаут выставлен неправильно? Или это не может быть причиной?

series60
На сайте с 03.02.2009
Offline
92
#1

В любом случае, вы ответили на свой вопрос =)

вылетели страницы из индекса Google.
Единственное, что делалось - это был переписан robots.txt.
Keep moving
На сайте с 20.10.2009
Offline
94
#2

Покажите сайт или хотя бы ваш роботс.

SS
На сайте с 26.10.2011
Offline
7
#3

#

# robots.txt 4 site.ua

#

User-agent: *

Crawl-delay: 10

# Directories

Disallow: /includes/

Disallow: /misc/

Disallow: /modules/

Disallow: /profiles/

Disallow: /scripts/

Disallow: /sites/

Disallow: /themes/

Disallow: /tour_map_data/

# Files

Disallow: /CHANGELOG.txt

Disallow: /cron.php

Disallow: /INSTALL.mysql.txt

Disallow: /INSTALL.pgsql.txt

Disallow: /install.php

Disallow: /INSTALL.txt

Disallow: /LICENSE.txt

Disallow: /MAINTAINERS.txt

Disallow: /update.php

Disallow: /UPGRADE.txt

Disallow: /xmlrpc.php

# Paths (clean URLs)

Disallow: /admin/

Disallow: /comment/reply/

Disallow: /contact/

Disallow: /logout/

Disallow: /node/add/

Disallow: /search/

Disallow: /user/register/

Disallow: /user/password/

Disallow: /user/login/

# Paths (no clean URLs)

Disallow: /?q=admin/

Disallow: /?q=comment/reply/

Disallow: /?q=contact/

Disallow: /?q=logout/

Disallow: /?q=node/add/

Disallow: /?q=search/

Disallow: /?q=user/password/

Disallow: /?q=user/register/

Disallow: /?q=user/login/

Disallow: /infrastructure/get_geo/

Disallow: /category/

Sitemap: http://site.ua/sites/site.ua/files/sitemap.index.xml

# Yandex

User-agent: Yandex

# Directories

Disallow: /includes/

Disallow: /misc/

Disallow: /modules/

Disallow: /profiles/

Disallow: /scripts/

Disallow: /sites/

Disallow: /themes/

Disallow: /tour_map_data/

# Files

Disallow: /CHANGELOG.txt

Disallow: /cron.php

Disallow: /INSTALL.mysql.txt

Disallow: /INSTALL.pgsql.txt

Disallow: /install.php

Disallow: /INSTALL.txt

Disallow: /LICENSE.txt

Disallow: /MAINTAINERS.txt

Disallow: /update.php

Disallow: /UPGRADE.txt

Disallow: /xmlrpc.php

# Paths (clean URLs)

Disallow: /admin/

Disallow: /comment/reply/

Disallow: /contact/

Disallow: /logout/

Disallow: /node/add/

Disallow: /search/

Disallow: /user/register/

Disallow: /user/password/

Disallow: /user/login/

# Paths (no clean URLs)

Disallow: /?q=admin/

Disallow: /?q=comment/reply/

Disallow: /?q=contact/

Disallow: /?q=logout/

Disallow: /?q=node/add/

Disallow: /?q=search/

Disallow: /?q=user/password/

Disallow: /?q=user/register/

Disallow: /?q=user/login/

Disallow: /infrastructure/get_geo/

Disallow: /category/

Sitemap: http://site.ua/sites/site.ua/files/sitemap.index.xml

Host: site.ua

mk-9
На сайте с 03.04.2011
Offline
82
#4

Вы теперь представте сколько робот будет индексить сайт с таким значением. Не удивительно, что выпали страницы :(

Всем добра!
SS
На сайте с 26.10.2011
Offline
7
#5

Так что это все-таки Crawl-delay: 10. Какое тогда значение оптимальное для более чем миллиона страниц? Или лучше его вовсе убрать? В любом случае, когда гугл обратно загонит в индекс страницы?

siv1987
На сайте с 02.04.2009
Offline
427
#6
mk-9:
Вы теперь представте сколько робот будет индексить сайт с таким значением. Не удивительно, что выпали страницы

Причем тут скорость сканирования с выпадением страниц?

S_Semid:
Какое тогда значение оптимальное для более чем миллиона страниц?

Откуда миллион страниц, ГС?

SS
На сайте с 26.10.2011
Offline
7
#7

Нет нормальный сайт. Туристический. Просто большая база предложений. Контент обновляется каждый день. За 8 лет под фильтры ПС не попадал. Вылетели страницы только из гугла (773000 из 1167700), в яндексе все на месте (380000)...

SS
На сайте с 26.10.2011
Offline
7
#8

Если с robots.txt все ок, то где искать причины? Я так понимаю, под фильтром запросы вылетают. У меня все на месте...

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий