Помогите разобраться с индексацией!

12
викушка
На сайте с 11.09.2010
Offline
10
660

Здравствуйте!

Не могу разобраться с индексацией. Яндекс индексирует все нормально: в индексе 24 страницы, как раз все, которые есть на сайте. А количество страниц в Гугл постоянно меняется: сегодня утром было 118 (даже не представляю, где он их нашел), сейчас их 59, но такого количества страниц нет на сайте.

Заранее спасибо за помощь!

Сайт http://stand-in-beauty.ru/

cheredov
На сайте с 07.04.2011
Offline
125
#1
викушка:
Здравствуйте!
Не могу разобраться с индексацией. Яндекс индексирует все нормально: в индексе 24 страницы, как раз все, которые есть на сайте. А количество страниц в Гугл постоянно меняется: сегодня утром было 118 (даже не представляю, где он их нашел), сейчас их 59, но такого количества страниц нет на сайте.
Заранее спасибо за помощь!

Сайт http://stand-in-beauty.ru/

Это дубли страниц. они сами отвалятся через некоторое время.

+1 поставила молодец, я плюснул

Иван Чередов (http://ivan.cheredov.com/about/)
eis
На сайте с 18.10.2008
Offline
473
eis
#2

викушка, После того как Google выдаст количество проиндексированных страниц, попробуйте пройтись по навигации в Google. После перехода на 4-ю страницу выдачи, страниц в индексе становится 24 ;)

- Здесь я покупаю вечные ссылки на свои сайты! (https://backlinkator.com) - сотни ссылок за копейки
cheredov
На сайте с 07.04.2011
Offline
125
#3
eis:
викушка, После того как Google выдаст количество проиндексированных страниц, попробуйте пройтись по навигации в Google. После перехода на 4-ю страницу выдачи, страниц в индексе становится 24 ;)

Точно, это не дубли. Это страницы типа http://www.google.ru/url?sa=t&source=web&cd=103&ved=0CB0QFjACOGQ&url=http%3A%2F%2Fstand-in-beauty.ru%2Fmodules%2Fmod_simpleform2%2Fengine.php%3Ftask%3Dcaptcha%26moduleID%3D40%26rand%3D31846%26rand%3D&ei=849BTo_iNsfRsgaD4LzjBw&usg=AFQjCNFePtymerMgcTHLAYbJ6hcofWefHA&sig2=SOAm4tt7p5lwJXZtk2gwJA

cheredov добавил 09.08.2011 в 23:56

Их по хорошему запретить к индексации, чтобы вам не путаться

cheredov добавил 09.08.2011 в 23:58

eis:
После перехода на 4-ю страницу выдачи

Кстати такие страницы и на 3-ей есть и их ровно 6 ;)

викушка
На сайте с 11.09.2010
Offline
10
#4

Уже поняла, что это картинки с кодами.

Может кто-то знает, как их запретить к индексации?

cheredov
На сайте с 07.04.2011
Offline
125
#5
Уже поняла, что это картинки с кодами.
Может кто-то знает, как их запретить к индексации?

В robots.txt

Disallow: /*/mod_simpleform2/*

викушка
На сайте с 11.09.2010
Offline
10
#6

А все равно, в какое место ставить?

Вот мой роботс:

User-agent: *

Disallow: /administrator/

Disallow: /cache/

Disallow: /components/

Disallow: /images/

Disallow: /includes/

Disallow: /installation/

Disallow: /language/

Disallow: /libraries/

Disallow: /media/

Disallow: /modules/

Disallow: /plugins/

Disallow: /templates/

Disallow: /tmp/

Disallow: /xmlrpc/

User-agent: Yandex

Disallow:

Host: stand-in-beauty.ru

cheredov
На сайте с 07.04.2011
Offline
125
#7
викушка:
А все равно, в какое место ставить?

Вот мой роботс:

User-agent: *
Disallow: /administrator/
Disallow: /cache/
Disallow: /components/
Disallow: /images/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /libraries/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
Disallow: /xmlrpc/

User-agent: Yandex
Disallow:
Host: stand-in-beauty.ru

ставь последним Disallow

cheredov добавил 10.08.2011 в 00:06

викушка:
User-agent: Yandex
Disallow:

А это зачем?

викушка
На сайте с 11.09.2010
Offline
10
#8
cheredov:

А это зачем?

Это я в какой-то статье прочитала, чтобы яндекс не индексировал сайт с www.

А почему гугл вообще индексировал mod_simpleform2, ведь написано Disallow: /modules/

cheredov
На сайте с 07.04.2011
Offline
125
#9
викушка:
Это я в какой-то статье прочитала, чтобы яндекс не индексировал сайт с www.

А почему гугл вообще индексировал mod_simpleform2, ведь написано Disallow: /modules/

Это ерунда, не верь. И удали.

cheredov добавил 10.08.2011 в 00:12

викушка:
А почему гугл вообще индексировал mod_simpleform2, ведь написано Disallow: /modules/

Потому правило

Disallow: /modules/

не подходит для урла типа

http://stand-in-beauty.ru/modules/mod_simpleform2/engine.php?task=captcha&moduleID=40&rand=27521&rand=

cheredov добавил 10.08.2011 в 00:13

Хотя... подходит... еще может потому, что robots.txt носит рекомендательный характер.

викушка
На сайте с 11.09.2010
Offline
10
#10

Удалила, теперь роботс выглядит так:

User-agent: *

Disallow: /administrator/

Disallow: /cache/

Disallow: /components/

Disallow: /images/

Disallow: /includes/

Disallow: /installation/

Disallow: /language/

Disallow: /libraries/

Disallow: /media/

Disallow: /modules/

Disallow: /plugins/

Disallow: /templates/

Disallow: /tmp/

Disallow: /xmlrpc/

Disallow: /*/mod_simpleform2/*

Спасибо за помощь, cheredov!

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий