Слишком много страниц в индексе

12
K
На сайте с 18.04.2011
Offline
55
2356

Доброго дня!

На сайте около 2,2 млн страниц. Но гугл утверждает что им скачано и проиндексировано более 4 млн страниц...

http://www.google.ru/search?hl=ru&q=site:www.bazazakonov.ru&newwindow=1&filter=0#q=site:bazazakonov.ru&hl=ru&newwindow=1&prmd=imvns&ei=MQi6TtLoLIHl4QSmyL39Bw&start=0&sa=N&bav=on.2,or.r_gc.r_pw.,cf.osb&fp=e2cc6d828c7e7733&biw=1472&bih=695

Технологические копии страниц типа копии для печати и файлов для скачивания закрыты в роботсе.

http://bazazakonov.ru/robots.txt

Я сначала подумал что гугл смешал в кучу с ВВВ и без, но это не так:

http://www.google.ru/search?hl=ru&q=site:www.bazazakonov.ru&newwindow=1&filter=0#sclient=psy-ab&hl=ru&newwindow=1&source=hp&q=site:www.bazazakonov.ru&pbx=1&oq=site:www.bazazakonov.ru&aq=f&aqi=&aql=&gs_sm=s&gs_upl=907607l911572l0l913602l8l7l1l0l0l0l180l827l3.4l8l0&bav=on.2,or.r_gc.r_pw.,cf.osb&fp=e2cc6d828c7e7733&biw=1472&bih=695

Вопросы:

чем это плохо? или наоборот хорошо.

как с этим бороться? или небороться.

Что делать? Кто виноват? Где деньги? :bl:

Gregor25
На сайте с 06.10.2005
Offline
133
#1

Вы давно в роботсе закрыли поиск и т.д.?

Т.к. например выдача результатов поиска в индексе на уровне 78000 стр

http://www.google.ru/search?hl=ru&q=site:www.bazazakonov.ru&newwindow=1&filter=0#q=site:bazazakonov.ru/search&hl=ru&newwindow=1&prmd=imvns&filter=0&bav=on.2,or.r_gc.r_pw.,cf.osb&fp=1df4f5d0662c6149&biw=1366&bih=667

далее не копал

Мы с тобой две капли разные, одной воды слёзы облака
K
На сайте с 18.04.2011
Offline
55
#2
Gregor25:
Вы давно в роботсе закрыли поиск и т.д.?

Т.к. например выдача результатов поиска в индексе на уровне 78000 стр

http://www.google.ru/search?hl=ru&q=site:www.bazazakonov.ru&newwindow=1&filter=0#q=site:bazazakonov.ru/search&hl=ru&newwindow=1&prmd=imvns&filter=0&bav=on.2,or.r_gc.r_pw.,cf.osb&fp=1df4f5d0662c6149&biw=1366&bih=667

далее не копал

Про поиск принято, это бревно в моем глазу, да.

Но их всего навсего 78 тыс. Откуда еще ~2 миллиона лишних страниц?

Gregor25
На сайте с 06.10.2005
Offline
133
#3

Я Вам намек дал, ладно, идем дальше:

Смотрите сюда:

http://www.google.ru/search?hl=ru&q=site:www.bazazakonov.ru&newwindow=1&filter=0#q=bazazakonov.ru%2Fdoc%2F%3FID%3D610992&hl=ru&newwindow=1&prmd=imvns&filter=0&bav=on.2,or.r_gc.r_pw.,cf.osb&fp=1df4f5d0662c6149&biw=1366&bih=667

у вас там чего только нет и склейка с кириллическим и www.www.

вот все эти бревна суммарно и набирают

K
На сайте с 18.04.2011
Offline
55
#4

Тогда вопрос такой - как бы это все привести к одному знаменателю?

В выдаче Яндекса былы примерно такие же глюки, но я указал: Host: bazazakonov.ru и все страницы с www, с www.www, кирилический домен склеились и теперь отзываются только по основному адресу.

Как тоже самое сделать в гугле?

B
На сайте с 10.04.2006
Offline
64
#5
Klacon:

Как тоже самое сделать в гугле?

копайте в сторону webmastertools

alexburzak
На сайте с 28.11.2006
Offline
61
#6
berin:
копайте в сторону webmastertools

+100

Там еще есть запретить параметры....

Должно помочь.

У меня один сайт больше года не могу избавится от лишней индексауии....

😡

alexburzak добавил 09.11.2011 в 16:21

На мой вглюд когда много проиндексированна, то очень сложно быкинуть с индеса страницы так 1000... 🤪

URL: Продвижение сайтов, построение сайтов, сопровождение сайтов (http://www.upmaster.co.il/default.aspx?lan=ru) Прежде, чем задать вопрос я всегда пользуюсь поиском и MSDN!
K
На сайте с 18.04.2011
Offline
55
#7
Afenor:
срочно правте роботс, иначе так и агс схватить можно с такими дублями

А что именно править? Дизаллоу ввв поставить? Можете подсказать?

И агс он в яндексе и с ним проблем нет, там директива Host расставила все на свои места. Это только гугл более туго соображает, значит надо ему както подсказать. Вот в этом и вопрос, как именно разные варианты написания (с www, русскоязычный домен...) привести к одному? Кто знает точный работающий способ? (даже готов оплатить консультацию/работу)

Klacon добавил 10.11.2011 в 10:57

Камрады, кто-нибудь может помочь? Очень надо...

B
На сайте с 10.04.2006
Offline
64
#8

сегодня на pubcon прошло что если в индексе намного больше страниц чем страниц приносящих траффик то это проблема :)

K
На сайте с 18.04.2011
Offline
55
#9

После вычитания всех дублей появившихся от написания урла (www, www.www, урл.РФ) и запрещенных в роботсе (/search) все равно остается 3,1 млн страниц из ~2,2 имеющихся. Т.е. гугл нашел еще около миллиона страниц на сайте...

Есть еще идеи, чтобы это могло быть?

Klacon добавил 11.11.2011 в 11:56

Klacon:
(даже готов оплатить консультацию/работу)

предложение в силе

6ecuk
На сайте с 30.03.2011
Offline
24
#10

site:bazazakonov.ru/doc/index.php

Думаю из-за этого весь сыр-бор.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий