Как определить число проиндексированных?

12
юни
На сайте с 01.11.2005
Online
902
2670

Первый вариант - 393 страницы.

Второй вариант - 35 300 страниц.

В панели вебмастера, по сайтмапу:

Отправленные URL
5 769
3 839 URL в интернет-индексе

Кому верить?

https://a-parser.com/ - парсер для профессионалов SEO, маркетологов, арбитражников и SaaS, https://searchengines.guru/ru/forum/944108 - прокси-сервис на базе операторов домашнего интернета, сотни тысяч IP-адресов, канал от 20 Мбит
M1
На сайте с 13.02.2007
Offline
123
#1

юни, в первом варианте - страницы находящиеся в так называемом основном индексе, во втором включены все страницы, включая те, что находятся в так называемом дополнительном индексе. Можно так же проверять через http://www.cy-pr.com/analysis/ или при помощи RDS Bar - покажет количество всех проиндексированных страниц, а в скобках будет указан % страниц находящихся в основном индексе.

~3 839 - число которому стоит верить в вашем случае.

I
На сайте с 14.09.2009
Offline
29
#2

Ещё вариант – "about 3,780 results", уже ближе к результату из Webmaster Tools.

На форуме вебмастеров гугла гугловцы время от времени уговаривают верить именно числу из WMT, напоминая, что оператор "site:" – это всего лишь фильтр для сужения области поиска.

юни
На сайте с 01.11.2005
Online
902
#3

А чем вызвана разница в числе проиндексированных для домена с "www" и без?

Как я понимаю, число из панели вебмастера с помощью операторов получить нельзя? Только приближенное через "site:"?

Linkeeper
На сайте с 15.06.2009
Offline
52
#4
юни:
А чем вызвана разница в числе проиндексированных для домена с "www" и без?

Как я понимаю, число из панели вебмастера с помощью операторов получить нельзя? Только приближенное через "site:"?

У Вас по сути два сайта: с WWW и без (два зеркала)

склейте их в robots.txt

------------

User-agent: *

Disallow:

Host: (САЙТ С WWW ИЛИ БЕЗ)

User-agent: Googlebot

Disallow:

Host: (САЙТ С WWW ИЛИ БЕЗ)

User-agent: Yandex

Disallow:

Host: (САЙТ С WWW ИЛИ БЕЗ)

------------

А тогда проверяйте

K
На сайте с 31.01.2001
Offline
737
#5

Linkeeper, а давно ли Гугл научился директиве Host ? ;)

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
M
На сайте с 27.10.2006
Offline
111
#6
Ippi:
Ещё вариант – "about 3,780 results"

И еще подвариант — прошерстить оператором site: каждый раздел сайта, добавляя, например, inurl:. Потом суммировать и получить еще точнее.

Бесплатное хранилище данных (http://bit.ly/gJYy9Z) (5GB) с синхронизацией. По ссылке — бонус 500MB.
M1
На сайте с 13.02.2007
Offline
123
#7
юни:
А чем вызвана разница в числе проиндексированных для домена с "www" и без?

Как я понимаю, число из панели вебмастера с помощью операторов получить нельзя? Только приближенное через "site:"?

1. Тем, что для ПС сайт с www и без www - это два разных сайта. До тех пор, пока не выбрано главное зеркало. Для решения проблемы необходимо склеить эти два варианта. Сделать это нужно так:

I. В панели вебмастера зайти в раздел Конфигурация сайта -> Настройки, и выбрать основной вариант домена (я, например, предпочитаю с www).

II. Поставить 301-ый редирект со вторичного вариантна на основной. Для редиректа на вариант с www необходимо прописать в .htaccess следующее:

Mr 13:
RewriteEngine On

#301-й редирект на www
RewriteBase /
RewriteCond %{HTTP_HOST} !^www\.(.*)$ [NC]
RewriteRule ^(.*)$ http://www.%{HTTP_HOST}/$1 [R=301,L]

При этом www будет подставляться автоматически и сайт будет доступен по одному адресу - с www.

Со временем сайты склеятся, и по обоим запросам будет выдаваться основной вариант, с одинаковым числом результатов (пример: 1. | 2.)

2. Да, но оно отличается не сильно, а иногда и вовсе не отличается.

Ида, что сказал Linkeeper - бред. Google не распознаёт директиву Host для robots.txt, но её нужно использовать для яндекса с той же целью, что редирект для гугла.

юни
На сайте с 01.11.2005
Online
902
#8

А как узнать, выбрал Гугл главное зеркало, или нет?

В .htaccess с самого начала стоит 301-й постоянный редирект (можете проверить, зайдя без www):

RewriteEngine on
RewriteCond %{HTTP_HOST} ^mining-enc.ru
RewriteRule (.*) http://www.mining-enc.ru/$1 [R=301,L]

Такая конструция верна? После установки cms на ней остановились, стоит она внутри тегов <IfModule mod_rewrite.c> </IfModule>. До этого было, видимо, вот так:

RewriteCond %{HTTP_HOST} ^mining-enc.ru$ [NC]
RewriteRule ^(.*)$ http://www.mining-enc.ru/$1 [R=301,L]

В панели вебмастера обязательно определять основной вариант домена (это действительно влияет на число проиндексированных)?

M1
На сайте с 13.02.2007
Offline
123
#9

юни, текущая конструкция верна - всё должно склеиться.

В панели вебмастера обязательно определять основной вариант домена (это действительно влияет на число проиндексированных)?

Желательно, это ускорит процесс корректной склейки, а ведь всего 2 клика ;)

юни
На сайте с 01.11.2005
Online
902
#10
Mr 13:
а ведь всего 2 клика

Если бы... просит подтвердить права на домен без www, причём тем же методом, что и с www - естественно, всё подтверждено, но принудительно выбрать имя домена по-прежнему нельзя... сцуко.

Ладно, разберёмся. Может, просто подождать надо.

А как достоверно проверить, какой из вариантов Гугл сейчас считает основным зеркалом?

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий