Sitemap и индексация?

K
На сайте с 21.06.2007
Offline
48
745

Доброе время суток!

Такой вопрос, к примеру у меня есть сайт: www.test.ru

на нем всего 2 страницы:

index.html и second.html, понятное дело, что при обращении к домену www.test.ru - попадаем на index.html, с index.html нет ссылки на second.html, т.е. боты ПС не могут на нее попасть.

Но при этом в sitemap.xml указаны обе страницы сайта! Вопрос такой, проиндексируют ли ПС (Яндекс, Google, Rambler) страницу second.html, только потому, что она указана в sitemap, но ссылки на нее на самом сайте нету.

Лично мое мнение - нет, но поставить эксперимент не успел, а знать как это происходит - требуется сейчас, может быть уже кто ставил такие эксперименты?

SEOman.
Bdiang
На сайте с 19.07.2006
Offline
102
#1

Проиндексирует

BB
На сайте с 13.03.2008
Offline
35
#2

Рассуждаем логически. Проиндексировать страницу должны после индексации карты сайта, ведь есть карта сайта, которую можно считать своего рода ссылкой (в коде карты ведь будет прописан адрес страницы, а значит, и краулер, и робот ПС до неё могут добраться). Более того, добавление карты сайта в индекс помогает проиндексировать сайт. Но будет ли адрес страницы считаться как отдельное доменное имя или связываться с главной - вопрос.

Продвижение сайтов в Украине (http://semantika.com.ua/)
K
На сайте с 21.06.2007
Offline
48
#3
Bdiang:
Проиндексирует

А разве это не странно?

Т.е. допустим, у меня перелинковка сайта такая, что я умышленно не желаю индексации той или иной страницы, допустим пихаю ссылки в <noindex> и пишу nofollow на страницы, которые не хочу индексировать, а генератор sitemap делает xml-ник, в котором эти страницы эти есть! И что получается в итоге тогда?

BB
На сайте с 13.03.2008
Offline
35
#4

ТС, а что, религия запрещает напрямую в роботс.тхт закрыть от индексации те или иные страницы сайта?

NB
На сайте с 15.10.2008
Offline
19
#5

получается что в итоге ПС ее проиндексирует, что непонятного то? :)

sitemap тоже своего рода ссылка. уберите оттуда страницу, чтобы точно не проиндексировал

K
На сайте с 21.06.2007
Offline
48
#6
Boris Baydenko:
ТС, а что, религия запрещает напрямую в роботс.тхт закрыть от индексации те или иные страницы сайта?

Это гарантирует, что даже при наличии страницы в sitemap.xml - она не проиндексируется?

Bdiang
На сайте с 19.07.2006
Offline
102
#7
kolesnicoff:
А разве это не странно?

Т.е. допустим, у меня перелинковка сайта такая, что я умышленно не желаю индексации той или иной страницы, допустим пихаю ссылки в <noindex> и пишу nofollow на страницы, которые не хочу индексировать, а генератор sitemap делает xml-ник, в котором эти страницы эти есть! И что получается в итоге тогда?

Если вы запретите страницу для индексирования в мета тегах, robots.txt, <noindex> и rel="nofollow",

то страница в индексе не появится, однако будет считана роботом на предмет новых ссылок на другие страницы.

Т.е если вы хотите, чтобы страница second.html не попала в индекс закройте ее способами перечисленными выше. Наличие ее в сайтмапе не должно повлиять на присутствие в индексе.

K
На сайте с 21.06.2007
Offline
48
#8
Nick Belov:
получается что в итоге ПС ее проиндексирует, что непонятного то? :)
sitemap тоже своего рода ссылка. уберите оттуда страницу, чтобы точно не проиндексировал

Понял, значит, общее мнение, что все же проиндексит. Да нет, просто проблема в том, что хотел простым образом сгенерить sitemap, а в виду этих обстоятельств - простым образом уже не получится.

kolesnicoff добавил 17.10.2008 в 16:17

Спасибо всем, попробую еще поставить эксперимент!

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий