Большие порталы, глубина индексации

123
Bdiang
На сайте с 19.07.2006
Offline
102
#11
wayfarer:
На мой взгляд самая лучшая структура у портала википедия но она никак не грамотноиерархическая

С точки зрения удобста да.

Я имел виду навигацию, доступ к страницам. Достаточно иметь постоянное меню, пусть к странице с сылками, динамические блоки на главной - дальше робот сделает свое дело.

Так у меня после введения обработки заголовков, за несколько апов количество страниц увеличилось на 20000 страниц и удалилось огромное количество старых 404 страниц и тд..

M
На сайте с 12.05.2005
Offline
112
#12
При грамотной иерархической структуре портала, IMHO эффективнее всего на индексацию влияет заголовок last-modified

Т.е для каждого документа дата последнего изменения которого меньше даты, приходящей от робота в заголовке if-modified-since выдавать 304 код.

На сколько я понял 304 - дает понять что страничка не обновлялась, какой ризон говорит об этом роботу?

wayfarer
На сайте с 28.12.2003
Offline
141
#13
mazazul:
На сколько я понял 304 - дает понять что страничка не обновлялась, какой ризон говорит об этом роботу?

это следует отдавать на уже проиндексированых страницах, чтобы работ не долбился в них а шел индексировать свежее, т.е. то чего еще не индексировал

Предпочитаю наличку
FlyAway
На сайте с 01.06.2005
Offline
439
#14
Sayros:
заход на глубокие страницы с hghltd.yandex (об этом где-то Каширин писал, поиском найдете)

Садовский говорил, что если подсвечивать сохраненную копию, то на скорость индексации это не повлияет.

Сердюченко Андрей (http://www.serdyuchenko.ru/) Масонская ложа — SЕ-Team.ru (http://goo.gl/YIjV6h) :)
Bdiang
На сайте с 19.07.2006
Offline
102
#15
mazazul:
На сколько я понял 304 - дает понять что страничка не обновлялась, какой ризон говорит об этом роботу?
wayfarer:
это следует отдавать на уже проиндексированых страницах, чтобы работ не долбился в них а шел индексировать свежее, т.е. то чего еще не индексировал

Только не на всех проиндексированных страницах, а на не изменившихся с последнего захода робота (для этого робот и передает в Get заголовок: if-modified-since)

Вобще с 304 надо аккуратнее...Лучше сначала изучить материал

Например это обсуждалось здесь /ru/forum/35948

А вобще в инете много про это написано

M
На сайте с 12.05.2005
Offline
112
#16

Bdiang,

Так у меня после введения обработки заголовков
Вобще с 304 надо аккуратнее...Лучше сначала изучить материал

Можете еще ссылочек накидать?

Morix
На сайте с 30.09.2005
Offline
169
#17
Как увеличить глубину и главное скорость индексации на больших порталах?

Никак. Стоит определенный порог сканирования сайта.

то есть робот не закапывается очень глубоко.

кто-то говорил про 10 000 страниц.

wayfarer
На сайте с 28.12.2003
Offline
141
#18
Morix:
Никак. Стоит определенный порог сканирования сайта.
то есть робот не закапывается очень глубоко.
кто-то говорил про 10 000 страниц.

а еще говорят что в москве кур доят :)

http://www.yandex.ru/yandsearch?serverurl=www.lenta.ru вот так посмотреть попробуйте

Morix
На сайте с 30.09.2005
Offline
169
#19
wayfarer:
а еще говорят что в москве кур доят :)

http://www.yandex.ru/yandsearch?serverurl=www.lenta.ru вот так посмотреть попробуйте

ай ай ай. Вы меня неправильно поняли. Неужели Яндекс не индексирует больше 10 тясяч страниц? 🙅

Просто за один обход робота он не берет больше nn nnn страниц (цифры у всех разные, но порог - 20 000). А так кол-во страниц естественно не ограничено. 🙄

wayfarer
На сайте с 28.12.2003
Offline
141
#20
Morix:
ай ай ай. Вы меня неправильно поняли. Неужели Яндекс не индексирует больше 10 тясяч страниц? 🙅

Просто за один обход робота он не берет больше nn nnn страниц (цифры у всех разные, но порог - 20 000). А так кол-во страниц естественно не ограничено. 🙄

В таком случае понятно :)

у меня из примеров максимум что брал робот яндекса за один заход 5341 страница

123

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий