Предлагаю метод ускорения индексации больших сайтов

12
Dybra
На сайте с 23.10.2005
Offline
84
1464

Предлагается следующее:

1. Используя Google sitemap по серверным логам сделать карту сайта в его стандартном xml формате. За сим для Гугля все заканчивается и дальше можно не заморачиваться. Остальное читать для остальных поисковиков.

2. Обрабатывается xml файл любым доступным способом (хоть с помощью регулярных выражений, парсинга, обработки xml или тупо в Ворде с помощью замены) и оттуда выдераются все url полученных страниц.

3. Потом все это пилится скриптом (прогой хоть на VB или Delphi) на html страницы содержашие ссылки. Сразу тут же можно выдерать из реальных страниц тайтлы и подставлять их в ссылки. Таких страниц получается много. Общее их количество ограничивается только количеством исходящих ссылок. Примем их равным (условно) 200, хотя ничего не мешает и придерживаться полуофициальной цифры 150. Так же создается индексная страница, содержащая ссылки на страницы по 200 (150) урлов.

4. Создается либо поддомен map.site.ru либо папка site.ru/map. Первый вариант хорошо для неЯндексов, т.к. это внешний домен, но в этом случае все ссылки будут являтся внешними и ограничение в 150 может еще ужесточится. Поэтому предпочтительнее думаю второй вариант в виде отдельной поддиректории, в этом случае все ссылки будут считаться внутренними. Хотя думаю варианты еще требует обсуждения. На эту "суперкарту" ставится ссылка с главной. Все полученные страницы заливаются на сервер, если все это делалось не на сервере непосредственно.

Итого. Принимая ограничения в 200 урлов таким образом можно сделать доступными для поисковиков с учетом "правила 3 кликов" 200*200=40000 страниц сайта.

Единственным узким место данного метода лично я пока вижу сложности с первичным наполенением серверных логов. Хотя если сайт реально посещаем то он сделается быстро. В крайнем случае можно просто посадить человека или создать своего бота который может пробежаться по всем страницам.

P.S. Надеюсь что это абсолютно "белый" метод оптимизации. :)

Мы из ВЫКСЫ (http://wyksa.ru)!
[Удален]
#1

и что на страницах будет?

урл1

урл2

урл3

?

имхо, за такое и побанить могут

Dybra
На сайте с 23.10.2005
Offline
84
#2
_Nic_:
и что на страницах будет?

урл1
урл2
урл3
?

имхо, за такое и побанить могут

Ну если лениво выдерать тайтлы, то да. А так будут вполне обычные ссылки в вынутыми по урл тайтлами. А за что банить-то? Где тут нарушение пункта 3.5? Это же обычная карта сайта. Т.е. в смысле не совсем обычная, а очень большая.

Г0
На сайте с 19.08.2004
Offline
129
#3

У меня такое еще по поддоменам разбито.

Работает плохо.

Вижу сусликов, которых нет. Покупаю заброшенные сайты, ссылки с pr17-18, пью водку. В личку. Интим не предлагать.
Dybra
На сайте с 23.10.2005
Offline
84
#4

Ну для экпериментов нужен новый большой сайт. У меня таких под рукой нет. Думаю кто-нибудь попробует и расскажет результат.

Deni
На сайте с 15.04.2006
Offline
355
#5

а зачем такие извращения?

У меня прога для построения карты сайта.

Она автоматом сканирует все мои 50000 страниц и сама строит карту сайта для гугла

А так же делают карты любых других видов.

И таких прог полно в сети.

Ну и само собой карта сайта которая автоматом генерится на сайте

Revan
На сайте с 09.09.2005
Offline
321
#6

Dybra, мдааа... Почти год на форуме... И такие поражающие новизной идеи...

С уважением, Прокофьев Александр, founder KudaGo.com (http://kudago.com). Отдаем информацию обо всех мероприятиях в РФ + Киев по API (/ru/forum/912869) всем желающим.
Deni
На сайте с 15.04.2006
Offline
355
#7

Всем рекомендую прогу GSiteCrawler http://gsitecrawler.com/

На русском, бесплатная и творит невозможное.

ЗЫ За пивом не бегает :(

Karastel
На сайте с 06.09.2006
Offline
10
#8
Deni:
Всем рекомендую прогу GSiteCrawler http://gsitecrawler.com/

Факт!

+1

сам ей пользуюсь, и карты сайта составлял, яша мнгновенно весь сайт в индекс заносит

причём гуглу тоже помогло быстрее проиндексировать

путешествия без турфирм (http://fresh-trip.ru/)
Disell
На сайте с 05.06.2006
Offline
253
#9
Deni:
На русском, бесплатная и творит невозможное

что то на сайте я руского не нашел. покажите слепому? в инстале тоже не обнаружил

Лучшие вакансии ( http://hh.ru ) РУнета. Построй свою карьеру ( http://career.ru )
Deni
На сайте с 15.04.2006
Offline
355
#10
Disell:
что то на сайте я руского не нашел. покажите слепому? в инстале тоже не обнаружил

Ставьте прогу - она мультиязычная

Потом в настройках смените язык

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий