Проблемы структуры и частого изменения контента. Робот не успевает.

I
На сайте с 08.08.2005
Offline
9
796

Во-первых, поздравляю всех с Новым годом!

Многое из того, что я узнал на этом форуме, очень сильно изменило мое отношение к сайтам. Спасибо Вам за это! Всем желаю развиваться.

Так вот. Есть сайт.

Контент на нем организован таким образом:

Есть куски информации (путь это будут новости). Они разбиты на категории. Их в каждой категории может быть нескольк сотен. Когда добавляетюя новые, старые сдвигаются вниз. Часть устаревших удаляется.

Таким образом есть 2 проблемы:

Проблема номер 1. Быстрая смена контента на страницах:

Сегодня робот проиндексировал стриницы

www.сайт.ru/категория_а/1/ - здесь записи 21-30

www.сайт.ru/категория_а/2/ - здесь записи 11-20

www.сайт.ru/категория_а/3/ - здесь записи 01-10

Через час добавилось еще 8 записей. Получилась следующая картина:

www.сайт.ru/категория_а/1/ - здесь записи 29 - 38

www.сайт.ru/категория_а/2/ - здесь записи 19 - 28

www.сайт.ru/категория_а/3/ - здесь записи 09 - 18

www.сайт.ru/категория_а/4/ - здесь записи 01 - 08

То есть то, что в яндексе проиндексировалось по адресу, к примеру

www.сайт.ru/категория_а/2/, уже частично съехало на страницу www.сайт.ru/категория_а/3/, а частично осталось там где было проиндексировано.

Это ведь не совсем правильно? А как правильно структурировать?

можно конечно так:

www.сайт.ru/дата1/1/

www.сайт.ru/дата1/2/

www.сайт.ru/дата2/1/... и т.д.

А если нет привязки к дате?

Как грамотно решить поблему?

Вторая проблема: - трупы в базе яндекса.

Допустим было так:

www.сайт.ru/категория_а/1/ - здесь записи 29 - 38

www.сайт.ru/категория_а/2/ - здесь записи 19 - 28

www.сайт.ru/категория_а/3/ - здесь записи 09 - 18

www.сайт.ru/категория_а/4/ - здесь записи 01 - 08

Яндекс проиндексировал.

А потом последние 8 записей удалились. Осталось:

www.сайт.ru/категория_а/1/ - здесь записи 29 - 38

www.сайт.ru/категория_а/2/ - здесь записи 19 - 28

www.сайт.ru/категория_а/3/ - здесь записи 09 - 18

Получилось, что яндекс проиндексировал страницу, которая через 2 часа перестала существовать. И яндекс может отправлять людей на страницу, которой нет.

Это ведь не очень хорошо. Потом яндекс прийдет индексировать эту страницу повторно... а ее нет. Как он отреагирует?

И как можно решить эту проблему?

С уважением, Максим Постников
I
На сайте с 22.10.2005
Offline
58
Iso
#1
Insane:
Контент на нем организован таким образом:
...
Когда добавляетюя новые, старые сдвигаются вниз. Часть устаревших удаляется.
Проблема номер 1. Быстрая смена контента на страницах:
Сегодня робот проиндексировал стриницы
www.сайт.ru/категория_а/1/ - здесь записи 21-30
www.сайт.ru/категория_а/2/ - здесь записи 11-20
www.сайт.ru/категория_а/3/ - здесь записи 01-10

Я бы посоветовал делать стабильные адреса:

www.сайт.ru/категория_а/1/ - здесь записи 01-10

www.сайт.ru/категория_а/2/ - здесь записи 11-20

www.сайт.ru/категория_а/3/ - здесь записи 21-30

И с главной страницы ставить ссылку на последний блок, чтобы человеку были видны свежие новости. В сети есть много образцов так сделанных новостных лент - смотрите на успешные проекты.

Insane:

Вторая проблема: - трупы в базе яндекса.

Тут я бы посоветовал, удаляя новость, не терять её номер.

Я это обычно делаю так: новости не удаляются, а получают флаг "скрытая". Т.е. в списке из десяти новостей останется только 9, если одну скрыли - это не страшно. А если поисковик её проиндексировал и привёл на неё человека, то тот получит вменяемый текст, что данной новости уже нету, читайте нашу новостную ленту, вот вам список из последних 10 новостей.

Т.е. не выдаём 404 ошибку, а говорим, что рады любому посетителю, хоть нужного ему текста сейчас и нету.

VX
На сайте с 01.08.2005
Offline
22
#2

подобная же проблема встречается на досках объявлений, если выдавать объявления списком, разбитым по количеству на страницы

старый контент при появлении новых объявлений съезжает вниз

мне видятся такие пути решения:

1. то что вы сами написали

www.сайт.ru/дата1/1/

www.сайт.ru/дата1/2/

www.сайт.ru/дата2/1/... и т.д.

раз это новости или объявления, значит привязка к дате должны быть

2. создание у каждой новости или объявления совей отдельной страницы, которые тоже будут индексироваться поисковиками

3. старые новости (отдельные страницы) НЕ удалять, а делать их невидимыми в основном списке для посетителей, а если человек перешел из поисковика на конкретную страницу новости, пусть и "удаленной", то почему бы ему ее не выдать, пусть она и старая, но возможно для него актуальная

4. отработать страницы, которые могут исчезать на предмет выдачи "вменяемого текста", об этом писал Iso

E
На сайте с 05.10.2005
Offline
172
#3
Iso:
Я бы посоветовал делать стабильные адреса:

Я обычно делаю для таких целей в базе уникальное поле fixid и при добавлении записи создаю скриптом уникальную строчку для него (обычно это дата и время записи с точностью до секунд, написанные без пробелов). Этот fixid сохраняется за данной записью навсегда и по нему на нее всегда можно сослаться. А когда записи выдаются списком, можно под каждой из них маленькими буквами дать ссылку на ее постоянный адрес - и робот его проиндексирует.

открытая многоязычная словарная база (http://tolmacz.ru)
Vetra
На сайте с 07.04.2005
Offline
200
#4

Insane, я бы посоветовала делать как на всех крупных новостных сайтах, например Вебпланета:

webplanet.ru/news/internet/2005/12/30/mail_ya.html

раздел -> число -> название.

Это хорошо не только для робота, но и для человека, я могу поставить закладку, вернуться через полгода, а статья будет на месте

С наступающем!

I
На сайте с 08.08.2005
Offline
9
#5

Vetra, а что делать, если речь идет не о новостях, а о записях, которые живут всего пару недель?

Vetra
На сайте с 07.04.2005
Offline
200
#6

Insane, то же самое :) Сложно могу представить записи, которые актульны пару дней и не новости.. может намекнете?

Либо вообще складывать все это в отдельную папку и закрывать от роботов.

K. Ermakov
На сайте с 10.12.2004
Offline
328
#7
Insane:
речь идет не о новостях, а о записях, которые живут всего пару недель?

Думаю, стоит перестать надеяться, что они смогут как-то полезно работать и приносить траффик из поисковиков. А почему не сделать для них архив?

С уважением, Константин Ермаков, absite.ru: онлайн кроссворды (http://absite.ru/); searchsuggest.ru: поисковые подсказки доставляют (http://searchsuggest.ru/).

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий