Индексация форума phpBB, внетренние страницы топиков

Сестры Бабурины
На сайте с 29.12.2011
Offline
45
1087

Друзья,

яндекс не хочет индексировать вторые и далее страницы в топиках на форуме phpBB (Гугл индексирует нормально).

В роботсе доступно.

url вяглядит вот таким образом.

/viewtopic.php?f=1&t=19&start=15

(номер подфорума)&(номер топика)&(номер страницы)

title на каждой странице разные (к названию темы добавляется "Страницы n").

Платонам писал, но с новой концепцией "задать вопроса" ответа так и не получил.

Как заставить Яшу проиндексировать следующие после первой страницы топика?

PS

кстати, по гуглу тоже вопросы есть.

если пробивать ссылку второй страницы топика, то он ее видит и в сниппете показывает некий текст. Но если этот самый тест пробить в гугле, то он его не находит. Поставил на форум поиск от гугла, там текст ищется. Не так ищу? :)

Julia-V
На сайте с 05.02.2010
Offline
77
#1

А сам текст какого-нибудь сообщения попробуйте проверить в поиске Яндекса. У меня нормально индексирует (версия 3.0.7), проверила текст нескольких таких страниц, в индексе, свежие, от 5 сентября. Поиск от Яндекса и Гугля не стоит.

Сестры Бабурины
На сайте с 29.12.2011
Offline
45
#2

в яндексе не всегда ищет содержимое даже проиндексированных страниц, как то 50/50.

Находит только если в области поиска указать сам этот сайт.

Проиндексировано 9к страниц.

В моем случае версия phpBB 3.0.12

Начал анализировать структуру страниц и url форума, в результате обнаружил интересные вещи:

1. переменная "f=" (указывающая на номер подфорума) имеет скорее декоративное значение в url топика, чем какое-то техническое.

То есть если в адрес /viewtopic.php?f=1&t=19 поставить любое значение "f", например,

/viewtopic.php?f=1000000&t=19

или

/viewtopic.php?f=nyashmyash&t=19

то тема будет доступна по любому из этих адресов.

(это я заметил когда перенес тему из одного подфорума в другой, а при этом номер форума у этой темы оставался прежним, пока не перезашел на страницу из подфорума)

Не смотря на это, ядро форума (читай разработчики) упорно подставляет эту переменную везде где только можно: в заголовке <h2> названия темы, в ссылках-нумерациях страниц, в ссылках на якорях # постов и тд.

Но и это не все (С)

2. Бонусом ко всей этой красоте есть ссылки на посты из этой темы, например:

/viewtopic.php?p=12345

/viewtopic.php?p=12346 (и тд, не важно первый ли пост на странице или нет)

По которым мы получаем всю ту же тему, все с тем же контентом (читай дубль).

В тоге в выдаче Яндекса адовая каша на выбор из:

/viewtopic.php?f=1&t=19

/viewtopic.php?p=12345

и

/viewtopic.php?t=19

Если Гугл их всего этого разрыва мозга выбрал более менее правильные и статичные "/viewtopic.php?t=" и успешно их индексирует, то Яндекс от такова ассортимента прибалдел и кроме как понизить (за дубли например) ничего не придумал.

Буду курить форум разработчиков пхпбб, искать какой-нибудь модуль или программера, который смог бы этот url-бардак привести к каком-то одному вменяемому виду.

Julia-V
На сайте с 05.02.2010
Offline
77
#3

Да, есть такая проблема с переменной и с дублями в Яндексе. Посмотрела статистику, ровно год назад в индексе было в 2,5 раза больше страниц, и это с учетом роста количества тем и постов. По косой пробежалась, да, некоторых старых тем нет в индексе, а они точно были. У Гугля в индексе на данный момент в 5 раз больше страниц и количество сильно не колеблется. С Яндекса началось проседание количества посетителей с марта. Сейчас нет времени копаться и анализировать, посетители в основном приходят из поисковиков, но много и постоянных. Быстробот постоянно живет на форуме.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий