Платон Щукин об индексации форума.

1 23
Александр Тер-Арутюнов
На сайте с 12.04.2004
Offline
72
#21
Mishael:
Кстати... а никто не пробовал пропатчить BB code чтобы не в <a href> превращался а в <noindex><a href> ?

и еще хорошо бы rel="nofollow" в теле ссылки добавлять 😂

"Победы - не окончательны, поражения - не смертельны, вопрос в том - достанет ли воли продолжать" - Уинстон Черчиль
Ctulhu
На сайте с 21.05.2005
Offline
222
#22
AlexKats:
и еще хорошо бы rel="nofollow" в теле ссылки добавлять

Посмотрите, кстати, Мастертолк. У них все ссылки через счетчик идут.

Александр Тер-Арутюнов
На сайте с 12.04.2004
Offline
72
#23
Ctulhu:
Посмотрите, кстати, Мастертолк. У них все ссылки через счетчик идут.

а это уже для трейда можно заюзать 😂

M
На сайте с 20.08.2004
Offline
376
#24
ШАНС-ON:
Эта функция реализована как раз в быстром ответе.

Странно, использовал две формы ни в одной такого небыло.

отец сыночка, лапочки дочки и еще одного сыночка
Mishael
На сайте с 08.11.2001
Offline
217
#25

Miracle, если ничего не путаю мой (где цитирование есть) называется ex_qreply_2.3.0.zip

Мой надежный веломагазин (https://veliki.com.ua/) на CMS Melbis Shop 6 (http://www.melbis.com/)
ШO
На сайте с 27.12.2005
Offline
375
#26
Mishael:
Miracle, если ничего не путаю мой (где цитирование есть) называется ex_qreply_2.3.0.zip

eqr_3.0.3.zip я ставил этот. Ссылка цитировать появляется вместо картинки статуса пользователя, под ником, а сам ник дает возможнсть "обратиться по нику".

Вот http://phpbbguru.net/files/mods/eqr_3.0.3.zip

Установка простая, поставил минут за 15, не парился с настройками цвета и т.п., все оставил по умолчанию. Красиво и удобно.

Если моды для phpBB будут развиваться с такой же скоростью, vB останется без штанов.:)

KB
На сайте с 10.08.2006
Offline
164
KGB
#27
newpraktika:
Никто не знает как в IPB сделать так чтобы вообще ссылок в форуме не было?

Можно, чтоб ссылок не было, можно так:

открываем файлик class_bbcode_core.php, ищем функцию regex_build_url.

Сразу после строчки $skip_it = 0; добавляем global $INFO;

Должно получиться так:


function regex_build_url( $url=array() )
{
$skip_it = 0;
global $INFO;

В конце функции есть строка:

return $url['st'] . "<a href=\"".$url['html']."\" target=\"_blank\">".$show."</a>" . $url['end'];

Меняем ее на следующее:


if(eregi($INFO['home_url'],$url['html'])) {
return $url['st'] . "<a href='".$url['html']."' target='_blank'>".$show."</a>" . $url['end'];
}
else {
return $url['st']."".$url['html']."".$url['end'];
}


Теперь "активными" будут только внутренние ссылки. Это для IPB версий 2.1.x

M
На сайте с 20.08.2004
Offline
376
#28

уж лучше так, как по мне.


return $url['st'] . "<a href='".$url['html']."' target='_blank'>".$show."</a>" . $url['end'];
}
else
{
return $url['st'] . "<a href='".$url['html']."' target='_blank' rel='nofollow'>".$show."</a>" . $url['end'];
}
Independence
На сайте с 29.10.2005
Offline
428
#29

У меня самописный форум. Работает он так.

Адреса разделов

site.ru/perlforum.html

site.ru/phpforum.html

и пр., где *.html - * это отдельная тема форума (Perl, PHP и пр.).

В каждую такую *.html-ку подгружается Perl-скрипт (инклюдом), который и выводит темы топиков, тексты сообщений людей, открывших эти топики. (страницы с комментариями к этим сообщения уже имеют адреса вида comment.cgi?data=2006-11&tid=123 и т.п.)

Вопрос вот в чем. В этих html'ках высвечиваются сообщения в текущем месяце. Когда начинается новый месяц, старые сообщения доступны в архивном разделе форума, а в этих .html-ках, пока никаких новых сообщений в этом месяце не появится, просто стоит ссылка на архивные раздел и все. Потом это постепенно опять начинает заполняться. Потом опять все в архив и по-новой.

Понятно, что поисковик заходит на страницу perlforum.html, индексирует ее содержимое и дает в выдаче. Проходит месяц, он заходит опять на эту страницу и видит, что там нет тех сообщений, что были раньше.

Вопрос: не скажется ли негативно такая схема работы форума на его индексировании и позициях в выдаче?

Еще вопрос. Сейчас в robots.txt полностью закрыта /cgi-bin/ часть.

Вывод perlforum.html делает скрипт perlforumview.cgi, то есть эта страница доступна по

адресу как perlforum.html, так и perlforumview.cgi, а последующие страницы все по адресам вида perlforumview.cgi?page=2 и т.п.

Архивные сообщения в выбираемом месяце выводятся по схеме типа perlarchive.cgi?data=2006-12, perlarchive.cgi?data=2006-11, perlarchive.cgi?data=2006-10 - то есть для каждого месяца свой адрес.

Комментарии к сообщениям в текущем месяце и в архивных месяцах выводятся по адресам типа comment.cgi?data=2006-11&tid=123 и т.п.

Есть желание открыть хотя бы архив форума с сообщениями, можно без комментариев к этим сообщения.

Что не радует дополнительно.

Если скрипты форума лежат в папке /cgi-bin/forum/ , то часть других скриптов файла лежат в корне папки /cgi-bin/

Если открывать папку /cgi-bin/, то нужно перечислить все эти скрипты для запрета к индексации, то есть любой чел. посмотрит список .cgi-скриптов, что есть на сайте. Правда, некоторые из них работают только по запросам через кнопки (метод POST) и по этому, наверное, их можно там не перечислять?

И еще проблема-это адреса самих .cgi-скриптов на форуме. Правильно ли я понимаю, что придется делать очень длинный robots.txt, который постоянно пополнять, где последовательно запрещать запросы вида:

perlarchive.cgi?data=2006-10&

perlarchive.cgi?data=2006-11&

perlarchive.cgi?data=2006-12&

perlarchive.cgi?data=2007-01&

чтобы запретить индексацию сообщений, отсортированных определенным образом (адреса типа perlarchive.cgi?data=2006-12&sort=a; perlarchive.cgi?data=2006-12&sort=b; perlarchive.cgi?data=2006-12&sort=c)

и при этом чтобы разрешить индексацию только титульных разделов, то все эти сообщения полностью (без сортировок)

pfarchive.cgi?data=2006-10

pfarchive.cgi?data=2006-11

pfarchive.cgi?data=2006-12

pfarchive.cgi?data=2007-01

Третий вопрос: правильно ли я понимаю, что

Disallow: /cgi-bin/script.cgi?page=

запрещает индексацию всех страниц с адресами типа /cgi-bin/script.cgi?page=1, /cgi-bin/script.cgi?page=2, /cgi-bin/script.cgi?page=3 ?

Independence
На сайте с 29.10.2005
Offline
428
#30

pfarchive.cgi в конце вопроса - опечатка; это perlarchive.cgi должно быть; сути вопроса не меняет.

В /cgi-bin/ директории лежат не только Perl-скрипты, но и некоторые файлы различных форматов (включая небольшие базы данных), которые они обрабатывают. Светить их в robots.txt желания нет. Можно их перенести в отдельную папку, но придется лезть и перепрограммировать скрипты. В принципе, из сети нарпямую их не видно, если только в robots.txt о них ничего не писать, а на директорию выставить права (которые вроде и сейчас стоят), чтобы робот не мог просмотреть ее содержимое.

1 23

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий