hashID и Яндекс

12
SU
На сайте с 22.11.2004
Offline
68
854

Уважаемые форумчане!

Наш сайт строим на одной cms (phpWcms.de) , кто-нибудь из вас сталкивался с проблеми индексации сайтов cms которых использует hashID? Хотя url-ы на сайте имеют вид: http://www.site.ru/news_1/125.45.38.phpml

но hashID все же используется.

Хотя cms и отфильтровывает (вроде) боты поисковиков (про яндекс молчу), но что то у меня возникают сомнения в том, что Яндекс сможет корректно индексировать сайт на котором:

// start session - neccessary if frontend users are available

// but neccessary also to check if a bot is visiting the site

// -> if so then do not initialize session for larger search engines

$BOTSLIST = array('googlebot', 'msnbot', 'ia_archiver', 'altavista', 'slurp', 'yahoo', 'jeeves', 'teoma', 'lycos');

$IS_A_BOT = false;

foreach($BOTSLIST as $value) {

if(!$IS_A_BOT && stristr($_SERVER['HTTP_USER_AGENT'], $value)) {

$IS_A_BOT = true;

break;

}

}

// if no bot was found initialize session

if(!$IS_A_BOT) {

session_name('hashID');

session_start();

/*

if (!isset($_SESSION['initiated'])) {

session_regenerate_id();

$_SESSION['initiated'] = true;

}

*/

}

T.R.O.N
На сайте с 18.05.2004
Offline
314
#1

Надо смотреть более подробно. В большенстве вариантов построения, происходит следующее. На самом деле страницы /news_1/125.45.38.phpml как и остальных просто нет. Они генеряться на лету, перехватив имя. Еще чаще при этом генерится 302 ошибка, а потом дается сам контент. Тогда конечно с роботом я, как и с другими могут быть проблемы.

А то что происходит с сесиями, если это не влияет на результат выдачи - так пусть делает что хочет.

От воздержания пока никто не умер. Хотя никто и не родился! Prototype.js был написан теми, кто не знает JavaScript, для тех, кто не знает JavaScript (Richard Cornford)
ITPuls
На сайте с 25.08.2005
Offline
109
#2

А почему остановились на phpWcms? По-момему Typo3 всегда отличался большей стабильностью и функционалом... - там кстати вообще таких проблем не возникает...

Демидов Николай
SU
На сайте с 22.11.2004
Offline
68
#3
T.R.O.N:
Еще чаще при этом генерится 302 ошибка, а потом дается сам контент. Тогда конечно с роботом я, как и с другими могут быть проблемы.

Хм, подскажите пожалуйста, а с помощью такого сервиса как http://seolab.ru/add/header.htm можно отследить выдается ошика 302 или нет?

Например если проверить заголовки сайта разработчика cms, то вроде все в порядке 200:

Location: http://phpwcms.de/index.php?id=2,0,0,1,0,0

HTTP/1.1 200 OK

Date: Wed, 31 Aug 2005 07:08:46 GMT

Server: Apache/1.3.33 (Linux/SuSE) mod_gzip/1.3.19.1a mod_ssl/2.8.22 OpenSSL/0.9.6g PHP/4.3.10

X-Powered-By: PHP/4.3.10

Keep-Alive: timeout=15, max=100

Connection: Keep-Alive

Content-Type: text/html

Или это еще не показатель?

T.R.O.N
На сайте с 18.05.2004
Offline
314
#4
Хм, подскажите пожалуйста, а с помощью такого сервиса как http://seolab.ru/add/header.htm можно отследить выдается ошика 302 или нет?

ТАк какая страница проверяется

http://www.site.ru/news_1/125.45.38.phpml или

http://phpwcms.de/index.php?id=2,0,0,1,0,0

SU
На сайте с 22.11.2004
Offline
68
#5
T.R.O.N:
ТАк какая страница проверяется
http://www.site.ru/news_1/125.45.38.phpml или
http://phpwcms.de/index.php?id=2,0,0,1,0,0

www.site.ru пока лежит локально. Просто я предположил, что если в cms имеются проблемы с 302 изначально, то пролема будет видна на любом сайте построеном на данной cms, или я ошибаюсь?

SU
На сайте с 22.11.2004
Offline
68
#6
T.R.O.N:
ТАк какая страница проверяется
http://www.site.ru/news_1/125.45.38.phpml или
http://phpwcms.de/index.php?id=2,0,0,1,0,0

site.ru - я прописал реврайт, а разработчик видимо, реврайтом не захотел воспользоваться.

Хотя для http://www.site.ru/news_1/125.45.38.phtml

реальный (до реврайта) адрес действительно http://www.site.ru/news_1.php?id=125,45,38

T.R.O.N
На сайте с 18.05.2004
Offline
314
#7

значит для этой странице будет 302 ошибка, с редиретом на

http://www.site.ru/news_1.php?id=125,45,38 ..... и хорошо если так, а не еще куданить, отличное от www.site.ru, тогда это воще граничит с накруткой.

SU
На сайте с 22.11.2004
Offline
68
#8
T.R.O.N:
значит для этой странице будет 302 ошибка, с редиретом на
http://www.site.ru/news_1.php?id=125,45,38 ..... и хорошо если так, а не еще куданить, отличное от www.site.ru, тогда это воще граничит с накруткой.

Т.е. тогда не пользоваться реврайтом?

P.S. Спасибо за Ваши ответы и извините плиз за глупые вопросы (вообще то по образованию я маркетолог, но нелегкая занесла меня в сферу ИТ :)

SU
На сайте с 22.11.2004
Offline
68
#9
T.R.O.N:
значит для этой странице будет 302 ошибка, с редиретом на
http://www.site.ru/news_1.php?id=125,45,38 ..... и хорошо если так, а не еще куданить, отличное от www.site.ru, тогда это воще граничит с накруткой.

Хм, ничего не понимаю: например страничка http://www.kmedv.at/sbm/cms/11.153.0.0.1.0.phtml

даже такая страничка отдает 200 OK

или есть разница между заголовками которые отдаются клиенту и заголовками которые отдаются боту?

T.R.O.N
На сайте с 18.05.2004
Offline
314
#10
Хм, ничего не понимаю: например страничка http://www.kmedv.at/sbm/cms/11.153.0.0.1.0.phtml

даже такая страничка отдает 200 OK

Если так, то все ок.

Это значит что редирект скрыт самим сервером. Все будит намано.

разница между заголовками которые отдаются клиенту и заголовками которые отдаются боту?

А вот это тогда скрыто в недрах по сервера

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий