Вопрос по кодировке и по robots.txt

<<Desperado>>
На сайте с 27.08.2007
Offline
58
1232

Подскажите плз пару вопросов.

1. Изменение кодировки.

На сайте в html коде страниц была установлена кодировка страницы - charset=windows-1251

Но дамп базы сайта находится в кодировке utf-8, в какой все таки кодировке сайт ? в 1251 ? А если я щас сделаю на всех страницах charset=utf-8 как это повлияет на страницы в индексе, они могут просесть по позициям из-за кодировки? Или лучше таки оставить charset=windows-1251 а база пусть так и будет в utf-8 ?

2. Вопрос по robots

На сайте есть страницы вида:

http://www.site.ru/news/index.php?news=6725

их надо все разрешить индексировать, а страницы дубли категорий, типа:

http://www.site.ru/news/index.php

http://www.site.ru/art/index.php

http://www.site.ru/index.php

нужно все запретить. Я сделал такую запись в роботс:

Disallow: /*index.php$

разве она не верная в моем случае? Почему после такой записи у меня не стали попадать в индекс новости вида http://www.site.ru/news/index.php?news=6725 ??

p.s. имеет ли смысл сделать редирект со страниц вида http://www.site.ru/art/index.php на http://www.site.ru/art/ ??

siv1987
На сайте с 02.04.2009
Offline
427
#1
<<Desperado>>:
На сайте в html коде страниц была установлена кодировка страницы - charset=windows-1251

Не факт что на самом деле кодировка charset=windows-1251. Если в заголовках сервера отдается другая кодировка, браузер будет учитывать приоритет серверной, а в хтмл коде вы можете писать хоть японскую.

Но дамп базы сайта находится в кодировке utf-8, в какой все таки кодировке сайт ?

И опять же не факт что сайт был в utf-8, дамп можно делать в любой кодировке. При запросе данных, mysql будет перекодировать автоматически данные.

Тут бы Вам специалисту показаться.

<<Desperado>>:
разве она не верная в моем случае? Почему после такой записи у меня не стали попадать в индекс новости вида http://www.site.ru/news/index.php?news=6725 ??

Верная. То, что не индексируются страницы после добавления, далеко не значит что не индексируются из-за нее. Проверить не пробовали, посмотреть в тулзе вебмастера статистику исключенных страниц запрещенных в роботс?

bracso
На сайте с 03.10.2007
Offline
86
#2

1 - забить, если нет проблем ..

2 - это лучше решать не на уровне роботса

успевает тот, кто не спешит
siv1987
На сайте с 02.04.2009
Offline
427
#3
bracso:
забить, если нет проблем ..

Ну забивать не стоит, лучше все таки разобраться в какой кодировке работает ваш сайт.

bracso
На сайте с 03.10.2007
Offline
86
#4

хотите поспорить ?

кодировка базы и кодировка в которой отдается сайт - разные вещи - это раз

если есть траблы с кодировкой, это сразу видно - это два ..

а вот дубли это уже серьезно, и надо решать координально ...

ПС: то Kamchess - не в теме не лезь ( тож мне реподрочер )

siv1987
На сайте с 02.04.2009
Offline
427
#5
bracso:
кодировка базы и кодировка в которой отдается сайт - разные вещи - это раз

Речь не о разных вещах, а о том чтобы эти вещи желательно были в одной кодировке, это избавит от многих проблем в будущем.

bracso:
если есть траблы с кодировкой, это сразу видно - это два ..

"Траблы" не обязательно означает видимые битая кодировка на странице, здесь есть подводные которые сразу не видно.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий