Помогите с установкой и настройкой robots.txt и .htaccess

A
На сайте с 06.11.2010
Offline
128
478

Здравстуйте.

В интернете почитал насчёт того как установить и настроить robots.txt и .htaccess

и запутался, там много всяких различных функций, что я даже не знаю какие использовать,

а хочу всё заранее сделать правильно, чтоб всё работало до индексации сайта.(сайту 1 день)

Примерно что я хочу:

1 - главный домен www.sait.ru

2 - закрыть от индексации одну папку

3 - настроить 301 редирект

что делать с .htaccess я вообще не знаю. Для нового сайта что ещё нужно? Если нужен сам сайт в личку напишу.

Заранее спасибо!

master_jeday
На сайте с 15.05.2010
Offline
231
#1

Если основное зеркало - www.sait.ru, в robots.txt пишите:

User-agent: *

Disallow: / *закрывает путь к файлу или папке для индексации*

User-agent: Yandex
Disallow: / *закрывает путь к файлу или папке для индексации*
Host: www.sait.ru

Sitemap: http://www.sait.ru/sitemap.xml *путь к карте сайта, если есть*

Как составить robots.txt читайте здесь.

Чтобы поставить 301-й редирект с sait.ru на www.sait.ru, в файле .htaccess добавляете строчки:

RewriteEngine On

RewriteBase /
RewriteCond %{HTTP_HOST} ^.sait\.ru$ [NC]
RewriteRule ^(.*)$ http://www.sait.ru/$1 [R=301,L]
Дорвеи на заказ с гарантией трафика ( /ru/forum/993918 ) >>> Осторожно, в телеге/скайпе есть клоны! Проверяйте, что общаетесь именно со мной через личку!
A
На сайте с 06.11.2010
Offline
128
#2

master_jeday, спасибо большое Вам за ответ, у меня есть ещё вопрос.

User-agent: * - это для всех роботов? если да то чего мы прописываем Host: www.sait.ru только яндексу?

Если мне не надо ничего закрывать от индексации Disallow: так должен выглядеть? Без /?

У меня на сайте 3 части заинклюжены, инклюды хранятся в папке include стоит ли эту папку запрещать к инексации? И есть папка с скриптом опроса эту папку тоже запретить?

Alkoshenko добавил 14.02.2011 в 00:07

вот сделал .htaccess вродебы всё работает

Options +FollowSymLinks

RewriteEngine On
RewriteCond %{HTTP_HOST} ^gistoryja\.ru$ [NC]
RewriteRule ^(.*)$ http://www.gistoryja.ru/$1 [R=301,L]

RewriteEngine On
RewriteCond %{REQUEST_URI} ^/index\.(.+)$
RewriteRule ^.*$ http://%{HTTP_HOST}/ [R=301,L]

ErrorDocument 404 /404.jpg

Сделал robots.txt

Правильно?

User-agent: *

Disallow: /sendmail/
Disallow: /opr/

User-agent: Yandex
Disallow: /sendmail/
Disallow: /opr/
Host: www.сайт.ru
Sitemap: http://www.сайт.ru/sitemap.xml
master_jeday
На сайте с 15.05.2010
Offline
231
#3
Alkoshenko:
User-agent: * - это для всех роботов?

Верно.

Alkoshenko:
если да то чего мы прописываем Host: www.sait.ru только яндексу?

Директиву "Host" "понимает" только Яндекс, поэтому, во избежание ошибок сканирования другими пауками, этот атрибут назначают только роботу Яндекса.

Alkoshenko:
Если мне не надо ничего закрывать от индексации Disallow: так должен выглядеть? Без /?

Атрибут "Disallow" запрещает индексирование всего сайта (Disallow: /), папки (Disallow: /category/), страницы (Disallow:/category/list.html) или же сходных путей (Disallow: /category?do=) Если запрещать к индексации ничего не требуется, данная директива просто не указывается.

Alkoshenko:
У меня на сайте 3 части заинклюжены, инклюды хранятся в папке include стоит ли эту папку запрещать к инексации? И есть папка с скриптом опроса эту папку тоже запретить?

Не знаю, тут смотрите сами: если эти страницы индексировать не требуется, то запрещайте.

Alkoshenko:
вот сделал .htaccess вродебы всё работает

Все правильно. Только если перед последними строчками:

RewriteEngine On

RewriteCond %{REQUEST_URI} ^/index\.(.+)$
RewriteRule ^.*$ http://%{HTTP_HOST}/ [R=301,L]

нет значка #, то эти три последние строчки нужно удалить, хотя не уверен:).

А эти:

Options +FollowSymLinks

RewriteEngine On
RewriteCond %{HTTP_HOST} ^gistoryja\.ru$ [NC]
RewriteRule ^(.*)$ http://www.gistoryja.ru/$1 [R=301,L]

оставить.

Alkoshenko:
Сделал robots.txt
Правильно?

Структура верная, только между строками "Host:" и "Sitemap:" указывается пустой перевод строки. То есть, так:

User-agent: *

Disallow: /sendmail/
Disallow: /opr/

User-agent: Yandex
Disallow: /sendmail/
Disallow: /opr/
Host: www.сайт.ru

Sitemap: http://www.сайт.ru/sitemap.xml
A
На сайте с 06.11.2010
Offline
128
#4

Спасибо большое за консультацию :)

Всётаки есть отзывчивые люди.

Есть ещё небольшой вопросик :o

При создании карты сайта здесь xml-sitemaps.com

какие настройки использовать?

Change frequency?

Last modification?

Priority?

Заранее спасибо!:)

master_jeday
На сайте с 15.05.2010
Offline
231
#5

Используйте все вышенаписанное.

A
На сайте с 06.11.2010
Offline
128
#6

Нет, там просто в каждо пункте есть выбор, а я не знаю что выбирать да ещё с английским не дружу)

master_jeday
На сайте с 15.05.2010
Offline
231
#7

Я вообще сервисами по генерации карт не пользуюсь (такая функция предусмотрена в используемом мной движке), но, по логике, при выборе данных опций будет отображаться следующее:

Change frequency - <changefreq>периодичность обновления, для робота</changefreq>

Last modification - <lastmod>дата последнего изменения страницы</lastmod>

Priority - <priority>приоритет страницы для робота</priority>

Ну, и <loc>урл страницы</loc> - просто не может не генерироваться:).

A
На сайте с 06.11.2010
Offline
128
#8

Спасибо большое! :)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий