Попробуйте создать Робтс. Тxt для сайта, который был создан на CMS yugo martin - Вопросы новичков в SEO

427

siv1987

27 января 2014, 15:33

#71

Alexeych:
Правильно ли я понимаю, что директива
Disallow: */index.php
запрещает к индексации только файл index.php
а:
Disallow: /*index.php$
все урлы оканчивающиеся на index.php?

Не правильно. Она запрещает все адреса содержащие index.php - /index.php?cat=1.

А вот вторая да - оканчивающиеся на index.php.

51

FUN4ik

29 января 2014, 11:06

#72

Всем привет. Подскажите, пожалуйста, как правильно создать robots.txt для сайта, который был создан на CMS yugo martin. Спасибо.

Регистрация в каталогах (/ru/forum/810601) Верстка сайтов и дизайн (/ru/forum/810604) Услуги по наполнению сайтов (/ru/forum/810606) Качественный копирайт и рерайт (/ru/forum/810603)

26

CHePaS

29 января 2014, 12:03

#73

Не знаю причем здесь CMS.

В стандартном роботсе указывается:

User-agent: - определяет правила для всех или одного поискового робота

Disallow: - закрывает от индексации нужные разделы

Host: - указывает роботу главное зеркало

Sitemap: - карта сайта

Заходит как-то SEOшник в бар, ресторан, купить алкогольные напитки, клубы, лучшие бары в Москве, заказать банкет в ресторане…

E

283

easywind

1 февраля 2014, 08:40

#74

FUN4ik:
как правильно создать robots.txt

xenu проверте все ссылки сайта. Посмотрите какие страницы есть и будете примерно знать, что закрывать.

V8

31

Vitos87

2 февраля 2014, 14:55

#75

Я хочу исключить страницы с решеткой (запись/#more-21 и запись/#comments), теги, страницы навигации с главной и рубрик (/page/2/ и т.д). Сайт на вордпрессе (если имеет значение).

Будет ли робтс, который ниже, правильным или нужно прописывать отдельно по ПС все расписывать?

User-agent: Yandex

Disallow:

HOST: site.ru

User-agent: Googlebot

Disallow:

User-agent: *

Disallow: /#*

Disallow: /*?dem

Disallow: /tag

Disallow: /page

Disallow: /wp-includes/wlwmanifest.xml

Disallow: /xmlrpc.php?rsd

O0

51

oz0n3

3 февраля 2014, 21:50

#76

Добрый день, Знатоки!

Подскажите пожалуйста, может ли прописанный на страницах сайта тег

<meta name="Robots" content="noarchive, index" /> быть причиной ошибки при запросе кэша страницы(cache:site.ru)? т.к. страница уже давно в индексе, но кеш постоянно выдает ошибку.

Заранее благодарен!

---------- Добавлено 03.02.2014 в 23:59 ----------

sorry, туплю, он ведь для этого и используется насколько я понял!

Вопрос в том, может ли он как-то негативно влиять на ранжирования сайта в целом непосредственно Googlom?

Читал на бурж форумах что вроде этот тег часто используется при клоакинге и может стать тревожным звоночком для гугла.

Есть у кого опыт по использованию?

W

43

webser

4 февраля 2014, 00:42

#77

А для чего собственно вы используете данный мета тег? если вам нужно закрыть сайт от веб архива просто в

robots.txt пропишыте :

User-agent: ia_archiver

Disallow: /

F

114

fowl

4 февраля 2014, 07:48

#78

как запретить в Robots.txt индексацию страниц с решеткой в конце?? вида site.ru/kakoitourl#

Disallow: *\# или Disallow: *# - ничего не запрещает
Disallow: */# - запрещает все :(

1723

LEOnidUKG

4 февраля 2014, 07:57

#79

Решётка для браузеров, а не для роботов.

✅ Мой Телеграм канал по SEO, оптимизации сайтов и серверов: https://t.me/leonidukgLIVE ✅ Качественное и рабочее размещение SEO статей СНГ и Бурж: https://getmanylinks.ru/

1609

SeVlad

4 февраля 2014, 07:58

#80

fowl:
как запретить в Robots.txt индексацию страниц с решеткой в конце?? вида site.ru/kakoitourl#

А кто тебе сказал, что якорь попадает в индекс?

Делаю хорошие сайты хорошим людям. Предпочтение коммерческим направлениям. Связь со мной через http://wp.me/P3YHjQ-3.

В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах

Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ

Все вопросы по robots.txt