- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Зачем быть уникальным в мире, где все можно скопировать
Почему так важна уникальность текста и как она влияет на SEO
Ingate Organic
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Ситуация: Яндекс проиндексировал некие страницы, которые яляются зеркалами
.../forum44/
.../forum44/?order=asc&sort=lastpost
.../forum44/ ?order=asc&sort=title
Эти страницы Яндекс "вытянул" по ссылкам сортировки, хотя были запрещены rel="nofollow"
В настоящее время такие ссылки (сортировки) удалены. При заходе бота Яндекса на сайт - се будет впорядке.
НО (!) - страницы базе остались.
Вопросы:
1. Как их базы Я удалить (вариант полного удаления страниц сайта из базы не прокатывает)?
2. Достаточно в будущем использование <noindex>...</noindex> чтобы избежать подобное?
2. Достаточно в будущем использование <noindex>...</noindex> чтобы избежать подобное?
rel="nofollow" учитывается только Гуглем и MSN
<noindex> - Яндексом и Рамблером
Если хотите, чтобы поисковики не ходили по ссылкам, придется пользоваться обоими извращениями...
Кстати, а не проще ли было запретить в robots.txt?
Если Вы подскажете как в robots.txt запретить к индексированию ссылки типа "?..." (все страницы после знака "?") буду благодарен.
До сих пор не нашел решения.
На форуме много обсуждалось, но решения нет
Можно попробрвать проверять $_SERVER["REQUEST_URI"], и если там есть, к примеру, "?order" отдавать 404-ю ошибку. По идее, со временем страница должна будет удалиться из базы.
и если там есть, к примеру, "?order" отдавать 404-ю ошибку.
Ее же (страницу 404) тогда и пользователи увидят...
Pavel2005,
т.е. "/forum44/" оставить, а "/forum/?..." - нет?
Можно попробрвать проверять $_SERVER["REQUEST_URI"], и если там есть, к примеру, "?order" отдавать 404-ю ошибку. По идее, со временем страница должна будет удалиться из базы.
А как и где это можно сделать? Можно пример?
Спасибо
Ее же (страницу 404) тогда и пользователи увидят...
Pavel2005,
т.е. "/forum44/" оставить, а "/forum/?..." - нет?
Да, именно так.
Только нужно учесть, что таких ссылок много разных. Я привел только один пример.
Мне нужно удалить все ссылки после знака "?"
1. Как их базы Я удалить (вариант полного удаления страниц сайта из базы не прокатывает)?
Вариантов-то всего два:
1) Удалить сайт из индекса целиком, затем добавить его заново.
2) Сделать, чтобы все "лишние урлы" отдавали 404 и затем добавить их в аддурл (можно сделать ссылочную карту, поместить ее на какую-нибудь жирную страницу и подождать).
Второго варианта можно ждать до морковкиного заговенья, а первый вполне действенен и отрабатывает полностью за 4-5 апдейтов.
2. Достаточно в будущем использование <noindex>...</noindex> чтобы избежать подобное?
По идее и документации - достаточно.
Сам пользуюсь яваскриптом - мне так надежней.
Если Вы подскажете как в robots.txt запретить к индексированию ссылки типа "?..." (все страницы после знака "?") буду благодарен.
Обработать $_SERVER["REQUEST_URI"] и при появлении в урле "?" выдавать в <head> дополнительно <meta name=robots content="noindex, nofollow">. Что-то, типа такого:
Либо как Alex Kirillin написал, либо еще как вариант
if (strstr($_SERVER["REQUEST_URI"], '?')) {
header("HTTP/1.0 404 Not Found");
}
Код должен стоять до начала вывода html страницы.
Sadie, поьзователи увидят нормальную страницу, только код будет не 200, а 404, что и надо поисковику для удаления, еще можно жестче поставить 410 Gone
header("HTTP/1.0 404 Not Found");
Вот не стал бы я 404 ставить, если пользователь должен увидеть контент.
Можно случайно своротить подводный камень, уже был такой случай в моей практике.
rel="nofollow" учитывается только Гуглем и MSN
Мсн всеяден.