- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

Как удалить плохие SEO-ссылки и очистить ссылочную массу сайта
Применяем отклонение ссылок
Сервис Rookee
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Пример:
Имеется страница http://delajblog.ru/acronis-true-image-home
На этой странице есть ссылка "Ответить"
<a class='comment-reply-link' href='/acronis-true-image-home?replytocom=1492#respond' onclick='return addComment.moveForm("div-comment-1492", "1492", "respond", "4112")'>Ответить</a>
Эта ссылка ведёт на адрес
http://delajblog.ru/acronis-true-image-home?replytocom=1492#respond
Этот адрес проверяю в гугл вебмастере:
Заблокировано по строке 15: Disallow: /*?*
Т.е по сгенерированной странице робот не ходит, но индексирует.
В коде на странице стоит
<meta name='robots' content='noindex,nofollow' />
Не пойму: отчего тогда индексация?
Кажется так: робот не может прочитать, что страницу индексировать не нужно, т.к. стоит запрет в robots на посещение этой страницы. Но если убрать Disallow: /*?*, то появятся другие дубли, например, поиск по сайту даст страницу с "?"
---------- Добавлено 09.06.2013 в 13:30 ----------
Отдавать на таких страницах не ответ 200, а доступ запрещен. Человеку это не помешает. А боту точно не даст индексировать. Я так с поиском по сайту сделал )
В .htasses так можно?
RewriteCond %{QUERY_STRING} replytocom=
RewriteRule ^(.*)$ /$1? [R=301,L]
Пример:
Имеется страница http://delajblog.ru/acronis-true-image-home
На этой странице есть ссылка "Ответить"
<a class='comment-reply-link' href='/acronis-true-image-home?replytocom=1492#respond' onclick='return addComment.moveForm("div-comment-1492", "1492", "respond", "4112")'>Ответить</a>
Эта ссылка ведёт на адрес
http://delajblog.ru/acronis-true-image-home?replytocom=1492#respond
Этот адрес проверяю в гугл вебмастере:
Заблокировано по строке 15: Disallow: /*?*
Т.е по сгенерированной странице робот не ходит, но индексирует.
В коде на странице стоит
<meta name='robots' content='noindex,nofollow' />
Не пойму: отчего тогда индексация?
еще раз - роботс для гугла запрещает сканирование, а не индексирование - индексирование запрещает метатег noindex. и сюда - http://support.google.com/webmasters/bin/answer.py?hl=ru&answer=156449 там все разжевано, чтобы бот считал метатег на стр не должно быть запретов в роботсе
Кажется так: робот не может прочитать, что страницу индексировать не нужно, т.к. стоит запрет в robots на посещение этой страницы. Но если убрать Disallow: /*?*, то появятся другие дубли, например, поиск по сайту даст страницу с "?"
какие дубли?
еще раз - роботс для гугла запрещает сканирование, а не индексирование - индексирование запрещает метатег noindex. и сюда - http://support.google.com/webmasters/bin/answer.py?hl=ru&answer=156449 там все разжевано, чтобы бот считал метатег на стр не должно быть запретов в роботсе
какие дубли?
То что роботс запрещает сканирование, но не индексирование уже вбил себе в долговременную память.
Кажется дошло. Спасибо за рекомендации.
У меня та же проблема... в роботсе директории запрещены, а в соплях они есть хоть там и пишется рядом, что описание этой страницы запрещено роботсом... как быть?
тупеж полный😂
да открой ты эти страницы в роботс, и метатегами запрети. Гугл же ясно сказал, что страница запрещена роботсом🤪 как только откроешь он ее схавает с метатегами
Теоретический вопрос: почему другие документы запрещенные в robots.txt не попадают в дополнительный индекс Google?
Хотя есть и другие документы, запрещенные в robots.txt. которые также попали в индекс. Почему одни документы попадают в индекс, а другие - нет?
Теоретический вопрос: почему другие документы запрещенные в robots.txt не попадают в дополнительный индекс Google?
Хотя есть и другие документы, запрещенные в robots.txt. которые также попали в индекс. Почему одни документы попадают в индекс, а другие - нет?
а почему одни страницы попадают в индекс.а другие нет!?
а почему одни страницы попадают в индекс.а другие нет!?
Потому что гуглу глубоко наплевать на robots.txt.
"Хотя Google не сканирует и не индексирует содержание страниц, заблокированных в файле robots.txt, URL, обнаруженные на других страницах в Интернете, по-прежнему могут добавляться в индекс" -справка гугла.
используйте noindex
Потому что гуглу глубоко наплевать на robots.txt.
"Хотя Google не сканирует и не индексирует содержание страниц, заблокированных в файле robots.txt, URL, обнаруженные на других страницах в Интернете, по-прежнему могут добавляться в индекс" -справка гугла.
хватит тупить! открой роботс и поставь метатеги😡 мудак!
Строго по теме - 3 рабочих способа избавления от дублей и почему среди них нет robots.txt