siv1987
Большое спасибо помогло.
Заметил сегодня косяк, появившийся после вставки редиректов предложенных вами. Перестали работать ссылки выйти из профиля /index.php?action=logout зарегистрироваться на сайт /index.php?do=register и т.д. и т.п. Что не так с редиректами? Код:
DirectoryIndex index.php RewriteEngine On RewriteCond %{HTTP_HOST} ^anime-news\.org.ua$ [NC] RewriteRule ^(.*)$ http://www.anime-news.org.ua/$1 [R=301,L] #Для index.php RewriteCond %{THE_REQUEST} index\.(php|html) RewriteRule ^index\.(php|html)$ /? [L,R=301] #Page1 RewriteRule ^(.*)page/1/?$ /$1 [L,R=301] #Для со слэшем и расширением RewriteCond %{REQUEST_FILENAME} !-f RewriteRule ^([^.]+)(?<!/)$ /$1/ [L,R=301]
Добавил Ваш код в таком виде:
Всё заработало так как надо большое спасибо.
Код добавлен в начало .htaccess лучше в начало или в конец помещать?
Вопрос по поводу ЧПУ для карты сайта:
# Карта сайта RewriteRule ^sitemap/(.*)$ /?do=sitemap [L]
Правильно или нет? Работает нормально, но хотелось бы быть уверенным.
seo_trudogolik
Я недавно начал изучать SEO, и до этого не подозревал о дублях контента вообще, и том, что это плохо, наоборот думал, чем больше страниц, тем лучше, учитывая, что сайт был в те времена добавлен в сапу. Так как со страниц навигации и от главной типа: /page/2/ … /page/N/ и от категорий, например: /anime/page/2/ … /anime/page/N/ уже есть ссылки в сапе, я не могу добавить мета теги noindex. А на новом сайте, который начал делать недавно, эту проблему решил через robots.txt, вот содержание его:
User-agent: * Disallow: /engine/ Disallow: /user/ Disallow: /newposts/ Disallow: /statistics.html Disallow: /*subaction=userinfo Disallow: /*subaction=newposts Disallow: /*do=lastcomments Disallow: /*do=feedback Disallow: /*do=register Disallow: /*do=lostpassword Disallow: /*do=addnews Disallow: /*do=stats Disallow: /*do=pm Disallow: /page/ Disallow: /2011/ Disallow: /favorites/ Disallow: /lastnews/ Disallow: /backup/ Disallow: /language/ Disallow: /cron.php Disallow: /admin.php Disallow: /*do=search Disallow: /tags/ Disallow: /news/ Sitemap: http://anime-manga.org.ua/sitemap.xml User-agent: Yandex Disallow: /engine/ Disallow: /user/ Disallow: /newposts/ Disallow: /statistics.html Disallow: /*subaction=userinfo Disallow: /*subaction=newposts Disallow: /*do=lastcomments Disallow: /*do=feedback Disallow: /*do=register Disallow: /*do=lostpassword Disallow: /*do=addnews Disallow: /*do=stats Disallow: /*do=pm Disallow: /page/ Disallow: /2011/ Disallow: /favorites/ Disallow: /lastnews/ Disallow: /backup/ Disallow: /language/ Disallow: /cron.php Disallow: /admin.php Disallow: /*do=search Disallow: /tags/ Disallow: /news/ Host: anime-manga.org.ua
То есть теоритически таким robots.txt я закрыл от индексации все абсолютно ссылки кроме тех, которые есть в sitemap.xml, а именно для индексации доступно только главная страница, главные страницы категорий и страницы новостей, если будут вылизать какие-то левые страницы буду добавлять дополнительные директивы в robots.txt, что бы поубивать их. ИМХО исключение через robots.txt без колупания движка сайта, что бы поставить на нужные страницы нужные мета теги, для меня удобней, может я и ошибаюсь. Что Вы скажите по поводу такого варианта скрытия ненужных страниц?
1) В движке DLE нет 301 редиректа на основной домен сайта, например: с http://anime-news.org.ua/ на http://www.anime-news.org.ua/.
2) В движке DLE нет 301 редиректа на / с /index.php и / index.html.
3) Также возникают дубли из-за страниц вида: page/2/ и page/2, это две одинаковые страницы, которые выдают статус 200 ОК, то есть создаться море дублей, особенно учитывая, что на сайте уже более двух тысяч новостей…
Надо реализовать вышеописанные пункты.
1 и 2 пункт в любом случае 301 редирект, а вот 3 пункт спорный с ним справляются люди по-разному. Идут до сих пор споры, что лучше ссылки со слэшем или без. Я выбрал вариант ссылок со слэшем, так как мне лично ссылки со слэшем в конце нравятся больше и, похоже, создатели движка DLE думают также, так как движок генерирует ссылки со слэшем в конце, если выбрать вариант без слэшей, тогда нужно будет вносить довольно много изменений в движок, какие именно можно прочитать здесь: http://alaev.info/post/2400
Закрыть страницы без слэшей от индексации при помощи мета тега <meta name="robots" content="noindex,follow" /> идея хорошая, но я догадываюсь, что придется опять-таки же вносить изменения в движок сайта, сомневаюсь, что эти теги можно расставить на нужные страницы в автоматическом режиме без изменений в движке, хотя может я и ошибаюсь, напишите тогда, как это сделать, если это так.
Из выше сказанного, учитывая тот факт, что я не хочу вносить изменений в движок сайта, следует вывод, что наиболее рациональный выход из сложившейся ситуации – это использовать 301 редиректы, так как в этом случае нужно изменить только один файл, а именно: .htaccess
Так как реализовать все 3 пункта описанные в начале этого сообщения при помощи только 301 редиректов редактируя только файл: .htaccess?
P.S. ИМХО: Ещё бонус от 301 редиректа, если со страницы page/2 происходит 301 редирект на страницу page/2/, тогда в этом случае вес первой страницы перетекает ко второй, происходит склейка этих двух страниц, а если первую запретить к индексированию при помощи мета тега, тогда вес первой страницы просто испарится в никуда склейка этих двух страниц не произойдёт. Так зачем же терять веса попусту, хотя я могу и ошибаться.
Спасибо за помощь, но не вышло.
Попробовал вот так:
#Для index.php RewriteCond %{THE_REQUEST} index\.(php|html) RewriteRule ^index\.(php|html)$ / [L,R=301] #Page1 RewriteRule ^(.*)page/1/?$ /$1 [L,R=301] #Для со слэшем и расширением RewriteCond %{REQUEST_FILENAME} !-f RewriteRule ^([^.]+)(?<!/)$ /$1/ [L,R=301] RewriteRule ^(.*)$ http://www.anime-news.org.ua/$1 [R=301,L]
И так:
RewriteRule ^(.*)$ http://www.anime-news.org.ua/$1 [R=301,L] #Для index.php RewriteCond %{THE_REQUEST} index\.(php|html) RewriteRule ^index\.(php|html)$ / [L,R=301] #Page1 RewriteRule ^(.*)page/1/?$ /$1 [L,R=301] #Для со слэшем и расширением RewriteCond %{REQUEST_FILENAME} !-f RewriteRule ^([^.]+)(?<!/)$ /$1/ [L,R=301]
В обоих случаях на всех страницах сайта белый экран с надписью:
Что я сделал не так? Помогите, пожалуйста.
Kartinka2008
Убрал возможность комментировать новости на сайте, так как устал бороться со спамом. Нормальные комментарии были от "настоящих" пользователей, но при этом тоннами лились комментарии с различными ссылками от спамеров. Как бороться со спамом помимо ручной проверки и вводом всевозможных каптч?
1) На этом сайте никогда не было ТИЦ 10 и раскупали же ссылки на протяжении более года стабильно. Я конечно попытаюсь поднять ТИЦ, но всё же вроде не в этом собака зарыта.
2) Да согласен, что новости скопированы в большинстве случаев, без каких либо изменений, но я пробовал переводить сам из первоисточников c английского на русский, тогда совпадения были в районе 60 – 80%. Это короткие новости, а не обзоры и даже, если пытаться пересказывать своими словами уникальности трудно добиться.
3) Это в данный момент в яндексе мало страниц, обычно было, наоборот, в гугле например 800 страниц, а в яндексе более 10 тысяч страниц.
4) Спасибо за совет, думаю так и поступлю.
К сожалению, физически удалить ссылки скорей всего не выйдет, так как сайт новостной, ссылки содержатся в новостях, и смысл в этих новостях для пользователей потеряется.
Сайт http://anime-news.org.ua/ в сапе он уже почти два года, обычно выкупались ссылки на 90% -100%. В настройках указано одна ссылка с сапы на страницу. Сейчас же уже почти на протяжении полу года процент выкупленных ссылок падает. В данный момент, например, ссылки 3 уровня 281/2283 (12%), 2 уровня 41/106 (39%), 1/1 (100%).
Что с сайтом не так? Какие могут быть причины такой ситуации?
Заказывал прогон сайта по 2 тарифу с составлением проекта и разбором писем. Выполнили качественно и в срок. На почтовик упало 2263 писем (входящие) + 167 (спам) и продолжают поступать. Спасибо и советую другим услуги ТС!
У меня сайты перелинкованы таким образом:
S1 сайт на укозе сапа была, S2 - S7 сайты на одном хостинге, одно ай пи, один ник хэндл, на всех сайтах есть сапа кроме S6, после апа выдачи 31.03.2010 "вылетели"* все сайты кроме S6 и S7.
*имею ввиду не нуль страниц, а осталось по 4 - 40 страниц на каждом сайте...
В моём случае выходит, что яша порезал "молодые" сайты с сапой, сделал такой вывод, так как S7 создавался примерно в июле 2009, S6 создавался чуть более месяц назад.
Пожалуйста подскажите:
1) Стоит ли убирать или менять перелинковку?
2) Стоит ли временно убирать сапу?
3) Дайте совет на будущее, застрахует ли от вылета с индекса, если добавлять в сапу только сайты возрастом более полу года?
P.S. На сайты S3 и S4 недавно добавил лаекс, тематику статей, естественно, не соблюдал, статьи "разбивали" "тематическую целостность". Могло ли это как то повлиять, или внести свою лепту в эту мрачную ситуацию?
Заказывал прогон двух сайтов, заказ был выполнен в сроки, качеством доволен. Рекомедую.