Сейчас, по крайней мере по Киевскому региону, по запросу "Внутренняя политика России и идеи гитлеризма", "Как видно, идеи гитлеризма им не чужды" (без кавычек) ваш сайта стоит на первом месте. Т.ч. беспокоится, на мой взгляд, не нужно. То, что пока у вашего блога траст меньше, чем у конкурента, так это со временем пройдет. Ссылки с чужих сайтов тоже плюс к развитию вашего блога. И вообще, если замечена такая тенденция - сами размещайте статьи (неполный текст статьи оригинальной + небольшой рерайт) на тематических (новостных) сайтах с аналогичным указанием себя, в качестве источника, и тогда полный копипаст на другом ресурсе не будет так выделяться в выдаче.
Не уверен, что это дор ТС-а, т.к. из найденых доров парочка за декабрь 2011 года. Правда все равно стата впечатляет, на некоторых по 5-7к трафика дейли. Знать бы еще чем их загоняют в яндекс, может просветит кто? И почему в гугле они не живут?
Вот переработанный универсальный запрос:
RewriteCond %{THE_REQUEST} \? RewriteRule (.*) /$1? [L,R=301]
Тестировал и так, и этак - вроде бы без ошибок теперь отрабатывает.
404 можно вот так:
RewriteCond %{REQUEST_URI} !^/index\.phpRewriteCond %{QUERY_STRING} !=""RewriteRule (.*) $1 [L,R=404]
В первой строке указываем файлы скрипта, которые далее по файлу разворачивают запросы вида
RewriteRule ^blabla/([^/]+)?$ index.php?module=blabla&category=$1 [L]
Если все страницы статические, то первая строка не нужна.
С 301 сложнее, т.к. если надо, чтобы редиректило на этот же урл, но без ?anyshit , то редирект надо организовывать php скриптом, который будет вырезать ?anyshit из запроса. А сам модреврайт может менять только REQUEST_URI и оставляет неизменным QUERY_STRING и сам знак вопроса.
Upd, только что проверил, если в RewriteRule (.*) $1 добавить знак вопроса, то нормально обнуляется QUERY_STRING и можно использовать 301 редирект, т.е.
RewriteCond %{REQUEST_URI} !^/index\.phpRewriteCond %{QUERY_STRING} !=""RewriteRule (.*) $1? [L,R=301]
Единственное, что не удалось побороть - случай когда к запросу просто добавляется знак вопроса - в этом случае правила не срабатывают
Замечу насчет метода генерации дублей внешними ссылками. Самый простой способ избежать санкций от ПС - это добавлять в страницу материала атрибут rel="canonical", тем более что и Яндекс, и Гугл заявляют у его полной поддержке (пруф и пруф).
Поправьте, если я ошибаюсь.