ТС показал сайт - эти URL редиректят на другие сайты, Google так и будет на них реагировать, тк формально он проверяет в robots.txt уже второй URL, куда показывает редирект. А там вообще другой домен.
Тема кратко описана тут и более полно - тут, но потребуется знание нерусскиго языка или беглого владения переводчиком Google.
По Юзер-Агенту "YandexBot" отдавайте "404 Not found" или уж сразу "Redirect 301" на сайт конкурентов, если уж начали "мутить" с клиентским сайтом.
Можно ссорудить конструкцию типа такой:
SELECT * FROM `имя_таблицы` WHERE parameters LIKE '%"height":"4__",%' OR parameters LIKE '%"height":"5__",%' OR parameters LIKE '%"height":"6__",%', выгребет от 400 до 600 включительно.
В более сложных случаях придётся выгребать все записи и отсеивать регуляркой на PHP.
В общем - правы. Возможно и .рф не будет рулить (.ру .нет - где вы??) и быстро выйдет из моды. С кириллицей в url нерешенных технических проблем ещё много.
А по поводу транслита решать голосованием - не комильфо.
Правильность транслитерации надо спрашивать у Яндекса и Google, иначе не получите бонусов от транслита.
Мистика какая-то, показывайте сайт.
У меня с Новосибирска по кирпич в Москве" - все московские - см скрин ниже.
А по запросу "Кирпич" внизу страницы появляется надпись: "При поиске отдано предпочтение сайтам из Новосибирской области" - значит запрос регионозависимый.
Запаритесь так двигаться в регионах, и дублей будет куча. Для регионов - странички для основных запросов, и телефоны/адреса поставить Екатеринбуржские.
Если включить сайт в Яндекс-каталог - там можно присвоить сразу несколько регионов - тогда поддомены не нужны.
Проверьте свой robots.txt анализатором Яндекса. У Google в панели ВМ, кажись, тоже подобное есть, но не суть важно.
Загружаете свой robots.txt в анализатор и проверяете url на запрет индексации.
Ну и запрет в robots - это лишь рекомендация для вежливых роботов.
Логично. А когда дор отловят - отправят в БАН и выкинут из индекса, какой смысл применять санкции постфактум? А пока дор в индексе - проблем нет, ПС не считает его дором (а то забанила бы).
К тому же, доры часто ссылаются на нормальные сайты, пытаясь задействовать теорию HITS.
PS: То, что за внешние факторы санкций нет - это уже очень спорное утверждение.
Сайтам типа mail.ru внешними не навредить, а вот свежеиспеченные сайты не так устойчивы.
Не найдет.
Запрос "Кирпич" - регионоЗависимый, то есть предпочтение в выдаче буде сайтам из региона, откуда IP этого потенциального клиента.
Именно за этим Яндекс и ввел региональность.
По "кипрпич в Москве" - найдет (если Вы по нему продвинулись в ТОП среди москвичей)
Если Вы работаете на регионы - делайте региональные поддомены - их можно привязать по регионам.
У Вас появятся дубли страниц со старым и новым url, если таких страниц много - это плохо.
Надо ставить со старых Редирект на новые, но при этом они временно вылетят из индекса.