"Почему так" - это вопрос скорее риторический. Истина в том, что "так" случается почти всегда, если один контент отзывается по разным УРЛам. Посему советую сосредоточить силы на вопросе "как с этим бороться". Навскидку 3 варианта:
1. (тупой, но может и прокатить) Попробовать отсечь лишнее в robots.txt - это если каким-то чудом "ненужные" параметры выводятся раньше нужных
2. (более умный) Поиграться с .htaccess и mod_rewrite (дока по mod_rewrite)
3. (я бы сделал так) В начале главного скрипта сделать функцию, которая будет отдавать 404 заголовок, анализируя суперглобальный массив $_GET. Т.е. примерно так:
$goodparams = array_flip(array('page', 'article')); //массив "хороших" параметров foreach ($_GET as $param => $value) { if (!isset($goodparams[$param])) { header("HTTP/1.0 404 Not Found"); //безболезненно отдаем 404 ошибку, //что отнюдь не мешает нам показать юзерю контент break; } }
Однако это не решает проблему передачи неверных значений в нужные параметры. В таком цикле можно проверять по крайней мере is_numeric, а уж имеет ли значение смысл - это надо проверять в движке.
Умные люди уже догадались бы. А их глупые "спаленые" кокуренты заводили бы тут по 4 темы в день, мол, чей-то я так спалился....
По поводу пропавших беков.
1) Возможно были быстророботные
2) Возможно поклеились сниппеты. Попробуйте дописать к запросу &rd=0 в адресной строке
3) Возможно что-то отвалилось, тоже бывает, хотя нечасто
4) Возможно что-то не показывает. Попробуйте проверить через расширенный поиск несколько ссылок, которые показывались, а потом исчезли. Т.е. заходим в расширенный поиск, в поле "находятся на сайте" вбиваем УРЛ сайта со ссылкой, в поле "содержат ссылку" - адрес нашего сайта. Смотрим.
Э... что-то мне подсказывает, что у http://www.trenager.ru/ нафигация на JavaScript. Не знаю уж, зачем это нужно, но явно не для того, чтоб помочь роботу проиндексировать сайт =)
Немного изврата =)
В яндексе можно попытаться искать так: #url="www.site.ru*" #link="www.*"
Например, внешние ссылки с lenta.ru
Это страницы сайта lenta.ru, содержащие, по мнению яндекса, ссылки виды www.* - поскольку обычно используются относительные пути, это, скорее всего, внешние ссылки. Жирным в сниппете показывается первое слово ссылки.
Как добавить прямо в выдачу УРЛ куда ведет ссылка я не придумал. Можно, в принципе, прямо на эту выдачу натравить спайдера, чтобы не ворошить весь сайт, а собрать только нужные данные с нужных страниц. Но что-то мне подсказывает, что точность будет несколько хромать. Например, с моих подопечных сайтов яндекс таким макаром не показывает сквозняки. Ссылки без www тоже пропадут.
И не мегамозги, а мегазады, способные долго и упорно жать кнопки в субмиттере и меняться ссылками 22 часа в сутки =) Ну, и, пожалуй да, мегамозги-спамеры, у которых получится все это автоматизировать =)
По сабжу. ИМХО, топикстартеру не хватает опыта работы "в промышленных масштабах". Когда есть 2 проекта по 50 баксов, конечно, можно и "незамыленные решения" искать... и даже радоваться каждой новой ссылке... а когда проектов становится несколько больше, хм, "замыленные" решения представляются скорее надежными, а их банальность уже как-то побоку =)
Ну, вообще-то разобраться с ЧПУ имеет смысл не столько ради результата, сколько ради того, чтоб потом в следующем проекте с самого начала делать "по-человечески", не испытывая никаких технических трудностей.
А в плане СЕО результат почти незаметен. Не вырастут ни позиции, ни даже тИЦ =) Но аккуратненькие ссылки в СЕРПе - тоже ценно +)
На третьем эпизоде лег под стул...
Респект!
Ну значит ты еще не на достаточно высоком уровне работаешь, если тебе любой новичек - потенциальный конкурент =)
На самом деле, если человек толковый и имеет потенциал, он безо всяких советов разберется. А если нет - значит и не конкурент. И если кто-то интересуется СЕО - это еще не значит, что он послезавтра начнет заказы принимать. Многие ведут один сайтик, никуда особо не рвутся. Часто это бывает человек, оказавшийся "крайним" в какой-нибудь маленькой конторе, т.к. кроме него сайтом заниматься вроде некому, а на профи денег заведомо жалко. Ну, почему бы таким товарищам не рассказать про тиц и виц?
Понятно, что у каждого есть набор секретов, про которые надо помалкивать. Тут уж специфика производства - многие хорошие идеи теряют ценность, как только выходят в массы.
А еще... меня вот несколько удручает общественное мнение (общественности, которая не в теме), что все оптимизаторы - козлы и спамеры. Как ни прескорбно, но такое мнение существует. Поэтому предостерегать от явных козлизмов, спама и пр. - мне кажется дело полезное. Правда, в глобальном смысле, т.е. польза получается нематериальная =)
Это один из способов смотреть бэклинки. Не самый популярный, т.к. много кликов надо делать =) Все способы дают примерно одинаковый результат, так что чем они отличаются разбираться не интересно. Как смотреть бэклинки я недавно кому-то объяснял вот в этом посте.
Еще можно проверить, не открыта ли статистка (счетчик).
Можно, кстати, поиграться вот с этой штукой http://search.liveinternet.ru/ - если на анализируемом сайте есть счетчик ливинтернета, можно методом подбора посмотреть, с какого запроса сколько народу идет. Но для этого надо знать запросы =)
Переходом на Firefox =) Вроде нормально работал.