Кстати говоря, о приходе спама на незасвеченные адреса... Зачастую это впечатляет, пока не начнешь разбираться с конкретным видом адреса. Так вот, самый простой способ разослать спам, не собирая адресов вообще - берется список доменов в зоне .ru, например, из него комплектуется список адресов типа webmaster@domain.ru, admin@domain.ru, root@domain.ru, info@domain.ru и шлется спам. Мне кучу раз приходил такого вида спам - при том, что адресов типа info@searchengines.ru просто никогда не существовало, но сервер не отбивает письма, а отправляет на головной аккаунт...
Да элементарно - страница-то вообще одна - showthread.php, только параметры разные...
Мой почтовый траффик вообще к М9 никакого отношения не имеет. А спама получаю не меньше остальных.
Письмо на два килобайта - это один полный экран в Бате... Т.е. строк 20, как минимум. А технике скорокликанья и быстропрокрутки кто такого агента научит?
Ну, ерунда какая. Есть еще отморозки вроде меня, у которых только траффик от дискуссионных листов может зашкалить за эту границы (ЕЖЕ-лист иногда как разфлеймится, мало не покажется), а многочисленные notification от форумов, новостных сайтов и прочего...
Авторы статьи, мягко говоря, выдают желаемое за действительное.
СОздается впечатление, что все юзеры очень умные и явно адреса не оставляют. АГА, ЩАС! Пройдясь самым примитивным роботом по Рунету, можно накопать пару миллионов адресов. К тому же, логика формирования адресов проста и даже примитивна - если есть адрес vasya666@mail.ru, то с вероятностью в 99% существуют адреса vasya@mail.ru, vasya66@mail.ru и т.д. Действительность адресов проверяется коротким запросом к sendmail. Благодать! :).
В качестве полумеры включен стандартный поиск форума, пользуйтесь. Что делать дальше - будем думать...
Ну, вы бы посмотрели вначале, за что есть побороться... Сайт на первой странице этого раздела получил с Рамблера сегодня аж два хоста... Оно вам так сильно надо?!
Да нет, реклама в Апорте - это нулевая ссылка, видимо.
Макс, а где у тебя тут запрещена индексация search.php?
Если "проблема" видится в том, что робот сожрал много одинаковых страниц - то это не проблема и бана из-за этого не будет. Это проблема робота и самого Яндекса, качать дубли - удовольствие небесплатное.
Сайту это никак повредит - в худшем случае каждая из проиндексированных страниц будет видна в базе отдельно, в лучшем - идентичные документы склеются.
Нет, он этого делать не пытается. Причину осведомленности легче найти в другом - Яндекс-Бар стоит? С включенным баром по таким адресам ходили?
Я не ходил смотреть, что именно катит Яндексу - но Яндексу может покатить пара ссылок на ваш сайт со словами Skoda Fabia... Рамблер же этого не поймет.
А в Google? А в Апорте? У каждого поисковика свой алгоритм, поэтому сравнение в принципе бесполезно...
Боюсь ошибиться, но, по-моему, site - есть сознательный mispelling слова sight, что довольно часто встречается у американцев (nite, luv, coz` и т.д.).
Оригинальное site в английском - слово действительно старинное, произносится [`sIt], происхождения французского.