Комментарии - Zerg WereWolf - Профиль вебмастера - Форум об интернет-маркетинге

Referer spam, или, Чего хотят добиться люди?

3 июля 2005, 06:34

BUFO:
На самом деле все просто... Находят лидера по запросу, смотрят бэки, видят рефы, думают как это сделать итп... Убогие методы спама, но работают... Причем видел по 250 записей на сайтах которые имели 6 - главное попасть на морду :D
ГЫ что в переводе US $(

Да я бы понял такие спам-телодвижения, если бы тематика сайтов не была абсолютно разной. У меня не укладывается в голове как можно соотнести блог и казино? Или факультетский сайт и виагру? Или астрономический сайт и покер... Или может у меня башня недостаточно набок смотрит или я что-то упустил в этой жизни???

Проверить Google PR всех страниц сайта

13 июня 2005, 15:00

У меня спотыкается на страницах с редиректом (php, пример тут) и на страницах, требующих авторизацию (пример). Кроме того, HEAD запросы идут не через прокси, а GET через проксти => если у меня прямое подключение к сайту, то проверить не проблема, если необходимо ходить через проксю (сайт далеко или еще по какой причине), то болт :(

Значение Гугла для русских сайтов

24 февраля 2005, 12:58

Как писал Piotiger
спасибо за данные, в общем я и прелполагал что не более 10% где-то получится. Вот только из этих 10% мне кажется 90% те пользователи которые уже искали это в Яндексе и в Рамблере. Не верится мне что России есть такие кто пользуется только Гуглом и все. Я лично узнал о его популярности только после того как стал посещать этот форум.

Ну почему же? Я к примеру практически только гуглем и пользуюсь...

Как писал Piotiger
Кстати, Zerg WereWolf, хотелось бы узнать, сайты занимают по определенным запросам соответствующие места в поисковиках или может на Яндексе ты первый а на Гугле 21-й, тогда естественно разница будет большая.

Это смотря по каким словам искать...

Значение Гугла для русских сайтов

24 февраля 2005, 07:01

Лично у меня на трех хостах складывается такая ситуация по первой пятерке:

1. Тематический сайт (довольно узкая специализация)

Rambler - 56.2 %

Google - 19.5 %

Yandex - 16.9 %

MSN - 5.4 %

Yahoo - 1.1 %

2. Корпоративный сайт (общего характера)

Yandex - 48.3 %

Rambler - 41.9 %

Google - 7.6 %

Yahoo - 0.7 %

MSN - 0.7 %

3. Корпоративный сайт (присутствует тематическая направленность)

Yandex - 55.3 %

Rambler - 27.2 %

Google - 12 %

DMOZ - 3 %

Yahoo - 1.4 %

Статистика подбивалась при помощи awstats (если нужно, то могу дать линки на полные данные по статистике)

Пишу паука

14 февраля 2005, 15:56

crawler, spider, search engine => http://scholar.google.com

ht://Dig vs. AspSeek vs. mnogoSearch

14 февраля 2005, 15:35

Исходники же лежат в свободном доступе - так соберите из них поисковик под виндой...

P.S. У нас по нескольким серверам ищет aspseek - вполне им довольны, когда-то пробовали mnogosearch - крайне не понравился, может сейчас лучше стал... Дубляж поиска при помощи старенького Yandex.Site (остался в качестве наследия от былых тестов)...

404 ошибка

20 января 2005, 06:14

Спискок условий :)

Работать будет точно так же как и в случае с ошибкой (скрипты даже править не придется), но error-логи будут чистенькие...

404 ошибка

19 января 2005, 09:25

В .htaccess

RewriteEngine On

RewriteCond %{REQUEST_FILENAME} !-f

RewriteCond %{REQUEST_FILENAME} !-d

RewriteCond %{REQUEST_FILENAME} !-s

RewriteCond %{REQUEST_FILENAME} !-l

RewriteRule ^(.+)$ /path/to/e404.script?REQUEST_URI=$1

Краулер

12 августа 2004, 11:54

Как писал Nobbin
А wget не подойдет? Скачать им все страницы на диск, а потом посчитать размеры файлов. По ссылкам он сам ходить умеет, только ему ключик нужно указать, чтобы он рекурсивно страницы обходил.

Скачивать wget-ом несколько гигабайт? - глупо...

Краулер

10 августа 2004, 12:52

Ммм... распотрошил я странички на предмет ссылок - ок, но (!) там ссылки не только на этот сайт, но и на другие + картинки, pdf-ки, wrl-ки, co-ки и многое еще чего, что считать не нужно. Метод HEAD не всегда пролезет - контент большей частью динамический. По части ширины канала не беспокойтесь - до того, что я собрался обсчитывать канал 100 Mbps... Кстати, по части очередей - оптимизировать это дело никак нельзя?

Вышел новый Яндекс Браузер с YandexGPT и YandexART

Все что нужно знать о DDоS-атаках грамотному менеджеру

Zerg WereWolf