Сравниваем Выдачу и Яндекс.xml

12
TF-Studio
На сайте с 17.08.2010
Offline
321
4129

Всегда хотел проверить разницу выдачи и xml

и узнать в цифрах разницу.

Про персонализацию в курсе, её степень влияния не такая сильная (скоро конкретно в цифрах её оценю, это будет второй эксперимент, который опубликую)

Суть эксперимента:

1. Было взято 2,778 запросов из 4 групп (коммерция, женская тематика, туризм, информационные запросы)

2. Почти одновременно был запущен парсинг поисковой выдачи (xml парсится дольше из-за внутренних ограничений)

3. Для доступа к Я.XML взяли собственные лимиты из Я.Вебмастера, для парсинга выдачи — закрытый прокси-сервис. Ради чистоты эксперимента был указан регион lr=1 (география IP прокси-сервиса — RU (по хуизу), в поле address указан Moscow).

Совпадает позиций — 75%

Не совпадает — 25%

Дамп и больше текста тут: http://habrahabr.ru/post/275197/

Всё ещё лучший способ заработка для белых сайтов: GoGetLinks (https://www.gogetlinks.net/?inv=fahbn8).
Brand from Amber
На сайте с 18.08.2007
Offline
263
#1

TF-Studio, теперь сравни "выдачу Яндекса" с "выдачей Яндекса" (через несколько секунд) - есть вероятность, что получишь те же 75 на 25 :)

/ru/news/23199

Лучший способ понять что-то самому - объяснить это другому.
TF-Studio
На сайте с 17.08.2010
Offline
321
#2

Оценил степень рандома - явно ниже 20%

Также очевидно виден алгоритм получения чистых данных, без рандомизации, если делать N-запросов в сутки с интервалом

Петр Елагин
На сайте с 21.03.2007
Offline
187
#3

если смотреть то, что проходит через мой сервис - то я могу сказать о трех типах выдачи

1 - XML - выдача тормозит с п2 на 1-2 дня примерно, в апы лучше ничего не снимать!

2 - броузер с джаваскриптом - тут вс просто органика и есть органика, перед апом и иногда после выката нового алго - все перекосяк

3 - обычный скрипт - помесь п2 с чем то неясным, возможно то, что кукии перемешаны, яндекс не могут понять предпочтения пользователей и поэтому мешает что-то от себя

datot
На сайте с 09.07.2007
Offline
980
#4
AlienZzzz:
если смотреть то, что проходит через мой сервис - то я могу сказать о трех типах выдачи

1 - XML - выдача тормозит с п2 на 1-2 дня примерно, в апы лучше ничего не снимать!
2 - броузер с джаваскриптом - тут вс просто органика и есть органика, перед апом и иногда после выката нового алго - все перекосяк
3 - обычный скрипт - помесь п2 с чем то неясным, возможно то, что кукии перемешаны, яндекс не могут понять предпочтения пользователей и поэтому мешает что-то от себя

А вы не пробовали смотреть выдачу "глазами" обывателя?

Продвижение по ПФ. Пакет от 40 запросов (http://smit.ru/prodvizhenie)
Петр Елагин
На сайте с 21.03.2007
Offline
187
#5
datot:
А вы не пробовали смотреть выдачу "глазами" обывателя?

не слышал о таких

[Удален]
#6

А еще, попробуйте запустить парсинг с 3 разных ip)

Петр Елагин
На сайте с 21.03.2007
Offline
187
#7

Я имел ввиду, что все запросы идут с адресов одного региона.

Отправлено с моего iPhone используя Tapatalk

TF-Studio
На сайте с 17.08.2010
Offline
321
#8
Flopp:
А еще, попробуйте запустить парсинг с 3 разных ip)

прямо сейчас так и делаю.

снимаю каждый час с новых и сохраняю.

оч интересные данные

[Удален]
#9

Думаю если процентов 40 совпадет, будет норм)

TF-Studio
На сайте с 17.08.2010
Offline
321
#10

меньше 20 пока

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий