Сравниваем Выдачу и Яндекс.xml

334

TF-Studio

15 января 2016, 14:51

4155

Всегда хотел проверить разницу выдачи и xml

и узнать в цифрах разницу.

Про персонализацию в курсе, её степень влияния не такая сильная (скоро конкретно в цифрах её оценю, это будет второй эксперимент, который опубликую)

Суть эксперимента:

1. Было взято 2,778 запросов из 4 групп (коммерция, женская тематика, туризм, информационные запросы)

2. Почти одновременно был запущен парсинг поисковой выдачи (xml парсится дольше из-за внутренних ограничений)

3. Для доступа к Я.XML взяли собственные лимиты из Я.Вебмастера, для парсинга выдачи — закрытый прокси-сервис. Ради чистоты эксперимента был указан регион lr=1 (география IP прокси-сервиса — RU (по хуизу), в поле address указан Moscow).

Совпадает позиций — 75%

Не совпадает — 25%

Дамп и больше текста тут: http://habrahabr.ru/post/275197/

Всё ещё лучший способ заработка для белых сайтов: GoGetLinks (https://www.gogetlinks.net/?inv=fahbn8).

293

Brand from Amber

15 января 2016, 16:06

#1

TF-Studio, теперь сравни "выдачу Яндекса" с "выдачей Яндекса" (через несколько секунд) - есть вероятность, что получишь те же 75 на 25 :)

/ru/news/23199

1

Лучший способ понять что-то самому - объяснить это другому.

334

TF-Studio

16 января 2016, 14:47

#2

Оценил степень рандома - явно ниже 20%

Также очевидно виден алгоритм получения чистых данных, без рандомизации, если делать N-запросов в сутки с интервалом

197

Петр Елагин

16 января 2016, 20:34

#3

если смотреть то, что проходит через мой сервис - то я могу сказать о трех типах выдачи

1 - XML - выдача тормозит с п2 на 1-2 дня примерно, в апы лучше ничего не снимать!

2 - броузер с джаваскриптом - тут вс просто органика и есть органика, перед апом и иногда после выката нового алго - все перекосяк

3 - обычный скрипт - помесь п2 с чем то неясным, возможно то, что кукии перемешаны, яндекс не могут понять предпочтения пользователей и поэтому мешает что-то от себя

https://shareways.ru

Очистка органической выдачи Яндекса Каннибализация органики или «нужно Яндекс.Директ ответил на частые

1108

Datot

16 января 2016, 20:38

#4

AlienZzzz:
если смотреть то, что проходит через мой сервис - то я могу сказать о трех типах выдачи

1 - XML - выдача тормозит с п2 на 1-2 дня примерно, в апы лучше ничего не снимать!
2 - броузер с джаваскриптом - тут вс просто органика и есть органика, перед апом и иногда после выката нового алго - все перекосяк
3 - обычный скрипт - помесь п2 с чем то неясным, возможно то, что кукии перемешаны, яндекс не могут понять предпочтения пользователей и поэтому мешает что-то от себя

А вы не пробовали смотреть выдачу "глазами" обывателя?

Накрутка ПФ @samdatot Группа полезных сеошников https://t.me/karkali Что надо знать владельцам сайтов https://dzen.ru/tunnel.ru

197

Петр Елагин

16 января 2016, 21:12

#5

datot:
А вы не пробовали смотреть выдачу "глазами" обывателя?

не слышал о таких

[Удален]

17 января 2016, 09:08

#6

А еще, попробуйте запустить парсинг с 3 разных ip)

1

197

Петр Елагин

17 января 2016, 10:22

#7

Я имел ввиду, что все запросы идут с адресов одного региона.

Отправлено с моего iPhone используя Tapatalk

1

334

TF-Studio

17 января 2016, 12:26

#8

Flopp:
А еще, попробуйте запустить парсинг с 3 разных ip)

прямо сейчас так и делаю.

снимаю каждый час с новых и сохраняю.

оч интересные данные

[Удален]

17 января 2016, 13:13

#9

Думаю если процентов 40 совпадет, будет норм)

334

TF-Studio

17 января 2016, 17:07

#10

меньше 20 пока

Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ

В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах