Подскажите разницу между xml выдачей и serp'ом

Valachi221
На сайте с 07.05.2010
Offline
70
1069

Всем привет!

Недавно встала задача изобрести велосипед - написать программку, которая парсит выдачу яндекса по определенномым запросам. Парсинг xml довольно тривиальная задача, но фигня в том, что позиции c xml.yandex.ru не совпадают с выдачей в серпе, хотя всегда был уверен, что серп фрмируется именно из xml.

Кто делал подробные программки или просто знает - откуда серп тащит данные? Разве не из xml? Почему позиции там и там отличаются? :crazy:

F
На сайте с 06.06.2008
Offline
51
#1
Почему позиции там и там отличаются?

Спросите Платона, может и ответит :)

Кто делал подробные программки или просто знает - откуда серп тащит данные?

А что Вам мешает парсить серп?

[Удален]
#2

если парсить хмл - тривиальная задача, а просто хтмл - нет. то лучше скачайте готовый софт, а то это и правда велосипед, с которым у вас похоже будут проблемы.

Valachi221
На сайте с 07.05.2010
Offline
70
#3
freesoccer:
А что Вам мешает парсить серп?

Да ничего, в принципе, просто кажется, что xml как-то правильнее...

Valachi221 добавил 19.06.2011 в 16:28

carl0s:
если парсить хмл - тривиальная задача, а просто хтмл - нет. то лучше скачайте готовый софт, а то это и правда велосипед, с которым у вас похоже будут проблемы.

ну как всегда - спрашиваешь одно, а тебе отвечают другое 🙅

F
На сайте с 06.06.2008
Offline
51
#4

Valachi221, когда кажется креститься надо :)

Основной вопрос как раз в том, что в XML Яндекс выдает далеко не то, что показывает пользователям. Вы сравните пару сайтов работающих на Яндекс XML и выдачу самого Яндекса, как говорится - почувствуйте разницу!

Иначе зачем люди ломают головы и покупают прокси, чтобы парсить выдачу напрямую с серпа?

Dimoha
На сайте с 15.06.2009
Offline
53
#5

Парси YandexXML и даже не думай над:

"зачем люди ломают головы и покупают прокси, чтобы парсить выдачу напрямую с серпа"

Разница там минимальная, и то в основном в послеапдейтовый период.

Drivelink (http://drivelink.ru/for/support/) - автоматическая проверка ссылок

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий