xml.yandex.ru vs www.yandex.ru

T.R.O.N
На сайте с 18.05.2004
Offline
314
486

Не раз уже говорилось, что база яши, доступная через сайт и XML расходятся. Апдейт идет асинхронно и т.д.

Но сейчас капаясь и сравнивая выдачу на сайте и выдачу через XML получил интересный, на мой взгляд, результат:

Анализировал 5 запросов.

1. Первые 30 позиций в XML и WWW совпадают (по 10 и по 50 идентичны).

2. После 30 позиции в XML начинают попадаться ДРУГИЕ страницы с сайтов, которые есть в топ30 xml. При этом эти страницы имеют более ппозднюю дату обновления. (При этом, эти стртаницы соответствуют запросу.)

3. Если убрать эти ДРУГИЕ страницы, то очередность сайтов в www и xml совпадает. (прошел первые 100)

4. Количество найденных результатов в www и в xml практически одинаково. При этом, в xml не наблюдается уменьшение количества результатов при переходе от страницы к странице.(Сам Яша говорит, что его XML сервис пользуют другие сайты. Получается, что выдача на других сайтах корректнее чем на самом Яше.)

Какие выводы сделать, не знаю. Но очень интересно откуда взялись лишнии странички, и почему они влезли в достаточно высокии позиции.

PS Помню, когда и на основном серпе такое попадалось, но там глюк удалялся быстро. Сейчас я это наблюдаю 3-й день.

От воздержания пока никто не умер. Хотя никто и не родился! Prototype.js был написан теми, кто не знает JavaScript, для тех, кто не знает JavaScript (Richard Cornford)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий