В XML выдача другая же. Сравните для примера запросы "терор", "путин", "президент рф". И их можно найти уйму.
А ещё в XML выдача с опечатками не совсем такая, как у пользователей обычного поиска.
Так что он не надежен на 100%.
Классификация + Bm25 + MatrixNet. Больше то и не как.