Тоесть Вы хотите сказать что у яндекса нет базы имен собственных и нарицательных, у него просто заложено в алгоритме ?
А про соотношение написаний пользователями что можете сказать, кто нибудь проводил исследования по этому вопросу?