aspseek - писан русскими, имхо, должен лучше всех из перечисленых справляться с русским. Можете еще посомтреть http://www.dataparksearch.org/ и http://www.mnogosearch.org/ - тоже писаны русскими и неплохо работающие с русским.
А я - про рост базы у Гугла :)
Кто, что банит, и каков процент мусора в базе - это всё вторично. Вся соль, что выдаётся на первых страницах. По запросу "Сочи" Яху на первой странице в основном выдаёт сочинские, географически, сайты, рассказывающие о Сочи, а Яндекс - в основном сайты московских контор, торгующих недвижимостью и турпутёвками в Сочи. Вот и вся разница, - первые страницы выдачи каждого из этих поисковиков будут более интересны разным категориям искателей.
Другой аспект: бОльшая база документов означает не только большее число мусора, но также и большее число интересных документов, с этим тоже глупо спорить.
А как будто в Яндексе этого нет ;)
Проверил ваш запрос сегодня - 9,57 млрд., т.е. на 20 млн. больше, чем 5 дней назад.
Хороший повод написать в саппорт Гугля. Полагаю, даже русский не будет для них особой проблемой :)
Вот и вопрос, а есть ли такие странице в базе, он мог эти страницы просто просканировать (без индексирования) в поисках новых ссылок :)
Потом заходим на http://www.google.ru/ и читаем мелким шрифтом внизу "Поиск среди 8 168 684 336 страниц"
Самое прямое: больше документов в базе - больше ссылок, в том числе и на документы, находившиеся в базе ранее.
Это не Дэнс, это наращивание базы: http://notes.sochi.org.ru/263/