Zute

Рейтинг
32
Регистрация
03.01.2004

aspseek - писан русскими, имхо, должен лучше всех из перечисленых справляться с русским. Можете еще посомтреть http://www.dataparksearch.org/ и http://www.mnogosearch.org/ - тоже писаны русскими и неплохо работающие с русским.

absolut:
Я говорил про "Поиск среди 8 168 684 336 страниц"

А я - про рост базы у Гугла :)

Кто, что банит, и каков процент мусора в базе - это всё вторично. Вся соль, что выдаётся на первых страницах. По запросу "Сочи" Яху на первой странице в основном выдаёт сочинские, географически, сайты, рассказывающие о Сочи, а Яндекс - в основном сайты московских контор, торгующих недвижимостью и турпутёвками в Сочи. Вот и вся разница, - первые страницы выдачи каждого из этих поисковиков будут более интересны разным категориям искателей.

Другой аспект: бОльшая база документов означает не только большее число мусора, но также и большее число интересных документов, с этим тоже глупо спорить.

absolut:
Zute, большая часть страниц в базе яху дорвеи, дубликаты или помойки с бесплатных хостингов.

А как будто в Яндексе этого нет ;)

absolut:
Эта цифра меняется крайне редко. Поэтому она не соответствует действительности.

Проверил ваш запрос сегодня - 9,57 млрд., т.е. на 20 млн. больше, чем 5 дней назад.

Unlock:
у меня гугл выкинул в индекс страницы с кешем, хоть они и закрыты через мета тег.

Хороший повод написать в саппорт Гугля. Полагаю, даже русский не будет для них особой проблемой :)

Lor:
Есть такое дело. Проиндексировал то, что закрыто в robots.txt. Правда пока кэша нет, может при "подробном рассмотрении" и уберет из базы.

Вот и вопрос, а есть ли такие странице в базе, он мог эти страницы просто просканировать (без индексирования) в поисках новых ссылок :)

Потом заходим на http://www.google.ru/ и читаем мелким шрифтом внизу "Поиск среди 8 168 684 336 страниц"

Самое прямое: больше документов в базе - больше ссылок, в том числе и на документы, находившиеся в базе ранее.

Это не Дэнс, это наращивание базы: http://notes.sochi.org.ru/263/

Всего: 218