выпали страницы с уникальным контентом

123
S
На сайте с 21.05.2006
Offline
3
#11

Проблема в том, что то, что там написано - это полуправда.

Забавно то, что Эрик Шмидт увтерждает, что у них не хватает машин (что отчасти объясняет неожиданные выпдения страниц из "белых" сайтов и нежелание гугля индексировать новые странички)


Schmidt said: "Those machines are full. We have a huge machine crisis."

В то время, как Мэт Катс, утверждает, что компьютеров у них достаточно :-) ужасный мир, никому нельзя верить. Еще отдельный прикол заключается в том, что гугль очень долго синхронизирует dir.googles.com и ODP :-)

Скорее всего тут множество факторов накладываются, большинство из которых умалчивается.

AleGa:
Вот ответ на вопрос что происходит с Google сейчас, правда на англ., но много интересного есть.
http://www.mattcutts.com/blog/indexing-timeline
S
На сайте с 21.05.2006
Offline
3
#12

Кстати, а откуда данные по размеру индекса, если не секрет?

absolut:
Какие-то временные проблемы у гугла. Индекс упал в 7 раз до 1.5 млд страниц. Но сейчас начал увеличиватся, каждый день растет. Может быть все вернется к прежнему состоянию.
AleGa
На сайте с 17.09.2003
Offline
102
#13
seodev:
Проблема в том, что то, что там написано - это полуправда.

Верно, но это хоть какая то информация о процессах проиcходящих с google

ДР Серча в Молдове (/ru/forum/416709)
A
На сайте с 23.10.2003
Offline
196
#14
seodev:
Кстати, а откуда данные по размеру индекса, если не секрет?

http://www.icq.com/search/results.php?q=-kjhkjw3424&ch_id=&search_mode=web

В то время как тут 25 милиардов - http://www.google.com/search?hl=en&q=-234lkjsdljfklsdf&btnG=Google+Search

андроид ТВ (http://qway.com.ua/android_tv) и экшн камеры (qway.com.ua/action-cameras) в Украине.
S
На сайте с 21.05.2006
Offline
3
#15

да нет, это некорректный способ оценки размера индекса.

вот, например, так

http://www.icq.com/search/results.php?q=%D1%82%D0%B0%D1%80%D1%82%D0%B8%D0%BD%D0%BA%D0%B0%D0%BC%D0%B8&search_mode=web&start=150

http://www.google.com/search?q=%D1%82%D0%B0%D1%80%D1%82%D0%B8%D0%BD%D0%BA%D0%B0%D0%BC%D0%B8&num=100&hl=en&lr=&start=300&sa=N

нужно по редко встречающимся ключевым словам и проверять есть ли слова на странице, потому как поиск по семантике ссылок вещь загадочная.

При этом, обратите внимание, что гугль выдает результатов значительно меньше, чем анонсирует (второй запрос)

S
На сайте с 21.05.2006
Offline
3
#16

хотя, прошу пардона, результатов порядка 800, но 700 supplemental.

может аська просто не считает supplemental results?

A
На сайте с 23.10.2003
Offline
196
#17

Да и так и так можно. В любом случае гугл врет. А это наводит на мысль, что у них действительно есть проблемы с железом.

S
На сайте с 21.05.2006
Offline
3
#18

Да нет, в том-то и дело, что нельзя. Потому что в первом случае поисковик может абсолютно любую цифру написать, а дает посмотреть только первые эн страниц. Это раз, во вторых, нужно реально проверять, есть ли искомые ключевые слова на странице, или найдено по ссылке. Возможно, это опять-таки только на "коротких" запросах. В-третьих, запрос должен быть по поиску ровно одного слова. Потому что по всем другим запросам может играть роль специфика конкретного поисковика.

absolut:
Да и так и так можно. В любом случае гугл врет. А это наводит на мысль, что у них действительно есть проблемы с железом.
S
На сайте с 21.05.2006
Offline
3
#19

Вот, кстати, классика на тему оценки размера индекса

http://net.pku.edu.cn/~wbia/2004/public_html/Readings/web%20graph/Searching%20the%20World%20Wide%20Web%20(1998)%20.pdf

ST
На сайте с 17.01.2004
Offline
136
#20

Я не спец. в определении размеров индекса, но может проще так:

http://www.google.com/search?sourceid=navclient&hl=ru&ie=UTF-8&rls=GGLD,GGLD:2005-23,GGLD:ru&q=http

Глобальная мечта: создать бизнес, управляемый с яхты.
123

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий