http://www.google.com/search?q=%22itman.narod.ru/english/ir%22&num=100&hl=en&lr=&rls=GGGL,GGGL:2005-09,GGGL:en&filter=0
Собственно, прикол dmozа заключается в том, что dmoz размножается :-) но, как это, это лично мне не помогло.
да по модулю общения с О. Бартуновом, он же сам и пользуется.
Дык, это же российская разработка. Если чего не будет работать, известен человек, которому можно на это пожаловаться.
Философия, однако :-)
Я согласен на тему эвристик обхода сайтов. Я просто хотел констатировать тот факт, что физически (или если хотите математически) можно получить разное множество страниц. Насколько это влияет на качество поиска - вопрос уже другого плана.
Разница есть, однозанчно, подмножество достижимых страниц может отличаться
Нет, подкаталога english/ir.
Хочу сказать, что, похоже, иногда не индексирует. Каталогу этому уже месяцев пять, гугль на сайт ходит пару раз в месяц, яха давно эти каталог проиндексировал. Какой я еще могу сделать вывод? Только, что гугль сейчас не совсем справляется с индексированием инета и несколько ограничивает индексируемый контент. Недаром же они в прошлом году официально заявили, что не будут соревноваться с Яху по части размера индекса.
легко:
http://www.google.com/search?q=site:itman.narod.ru&num=100&hl=en&lr=&rls=GGGL,GGGL:2005-09,GGGL:en&filter=0
ветки english/ir отсутствует, хотя она достигается в три клика из корня, и на на нее есть ссылочка в dmoz.
ну и в itman.narod.ru/sitemap.xml естественно.
Причем делает это он как-то очень странно. У меня есть подкаталог третьего уровня, который гуглем почему-то упорно не индексируется. Несмотря на ссылку из дмоза и сайтмеп. При этом есть куча страничек третьего уровня, которые успешно проиндексированы. Я очень сильно подозреваю, что это просто свежее ограничение. То есть старые длинные пути остались в индексе, а новые отрезаются по количеству слешей в пути.
я бы уточнил: очень избирательно. причем из большой тройки особенно хорошо сос...т гугль. он, например, почему-то паталогически не хочет забирать с моего сайта самые интересную для меня страничку. при том, что на эти странички есть даже ссылка из дмоза :-) и в сайтмепе она прописана. а яха и мой собственный робот все странички без проблем забирает.
Lagif, могут быть внешние ссылочки.