Подписаный сертификат можно считать ссылкой от компании, подписавшей сертификат, к компании, которой этот сертификат принадлежит. Как поступает именно Google я не знаю.
Морочить-то могут, но для некоторых страниц, которым тулбар PR показывает, эта тулза говорит мол нету PR, приходите после данса. Это как отбирают ? И как помнят кому давали, а кому говорили "приходите завтра" ?
Ещё одна интересная тулза с того же сайта:
http://www.webrankinfo.com/outils/google-dance/pagerank-data-centers.php
Позволяет определить PR, номер и имя категории DMOZ на каждом датацентре, во время данса, очевидно, он может быть разный. Но кроме урла нужно вводить её гугловую контрольную сумму (ch). Её можно определить из запроса, который шлёт toolbar для определения PR - это параметр ch этого запроса. Для win2000 этот запрос можно посмотреть во временных файлах броузера (так советуют на сайте, не проверял). При наличии прокси, можно посмотреть этот запрос в логах прокси.
Так там написано, что эти цифры на основе алгоритма апроксимации PR, изобретённого WebRankInfo.
А ваши, что вы кивками на дийзайн хотите прикрыть своё неумение или даже нежелание правильно пользоваться этим инструментом. Не более. Еще раз: при задании достаточного MaxDocSize и возможности вашей системы выделить такое количество памяти, проблем с индексацией таблиц любого размера нет. Приведённая вами цитата говорит имеено тоже самое, что было сказано мной, только на английском. Все остальные "танцы с бубнами" - это решение проблемы, когда ваша система не может выделить требуемого количества памяти...
С таким же успехом можно сказать, что Windows2000 имеет проблему в дизайне - она не работает на 16 мегабайт ОЗУ...
Вы ошибаетесь, команда HTDBList из индекса базы генерит нечто вроде индекса в HTML. Но у mnogosearch есть ограничение на максимальный размер индексируемого файла, для 3.1 версии он меняется с перекомпиляцией, для 3.2 меняется параметром. Поэтому всё и сводится к вашему железу - может ли оно выделить для вашего процесса достаточно памяти или не может.
HTTDB - это и есть workaround, олько нам надо уметь пользоваться, как и всем остальным. Вам сосбственно неикто не мешает сделать несколько HTDBList команд...
1. работает
2. Нет такой проблемы - если вы хотите выбрать всю базу одним запросом HTDBList будьте готовы иметь железо, которое сможет выполнить ваш запрос. Ровно также как и с обычными селектами в SQL.
3. http://www.mnogosearch.org/bugs/
4. несложен.
В текущей CVS версии 3.2.х добавлена возможность сортировки результатов по дате. Если хотите, можете поспробовать последний снапшот.
Позиции у Яндекса не отличаются. По крайней мере для моих запросов.
Поставить какой-нибудь счётчик, например HotLog. Правда отношение сильно плавает, по крайне мере у меня, для запроса "Сочи", когда половина или чуть больше пишет с маленькой, а когда не более 5-10%. Это по дневной статистике. По полугодовой статистике, примерно одинаково, но с мальнькой чуть больше (не более 1% разница)